l16: sub, l15: Zero-length Match

Saeid Darvish · Saeid Darvish · commit c8428a134619 · 2021-02-25T23:46:17.000+03:30
diff --git a/lessons/l15.rst b/lessons/l15.rst
@@ -372,6 +372,18 @@
   [`regex101@ تست آنلاین <https://regex101.com/r/IIc4Fh/17>`__]
 
 
+  .. tip::
+     این کاراکتر (``b\``) در مبحث RegEx به عنوان انطباق‌گر یک word(``\w``) boundary نیز خوانده می‌شود. word boundary (مرز واژه) به سه موقعیت گفته میشود:
+
+    * قبل از نخستین کاراکتر، زمانی که کاراکتر نخست یکی از کاراکترهای شامل ``w\`` باشد
+    * بعد از کاراکتر پایانی، زمانی که کاراکتر پایانی یکی  از کاراکترهای شامل ``w\`` باشد
+    * بین دو کاراکتر، زمانی که یکی از این دو کارامتر شامل ``w\`` باشد ولی دیگری خیر
+
+    [`regex101@ تست آنلاین <https://regex101.com/r/48XLbY/1>`__] در این نمونه کد، نقاط word boundary مشخص شده است
+
+    در ادمه کارکتر ``w\`` شرح داده خواهد شد.
+
+
 * ``B\``
 
   برعکس ``b\``، بر حسب موقعیت قرار گرفتن، شروع یا پایان **نیافتن** یک **کلمه** را مشخص می‌کند. یعنی کلماتی را تطبیق می‌دهد که با کاراکتر یا کارکترهایی مشخصی شروع یا پایان نیافته باشند.
@@ -397,6 +409,9 @@
 
   [`regex101@ تست آنلاین <https://regex101.com/r/IIc4Fh/19>`__]
 
+  .. tip::
+     این کاراکتر (``B\``) در تضاد با ``b\`` به عنوان انطباق‌گر نقاطی که word(``\w``) boundary **نیستند**، نیز خوانده می‌شود. [`regex101@ تست آنلاین <https://regex101.com/r/M3f3VN/1>`__]
+
 
 * ``d\``
 
@@ -521,6 +536,32 @@
 
 
 
+انطباق با طول صفر (Zero-length Match)
+~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+
+یک عبارت Zero-length به عبارتی از مبحث RegEx گفته می‌شود که هیچ کاراکتری را انطباق نمی‌دهد بلکه تنها موقعیت‌هایی را در متن رشته مورد نظر تطبیق می‌دهد. برای نمونه متن رشته ``1,2`` را درنظر بگیرید، الگو ``b\`` تنها موقعیت‌های قبل از ``1``، بین  ``1`` و ``,``، بین  ``,`` و ``2`` و بعد از ``2`` را تطبیق می‌دهد؛ در نتیجه الگو ``b\`` برای این متن یک Zero-length Match است. [به نتایج دقت کنید: `regex101@ تست آنلاین <https://regex101.com/r/BCuLmh/1>`__] . Zero-length Match در RegEx بسیار گمراه کننده هستند و می‌بایست با دقت از آن‌ها استفاده کرد. در زیر چند نمونه الگو از Zero-length Match‌ها ارايه شده است::
+
+    \b
+    \B
+    \A
+    \B
+    ^
+    $
+    .*
+    \d*
+
+سعی کنید برای الگوهای بالا در regex101.com، متن‌هایی را مثال بزنید، تست کنید و نتایج را با دقت مشاهده نمایید، به عنوان مثالی دیگر الگو زیر را در نظر بگیرید - این مورد را با هم بررسی می‌کنیم::
+
+    p*
+
+حاصل انطباق این الگو برای متنی مانند ``1,2`` هیچ فرق با الگو ``b\`` (که پیش‌تر صحبت شد) ندارد - تا اینجا فهمیدیم که از دید RegEx متن تنها همان کاراکترهای قابل دید نیست بلکه نقاطی مثل قبل از کاراکتر نخست، بعد از کاراکتر پایانی و حتی گاهی بین دو کاراکتر را نیز در نظر می‌گیرد و همچنین می‌دانیم که این الگو به دنبال هیچ یا هربار تکرار کاراکتر ``p`` در متن است. در نتیجه نقاطی که شامل هیچ کاراکتری نباشد یا شامل کاراکتر ``p`` باشد تطبیق پیدا می‌کند و از آنجایی که متن مورد نظر شامل ``p`` نمی‌باشد، تنها موقعیت‌های Zero-length باقی می‌ماند! - این الگو برای متن یاد شده کاملا یک Zero-length Match است.
+
+[`regex101@ تست آنلاین <https://regex101.com/r/OQrGDE/1>`__]  (p در این الگو تنها یک کاراکتر متنی است - کاراکترهای دیگر را نیز خودتان تست کنید)
+
+
+     
+
+
 
 ماژول re پایتون
 -----------------
@@ -836,6 +877,10 @@
     YES
 
 
+.. note::
+  
+  قالب‌های Lookahead یا Lookbehind (در کل lookaround‌ها) را نیز می‌توان از نوع Zero-Lengthها در نظر گرفت تنها تفاوت آن‌ها با الگوهایی که پیش‌تر بیان شد این است که lookaround‌ها ابتدا کاراکتر(هایی) را تطبیق و سپس از آن(ها) گذر می‌کنند.
+
 
 |
 
diff --git a/lessons/l16.rst b/lessons/l16.rst
@@ -589,6 +589,63 @@
 
 ``sub(pattern, repl, string, count=0, flags=0)``
 
+این تابع (``sub``) حاصل انطباق‌های ممکن pattern در string را در repl جایگذاری می‌کند. این تابع همچنین دو پارامتر اختیاری دارد (flags و count)، پیش‌تر در مورد flags صحبت کردیم و count نیز بیانگر ماکزیمم تعداد انطباقی است که می‌خواهیم در repl جایگذاری شود - این مقدار می‌بایست یک عدد مثبت باشد و مقدار صفر (مقدار پیش‌فرض) برای آن به معنی هر تعداد (نامحدود) خواهد بود. پارامتر repl در این تابع می‌تواند از نوع رشته یا تابع باشد، ابتدا حالت رشته را بررسی می‌کنیم [`اسناد پایتون <https://docs.python.org/3/library/re.html#re.sub>`__]::
+
+     >>> import re  # Python 3.x
+
+     >>> string = 'Perl@1987,Python@1991,Ruby@1995'
+     >>> repl = ' - '
+     >>> pattern = r'@\d+,?'
+
+     >>> result = re.sub(pattern, repl, string)
+
+     >>> type(result)
+     <class 'str'>
+
+     >>> print(result)
+     Perl - Python - Ruby - 
+
+     >>> result = re.sub(pattern, repl, string, 2) #  count=2
+     >>> print(result)
+     Perl - Python - Ruby@1995
+
+     >>> result = re.sub(pattern, repl, string, 1) #  count=1
+     >>> print(result)
+     Perl - Python@1991,Ruby@1995
+
+متد ``expand`` از شی Match که در ابتدای این درس مطرح شد را بیاد بیاورید، بدیهی است که pattern می‌تواند شامل گروهبندی نیز باشد، در این شرایط آنچه از قوانین موجود در پارامتر template متد ``expand`` گفته شد در repl (در حالتی که یک شی رشته است) نیز صدق می‌کند::
+
+     >>> result = re.sub(r'(\w+),(\w+),(\w+)', r'(\1) (\2) (\3)', 'Jazz,Rock,Pop')
+     >>> print(result)
+     (Jazz) (Rock) (Pop)
+
+     >>> re.sub(r'(\w+),(\w+),(\w+)', r'(\g<1>) (\g<2>) (\g<3>)', 'Jazz,Rock,Pop')
+     '(Jazz) (Rock) (Pop)'
+
+
+::
+
+      >>> re.sub(r'(?P<num>\d+)', r'#\g<num>#', 'Top 100 songs')
+      'Top #100# songs'
+
+به مثالی دیگر توجه نمایید::
+
+    >>> re.sub('x*', '-', 'abc@123,456')
+    '-a-b-c-@-1-2-3-,-4-5-6-'
+
+الگو مورد استفاده برای متن مثال بالا یک Zero-length Match است (درس قبل) - [`regex101@ تست آنلاین <https://regex101.com/r/n0I6JU/1>`__] 
+
+
+.. tip::
+  
+  چنانچه تابع ``sub`` هیچ انطباقی از pattern در string پیدا نکند، مقدار string را بدون تغییر برمی‌گرداند::
+
+       >>> re.sub(r'\d', '-', 'abc@xyz') #  Without matching
+       'abc@xyz'
+
+       >>> re.sub(r'\d', '-', 'abc@123')
+       'abc@---'
+