l16: completed

Saeid Darvish · Saeid Darvish · commit f14f7701fe1e · 2021-02-26T17:42:44.000+03:30
diff --git a/lessons/l15.rst b/lessons/l15.rst
@@ -726,6 +726,39 @@
     NO
 
 
+* پرانتزگذاری غیرقابل پیگیری (non-capturing): ``(...:?)``
+
+  این ساختار نمایش پرانتزگذاری یا همان گروه‌بندی معمولی در بحث RegEx است ولی با این تفاوت که نتایج انطباق داخل پرانتز قابل بازیابی (همانند یک گروه معمولی) نخواهد بود::
+
+     >>> import re
+
+     >>> string = "Python@1991"
+     >>> pattern = "(\d+)"
+     >>> match = re.search(pattern, string)
+
+     >>> match
+     <re.Match object; span=(7, 11), match='1991'>
+
+     >>> match.group(1)
+     '1991'
+
+  ::
+
+         >>> import re
+
+         >>> string = "Python@1991"
+         >>> pattern = "(?:\d+)"
+         >>> match = re.search(pattern, string)
+  
+         >>> match
+         <re.Match object; span=(7, 11), match='1991'>
+  
+         >>> match.group(1)
+         Traceback (most recent call last):
+           File "<stdin>", line 1, in <module>
+         IndexError: no such group
+
+
 * گروه بانام (Named Group): ``(...<P<name?)``
 
   این ساختار نمایش همان گروه‌بندی عادی در بحث RegEx است با این تفاوت که می‌توان به هر گروه یک نام انتساب داد. به کمک ماژول re پایتون، همانطوری که در درس بعدی به صورت کامل خواهید دید، حاصل انطباق هر گروه موجود در الگو با متن مورد نظر از طریق یک اندیس عددی که به ترتیب از یک شروع می‌شود قابل دسترسی است، با استفاده از این ساختار می‌توان حاصل انطباق را بسیار خواناتر و تنها با استفاده از نام آن دستیابی نمود::
diff --git a/lessons/l16.rst b/lessons/l16.rst
@@ -1,7 +1,7 @@
 .. role:: emoji-size
 
 .. meta::
-   :description: کتاب آموزش زبان برنامه نویسی پایتون به فارسی، آموزش ماژول re در پایتون، عبارات باقاعده در پایتون، Regular expression در پایتون، regex در پایتون
+   :description: کتاب آموزش زبان برنامه نویسی پایتون به فارسی، آموزش ماژول re در پایتون، عبارات باقاعده در پایتون، Regular expression در پایتون، regex در پایتون، توابع ماژول re پایتون - 
    :keywords:  آموزش, آموزش پایتون, آموزش برنامه نویسی, پایتون, تابع, کتابخانه, پایتون, re
 
 
@@ -129,7 +129,7 @@
       File "<stdin>", line 1, in <module>
     IndexError: no such group
     
-  در صورتی که الگو مورد نظر شامل هیچ گروهبندی نباشد، فراخوانی بدون آرگومان (یا ارسال آرگومان صفر) این متد، تمام متن تطبیق داده شده را برمی‌گرداند::
+  فراخوانی بدون آرگومان (یا ارسال آرگومان صفر - مقدار پیش‌فرض) این متد، تمام متن تطبیق داده شده را برمی‌گرداند::
   
   
     >>> pattern = re.compile('Py...n')
@@ -139,13 +139,6 @@
     
     >>> match.group(0)
     'Python'
-    
-    >>> match.group(1)
-    Traceback (most recent call last):
-      File "<stdin>", line 1, in <module>
-    IndexError: no such group
-    >>> 
-
 
 
 
@@ -214,7 +207,7 @@
 
   * ``Match.expand(template)`` [`اسناد پایتون <https://docs.python.org/3/library/re.html#re.Match.expand>`__]
 
-    این متد حاصل انطباق را در قالب ``template`` جایگذاری کرده و یک شی رشته جدید برمی‌گرداند. قالب در اینجا یک رشته است که در آن می‌توان به حاصل انطباق گروهبندی‌های موجود در الگو ارجاع داد به این صورت کرد که می‌توان گروه‌های بی‌نام موجود در الگو را با استفاده از ارجاع عددی به شماره اندیس آن‌ها به مانند ``1\``، ``2\`` و گروه‌های بانام را با استفاده از نام گروه به مانند ``<g<name\`` یا ``<g<1\`` در قالب موجود جایگذاری کرد. Escape character‌های موجود در قالب به کاراکترهای مناسب خود در متن خروجی تبدیل می‌شوند و از **نسخه 3.5 پایتون** گروه‌هایی که هیچ انطباقی نداشته‌اند با هیچی (empty string) جایگذاری می‌شوند::
+    این متد حاصل انطباق را در قالب ``template`` جایگذاری کرده و یک شی رشته جدید برمی‌گرداند. قالب در اینجا یک رشته است که در آن می‌توان به حاصل انطباق گروهبندی‌های موجود در الگو ارجاع داد به این صورت کرد که می‌توان گروه‌های بی‌نام موجود در الگو را با استفاده از ارجاع عددی به شماره اندیس آن‌ها به مانند ``1\``، ``2\``  یا ``<g<1\`` و گروه‌های بانام را با استفاده از نام گروه به مانند ``<g<name\`` در قالب موجود جایگذاری کرد. Escape character‌های موجود در قالب به کاراکترهای مناسب خود در متن خروجی تبدیل می‌شوند و از **نسخه 3.5 پایتون** گروه‌هایی که هیچ انطباقی نداشته‌اند با هیچی (empty string) جایگذاری می‌شوند::
 
         >>> import re
 
@@ -376,9 +369,9 @@
 
   تفاوت دو تابع ``match`` و ``search`` [`اسناد پایتون <https://docs.python.org/3/library/re.html#search-vs-match>`__]:
 
-  هنگام استفاده از تابع ``match``، از همان ابتدای متن مورد نظر می‌بایست با الگو تطابق صورت پذیرد (حتی در متن‌های چند سطری) ولی تابع ``search`` انجام انطباق را در هر جایی از متن دنبال می‌کند.
+  هنگام استفاده از تابع ``match``، از همان ابتدای متن مورد نظر، می‌بایست تطابق با الگو صورت پذیرد (حتی در متن‌های چند سطری) ولی تابع ``search`` انجام انطباق را در هر جایی از متن دنبال می‌کند.
 
-  هنگام استفاده از نشانه ``re.MULTILINE`` در تابع ``search``، کاراکتر ``^`` در الگو از معنای **ابتدای متن** به معنای **ابتدای هر سطر** تغییر می‌کند ولی از نظر تابع ``match`` وجود کاراکتر ``^`` در الگو همواره به معنی ابتدای متن می‌باشد (نه هر سطر)::
+  هنگام استفاده از نشانه ``re.MULTILINE`` در تابع ``search``، کاراکتر ``^`` در الگو از معنای **ابتدای متن** به معنای **ابتدای هر سطر** تغییر می‌کند (درس قبل) ولی از نظر تابع ``match`` وجود کاراکتر ``^`` در الگو همواره به معنی ابتدای متن می‌باشد (نه هر سطر)::
 
       >>> import re
       >>> string = 'Perl\nPython\nRuby'  # 3 lines
@@ -589,7 +582,7 @@
 
 ``sub(pattern, repl, string, count=0, flags=0)``
 
-این تابع (``sub``) حاصل انطباق‌های ممکن pattern در string را در repl جایگذاری می‌کند. این تابع همچنین دو پارامتر اختیاری دارد (flags و count)، پیش‌تر در مورد flags صحبت کردیم و count نیز بیانگر ماکزیمم تعداد انطباقی است که می‌خواهیم در repl جایگذاری شود - این مقدار می‌بایست یک عدد مثبت باشد و مقدار صفر (مقدار پیش‌فرض) برای آن به معنی هر تعداد (نامحدود) خواهد بود. پارامتر repl در این تابع می‌تواند از نوع رشته یا تابع باشد، ابتدا حالت رشته را بررسی می‌کنیم [`اسناد پایتون <https://docs.python.org/3/library/re.html#re.sub>`__]::
+این تابع (``sub``) حاصل انطباق‌های ممکن pattern در string را در repl جایگذاری می‌کند. این تابع همچنین دو پارامتر اختیاری دارد (flags و count)، پیش‌تر در مورد flags صحبت کردیم (که از نسخه 3.1 پایتون به این تابع اضافه شده است) و count نیز بیانگر ماکزیمم تعداد انطباقی است که می‌خواهیم در repl جایگذاری شود - این مقدار می‌بایست یک عدد مثبت باشد و مقدار صفر (مقدار پیش‌فرض) برای آن به معنی هر تعداد (نامحدود) خواهد بود. پارامتر repl در این تابع می‌تواند از نوع رشته یا تابع باشد، ابتدا حالت رشته را بررسی می‌کنیم [`اسناد پایتون <https://docs.python.org/3/library/re.html#re.sub>`__]::
 
      >>> import re  # Python 3.x
 
@@ -647,6 +640,144 @@
        'abc@---'
 
 
+گفتیم پارامتر repl در این تابع می‌تواند از نوع تابع باشد. در این صورت ``sub`` در هر بار انطباق تابع ``repl`` را فراخوانی می‌کند و شی ``Match`` مربوط را به آن ارسال می‌کند::
+
+     >>> import re
+
+     >>> def mask_numbers(match):
+     ...     string = match.group(0)  # The matching string
+     ...
+     ...     # string.isdigit() returns True if all characters in string are digits
+     ...     if string.isdigit():
+     ...         return '_' * len(string)
+     ...     else:
+     ...         return string
+     ... 
+     >>> 
+
+     >>> re.sub(r'\w+', mask_numbers, 'Perl.1987.Python.1991.Ruby.1995')
+     'Perl.____.Python.____.Ruby.____'
+
+     >>> re.sub(r'\w+', mask_numbers, 'My ID is 123.45679 and your ID is 98521.2')
+     'My ID is ___._____ and your ID is _____._'
+
+
+::
+
+    >>> re.sub(r'\d+', lambda match : '_' * len(match.group(0)), 'Perl.1987.Python.1991.Ruby.1995')
+    'Perl.____.Python.____.Ruby.____'
+
+    >>> re.sub(r'\d+', lambda match : '_' * len(match.group(0)), 'My ID is 123.45679 and your ID is 98521.2')
+    'My ID is ___._____ and your ID is _____._'
+
+*lambda در درس سیزدهم بررسی شده است.*
+
+
+
+یادآوری می‌شود که دو نمونه کد زیر عملکردی معادل یکدیگر دارند::
+
+
+    >>> pattern = re.compile('Py...n')
+    >>> result = pattern.sub('*', 'PythonPythonPython')
+
+::
+
+    >>> result = re.sub('Py...n', '*', 'PythonPythonPython')
+
+
+
+
+تابع ``subn``
+~~~~~~~~~~~~~~~~~~~~~~
+
+
+``subn(pattern, repl, string, count=0, flags=0)``
+
+عملکرد این تابع (``subn``) همانند تابع ``sub`` است. تنها تفاوت در خروجی آن‌هاست، تابع ``subn`` یک شی تاپل محتوی نتیجه و تعداد عملیات جایگذاری را برمی‌گرداند [`اسناد پایتون <https://docs.python.org/3/library/re.html#re.subn>`__]::
+
+    >>> import re  # Python 3.x
+
+    >>> string = 'Perl@1987,Python@1991,Ruby@1995'
+    >>> repl = ' - '
+    >>> pattern = r'@\d+,?'
+
+    >>> result = re.subn(pattern, repl, string)
+
+    >>> type(result)
+    <class 'tuple'>
+
+    >>> result
+    ('Perl - Python - Ruby - ', 3)
+
+    >>> re.subn(pattern, repl, string, count=2)
+    ('Perl - Python - Ruby@1995', 2)
+
+    >>> re.subn(pattern, repl, string, count=1)
+    ('Perl - Python@1991,Ruby@1995', 1)
+
+
+
+توابع جداسازی، ماژول ``re`` پایتون
+---------------------------------------
+
+توابع پرکاربرد ماژول ``re`` پایتون مرتبط با عمل جداسازی بخش (هایی) از متن عبارتند از: 
+
+* ``split``
+
+
+تابع ``split``
+~~~~~~~~~~~~~~~~~~~~~~
+
+
+``split(pattern, string, maxsplit=0, flags=0)``
+
+این تابع (``split``) محتوای متن string را بر اساس الگو pattern جدا (split) می‌کند و خروجی آن یک شی لیست از رشته‌ها خواهد بود. این تابع همچنین علاوه بر پارامتر flags (که از نسخه 3.1 پایتون به این تابع اضافه شده است) یک پارامتر اختیاری دیگر نیز با نام maxsplit دارد که تعیین کننده ماکزیمم تعداد جداسازی خواهد بود - این مقدار می‌بایست یک عدد مثبت باشد و مقدار صفر (مقدار پیش‌فرض) برای آن به معنی هر تعداد (نامحدود) خواهد بود. [`اسناد پایتون <https://docs.python.org/3/library/re.html#re.split>`__]::
+
+    >>> import re  # Python 3.x
+
+    >>> string = 'Perl,Python,Ruby'
+    >>> pattern = ','
+
+    >>> result = re.split(pattern, string)
+
+    >>> type(result)
+    <class 'list'>
+
+    >>> result
+    ['Perl', 'Python', 'Ruby']
+
+    >>> re.split(pattern, string, maxsplit=1)
+    ['Perl', 'Python,Ruby']
+
+    >>> re.split(pattern, string, maxsplit=2)
+    ['Perl', 'Python', 'Ruby']
+
+اگر الگو شامل پرانتز یا همان گروهبندی معمولی باشد، خروجی تابع ``split`` شامل جداکننده‌ها نیز می‌باشد::
+
+    >>> re.split('(_)', 'Perl_Python_Ruby')
+    ['Perl', '_', 'Python', '_', 'Ruby']
+
+به نمونه کد پایین توجه نمایید::
+
+    >>> re.split('/', '/Perl/Python/Ruby/')
+    ['', 'Perl', 'Python', 'Ruby', '']
+
+    >>> re.split('(/)', '/Perl/Python/Ruby/')
+    ['', '/', 'Perl', '/', 'Python', '/', 'Ruby', '/', '']
+
+**همانطور که مشاهده می‌شود، خروجی شامل دو رشته خالی در ابتدا و انتها می‌باشد. در مواقعی که جداکننده (delimiter) در نقاط ابتدایی و پایانی متن قرار دارد می‌بایست بروز همچین نتیجه‌ای را پیش‌بینی نمایید.**
+
+
+چنانچه در مسئله شما قرار گرفتن جداکننده در خروجی مطلوب نیست می‌توانید از طرح non-capturing پرانتزها (درس قبل) استفاده کنید::
+
+    >>> re.split('(?:_)', 'Perl_Python_Ruby')
+    ['Perl', 'Python', 'Ruby']
+
+    >>> re.split('(?:/)', '/Perl/Python/Ruby/')
+    ['', 'Perl', 'Python', 'Ruby', '']
+
+
+
 
 
 |
@@ -655,7 +786,7 @@
 
 :emoji-size:`😊` امیدوارم مفید بوده باشه
 
-`لطفا دیدگاه و سوال‌های مرتبط با این درس خود را در کدرز مطرح نمایید. <http://www.coderz.ir/python-tutorial-re-regex/>`_
+`لطفا دیدگاه و سوال‌های مرتبط با این درس خود را در کدرز مطرح نمایید. <http://www.coderz.ir/python-tutorial-re-regex-2/>`_