Skip to content

Commit 0d6ca23

Browse files
committed
renovations
1 parent 36b0b5b commit 0d6ca23

8 files changed

Lines changed: 112 additions & 6 deletions

File tree

Lines changed: 36 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,36 @@
1+
Сначала неправильный способ.
2+
3+
Если перечислить языки один за другим через `|`, то получится совсем не то:
4+
5+
```js
6+
//+ run
7+
var reg = /Java|JavaScript|PHP|C|C\+\+/g;
8+
9+
var str = "Java, JavaScript, PHP, C, C++";
10+
11+
alert( str.match(reg) ); // Java,Java,PHP,C,C
12+
```
13+
14+
Как видно, движок регулярных выражений ищет альтернации в порядке их перечисления. То есть, он сначала смотрит, есть ли <code class="match">Java</code>, а если нет -- ищет <code class="match">JavaScript</code>.
15+
16+
Естественно, при этом <code class="match">JavaScript</code> не будет найдено никогда.
17+
18+
То же самое -- с <code class="match">C</code> и <code class="match">C++</code>.
19+
20+
Есть два решения проблемы:
21+
22+
<ol>
23+
<li>Поменять порядок, чтобы более длинное совпадение проверялось первым: <code class="pattern">JavaScript|Java|C\+\+|C|PHP</code>.</li>
24+
<li>Соединить длинный вариант с коротким: <code class="pattern">Java(Script)?|C(\+\+)?|PHP</code>.</li>
25+
</ol>
26+
27+
В действии:
28+
29+
```js
30+
//+ run
31+
var reg = /Java(Script)?|C(\+\+)?|PHP/g;
32+
33+
var str = "Java, JavaScript, PHP, C, C++";
34+
35+
alert( str.match(reg) ); // Java,JavaScript,PHP,C,C++
36+
```
Lines changed: 6 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,6 @@
1+
# Найдите языки программирования
2+
3+
Существует много языков программирования, например Java, JavaScript, PHP, C, C++.
4+
5+
Напишите регулярное выражение, которое найдёт их все в строке "Java JavaScript PHP C++ C"
6+
Lines changed: 19 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,19 @@
1+
Решение задачи: <code class="pattern">/"(\\.|[^"\\])*"/g</code>.
2+
3+
То есть:
4+
<ul>
5+
<li>Сначала ищем кавычку <code class="pattern">"</code></li>
6+
<li>Затем, если далее слэш <code class="pattern">\\</code> (удвоение слэша -- техническое, для вставки в регэксп, на самом деле там один слэш), то после него также подойдёт любой символ (точка).</li>
7+
<li>Если не слэш, то берём любой символ, кроме кавычек (которые будут означать конец строки) и слэша (чтобы предотвратить одинокие слэши, сам по себе единственный слэш не нужен, он должен экранировать какой-то символ) <code class="pattern">[^"\\]</code></li>
8+
<li>...И так жадно, до закрывающей кавычки.</li>
9+
</ul>
10+
11+
В действии:
12+
13+
```js
14+
//+ run
15+
var re = /"(\\.|[^"\\])*"/g;
16+
var str = '.. "test me" .. "Скажи \\"Привет\\"!" .. "\\r\\n" ..';
17+
18+
alert( str.match(re) ); // "test me","Скажи \"Привет\"!","\r\n"
19+
```
Lines changed: 27 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,27 @@
1+
# Найдите строки в кавычках
2+
3+
Найдите при помощи регэкспа строки в двойных кавычках <code class="subject">"..."</code>.
4+
5+
В строке *могут* быть любые символы, включая вложенные кавычки, заэкранированные слэшем, то есть: <code class="subject">\"</code>, <code class="subject">\n</code>. Слэш удваивается, чтобы вставить его как символ: <code class="subject">\\</code>.
6+
7+
Иначе говоря, синтаксис строки -- примерно соответствует используемому в JavaScript. Нужно такие строки найти.
8+
9+
Пример совпадающих строк:
10+
```js
11+
var str = ' .. *!*"test me"*/!* .. ';
12+
13+
var str = ' .. *!*"Скажи \\"Привет\\"!"*/!* ... ';
14+
15+
var str = ' .. *!*"\\r\\n"*/!* .. ';
16+
```
17+
18+
Слэши в этих строках удвоены по технической причине -- в JavaScript кавычки `'...'` считают слэш специальным символом и требуют его экранировать.
19+
20+
Так что на самом деле, к примеру, в такой строке одинарные слэши:
21+
```js
22+
//+ run
23+
var str = ' .. *!*"Скажи \\"Привет\\"!"*/!* ... ';
24+
25+
alert(str); // .. "Скажи \"Привет\" ...
26+
```
27+

11-regular-expressions-javascript/3-regexp-character-classes/article.md

Lines changed: 3 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -41,9 +41,9 @@ alert( str.match(reg) ); // массив всех совпадений: 7,9,0,3,
4141

4242
Наиболее часто используются:
4343
<dl>
44-
<dt>`\d` (от английского "digit" - "цифра")</dt>
44+
<dt>`\d` (от английского "digit" -- "цифра")</dt>
4545
<dd>Цифра, символ от `0` до `9`.</dd>
46-
<dt>`\s` (от английского "space" - "пробел")</dt>
46+
<dt>`\s` (от английского "space" -- "пробел")</dt>
4747
<dd>Пробельный символ, включая табы, переводы строки и т.п.</dd>
4848
<dt>`\w` (от английского "word" -- "слово") </dt>
4949
<dd>Символ "слова", а точнее -- буква латинского алфавита или цифра или подчёркивание `'_'`. Не-английские буквы не являются `\w`, то есть русская буква не подходит.</dd>
@@ -142,7 +142,7 @@ alert( str.replace(/\D/g, "") ); // 79031234567
142142

143143
## Пробелы -- обычные символы
144144

145-
Заметим, что в регулярных выражениях пробел - такой же символ, как и другие.
145+
Заметим, что в регулярных выражениях пробел -- такой же символ, как и другие.
146146

147147
Обычно мы не обращаем внимание на пробелы. Для нашего взгляда строки <code class="subject">1-5</code> и <code class="subject">1 - 5</code> почти идентичны.
148148

11-regular-expressions-javascript/7-regexp-quantifiers/2-find-html-colors-6hex/solution.md

Lines changed: 10 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -22,4 +22,13 @@ alert( str.match(re) ); // #121212,#AA00ef
2222
alert( "#12345678".match( /#[a-f0-9]{6}/gi ) ) // #12345678
2323
```
2424

25-
Если это является проблемой, то ее можно решить чуть более сложным выражением.
25+
Чтобы такого не было, можно добавить в конец `\b`:
26+
27+
```js
28+
//+ run
29+
// цвет
30+
alert( "#123456".match( /#[a-f0-9]{6}\b/gi ) ); // #123456
31+
32+
// не цвет
33+
alert( "#12345678".match( /#[a-f0-9]{6}\b/gi ) ); // null
34+
```

11-regular-expressions-javascript/9-regexp-groups/1-find-webcolor-3-or-6/solution.md

Lines changed: 10 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
Регулярное выражение для поиска 3-значного цвета: <code class="pattern">/#[a-f0-9]{3}/i</code>.
1+
Регулярное выражение для поиска 3-значного цвета вида `#abc`: <code class="pattern">/#[a-f0-9]{3}/i</code>.
22

33
Нужно добавить ещё три символа, причём нужны именно три, четыре или семь символов не нужны. Эти три символа либо есть, либо нет.
44

@@ -18,4 +18,13 @@ var str = "color: #3f3; background-color: #AA00ef; and: #abcd";
1818
alert( str.match(re) ); // #3f3 #AA0ef #abc
1919
```
2020

21+
В последнем выражении <code class="subject">#abcd</code> было найдено совпадение <code class="match">#abc</code>. Чтобы этого не происходило, добавим в конец <code class="pattern">\b</code>:
2122

23+
```js
24+
//+ run
25+
var re = /#([a-f0-9]{3}){1,2}\b/gi;
26+
27+
var str = "color: #3f3; background-color: #AA00ef; and: #abcd";
28+
29+
alert( str.match(re) ); // #3f3 #AA0ef
30+
```

11-regular-expressions-javascript/9-regexp-groups/1-find-webcolor-3-or-6/task.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -11,4 +11,4 @@ var str = "color: #3f3; background-color: #AA00ef; and: #abcd";
1111
alert( str.match(re) ); // #3f3 #AA0ef
1212
```
1313

14-
P.S. Значения из четырёх и более букв, такие как `#abcd` мы в этой задаче также учитываем, но берём из них только необходимые для совпадения символы, то есть `#abc`.
14+
P.S. Значения из любого другого количества букв, кроме 3 и 6, такие как `#abcd`, не должны подходить под регэксп.

0 commit comments

Comments
 (0)