Permalink
Switch branches/tags
Nothing to show
Find file Copy path
Fetching contributors…
Cannot retrieve contributors at this time
62 lines (35 sloc) 4.16 KB

Обратные ссылки: \n и $n

Скобочные группы можно не только получать в результате.

Движок регулярных выражений запоминает их содержимое, и затем его можно использовать как в самом паттерне, так и в строке замены.

Группа в строке замены

Ссылки в строке замены имеют вид $n, где n -- это номер скобочной группы.

Вместо $n подставляется содержимое соответствующей скобки:

var name = "Александр Пушкин";

name = name.replace(/([а-яё]+) ([а-яё]+)/i, *!*"$2, $1"*/!*);
alert( name ); // Пушкин, Александр

В примере выше вместо pattern:$2 подставляется второе найденное слово, а вместо pattern:$1 -- первое.

Группа в шаблоне

Выше был пример использования содержимого групп в строке замены. Это удобно, когда нужно реорганизовать содержимое или создать новое с использованием старого.

Но к скобочной группе можно также обратиться в самом поисковом шаблоне, ссылкой вида \номер.

Чтобы было яснее, рассмотрим это на реальной задаче -- необходимо найти в тексте строку в кавычках. Причём кавычки могут быть одинарными subject:'...' или двойными subject:"..." -- и то и другое должно искаться корректно.

Как такие строки искать?

Можно в регэкспе предусмотреть произвольные кавычки: pattern:['"](.*?)['"]. Такой регэксп найдёт строки вида match:"...", match:'...', но он даст неверный ответ в случае, если одна кавычка ненароком оказалась внутри другой, как например в строке subject:"She's the one!":

var str = "He said: \"She's the one!\".";

var reg = /['"](.*?)['"]/g;

// Результат не соответствует замыслу
alert( str.match(reg) ); // "She'

Как видно, регэксп нашёл открывающую кавычку match:", затем текст, вплоть до новой кавычки match:', которая закрывает соответствие.

Для того, чтобы попросить регэксп искать закрывающую кавычку -- такую же, как открывающую, мы обернём её в скобочную группу и используем обратную ссылку на неё:

var str = "He said: \"She's the one!\".";

var reg = /(['"])(.*?)\1/g;

alert( str.match(reg) ); // "She's the one!"

Теперь работает верно! Движок регулярных выражений, найдя первое скобочное выражение -- кавычку pattern:(['"]), запоминает его и далее pattern:\1 означает "найти то же самое, что в первой скобочной группе".

Обратим внимание на два нюанса:

  • Чтобы использовать скобочную группу в строке замены -- нужно использовать ссылку вида $1, а в шаблоне -- обратный слэш: \1.
  • Чтобы в принципе иметь возможность обратиться к скобочной группе -- не важно откуда, она не должна быть исключена из запоминаемых при помощи ?:. Скобочные группы вида (?:...) не участвуют в нумерации.