# Criando Objetos Regex

Todas as funções _regex_ em Python estão no módulo `re`. Entre os seguintes código para importar este módulo

In [13]:
import re

Passar um valor de string representando uma expressão regular para `re.compile()` retorna um objeto padrão de _regex_ (ou simplismente, um objeto _regex_).

In [14]:
phoneNumRegex = re.compile(r'\d\d \d\d\d\d-\d\d\d\d')

Desde que expressões regulares frequentemente usam contra-barra, é muito conveniente passar uma string bruta para a função `re.compile()` ao invés de escrever contra-barras extras.

# Combinando Objetos Regex

In [15]:
mo = phoneNumRegex.search('Meu número de telefone é 13 8804-7676.')
print(f'Número de telefone encontrado: {mo.group()}')

Número de telefone encontrado: 13 8804-7676


# Agrupamento com Parenteses

Adicionando parentes na _regex_ criará grupos. Então vocPe pode usar o método `group()` do objeto _macth_ para pegar os textos compatives com apenas um grupo.

In [18]:
phoneNumRegex = re.compile(r'(\d\d) (\d\d\d\d-\d\d\d\d)')
mo = phoneNumRegex.search('Meu número de telefone é 13 8804-7676.')
print(mo.group(1))
print(mo.group(2))
print(mo.group(0))
print(mo.group())

13
8804-7676
13 8804-7676
13 8804-7676


Se você quiser recuperar todos os grupos de uma vez, use o método `groups()` - note a forma plural para o nome.

In [19]:
mo.groups()

('13', '8804-7676')

In [20]:
codigoArea, numeroPrincipal = mo.groups()
print(codigoArea)
print(numeroPrincipal)

13
8804-7676


Parenteses tem um significado especial em expressões regulares, mas o que você faz se você precisa encontrar a correspondência de um parenteses em seu texto? Por exemplo, pode ser que os telefones que você está tentando encontrar tenham o código de área entre parenteses. Nesse caso vocPe pode escabar o ( e ) com uma contra-barra.

In [21]:
phoneNumRegex = re.compile(r'\((\d\d)\) (\d\d\d\d-\d\d\d\d)')
mo = phoneNumRegex.search('Meu número de telefone é (13) 8804-7676.')
print(mo.group(1))
print(mo.group(2))

13
8804-7676


# Correspondendo multiplos grupos com o Pipe

O caracter | é chamado de _pipe_. Voce pode usa-lo em qualquer lugar que você quer encontrar a correspondência de uma ou mais expressões. Por exemplo, a expressão regular r'Batman|Tinha Frey' correspoderá a ambos 'Batman' ou 'Tina Frey'.

In [22]:
heroRegex = re.compile(r'Batman|Tina Frey')
mo1 = heroRegex.search('Batman e Tina Frey')
mo1.group()

'Batman'

In [23]:
mo2 = heroRegex.search('Tina Frey e Batman')
mo2.group()

'Tina Frey'

## Nota

Você pode encontrar todas as correspodências com o método `findall()`

In [24]:
heroRegex.findall('Batman e Tina Frey')

['Batman', 'Tina Frey']