# Expressões Regulares

Uma expressão regular é uma `string` especial que pode ser utilizada para validar outra `string`.

São muito usadas para validar a entradas de dados em sistemas ou validar valores em um banco de dados.

Por exemplo, como verificar que a string pedida por uma função é realmente um número de telefone no formato `+"numero do país" (ddd) (4 primeiros dígitos do numero de telefone)-(restante dos números)`, i.e. `+55 (85) 98765-4321`.


In [None]:
# Validando o telefone sem usar expressão regular.

def éDigito(caractere):
    digitos = "0123456789"
    if caractere in digitos:
        return True
    else:
        return False


def éTelefone(numero: str):
    # +dd (dd) ddddd-dddd

    if not len(numero) == 19:
        return False
    if not numero.startswith("+"):
        return False
    if not (éDigito(numero[1]) and éDigito(numero[2]) and éDigito(numero[4]) and éDigito(numero[5])):
        return False
    if not (numero[3] == " " and numero[5] == " "):
        return False

# DEUS ME LIVRE CONTINUAR ISSO!


## Usando o pacote de expressões regulares

O módulo `re` [Regular expression operations](https://docs.python.org/3/library/re.html) ajuda a resolver esse tipo de problema por meio de expressões regulares.


In [None]:
# Validando um telefone usando expressões regulares

import re


def éTelefone(entrada: str):
    # O prefixo r evita que a string seja interpretada e os caracteres especiais convertidos pelo interpretador.
    padrão = re.compile(r'\+\d{2} \(\d{2}\) \d{5}-\d{4}')
    resposta = padrão.fullmatch(entrada)
    if resposta:
        return True
    return False


print("Teste:", éTelefone("Teste"))
print("123456:", éTelefone("123456"))
print("+55 (85) 9876-:", éTelefone("+55 (85) 9876-"))
print("+55 (85) 9876-54321:", éTelefone("+55 (85) 98765-4321"))


In [None]:
# Validando email

import re


def éEmail(entrada: str):
    if re.fullmatch(r"[A-Za-z0-9_+.]+@[A-Za-z0-9]+\.[A-Za-z0-9.]+", entrada):
        return True
    else:
        return False


def éEmailv2(entrada: str):
    if re.fullmatch(r"[A-Za-z0-9_+.]+@[A-Za-z0-9]+(\.[A-Za-z0-9]+)+", entrada):
        return True
    else:
        return False


print(éEmail("ronan.soares@ufc.br"))
print(éEmail("batman@batcaverna.com"))
print(éEmail("robin+aqui@teste...com"))  # Bug... como resolver!?
print(éEmailv2("robin+aqui@teste...com"))  # Resolve com a versão 2.


## Métodos de busca de um padrão

Temos alguns métodos de busca usando expressões regulares.


In [None]:
# Métodos de Busca de padrões
import re

padrão = re.compile(r'cachorro')

print("Search:", padrão.search("Tem cachorro em algum lugar dessa frase?"))
print("match 1:", padrão.match(
    "Talvez tenha cachorro, mas match só procura no começo da string."))
print("match 2:", padrão.match("cachorro, viu!?"))
print("match 3:", padrão.match(
    "Talvez tenha cachorro, mais na frente...", len("Talvez tenha ")))
print("fullmatch:", padrão.fullmatch(
    "Aqui tem que ter exclusivamente só cachorro escrito."))


## Padrões importantes


### Agrupamentos com parênteses


### Pelo menos um `+`


### Um ou zero `?`


### Zero ou mais `*`


### Entre mínimo e máximo `{min, max}`


### Procura "avarenta" ou procura "preguiçosa"

Avarenta: `{3,5}` vai tentar pegar o máximo.
Preguiçosa: `{3,5}` vai tentar pegar o mínimo.
