# Express√µes Regulares em Python

Este notebook demonstra como utilizar express√µes regulares (regex) em Python utilizando o m√≥dulo `re`.

## O que s√£o express√µes regulares?
Express√µes regulares s√£o padr√µes utilizados para **buscar, extrair e manipular** strings de maneira eficiente.


In [None]:
import re

## M√©todos Principais do M√≥dulo `re`

| M√©todo       | Descri√ß√£o |
|-------------|-----------|
| `re.search()` | Procura pelo padr√£o dentro da string e retorna a **primeira ocorr√™ncia**. |
| `re.findall()` | Retorna **todas as ocorr√™ncias** do padr√£o dentro da string. |
| `re.match()` | Verifica se a string **come√ßa** com o padr√£o. |
| `re.sub()` | Substitui partes da string que correspondem ao padr√£o. |

Vamos explorar cada um deles com exemplos pr√°ticos! üöÄ

In [None]:
# Exemplo 1: Usando `re.search()` para encontrar um e-mail em um texto
txt = "Meu e-mail √© exemplo@email.com, entre em contato!"
padrao = r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}"

match = re.search(padrao, txt)
if match:
    print("E-mail encontrado:", match.group())
else:
    print("Nenhum e-mail encontrado.")

## Encontrando todas as ocorr√™ncias com `re.findall()`

Vamos buscar **todas** as palavras que come√ßam com letra mai√∫scula.

In [3]:
texto = "Maria foi √† feira com Jo√£o e Pedro."
padrao = r"\\b[A-Z][a-z]+\\b"

nomes = re.findall(padrao, texto)
print("Nomes encontrados:", nomes)

## Verificando correspond√™ncias no in√≠cio da string com `re.match()`

Aqui, verificamos se um texto **come√ßa com uma data no formato DD/MM/AAAA**.

In [4]:
texto = "12/05/2023 √© a data do evento."
padrao = r"\\d{2}/\\d{2}/\\d{4}"

if re.match(padrao, texto):
    print("O texto come√ßa com uma data!")
else:
    print("O texto N√ÉO come√ßa com uma data!")

## Substituindo textos com `re.sub()`

Aqui, substitu√≠mos n√∫meros de telefone por `***-****` para ocult√°-los.

In [5]:
texto = "Meu n√∫mero √© 1234-5678, me ligue!"
padrao = r"\\d{4}-\\d{4}"
novo_texto = re.sub(padrao, "****-****", texto)

print("Texto anonimizado:", novo_texto)

## Caracteres Especiais e suas Fun√ß√µes

Aqui est√£o alguns **caracteres especiais** comuns em express√µes regulares e suas fun√ß√µes:

| S√≠mbolo  | Fun√ß√£o |
|----------|--------|
| `.` | Representa **qualquer caractere**, exceto nova linha. |
| `^` | Indica **in√≠cio da string**. |
| `$` | Indica **final da string**. |
| `\d` | Representa **qualquer d√≠gito** (0-9). |
| `\D` | Representa **qualquer caractere que n√£o seja um d√≠gito**. |
| `\w` | Representa **qualquer caractere alfanum√©rico** (letras, n√∫meros e `_`). |
| `\W` | Representa **qualquer caractere n√£o alfanum√©rico**. |
| `\s` | Representa **qualquer espa√ßo em branco** (espa√ßo, tabula√ß√£o, nova linha). |
| `\S` | Representa **qualquer caractere que n√£o seja um espa√ßo em branco**. |
| `*` | Casa **zero ou mais** ocorr√™ncias do padr√£o anterior. |
| `+` | Casa **uma ou mais** ocorr√™ncias do padr√£o anterior. |
| `?` | Casa **zero ou uma** ocorr√™ncia do padr√£o anterior. |
| `{n,m}` | Casa **entre `n` e `m`** ocorr√™ncias do padr√£o anterior. |

# Exemplos

## Exemplo: Encontrando palavras com pelo menos 5 letras

In [None]:
texto = "O carro √© veloz e eficiente."
padrao = r"\b\w{5,}\b"

palavras = re.findall(padrao, texto)
print("Palavras com 5 ou mais letras:", palavras)

## Exemplo: Extra√ß√£o de URLs

In [None]:
texto = "Acesse nosso site em https://www.exemplo.com ou veja https://docs.python.org."
padrao = r"https?://[a-zA-Z0-9./-]+"
urls = re.findall(padrao, texto)
print("URLs encontradas:", urls)

## Exemplo: Divis√£o de texto por m√∫ltiplos separadores

In [None]:
texto = "banana, ma√ß√£; laranja - morango"
padrao = r"[,; -]+"
frutas = re.split(padrao, texto)
print("Lista de frutas:", frutas)

## Exemplo: Valida√ß√£o de E-mails

In [None]:
def validar_email(email):
    padrao = r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"
    return bool(re.match(padrao, email))

emails = ["usuario@email.com", "email.invalido@", "outro.email@dominio.net"]
for email in emails:
    print(f"{email}: {'V√°lido' if validar_email(email) else 'Inv√°lido'}")

## Exemplo: Extra√ß√£o de Telefones

In [None]:
texto = "Me ligue no n√∫mero (11) 98765-4321 ou (21) 91234-5678."
padrao = r"\(\d{2}\) \d{4,5}-\d{4}"
telefones = re.findall(padrao, texto)
print("Telefones encontrados:", telefones)

## Exemplo: Anonimiza√ß√£o de CPF

In [None]:

texto = "O CPF do cliente √© 123.456.789-00."
padrao = r"\d{3}\.\d{3}\.\d{3}-\d{2}"
texto_anonimizado = re.sub(padrao, "XXX.XXX.XXX-XX", texto)
print("Texto anonimizado:", texto_anonimizado)

# Conclus√£o üìå

Express√µes regulares s√£o ferramentas poderosas para manipula√ß√£o de strings! Com `re.search()`, `re.findall()`, `re.match()` e `re.sub()`, conseguimos:
- ‚úÖ Encontrar padr√µes;
- ‚úÖ Extrair informa√ß√µes;
- ‚úÖ Substituir textos de maneira eficiente.