# Expressões Regulares em Python


Expressões Regulares: Uma Ferramenta Poderosa para Manipulação de Texto
As expressões regulares (ou "regex", "regexp") são uma linguagem em miniatura, uma sequência de caracteres que define um padrão de busca. Elas são incrivelmente eficazes para encontrar, substituir e extrair informações em strings de texto complexas. Em Python, o módulo re é a biblioteca padrão para trabalhar com elas.

O módulo re fornece funções para aplicar padrões de expressões regulares a strings.

re.search(padrao, string)

Propósito: Procura pela primeira ocorrência do padrao dentro da string.

Retorno: Se encontra uma correspondência, retorna um objeto match. Caso contrário, retorna None.

Métodos do Objeto match:

match.span(): Retorna uma tupla (início, fim) indicando os índices onde a correspondência começou e terminou (o índice fim é exclusivo).

match.group(): Retorna a parte da string que foi correspondida pelo padrão.

match.groups(): Retorna uma tupla de todas as substrings correspondidas pelos grupos de captura () no padrão.

# ### I. Funções Essenciais do Módulo `re`

# 1. re.search(padrao, string)
 Propósito: Procura pela **primeira ocorrência** do `padrao` dentro da `string`.
Retorno: Se encontra uma correspondência, retorna um **objeto `match`**. Caso contrário, retorna `None`.
Métodos do Objeto `match`:
  - `match.span()`: Retorna uma tupla `(início, fim)` indicando os índices onde a correspondência começou e terminou (o índice `fim` é exclusivo).
- `match.group()`: Retorna a parte da string que foi correspondida pelo padrão.
- `match.groups()`: Retorna uma tupla de todas as substrings correspondidas pelos grupos de captura `()` no padrão.
print("\n--- Função: re.search() ---")

In [3]:
print("\n--- Função: re.search() ---")
texto_search = '00123451'
padrao_search = '1'
info_search = re.search(padrao_search, texto_search)
if info_search: # É boa prática verificar se o objeto não é None
  print(f"  Exemplo: re.search('{padrao_search}', '{texto_search}')")
  print(f"    Encontrado ocorrência em {info_search.span()}")
  print(f"    O que foi encontrado: '{info_search.group()}'")
else:
  print(f"  Exemplo: re.search('{padrao_search}', '{texto_search}')")
  print("    Nenhuma correspondência encontrada.")


--- Função: re.search() ---
  Exemplo: re.search('1', '00123451')
    Encontrado ocorrência em (2, 3)
    O que foi encontrado: '1'


In [None]:
# 2. re.findall(padrao, string)
# Propósito: Encontra **todas as ocorrências não sobrepostas** do `padrao` na `string`.
# Retorno: Uma **lista de strings** contendo todas as correspondências. Se não houver correspondências, retorna uma lista vazia `[]`.
# Com Grupos de Captura: Se o padrão contiver grupos de captura `()`, `findall` retornará uma lista de tuplas (onde cada tupla contém as strings capturadas pelos grupos).

In [4]:
print("\n--- Função: re.findall() ---")
texto_findall = '00123451'
padrao_findall = '1'
info_findall = re.findall(padrao_findall, texto_findall)
print(f"  Exemplo: re.findall('{padrao_findall}', '{texto_findall}')")
print(f"    Resultados: {info_findall}")


--- Função: re.findall() ---
  Exemplo: re.findall('1', '00123451')
    Resultados: ['1', '1']


In [None]:
# 3. re.split(padrao, string, maxsplit=0)
# Propósito: Divide a `string` pelas ocorrências do `padrao`. O `padrao` em si não é incluído na lista resultante.
# Retorno: Uma **lista de strings** resultantes da divisão.
# `maxsplit`: (Opcional) O número máximo de divisões a serem feitas.

In [5]:
print("\n--- Função: re.split() ---")
texto_split = '001234510'
padrao_split = "1"
info_split = re.split(padrao_split, texto_split)
print(f"  Exemplo: re.split('{padrao_split}', '{texto_split}')")
print(f"    Resultados da divisão: {info_split}")


--- Função: re.split() ---
  Exemplo: re.split('1', '001234510')
    Resultados da divisão: ['00', '2345', '0']


In [None]:
# 4. re.sub(padrao, substituicao, string, count=0)
# Propósito: Substitui todas as ocorrências do `padrao` na `string` pela `substituicao` especificada.
# Retorno: A nova string com as substituições feitas.
# `count`: (Opcional) O número máximo de substituições a serem feitas.

In [6]:
print("\n--- Função: re.sub() ---")
texto_sub = '001234510'
padrao_sub = "1"
substituicao_sub = "#"
info_sub = re.sub(padrao_sub, substituicao_sub, texto_sub)
print(f"  Exemplo: re.sub('{padrao_sub}', '{substituicao_sub}', '{texto_sub}')")
print(f"    String após substituição: '{info_sub}'")


--- Função: re.sub() ---
  Exemplo: re.sub('1', '#', '001234510')
    String após substituição: '00#2345#0'


# II. Metacaracteres Essenciais: Os Blocos de Construção dos Padrões

Os metacaracteres dão poder e flexibilidade às expressões regulares, permitindo ir além da busca por strings literais.


Ponto (.) - O Coringa de um CaractereSignificado: Corresponde a **qualquer caractere individual**, **EXCETO** o caractere de quebra de linha (`\n`).Pense nele como um "espaço em branco" que pode ser preenchido por qualquer letra, número, símbolo, etc., mas que representa apenas **uma posição**.

In [8]:
### 1. Ponto (.) - O Coringa de um Caractere###
print("\n\n--- Metacaractere: Ponto (.) ---")
texto_ponto_ex1 = 'cat, cot, cAt, c0t, c t'
padrao_ponto_ex1 = r"c.t"
encontrados_ponto_ex1 = re.findall(padrao_ponto_ex1, texto_ponto_ex1)
print(f"  Exemplo: r'c.t' em '{texto_ponto_ex1}'")
print(f"    Resultados: {encontrados_ponto_ex1}")



--- Metacaractere: Ponto (.) ---
  Exemplo: r'c.t' em 'cat, cot, cAt, c0t, c t'
    Resultados: ['cat', 'cot', 'cAt', 'c0t', 'c t']


In [13]:
texto_ponto_ex2 = 'Olá sou eu, AQUI, e nada para frente'
# Padrão: qualquer coisa (.*), seguido de "AQUI", seguido de qualquer coisa (.*)
texto_ponto_ex2 = 'Olá sou eu, AQUI, e nada para frente'
# Padrão: qualquer coisa (.*), seguido de "AQUI", seguido de qualquer coisa (.*)
padrao_ponto_ex2 = r'(.*)(AQUI)(.*)' # Use 'r' para raw string, evita problemas com \
info_ponto_ex2 = re.search(padrao_ponto_ex2, texto_ponto_ex2)
if info_ponto_ex2:
  print(f"  Exemplo: r'(.*)(AQUI)(.*)' em '{texto_ponto_ex2}'")
  print(f"    Correspondência completa: '{info_ponto_ex2.group()}'")

  Exemplo: r'(.*)(AQUI)(.*)' em 'Olá sou eu, AQUI, e nada para frente'
    Correspondência completa: 'Olá sou eu, AQUI, e nada para frente'


2. Conjuntos de Caracteres ([]) - Listas de Opções
 Significado: Corresponde a **qualquer um dos caracteres listados** dentro dos colchetes.
 Intervalos: O hífen `-` dentro dos colchetes cria um intervalo (ex: `A-Z`, `0-9`).
Negação (`^` dentro de `[]`): Se `^` for o *primeiro* caractere dentro dos colchetes, ele nega o conjunto, correspondendo a **qualquer caractere EXCETO** os listados.


In [14]:
print("\n--- Metacaractere: Conjuntos de Caracteres ([]) ---")
texto_conjunto = 'ABCDefgHI123'
info_conjunto1 = re.findall('[Ae3]', texto_conjunto)
info_conjunto2 = re.findall('[0-9]', texto_conjunto)
info_conjunto3 = re.findall('[^a-z]', texto_conjunto) # Qualquer coisa que não seja letra minúscula
print(f"  Exemplo: em '{texto_conjunto}'")
print(f"    '[Ae3]': {info_conjunto1}")
print(f"    '[0-9]': {info_conjunto2}")
print(f"    '[^a-z]': {info_conjunto3} (pega maiúsculas, números, símbolos, espaços)")



--- Metacaractere: Conjuntos de Caracteres ([]) ---
  Exemplo: em 'ABCDefgHI123'
    '[Ae3]': ['A', 'e', '3']
    '[0-9]': ['1', '2', '3']
    '[^a-z]': ['A', 'B', 'C', 'D', 'H', 'I', '1', '2', '3'] (pega maiúsculas, números, símbolos, espaços)


3. Alternância (|) - O Operador "OU"
Significado: Atua como um operador "OU" lógico. Corresponde ao padrão à esquerda **OU** ao padrão à direita do `|`.
Importante: Ele tenta casar a opção da esquerda primeiro. Se ela corresponder, ele para de tentar outras opções para aquela busca.
Uso de `()`: Essenciais para agrupar as opções do `|`.

In [16]:
print("\n--- Metacaractere: Alternância (|) ---")
texto_alternancia = 'Eu vi um cachorro e um gato no parque.'
info_alternancia = re.findall('cachorro|gato', texto_alternancia)
print(f"  Exemplo: 'cachorro|gato' em '{texto_alternancia}'")
print(f"    Resultados: {info_alternancia}")

texto_alternancia2 = 'Eu moro na rua principal.'
padrao_alternancia2 = r'(rua|avenida) principal'
info_alternancia2 = re.search(padrao_alternancia2, texto_alternancia2)
if info_alternancia2:
    print(f"  Exemplo: r'(rua|avenida) principal' em '{texto_alternancia2}'")
    print(f"    Encontrado: '{info_alternancia2.group()}'")



--- Metacaractere: Alternância (|) ---
  Exemplo: 'cachorro|gato' em 'Eu vi um cachorro e um gato no parque.'
    Resultados: ['cachorro', 'gato']
  Exemplo: r'(rua|avenida) principal' em 'Eu moro na rua principal.'
    Encontrado: 'rua principal'


In [None]:
4. Agrupamento (()) - Organizando Padrões e Capturando
Propósito:
- Agrupar itens: Permite que você aplique quantificadores a uma sequência de caracteres (ex: `(ab)+`).
- Capturar partes: As substrings que correspondem ao que está dentro dos parênteses podem ser extraídas separadamente usando `match.group(numero_do_grupo)`.
- Alternância: Essencial para definir o escopo do operador `|` (ex: `(maçã|pera) verde`).
Grupos Não-Capturantes (`?:`): `(?:padrao)` agrupa sem capturar, útil quando você só quer agrupar para aplicar um quantificador sem criar um grupo extra para extração.

In [17]:
print("\n--- Metacaractere: Agrupamento (()) ---")
texto_agrupamento = 'abcabcabc'
padrao_agrupamento = r'(abc)+' # Grupo 'abc' que se repete uma ou mais vezes
info_agrupamento = re.search(padrao_agrupamento, texto_agrupamento)
if info_agrupamento:
    print(f"  Exemplo: r'(abc)+' em '{texto_agrupamento}'")
    print(f"    Correspondência: '{info_agrupamento.group()}'")
    print(f"    Grupo 1 (o que 'abc' pegou): '{info_agrupamento.group(1)}'")

texto_agrupamento2 = 'maçã verde ou pera verde'
padrao_agrupamento2 = r'(maçã|pera) verde'
info_agrupamento2 = re.search(padrao_agrupamento2, texto_agrupamento2)
if info_agrupamento2:
    print(f"  Exemplo: r'(maçã|pera) verde' em '{texto_agrupamento2}'")
    print(f"    Correspondência: '{info_agrupamento2.group()}'")
    print(f"    Fruta encontrada (Grupo 1): '{info_agrupamento2.group(1)}'")



--- Metacaractere: Agrupamento (()) ---
  Exemplo: r'(abc)+' em 'abcabcabc'
    Correspondência: 'abcabcabc'
    Grupo 1 (o que 'abc' pegou): 'abc'
  Exemplo: r'(maçã|pera) verde' em 'maçã verde ou pera verde'
    Correspondência: 'maçã verde'
    Fruta encontrada (Grupo 1): 'maçã'


# III. Metacaracteres de Posição (Âncoras)

Esses metacaracteres "ancoram" a correspondência a pontos específicos da string.


1. Início da String/Linha (^)
# Significado: Corresponde ao **início da string** que está sendo pesquisada. Se o modo `re.M` (multilinha) for ativado, ele também corresponde ao início de cada linha após um `\n`.

In [19]:

print("\n\n--- Âncora: Início da String/Linha (^) ---")
texto_ancora_inicio = 'existem 64 predios com 700 metros'
padrao_ancora_inicio = r"^existem"
info_ancora_inicio = re.search(padrao_ancora_inicio, texto_ancora_inicio)
if info_ancora_inicio:
  print(f"  Exemplo: r'^existem' em '{texto_ancora_inicio}'")
  print(f"    Encontrado no início: '{info_ancora_inicio.group()}'")
else:
  print(f"  Exemplo: r'^existem' em '{texto_ancora_inicio}'")
  print("    Não encontrado no início.")




--- Âncora: Início da String/Linha (^) ---
  Exemplo: r'^existem' em 'existem 64 predios com 700 metros'
    Encontrado no início: 'existem'


2. Fim da String/Linha ($)
Significado: Corresponde ao **fim da string** que está sendo pesquisada. Se o modo `re.M` (multilinha) for ativado, ele também corresponde ao fim de cada linha antes de um `\n`.

In [20]:
print("\n--- Âncora: Fim da String/Linha ($) ---")
texto_ancora_fim = 'existem 64 predios com 700 metros'
padrao_ancora_fim = r"metros$"
info_ancora_fim = re.search(padrao_ancora_fim, texto_ancora_fim)
if info_ancora_fim:
  print(f"  Exemplo: r'metros$' em '{texto_ancora_fim}'")
  print(f"    Encontrado no fim: '{info_ancora_fim.group()}'")
else:
  print(f"  Exemplo: r'metros$' em '{texto_ancora_fim}'")
  print("    Não encontrado no fim.")


--- Âncora: Fim da String/Linha ($) ---
  Exemplo: r'metros$' em 'existem 64 predios com 700 metros'
    Encontrado no fim: 'metros'


# IV. Quantificadores: Repetições de Padrões
 Os quantificadores controlam a **quantidade** de vezes que o caractere ou grupo **imediatamente anterior** a eles deve aparecer, sempre de forma **consecutiva**.


In [None]:
1. Um ou Mais (+)
Sintaxe: `elemento+`
Significado: O `elemento` deve aparecer **uma ou mais vezes**.

In [55]:
print("\n\n--- Quantificador: Um ou Mais (+) ---")
texto_quant_mais = 'abbabb'
padrao_quant_mais = r'(abb)+'
info_quant_mais = re.search(padrao_quant_mais, texto_quant_mais)
if info_quant_mais:
  print(f"  Exemplo: r'(abb)+' em '{texto_quant_mais}'")
  print(f"    Encontrado: '{info_quant_mais.group()}'")

texto_digitos = 'Telefone: 123456789'
padrao_digitos = r'\d+'
info_digitos = re.search(padrao_digitos, texto_digitos)
if info_digitos:
    print(f"  Exemplo: r'\\d+' em '{texto_digitos}'")
    print(f"    Encontrado: '{info_digitos.group()}'")




--- Quantificador: Um ou Mais (+) ---
  Exemplo: r'(abb)+' em 'abbabb'
    Encontrado: 'abbabb'
  Exemplo: r'\d+' em 'Telefone: 123456789'
    Encontrado: '123456789'


2. Zero ou Mais (*)
Sintaxe: `elemento*`
Significado: O `elemento` aparece zero ou mais vezes (é opcional e pode se repetir).
Uma correspondência pode ser encontrada mesmo que o elemento não esteja presente.

In [23]:
print("\n--- Quantificador: Zero ou Mais (*) ---")
texto_quant_estrela = 'abc'
padrao_quant_estrela = r'(aa|bb)*' # Pegaria uma string vazia no início se não houvesse 'aa' ou 'bb'
info_quant_estrela = re.search(padrao_quant_estrela, texto_quant_estrela)
if info_quant_estrela:
  print(f"  Exemplo: r'(aa|bb)*' em '{texto_quant_estrela}' (início)")
  print(f"    Encontrado (pode ser vazio): '{info_quant_estrela.group()}' (string vazia)")



--- Quantificador: Zero ou Mais (*) ---
  Exemplo: r'(aa|bb)*' em 'abc' (início)
    Encontrado (pode ser vazio): '' (string vazia)


3. Zero ou Uma (Opcional) (?)
Sintaxe: `elemento?`
Significado: O `elemento` aparece zero ou uma vez (o torna opcional).

In [24]:
print("\n--- Quantificador: Zero ou Uma (?) ---")
texto_quant_opcional = 'colour'
padrao_quant_opcional = r'colou?r'
info_quant_opcional = re.search(padrao_quant_opcional, texto_quant_opcional)
print(f"  Exemplo: r'colou?r' em '{texto_quant_opcional}'")
if info_quant_opcional:
  print(f"    Encontrado: '{info_quant_opcional.group()}'")

texto_quant_opcional2 = 'color'
info_quant_opcional2 = re.search(padrao_quant_opcional, texto_quant_opcional2)
print(f"  Exemplo: r'colou?r' em '{texto_quant_opcional2}'")
if info_quant_opcional2:
  print(f"    Encontrado: '{info_quant_opcional2.group()}'")



--- Quantificador: Zero ou Uma (?) ---
  Exemplo: r'colou?r' em 'colour'
    Encontrado: 'colour'
  Exemplo: r'colou?r' em 'color'
    Encontrado: 'color'


In [None]:
4. Exatamente n Ocorrências ({n})
Sintaxe: `elemento{n}`
Significado: O `elemento` aparece exatamente 'n' vezes.

In [25]:
print("\n--- Quantificador: Exatamente n Ocorrências ({n}) ---")
texto_quant_n = 'aaab'
padrao_quant_n = r'a{3}' # 3 'a's consecutivos
info_quant_n = re.search(padrao_quant_n, texto_quant_n)
if info_quant_n:
  print(f"  Exemplo: r'a{{3}}' em '{texto_quant_n}'")
  print(f"    Encontrado: '{info_quant_n.group()}'")


--- Quantificador: Exatamente n Ocorrências ({n}) ---
  Exemplo: r'a{3}' em 'aaab'
    Encontrado: 'aaa'


In [None]:
5. No Mínimo n Ocorrências ({n,})
Sintaxe: `elemento{n,}`
Significado: O `elemento` aparece 'n' ou mais vezes.

In [26]:
print("\n--- Quantificador: No Mínimo n Ocorrências ({n,}) ---")
texto_quant_n_virgula = 'aaaaaa'
padrao_quant_n_virgula = r'a{4,}' # Quatro ou mais 'a's
info_quant_n_virgula = re.search(padrao_quant_n_virgula, texto_quant_n_virgula)
if info_quant_n_virgula:
  print(f"  Exemplo: r'a{{4,}}' em '{texto_quant_n_virgula}'")
  print(f"    Encontrado: '{info_quant_n_virgula.group()}'")


--- Quantificador: No Mínimo n Ocorrências ({n,}) ---
  Exemplo: r'a{4,}' em 'aaaaaa'
    Encontrado: 'aaaaaa'


6. Entre n e m Ocorrências ({n,m})
intaxe: `elemento{n,m}`
Significado: O `elemento` aparece entre 'n' e 'm' vezes, inclusive.


In [27]:
print("\n--- Quantificador: Entre n e m Ocorrências ({n,m}) ---")
texto_quant_n_m = 'aaaaaa'
padrao_quant_n_m = r'(aa){2,3}' # O grupo 'aa' aparece 2 ou 3 vezes
info_quant_n_m = re.search(padrao_quant_n_m, texto_quant_n_m)
if info_quant_n_m:
  print(f"  Exemplo: r'(aa){{2,3}}' em '{texto_quant_n_m}'")
  print(f"    Encontrado: '{info_quant_n_m.group()}'")


--- Quantificador: Entre n e m Ocorrências ({n,m}) ---
  Exemplo: r'(aa){2,3}' em 'aaaaaa'
    Encontrado: 'aaaaaa'


# V. Sequências Especiais (Metacaracteres Comuns)

1. Dígito (\d)
Significado: Corresponde a qualquer dígito decimal (0-9). Equivalente a `[0-9]`.



In [31]:
print("\n\n--- Sequência Especial: Dígito (\\d) ---")
texto_seq_d = 'Meu telefone é 12345-6789.'
padrao_seq_d = r'\d{5}' # Cinco dígitos consecutivos
info_seq_d = re.search(padrao_seq_d, texto_seq_d)
if info_seq_d:
  print(f"  Exemplo: r'\\d{{5}}' em '{texto_seq_d}'")
  print(f"    Encontrado: '{info_seq_d.group()}'")



--- Sequência Especial: Dígito (\d) ---
  Exemplo: r'\d{5}' em 'Meu telefone é 12345-6789.'
    Encontrado: '12345'


In [None]:
2. Não-Palavra (\W)
 Significado: Corresponde a qualquer caractere que NÃO seja uma letra (a-z, A-Z), um dígito (0-9) ou um sublinhado (`_`). Inclui espaços, pontuação, símbolos.

In [32]:
print("\n--- Sequência Especial: Não-Palavra (\\W) ---")
texto_seq_W = 'Olá, Mundo! 123_abc'
padrao_seq_W = r'\W+' # Um ou mais caracteres não-palavra
info_seq_W = re.findall(padrao_seq_W, texto_seq_W)
print(f"  Exemplo: r'\\W+' em '{texto_seq_W}'")
print(f"    Encontrado: {info_seq_W}")


--- Sequência Especial: Não-Palavra (\W) ---
  Exemplo: r'\W+' em 'Olá, Mundo! 123_abc'
    Encontrado: [', ', '! ']


# VI. Aplicações Práticas

In [37]:
# Validação de Temperatura: Valida se uma string é um valor de temperatura válido no formato "X C°", podendo ter sinal negativo.

In [33]:

# Padrão: `^(-)?[0-9]+ C°$`
# Valida se uma string representa uma temperatura, permitindo sinal negativo (`-?`), um ou mais dígitos (`[0-9]+`), seguido de espaço e "C°".
print("\n\n--- Aplicação Prática: Validação de Temperatura ---")
texto_temp1 = '25 C°'
texto_temp2 = '-10 C°'
texto_temp3 = 'abc C°'
padrao_temp = r'^(-)?[0-9]+ C°$'

print(f"  Padrão para Temperatura: r'^(-)?[0-9]+ C°$'")
if re.search(padrao_temp, texto_temp1): print(f"    '{texto_temp1}': Válido")
else: print(f"    '{texto_temp1}': Inválido")
if re.search(padrao_temp, texto_temp2): print(f"    '{texto_temp2}': Válido")
else: print(f"    '{texto_temp2}': Inválido")
if re.search(padrao_temp, texto_temp3): print(f"    '{texto_temp3}': Inválido")
else: print(f"    '{texto_temp3}': Inválido")




--- Aplicação Prática: Validação de Temperatura ---
  Padrão para Temperatura: r'^(-)?[0-9]+ C°$'
    '25 C°': Válido
    '-10 C°': Válido
    'abc C°': Inválido


 2. Exemplo de Validação de Número de Telefone (Fictício)
 Padrão: `^99([0-9]{6})$`
 Valida um número de 8 dígitos que começa com "99". `([0-9]{6})` captura os 6 dígitos restantes.

In [34]:
print("\n--- Aplicação Prática: Validação de Telefone Fictício ---")
texto_tel1 = '99123456'
texto_tel2 = '98765432'
texto_tel3 = '99123'
padrao_tel = r'^99([0-9]{6})$'

print(f"  Padrão para Telefone: r'^99([0-9]{{6}})$'")
if re.search(padrao_tel, texto_tel1): print(f"    '{texto_tel1}': Válido (começa com 99 e tem 8 dígitos)")
else: print(f"    '{texto_tel1}': Inválido")
if re.search(padrao_tel, texto_tel2): print(f"    '{texto_tel2}': Inválido (não começa com 99)")
else: print(f"    '{texto_tel2}': Inválido")
if re.search(padrao_tel, texto_tel3): print(f"    '{texto_tel3}': Inválido (não tem 8 dígitos)")
else: print(f"    '{texto_tel3}': Inválido")


--- Aplicação Prática: Validação de Telefone Fictício ---
  Padrão para Telefone: r'^99([0-9]{6})$'
    '99123456': Válido (começa com 99 e tem 8 dígitos)
    '98765432': Inválido
    '99123': Inválido


3. Exemplo de Detecção de Palavras no Gerúndio
Padrão: `r'([\w]+indo|ando|endo)'`
Encontra palavras que terminam em "ando", "endo" ou "indo".

In [35]:
print("\n--- Aplicação Prática: Detecção de Palavras no Gerúndio ---")
texto_gerundio = "Olá, eu estou dormindo, e não sorrindo ou cantando."
padrao_gerundio = r'([\w]+indo|ando|endo)'
encontrados_gerundio = re.findall(padrao_gerundio, texto_gerundio)
print(f"  Padrão para Gerúndio: r'([\\w]+indo|ando|endo)'")
print(f"  Texto: '{texto_gerundio}'")
print(f"  Palavras no gerúndio encontradas: {encontrados_gerundio}")



--- Aplicação Prática: Detecção de Palavras no Gerúndio ---
  Padrão para Gerúndio: r'([\w]+indo|ando|endo)'
  Texto: 'Olá, eu estou dormindo, e não sorrindo ou cantando.'
  Palavras no gerúndio encontradas: ['dormindo', 'sorrindo', 'ando']


# Exercícios de fixação

Exercício 1: Encontrando Números Simples (\d)
Objetivo: Encontrar todos os números de telefone de 4 dígitos em uma lista de strings.

In [42]:
print("--- Exercícios 1: Encontrando Números Simples ---")
textos_telefone =[
    "O número de contato é 1234.", 
    "ligue para 5678, ou 9012 para emergências.",
    "Meu celular é (11)98765-4321, mas o ramal é 5555.",
    "Sem números aqui."
]
padrao_ex1 = r'\d{4}'
print("\nResultados:")
for texto in textos_telefone:
    numeros_encontrados = re.findall(padrao_ex1, texto)
    if numeros_encontrados:
        print(f"No texto '{texto}': Números de 4 dígitos encontrados: {numeros_encontrados}")
    else: 
        print(f"No texto '{texto}': Nenhum número de 4 dígitos encontrado.")

--- Exercícios 1: Encontrando Números Simples ---

Resultados:
No texto 'O número de contato é 1234.': Números de 4 dígitos encontrados: ['1234']
No texto 'ligue para 5678, ou 9012 para emergências.': Números de 4 dígitos encontrados: ['5678', '9012']
No texto 'Meu celular é (11)98765-4321, mas o ramal é 5555.': Números de 4 dígitos encontrados: ['9876', '4321', '5555']
No texto 'Sem números aqui.': Nenhum número de 4 dígitos encontrado.


Exercício 2: O Caractere Coringa (.)
Objetivo: Encontrar palavras de 3 letras que começam com 'c' e terminam com 't'.

In [47]:
import re
print("n --- Exercício 2 : O caractere Coringa(.)---")
textos_palavras = [
    "Eu vi um cat e um cot.",
    "Este é um c t estranho.",
    "Não tem cab nem cut aqui."
]
padrao_ex2 = r'c.t'
print("\nResultados")
for texto in textos_palavras:
    palavras_encontradas  = re.findall(padrao_ex2, texto)
    if palavras_encontradas:
        print(f"No texto'{texto}': Palavras encontradas com 'c.t': {palavras_encontradas}")
    else:
        print(f"No texto '{texto}': Nenhuma palavra encontrada com 'c.t'.")

n --- Exercício 2 : O caractere Coringa(.)---

Resultados
No texto'Eu vi um cat e um cot.': Palavras encontradas com 'c.t': ['cat', 'cot']
No texto'Este é um c t estranho.': Palavras encontradas com 'c.t': ['c t']
No texto'Não tem cab nem cut aqui.': Palavras encontradas com 'c.t': ['cut']


Exercício 3: Caracteres Opcionais (?)
Objetivo: Encontrar tanto "cor" quanto "coro" (o 'o' no final é opcional).

In [50]:
print("\n --- Exercício 3: Caracteres Opcionais(?) ---")

textos_cores = [
    "Qual a sua cor favorita?",
    "Que lindo coro de anjos!",
    "Essa é uma coor diferente."
]
padrao_ex3 = r'coro?'

print("\nResultados:")
for texto in textos_cores:
    matches = re.findall(padrao_ex3, texto)
    if matches:
        print(f"No texto '{texto}': Matches encontrados: {matches}")
    else:
        print(f"No texto '{texto}': Nenhum match encontrado.")



 --- Exercício 3: Caracteres Opcionais(?) ---

Resultados:
No texto 'Qual a sua cor favorita?': Matches encontrados: ['cor']
No texto 'Que lindo coro de anjos!': Matches encontrados: ['coro']
No texto 'Essa é uma coor diferente.': Nenhum match encontrado.


Exercício 4: Conjuntos de Caracteres ([])
Objetivo: Encontrar todas as vogais (maiúsculas ou minúsculas) em uma string.

In [51]:
import re

print("\n--- Exercício 4: Conjuntos de Caracteres ([]) ---")

texto_vogais = "A casa AZUL é BEm GRAnde."

# Padrão: qualquer uma das vogais (maiúsculas ou minúsculas)
# '[aeiouAEIOU]' significa qualquer caractere dentro deste conjunto
padrao_ex4 = r'[aeiouAEIOU]'

print(f"Texto: '{texto_vogais}'")
vogais_encontradas = re.findall(padrao_ex4, texto_vogais)
print(f"Vogais encontradas: {vogais_encontradas}")



--- Exercício 4: Conjuntos de Caracteres ([]) ---
Texto: 'A casa AZUL é BEm GRAnde.'
Vogais encontradas: ['A', 'a', 'a', 'A', 'U', 'E', 'A', 'e']


Exercício 5: Combinando Quantificadores (+, *)
Objetivo: Extrair tags HTML simples que contenham texto dentro. Por exemplo, <b>texto</b> ou <p>paragrafo</p>.

In [53]:
print("\n--- Exercício 5: Combinando Quantificadores (+, *) ---")
texto_html = "Isso é um <b>texto em negrito</b> e um <p>parágrafo</p> simples. Sem tags aqui."
# Padrão:
# '<': Abre a tag
# '\w+': Um ou mais caracteres de palavra (o nome da tag, ex: 'b', 'p')
# '>': Fecha a tag de abertura
# '.*?': Qualquer coisa (.), zero ou mais vezes (*), de forma não-gananciosa (?).
#        Isso garante que ele pare na primeira tag de fechamento que encontrar.
# '</': Abre a tag de fechamento
# '\w+': O nome da tag novamente
# '>': Fecha a tag de fechamento
padrao_ex5 = r'<(\w+)>(.*?)</\1>' # \1 refere-se ao conteúdo do primeiro grupo capturado (\w+)
tags_encontradas = re.findall(padrao_ex5, texto_html)

if tags_encontradas:
    print(f"Tags HTML e seus conteúdos encontrados: {tags_encontradas}")
    for tag_name, content in tags_encontradas:
        print(f"  - Tag: <{tag_name}>, Conteúdo: '{content}'")
else:
    print("Nenhuma tag HTML encontrada.")



--- Exercício 5: Combinando Quantificadores (+, *) ---
Tags HTML e seus conteúdos encontrados: [('b', 'texto em negrito'), ('p', 'parágrafo')]
  - Tag: <b>, Conteúdo: 'texto em negrito'
  - Tag: <p>, Conteúdo: 'parágrafo'
