## Regular Expressions

**1. Verificar se um padrão está presente em uma string**

In [None]:
import re

padrao = r'Python'
texto = 'Python é uma linguagem de programação poderosa.'

if re.search(padrao, texto):
    print("Padrão encontrado na string.")
else:
    print("Padrão não encontrado na string.")

**2. Encontrar todas as ocorrências de um padrão em uma string**

In [None]:
import re

padrao = r'\b\w{4}\b'
texto = 'Python é uma linguagem de programação poderosa.'

ocorrencias = re.findall(padrao, texto)
print("Ocorrências encontradas:", ocorrencias)

**3. Substituir um padrão por outro em uma string**

In [None]:
import re

padrao = r'\b\w{4}\b'
texto = 'Python é uma linguagem de programação poderosa.'

novo_texto = re.sub(padrao, 'Java', texto)
print("Texto modificado:", novo_texto)

**4. Dividir uma string usando um padrão como delimitador**

In [None]:
import re

padrao = r'\s+'
texto = 'Python é uma linguagem de programação poderosa.'

partes = re.split(padrao, texto)
print("Partes divididas:", partes)

**5. Validar se uma string corresponde a um padrão específico**

In [None]:
import re

padrao = r'\b\d{3}-\d{3}-\d{4}\b'  # Padrão para número de telefone no formato XXX-XXX-XXXX
telefone = '123-456-7890'

if re.fullmatch(padrao, telefone):
    print("Número de telefone válido.")
else:
    print("Número de telefone inválido.")

**6. Verificar se um padrão está presente no início de uma string**

In [None]:
import re

padrao = r'^Python'
texto = 'Python é uma linguagem de programação poderosa.'

if re.match(padrao, texto):
    print("O padrão está presente no início da string.")
else:
    print("O padrão não está presente no início da string.")

**7. Validar se uma string contém apenas dígitos**

In [None]:
import re

padrao = r'^\d+$'
texto1 = '12345'
texto2 = '123a45'

if re.match(padrao, texto1):
    print("A string contém apenas dígitos.")
else:
    print("A string não contém apenas dígitos.")

if re.match(padrao, texto2):
    print("A string contém apenas dígitos.")
else:
    print("A string não contém apenas dígitos.")

**8. Encontrar todas as ocorrências de um padrão em uma lista de strings**

In [None]:
import re

padrao = r'\b\w{4}\b'
lista = ['Python', 'Java', 'C++', 'JavaScript', 'PHP']

ocorrencias = [string for string in lista if re.search(padrao, string)]
print("Ocorrências encontradas na lista:", ocorrencias)

**9. Validar se uma string corresponde a um padrão de e-mail**

In [None]:
import re

padrao = r'^[\w\.-]+@[\w\.-]+\.\w+$'
emails = ['usuario@example.com', 'invalido@', 'sem_arroba.com']

for email in emails:
    if re.match(padrao, email):
        print(f"{email} é um e-mail válido.")
    else:
        print(f"{email} não é um e-mail válido.")

**10. Substituir todas as letras minúsculas por maiúsculas em uma string**

In [None]:
import re

texto = 'Python é uma linguagem de programação poderosa.'

texto_modificado = re.sub(r'[a-z]', lambda x: x.group(0).upper(), texto)
print("Texto modificado:", texto_modificado)

**11. Verificar se uma string começa com um número**

In [None]:
import re

padrao = r'\d+'
texto = '123 Python'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**12. Verificar se uma string começa com uma letra maiúscula**

In [None]:
import re

padrao = r'[A-Z]'
texto = 'Python'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**13. Verificar se uma string começa com a palavra "Hello"**

In [None]:
import re

padrao = r'Hello'
texto = 'Hello, World!'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**14. Verificar se uma string começa com um caractere especial**

In [None]:
import re

padrao = r'\W'
texto = '@Hello'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**15. Verificar se uma string começa com uma palavra de exatamente três letras**

In [None]:
import re

padrao = r'\b\w{3}\b'
texto = 'The quick brown fox'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**16. Verificar se uma string começa com uma sequência específica de caracteres**

In [None]:
import re

padrao = r'^abc'
texto = 'abcdef'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**17. Verificar se uma string começa com um número de telefone no formato adequado**

In [None]:
import re

padrao = r'^\d{3}-\d{3}-\d{4}'
telefone = '123-456-7890'

match = re.match(padrao, telefone)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**18. Verificar se uma string começa com uma palavra seguida de um número**

In [None]:
import re

padrao = r'^\w+\d'
texto = 'Python3'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**19. Verificar se uma string começa com um padrão de data no formato "dd/mm/aaaa"**

In [None]:
import re

padrao = r'^\d{2}/\d{2}/\d{4}'
data = '25/12/2023'

match = re.match(padrao, data)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**20. Verificar se uma string começa com uma sequência de caracteres alfanuméricos**

In [None]:
import re

padrao = r'^\w+'
texto = 'Python123'

match = re.match(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**21. Verificar se uma string contém a palavra "Python"**

In [None]:
import re

padrao = r'Python'
texto = 'Python é uma linguagem de programação poderosa.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**22. Verificar se uma string contém um número de telefone no formato adequado**

In [None]:
import re

padrao = r'\d{3}-\d{3}-\d{4}'
texto = 'Entre em contato pelo número 123-456-7890.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**23. Verificar se uma string contém uma sequência de caracteres alfanuméricos**

In [None]:
import re

padrao = r'\w+'
texto = 'Python123 é uma ótima linguagem.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**24. Verificar se uma string contém uma data no formato "dd/mm/aaaa"**

In [None]:
import re

padrao = r'\b\d{2}/\d{2}/\d{4}\b'
texto = 'A reunião está marcada para o dia 25/12/2023.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**25. Verificar se uma string contém um endereço de e-mail**

In [None]:
import re

padrao = r'\b[\w\.-]+@[\w\.-]+\.\w+\b'
texto = 'Entre em contato pelo e-mail usuario@example.com.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**26. Verificar se uma string contém uma sequência de dígitos consecutivos**

In [None]:
import re

padrao = r'\d+'
texto = 'O número de telefone é 123-456-7890.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**27. Verificar se uma string contém uma sequência de caracteres especiais**

In [None]:
import re

padrao = r'\W+'
texto = 'Oi! Como você está?'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**28. Verificar se uma string contém uma sequência de letras minúsculas seguida por uma letra maiúscula**

In [None]:
import re

padrao = r'[a-z]+[A-Z]'
texto = 'PythonCode'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**29. Verificar se uma string contém uma palavra que começa com "P" seguida por uma ou mais letras**

In [None]:
import re

padrao = r'\bP\w+'
texto = 'Python é uma linguagem de programação.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**30. Verificar se uma string contém um número hexadecimal**

In [None]:
import re

padrao = r'0[xX][0-9a-fA-F]+'
texto = 'O código de cor é #00FF00.'

match = re.search(padrao, texto)
if match:
    print("Correspondência encontrada:", match.group())
else:
    print("Nenhuma correspondência encontrada.")

**31. Encontrar todas as palavras de três letras em uma string**

In [None]:
import re

padrao = r'\b\w{3}\b'
texto = 'Python é uma linguagem de programação poderosa.'

ocorrencias = re.findall(padrao, texto)
print("Palavras de três letras encontradas:", ocorrencias)

**32. Encontrar todos os números em uma string**

In [None]:
import re

padrao = r'\d+'
texto = 'O número de telefone é 123-456-7890 e o código postal é 54321.'

ocorrencias = re.findall(padrao, texto)
print("Números encontrados:", ocorrencias)

**33. Encontrar todas as palavras que começam com a letra 'P'**

In [None]:
import re

padrao = r'\bP\w+'
texto = 'Python é uma linguagem de programação poderosa e fácil de aprender.'

ocorrencias = re.findall(padrao, texto)
print("Palavras que começam com 'P':", ocorrencias)

**34. Encontrar todos os endereços de e-mail em uma lista de strings**

In [None]:
import re

padrao = r'\b[\w\.-]+@[\w\.-]+\.\w+\b'
lista = ['usuario1@example.com', 'contato@example.com', 'invalido', 'usuario2@example.com']

ocorrencias = [email for email in lista if re.findall(padrao, email)]
print("Endereços de e-mail encontrados:", ocorrencias)

**35. Encontrar todas as palavras que começam com uma letra maiúscula em uma string**

In [None]:
import re

padrao = r'\b[A-Z]\w*'
texto = 'Python é uma linguagem de programação poderosa e Fácil de aprender.'

ocorrencias = re.findall(padrao, texto)
print("Palavras que começam com letra maiúscula:", ocorrencias)

**36. Encontrar todas as hashtags em um texto**

In [None]:
import re

padrao = r'#\w+'
texto = 'Hoje está um belo dia! #sol #verão #praia'

ocorrencias = re.findall(padrao, texto)
print("Hashtags encontradas:", ocorrencias)

**37. Encontrar todas as palavras que terminam com "ing" em uma string**

In [None]:
import re

padrao = r'\b\w+ing\b'
texto = 'Correndo, nadando, pulando, cantando'

ocorrencias = re.findall(padrao, texto)
print("Palavras que terminam com 'ing':", ocorrencias)

**38. Encontrar todas as URLs em um texto**

In [None]:
import re

padrao = r'https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+'
texto = 'Visite nosso site em https://www.exemplo.com.br'

ocorrencias = re.findall(padrao, texto)
print("URLs encontradas:", ocorrencias)

**39. Encontrar todos os números decimais em uma string**

In [None]:
import re

padrao = r'\b\d+\.\d+\b'
texto = 'O preço do produto é R$ 9.99 ou $15.50'

ocorrencias = re.findall(padrao, texto)
print("Números decimais encontrados:", ocorrencias)

**40. Encontrar todas as palavras duplicadas em uma string**

In [None]:
import re

padrao = r'\b(\w+)\b.*\b\1\b'
texto = 'Este é um exemplo de frase com palavras repetidas.'

ocorrencias = re.findall(padrao, texto)
print("Palavras duplicadas encontradas:", ocorrencias)

**41. Substituir todas as ocorrências de "gato" por "cachorro"**

In [None]:
import re

padrao = r'gato'
texto = 'Eu tenho um gato preto e um gato branco.'

novo_texto = re.sub(padrao, 'cachorro', texto)
print("Novo texto:", novo_texto)

**42. Substituir todas as letras minúsculas por letras maiúsculas**

In [None]:
import re

texto = 'Este é um exemplo de texto com letras minúsculas.'

novo_texto = re.sub(r'[a-z]', lambda x: x.group(0).upper(), texto)
print("Novo texto:", novo_texto)

**43. Substituir todos os números por "X"**

In [None]:
import re

texto = 'A senha é 1234.'

novo_texto = re.sub(r'\d', 'X', texto)
print("Novo texto:", novo_texto)

**44. Remover todos os caracteres não alfanuméricos**

In [None]:
import re

texto = 'Este é um exemplo! De texto; com caracteres especiais?'

novo_texto = re.sub(r'\W', '', texto)
print("Novo texto:", novo_texto)

**45. Substituir datas no formato "dd/mm/aaaa" por "DATA"**

In [None]:
import re

texto = 'Hoje é 25/12/2023 e amanhã será 26/12/2023.'

novo_texto = re.sub(r'\b\d{2}/\d{2}/\d{4}\b', 'DATA', texto)
print("Novo texto:", novo_texto)

**46. Substituir todas as vogais por um caractere de sublinhado**

In [None]:
import re

texto = 'Este é um exemplo de substituição de vogais.'

novo_texto = re.sub(r'[aeiou]', '_', texto)
print("Novo texto:", novo_texto)

**47. Substituir todas as palavras por seu comprimento**

In [None]:
import re

texto = 'O rato roeu a roupa do rei de Roma.'

novo_texto = re.sub(r'\b\w+\b', lambda x: str(len(x.group())), texto)
print("Novo texto:", novo_texto)

**48. Remover todas as letras minúsculas**

In [None]:
import re

texto = 'Este é um Exemplo De TEXTO com Letras Minúsculas.'

novo_texto = re.sub(r'[a-z]', '', texto)
print("Novo texto:", novo_texto)

**49. Substituir todas as letras maiúsculas por uma letra X**

In [None]:
import re

texto = 'Este é um Exemplo De TEXTO com Letras Maiúsculas.'

novo_texto = re.sub(r'[A-Z]', 'X', texto)
print("Novo texto:", novo_texto)

**50. Substituir palavras por sua forma invertida**

In [None]:
import re

texto = 'Python é uma linguagem de programação.'

def invert_palavra(match):
    return match.group()[::-1]

novo_texto = re.sub(r'\b\w+\b', invert_palavra, texto)
print("Novo texto:", novo_texto)

**51. Calculadora Simples**

In [None]:
import re

operacao = input('Qual a operação? ')
conta = re.search(r'^(\d)+(\+|\-|\*|\/)+(\d)$', operacao)

a = int(conta.group(1))
b = str(conta.group(2))
c = int(conta.group(3))

if b == '+':
    resultado = a + c
elif b == '-':
    resultado = a - c
elif b == '*':
    resultado = a * c
else b == '/':
    resultado = a / c

print(resultado)

**52. Extrator de Links Web.**

In [None]:
import re
import requests

def extrair_links_pagina(url):
    try:
        resposta = requests.get(url)
        conteudo = resposta.text
        links = re.findall(r'href=["\'](https?://.*?)(?=["\'])', conteudo)
        return links
    except Exception as e:
        print(f"Erro ao extrair links: {str(e)}")
        return []

if __name__ == "__main__":
    url = input("Digite a URL da página da web para extrair links: ")
    links = extrair_links_pagina(url)

    if links:
        print("Links encontrados:")
        for link in links:
            print(link)
    else:
        print("Nenhum link encontrado.")

**53. Extrator de Endereço IP.**

In [None]:
import re

# Texto de exemplo contendo endereços IP
texto = "Este é um exemplo de texto contendo endereços IP como 192.168.1.1, 10.0.0.1 e 172.16.254.1."

# Expressão regular para encontrar endereços IP
padrao_ip = r'\b(?:\d{1,3}\.){3}\d{1,3}\b'

# Encontrar todos os endereços IP no texto
ips_encontrados = re.findall(padrao_ip, texto)

# Imprimir os endereços IP encontrados
print("Endereços IP encontrados:")
for ip in ips_encontrados:
    print(ip)

**54. Extrator de Dados de Texto.**

In [None]:
import re

def extrair_numeros_telefone(texto):
    padrao = r'\b\d{3}[-.\s]?\d{3}[-.\s]?\d{4}\b'
    numeros = re.findall(padrao, texto)
    return numeros

if __name__ == "__main__":
    texto = input("Digite o texto no qual você deseja encontrar números de telefone: ")
    numeros = extrair_numeros_telefone(texto)

    if numeros:
        print("Números de telefone encontrados:")
        for numero in numeros:
            print(numero)
    else:
        print("Nenhum número de telefone encontrado.")

**55. Ferramenta de Busca de arquivos.**

In [None]:
import os

def buscar_em_arquivos(diretorio, padrao):
    resultados = []

    for pasta_raiz, _, arquivos in os.walk(diretorio):
        for arquivo in arquivos:
            caminho_completo = os.path.join(pasta_raiz, arquivo)
            with open(caminho_completo, 'r', encoding='utf-8') as file:
                linhas = file.readlines()
                for numero_linha, linha in enumerate(linhas, start=1):
                    if re.search(padrao, linha):
                        resultados.append(f'{caminho_completo} - Linha {numero_linha}: {linha.strip()}')

    return resultados

if __name__ == "__main__":
    diretorio = input("Digite o diretório para busca: ")
    padrao = input("Digite o padrão de busca (expressão regular): ")

    resultados = buscar_em_arquivos(diretorio, padrao)

    if resultados:
        print("Resultados encontrados:")
        for resultado in resultados:
            print(resultado)
    else:
        print("Nenhum resultado encontrado.")

**56. Extrator de CEP.**

In [None]:
import re

def extrair_cep(texto):
    # Padrão para encontrar CEPs no formato XXXXX-XXX ou XXXXXXXX
    padrao = r'\b\d{5}-\d{3}|\d{8}\b'
    ceps = re.findall(padrao, texto)
    return ceps

if __name__ == "__main__":
    texto = input("Digite o texto no qual você deseja encontrar CEPs: ")
    ceps_encontrados = extrair_cep(texto)

    if ceps_encontrados:
        print("CEPs encontrados:")
        for cep in ceps_encontrados:
            print(cep)
    else:
        print("Nenhum CEP encontrado.")

**57. Tradutor de Números romanos.**

In [None]:
def romano_para_arabico(romano):
    valores = {'I': 1, 'V': 5, 'X': 10, 'L': 50, 'C': 100, 'D': 500, 'M': 1000}
    arabico = 0
    anterior = 0

    for algarismo in romano[::-1]:
        valor = valores[algarismo]
        if valor < anterior:
            arabico -= valor
        else:
            arabico += valor
        anterior = valor

    return arabico

if __name__ == "__main__":
    numero_romano = input("Digite um número em algarismos romanos: ")
    numero_arabico = romano_para_arabico(numero_romano.upper())
    print(f"O número em algarismos arábicos é: {numero_arabico}")

**58. Extrator de Código fonte html.**

In [None]:
import re

def extrair_codigo_fonte_html(texto):
    # Padrão para encontrar código HTML em um texto
    padrao = r'<.*?>'
    codigo_fonte = re.sub(padrao, '', texto)
    return codigo_fonte

if __name__ == "__main__":
    texto = input("Digite o texto contendo código HTML: ")
    codigo_fonte_html = extrair_codigo_fonte_html(texto)
    print("Código Fonte HTML Extraído:")
    print(codigo_fonte_html)

**59. Validador de URL's.**

In [None]:
import re

def validar_url(url):
    # Padrão para validar URLs simples
    padrao = r'^(https?|ftp)://[^\s/$.?#].[^\s]*$'
    return bool(re.match(padrao, url))

if __name__ == "__main__":
    url = input("Digite a URL a ser validada: ")
    if validar_url(url):
        print("URL válida.")
    else:
        print("URL inválida.")

**60. Extrator de Domínios.**

In [None]:
import re

def extrair_dominio(url):
    # Padrão para extrair o domínio de uma URL
    padrao = r'^(https?|ftp)://([^\s/$.?#].[^\s]*)'
    match = re.match(padrao, url)
    if match:
        return match.group(2)
    else:
        return None

if __name__ == "__main__":
    url = input("Digite a URL para extrair o domínio: ")
    dominio = extrair_dominio(url)
    if dominio:
        print(f"Domínio extraído: {dominio}")
    else:
        print("URL inválida.")

**61. Validador de CPF.**

In [None]:
import re

def validar_cpf(cpf):
    # Expressão regular para validar CPF
    padrao = re.compile(r'^\d{3}\.\d{3}\.\d{3}-\d{2}$|^\d{11}$')

    if re.match(padrao, cpf):
        return True
    else:
        return False

# Exemplo de uso
cpf = input("Digite um CPF (no formato XXX.XXX.XXX-XX ou XXXXXXXXXXX): ")
if validar_cpf(cpf):
    print("CPF válido.")
else:
    print("CPF inválido. Digite no formato XXX.XXX.XXX-XX ou XXXXXXXXXXX.")

**62. Analisador de Logs da Web.**

In [None]:
import re

def analisar_log_web(log, padrao):
    return re.findall(padrao, log)

# Exemplo de uso
log = "192.168.1.1 - - [18/Sep/2023:08:30:45 -0400] 'GET /page HTTP/1.1' 200 1234"
padrao = r'\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b|\[([^\[\]]+)\]|\b\d{3}\b'
resultados = analisar_log_web(log, padrao)
print("Informações encontradas:")
for resultado in resultados:
    print(resultado)

**63. Extrator de números de telefone Internacionais.**

In [None]:
import re

def extrair_numeros_telefone_internacionais(texto):
    # Expressão regular para extrair números de telefone internacionais
    padrao = r'\+\d{1,3}\s?\d{1,4}[-\s]?\d{1,12}'

    return re.findall(padrao, texto)

# Exemplo de uso
texto = "Entre em contato conosco no +1 123-456-7890 ou +44 20 1234 5678."
numeros = extrair_numeros_telefone_internacionais(texto)
print("Números de telefone internacionais encontrados:")
for numero in numeros:
    print(numero)

**64. Validador de Placas de Carro.**

In [None]:
import re

def extrair_numeros_telefone_internacionais(texto):
    # Expressão regular para extrair números de telefone internacionais
    padrao = r'\+\d{1,3}\s?\d{1,4}[-\s]?\d{1,12}'

    return re.findall(padrao, texto)

# Exemplo de uso
texto = "Entre em contato conosco no +1 123-456-7890 ou +44 20 1234 5678."
numeros = extrair_numeros_telefone_internacionais(texto)
print("Números de telefone internacionais encontrados:")
for numero in numeros:
    print(numero)

**65. Pesquisa de Expressões Regulares em Arquivos.**

In [None]:
import re
import os

def pesquisar_em_arquivos(padrao, diretorio):
    resultados = []

    for raiz, _, arquivos in os.walk(diretorio):
        for arquivo in arquivos:
            caminho_arquivo = os.path.join(raiz, arquivo)
            with open(caminho_arquivo, 'r', encoding='utf-8') as f:
                conteudo = f.read()
                correspondencias = re.findall(padrao, conteudo)
                if correspondencias:
                    resultados.append((caminho_arquivo, correspondencias))

    return resultados

# Exemplo de uso
padrao = r'\bexpressao_regular\b'
diretorio = '.'  # Diretório atual, você pode especificar um diretório diferente
resultados = pesquisar_em_arquivos(padrao, diretorio)

if resultados:
    print("Correspondências encontradas:")
    for caminho_arquivo, correspondencias in resultados:
        print(f"Arquivo: {caminho_arquivo}")
        for correspondencia in correspondencias:
            print(f"  - {correspondencia}")
else:
    print("Nenhuma correspondência encontrada.")

**66. Validador de Cartão de Crédito.**

In [None]:
import re

def validar_cartao_credito(numero):
    # Expressão regular para validar números de cartão de crédito
    padrao = re.compile(r'^\d{4}-\d{4}-\d{4}-\d{4}$|^\d{16}$')

    if re.match(padrao, numero):
        return True
    else:
        return False

# Exemplo de uso
numero_cartao = input("Digite um número de cartão de crédito (no formato XXXX-XXXX-XXXX-XXXX ou XXXXXXXXXXXXXXXX): ")
if validar_cartao_credito(numero_cartao):
    print("Número de cartão de crédito válido.")
else:
    print("Número de cartão de crédito inválido. Digite no formato XXXX-XXXX-XXXX-XXXX ou XXXXXXXXXXXXXXXX.")

**67. Processador de Texto com Marcação.**

In [None]:
import re

def processar_texto_com_marcacao(texto):
    # Expressões regulares para encontrar marcações e aplicar formatação
    negrito = re.compile(r'\*\*(.*?)\*\*')
    italico = re.compile(r'_(.*?)_')

    # Aplicar formatação para negrito e itálico
    texto_formatado = negrito.sub(r'<b>\1</b>', texto)
    texto_formatado = italico.sub(r'<i>\1</i>', texto_formatado)

    return texto_formatado

# Exemplo de uso
texto_original = "Este é um exemplo **de texto** com _marcações_."
texto_formatado = processar_texto_com_marcacao(texto_original)
print(texto_formatado)

**68. Analisador de Endereços IP.**

In [None]:
import re

def analisar_enderecos_ip(texto):
    # Expressão regular para encontrar endereços IP
    padrao = r'\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b'

    enderecos = re.findall(padrao, texto)

    categorias = {
        'IPv4': [],
        'IPv6': [],
    }

    for endereco in enderecos:
        if '.' in endereco:
            categorias['IPv4'].append(endereco)
        else:
            categorias['IPv6'].append(endereco)

    return categorias

# Exemplo de uso
texto = "Endereços IP válidos na rede: 192.168.1.1, 2001:0db8:85a3:0000:0000:8a2e:0370:7334."
resultados = analisar_enderecos_ip(texto)
print("Endereços IPv4 encontrados:")
print(resultados['IPv4'])
print("Endereços IPv6 encontrados:")
print(resultados['IPv6'])

**69. Validador de Números de registro nacional.**

In [None]:
import re

def validar_numero_registro_nacional(registro):
    # Expressão regular para validar números de registro nacional (por exemplo, RG no Brasil)
    padrao = re.compile(r'^\d{1,10}$')

    if re.match(padrao, registro):
        return True
    else:
        return False

# Exemplo de uso
registro = input("Digite um número de registro nacional (por exemplo, RG): ")
if validar_numero_registro_nacional(registro):
    print("Número de registro nacional válido.")
else:
    print("Número de registro nacional inválido. Digite no formato numérico.")

**70. Extrator de Endereções de E-mail a partir do documento PDF.**

In [None]:
import re
import PyPDF2

def extrair_emails_de_pdf(arquivo_pdf):
    emails = []

    with open(arquivo_pdf, 'rb') as pdf_file:
        pdf_reader = PyPDF2.PdfFileReader(pdf_file)
        for page_num in range(pdf_reader.getNumPages()):
            page = pdf_reader.getPage(page_num)
            text = page.extractText()
            padrao = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,7}\b'
            emails.extend(re.findall(padrao, text))

    return emails

# Exemplo de uso
arquivo_pdf = "exemplo.pdf"  # Substitua pelo nome do seu arquivo PDF
emails_encontrados = extrair_emails_de_pdf(arquivo_pdf)
print("E-mails encontrados no PDF:")
for email in emails_encontrados:
    print(email)

**71. Validador de Cep**

In [None]:
import re

def validar_cep(cep):
    # Expressão regular para validar CEP no formato XXXXX-XXX ou XXXXXXXX
    padrao = re.compile(r'^\d{5}-\d{3}$|^\d{8}$')

    if re.match(padrao, cep):
        return True
    else:
        return False

# Exemplo de uso
cep = input("Digite um CEP (no formato XXXXX-XXX ou XXXXXXXX): ")
if validar_cep(cep):
    print("CEP válido.")
else:
    print("CEP inválido. Digite no formato XXXXX-XXX ou XXXXXXXX.")

**72. Extrator de Datas.**

In [None]:
import re

def extrair_datas(texto):
    # Expressão regular para extrair datas no formato DD/MM/AAAA
    padrao = r'\b(\d{2}/\d{2}/\d{4})\b'

    return re.findall(padrao, texto)

# Exemplo de uso
texto = "A reunião está marcada para o dia 18/09/2023. Não esqueça da data 22/10/2023."
datas = extrair_datas(texto)
print("Datas encontradas:")
for data in datas:
    print(data)

**73. Validador de Números de Telefone.**

In [None]:
import re

def validar_numero_telefone(numero):
    # Expressão regular para validar números de telefone no formato (XX) XXXXX-XXXX ou XXXXX-XXXX
    padrao = re.compile(r'^\((\d{2})\)\s?(\d{5}-\d{4}|\d{4}-\d{4})$')

    if re.match(padrao, numero):
        return True
    else:
        return False

# Exemplo de uso
numero_telefone = input("Digite um número de telefone (no formato (XX) XXXXX-XXXX ou XXXXX-XXXX): ")
if validar_numero_telefone(numero_telefone):
    print("Número de telefone válido.")
else:
    print("Número de telefone inválido. Digite no formato (XX) XXXXX-XXXX ou XXXXX-XXXX.")

**74. Analisador de Log.**

In [None]:
import re

def analisar_log(log, padrao):
    return re.findall(padrao, log)

# Exemplo de uso
log = "2023-09-18 08:30:45 - Erro: Ocorreu um erro inesperado no servidor."
padrao = r'\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2}'
resultados = analisar_log(log, padrao)
print("Datas encontradas:")
for resultado in resultados:
    print(resultado)

**75. Filtragem de Dados.**

In [None]:
import re

def filtrar_dados(texto, padrao):
    return re.findall(padrao, texto)

# Exemplo de uso
texto = "Lorem ipsum 42 dolor sit amet, consectetur adipiscing elit. Fusce 12345 euismod 6789."
padrao = r'\d+'
resultados = filtrar_dados(texto, padrao)
print("Números encontrados:")
for resultado in resultados:
    print(resultado)

**76. Verificador de Senhas Fortes.**

In [None]:
import re

def verificar_senha_forte(senha):
    # Expressão regular para verificar senhas fortes
    padrao = r'^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)(?=.*[@$!%*?&])[A-Za-z\d@$!%*?&]{8,}$'

    if re.match(padrao, senha):
        return True
    else:
        return False

# Exemplo de uso
senha = input("Digite uma senha: ")
if verificar_senha_forte(senha):
    print("Senha forte.")
else:
    print("Senha fraca. A senha deve conter pelo menos 8 caracteres, incluindo maiúsculas, minúsculas, números e caracteres especiais.")

**77. Contador de Palavras - Chave.**

In [None]:
import re

def contar_palavras_chave(texto, palavra_chave):
    # Expressão regular para encontrar a palavra-chave
    padrao = re.compile(r'\b' + re.escape(palavra_chave) + r'\b', re.IGNORECASE)

    ocorrencias = len(re.findall(padrao, texto))
    return ocorrencias

# Exemplo de uso
texto = "Python é uma linguagem de programação. Programar em python é fácil e Python é popular."
palavra_chave = "Python"
ocorrencias = contar_palavras_chave(texto, palavra_chave)
print(f"A palavra-chave '{palavra_chave}' ocorre {ocorrencias} vezes no texto.")

**78. Validador de E-mail.**

In [None]:
import re

def validar_email(email):
    # Expressão regular para validar e-mails
    padrao = r'^[\w\.-]+@[\w\.-]+\.\w+$'

    if re.match(padrao, email):
        return True
    else:
        return False

# Exemplo de uso
email = input("Digite um endereço de e-mail: ")
if validar_email(email):
    print("E-mail válido.")
else:
    print("E-mail inválido.")

**79. Extrator de URL’s.**

In [None]:
import re

def extrair_urls(texto):
    # Expressão regular para extrair URLs
    padrao = r'https?://\S+'

    return re.findall(padrao, texto)

# Exemplo de uso
texto = "Acesse o nosso site em https://www.example.com para obter mais informações. Visite também http://www.test.com."
urls = extrair_urls(texto)
print("URLs encontradas:")
for url in urls:
    print(url)

**80. Identificador de Formatos de Arquivos.**

In [None]:
import re

def identificar_formato_arquivo(arquivo):
    # Dicionário de padrões de assinaturas binárias para formatos de arquivo conhecidos
    padroes_formatos = {
        "JPEG": b'\xFF\xD8\xFF',
        "PNG": b'\x89\x50\x4E\x47',
        "PDF": b'\x25\x50\x44\x46\x2D',
        # Adicione mais formatos conforme necessário
    }

    with open(arquivo, 'rb') as f:
        dados = f.read(4)
        for formato, padrao in padroes_formatos.items():
            if dados.startswith(padrao):
                return formato

    return "Formato desconhecido"

# Exemplo de uso
arquivo = "exemplo.jpg"  # Substitua pelo nome do seu arquivo
formato = identificar_formato_arquivo(arquivo)
print(f"O formato do arquivo '{arquivo}' é: {formato}")

**81. Analisador de Logs de Servidor.**

In [None]:
import re

# Exemplo de um log de servidor
log = """
192.168.1.1 - - [10/Mar/2023:10:45:32] "GET /page1 HTTP/1.1" 200 3402
192.168.1.2 - - [10/Mar/2023:10:46:20] "GET /page2 HTTP/1.1" 404 1234
192.168.1.3 - - [10/Mar/2023:10:47:15] "GET /page1 HTTP/1.1" 200 6543
"""

# Expressão regular para extrair endereços IP e URLs do log
pattern = r'(\d+\.\d+\.\d+\.\d+) - - \[(.*?)\] "(GET|POST) (.*?) HTTP/1.1" (\d+) (\d+)'

matches = re.findall(pattern, log)
for match in matches:
    ip, timestamp, method, url, status, bytes_sent = match
    print(f"IP: {ip}, Timestamp: {timestamp}, Method: {method}, URL: {url}, Status: {status}, Bytes Sent: {bytes_sent}")

**82. Extrator de Dados de Páginas da Web.**

In [None]:
from bs4 import BeautifulSoup
import requests
import re

# URL da página da web de exemplo
url = "https://example.com"

# Realize uma solicitação HTTP para obter o conteúdo da página
response = requests.get(url)
html = response.text

# Use BeautifulSoup para analisar o HTML
soup = BeautifulSoup(html, 'html.parser')

# Encontre todos os links na página usando expressões regulares
links = soup.find_all('a', href=re.compile(r'https://example\.com/.*'))

# Extraia e imprima os títulos e URLs dos links
for link in links:
    title = link.text
    url = link['href']
    print(f"Link Title: {title}, URL: {url}")

**83. Conversor de Formatos de Data.**

In [None]:
import re

# Expressão regular para encontrar datas no formato "dd/mm/aaaa"
data_pattern = r'(\d{2})/(\d{2})/(\d{4})'

# Função para substituir o formato da data
def converter_data(match):
    dia, mes, ano = match.groups()
    nova_data = f"{ano}-{mes}-{dia}"
    return nova_data

# Texto de exemplo com datas no formato "dd/mm/aaaa"
texto = "A data de nascimento é 25/12/1990 e o evento ocorreu em 30/04/2022."

# Use re.sub() com a função de substituição para converter as datas
texto_convertido = re.sub(data_pattern, converter_data, texto)

print(texto_convertido)

**84. Busca e Substituição de Texto em Lote.**

In [None]:
import os
import re

# Diretório onde os arquivos .txt estão localizados
diretorio = "caminho/para/seu/diretorio"

# Palavra a ser substituída
palavra_antiga = "palavra_antiga"
palavra_nova = "palavra_nova"

# Expressão regular para encontrar a palavra antiga
padrao = re.compile(r'\b' + re.escape(palavra_antiga) + r'\b')

# Percorre todos os arquivos .txt no diretório
for root, _, files in os.walk(diretorio):
    for file in files:
        if file.endswith(".txt"):
            file_path = os.path.join(root, file)

            # Abre o arquivo, lê seu conteúdo e substitui a palavra
            with open(file_path, 'r') as f:
                conteudo = f.read()
                conteudo_modificado = re.sub(padrao, palavra_nova, conteudo)

            # Escreve o conteúdo modificado de volta no arquivo
            with open(file_path, 'w') as f:
                f.write(conteudo_modificado)

print("Substituição de texto em lote concluída.")

**85. Verificador de Links Quebrados em Sites.**

In [None]:
import requests
from bs4 import BeautifulSoup
import re

# URL do site a ser verificado
url = "https://example.com"

# Realize uma solicitação HTTP para obter o conteúdo da página
response = requests.get(url)
html = response.text

# Use BeautifulSoup para analisar o HTML
soup = BeautifulSoup(html, 'html.parser')

# Encontre todos os links na página
links = soup.find_all('a', href=True)

for link in links:
    link_url = link['href']
    if not re.match(r'http', link_url):  # Verifique se o link é relativo
        link_url = url + link_url  # Converta para um URL absoluto

    try:
        # Faça uma solicitação HEAD para verificar se o link está ativo
        response = requests.head(link_url)
        if response.status_code == 200:
            print(f"Link válido: {link_url}")
        else:
            print(f"Link quebrado: {link_url}")
    except requests.exceptions.RequestException as e:
        print(f"Erro ao verificar o link: {link_url}")

**86. Reconhecimento de Padrões em Texto.**

In [None]:
import re

# Expressão regular para encontrar números de telefone no formato (123) 456-7890
padrao_telefone = r'\(\d{3}\) \d{3}-\d{4}'

# Texto de exemplo com números de telefone
texto = "Entre em contato conosco pelo telefone (123) 456-7890 ou visite nosso site."

# Use re.findall() para encontrar números de telefone no texto
numeros_telefone = re.findall(padrao_telefone, texto)

print("Números de telefone encontrados:")
for numero in numeros_telefone:
    print(numero)

**87. Extrator de Código Postal.**

In [None]:
import re

# Expressão regular para extrair códigos postais no formato "12345-678"
padrao_cep = r'\b\d{5}-\d{3}\b'

# Texto de exemplo com códigos postais
texto = "O CEP da minha casa é 12345-678 e o CEP da minha empresa é 98765-432."

# Use re.findall() para encontrar códigos postais no texto
ceps_encontrados = re.findall(padrao_cep, texto)

print("Códigos postais encontrados:")
for cep in ceps_encontrados:
    print(cep)

**88. Validador de Cartões de Crédito.**

In [None]:
import re

# Expressão regular para validar números de cartões de crédito
padrao_cartao = r'^\d{13,19}$'

# Função para validar números de cartão de crédito usando o algoritmo de Luhn
def validar_cartao(numero):
    numero = list(map(int, numero[::-1]))
    total = sum(numero[0::2]) + sum(sum(divmod(d * 2, 10)) for d in numero[1::2])
    return total % 10 == 0

# Números de cartão de crédito de exemplo
cartoes = ["4532015112830366", "6011000990139424", "378282246310005", "1234567890123456"]

for cartao in cartoes:
    if re.match(padrao_cartao, cartao) and validar_cartao(cartao):
        print(f"Cartão válido: {cartao}")
    else:
        print(f"Cartão inválido: {cartao}")

**89. Resumo de Artigos Científicos.**

In [None]:
import re

# Expressões regulares para extrair informações de um artigo científico
padrao_autores = r'Autores: (.*)'
padrao_data = r'Data de Publicação: (\d{2}/\d{2}/\d{4})'
padrao_resultados = r'Resultados: (.*)'

# Texto de exemplo de um artigo científico
artigo = """
Título: Descoberta de um Novo Medicamento

Autores: John Doe, Jane Smith

Data de Publicação: 15/09/2022

Resumo: Este artigo descreve a pesquisa e os resultados da descoberta de um novo medicamento para tratar doenças.

Resultados: O medicamento mostrou eficácia em 95% dos casos testados.
"""

# Extrair informações do artigo usando expressões regulares
autores = re.search(padrao_autores, artigo).group(1)
data_publicacao = re.search(padrao_data, artigo).group(1)
resultados = re.search(padrao_resultados, artigo).group(1)

# Imprimir as informações extraídas
print(f"Autores: {autores}")
print(f"Data de Publicação: {data_publicacao}")
print(f"Resultados: {resultados}")

**90. Extrator de Metadados de Música.**

In [None]:
import re

# Expressões regulares para extrair metadados de música
padrao_titulo = r'Título: (.*)'
padrao_artista = r'Artista: (.*)'
padrao_album = r'Álbum: (.*)'
padrao_ano = r'Ano de Lançamento: (\d{4})'

# Texto de exemplo com metadados de música
metadados_musica = """
Título: Música de Exemplo
Artista: Artista da Música
Álbum: Álbum de Exemplo
Ano de Lançamento: 2022
"""

# Extrair metadados da música usando expressões regulares
titulo = re.search(padrao_titulo, metadados_musica).group(1)
artista = re.search(padrao_artista, metadados_musica).group(1)
album = re.search(padrao_album, metadados_musica).group(1)
ano = re.search(padrao_ano, metadados_musica).group(1)

# Imprimir os metadados extraídos
print(f"Título: {titulo}")
print(f"Artista: {artista}")
print(f"Álbum: {album}")
print(f"Ano de Lançamento: {ano}")

**91. Verificador de CPF e CNPJ.**

In [None]:
import re

def validar_cpf(cpf):
    # Remove caracteres não numéricos do CPF
    cpf = re.sub(r'[^0-9]', '', cpf)

    # Verifica se o CPF tem 11 dígitos
    if len(cpf) != 11:
        return False

    # Calcula o primeiro dígito verificador do CPF
    soma = 0
    for i in range(9):
        soma += int(cpf[i]) * (10 - i)
    digito1 = 11 - (soma % 11)
    if digito1 == 10 or digito1 == 11:
        digito1 = 0

    # Verifica o primeiro dígito verificador
    if digito1 != int(cpf[9]):
        return False

    # Calcula o segundo dígito verificador do CPF
    soma = 0
    for i in range(10):
        soma += int(cpf[i]) * (11 - i)
    digito2 = 11 - (soma % 11)
    if digito2 == 10 or digito2 == 11:
        digito2 = 0

    # Verifica o segundo dígito verificador
    if digito2 != int(cpf[10]):
        return False

    return True

def validar_cnpj(cnpj):
    # Remove caracteres não numéricos do CNPJ
    cnpj = re.sub(r'[^0-9]', '', cnpj)

    # Verifica se o CNPJ tem 14 dígitos
    if len(cnpj) != 14:
        return False

    # Calcula o primeiro dígito verificador do CNPJ
    soma = 0
    for i in range(4):
        soma += int(cnpj[i]) * (5 - i)
    for i in range(8, 12):
        soma += int(cnpj[i]) * (13 - i)
    digito1 = 11 - (soma % 11)
    if digito1 == 10 or digito1 == 11:
        digito1 = 0

    # Verifica o primeiro dígito verificador
    if digito1 != int(cnpj[12]):
        return False

    # Calcula o segundo dígito verificador do CNPJ
    soma = 0
    for i in range(5):
        soma += int(cnpj[i]) * (6 - i)
    for i in range(8, 13):
        soma += int(cnpj[i]) * (14 - i)
    digito2 = 11 - (soma % 11)
    if digito2 == 10 or digito2 == 11:
        digito2 = 0

    # Verifica o segundo dígito verificador
    if digito2 != int(cnpj[13]):
        return False

    return True

# Teste de validação de CPF e CNPJ
cpf_valido = validar_cpf("123.456.789-09")
cnpj_valido = validar_cnpj("12.345.678/0001-01")

if cpf_valido:
    print("CPF válido.")
else:
    print("CPF inválido.")

if cnpj_valido:
    print("CNPJ válido.")
else:
    print("CNPJ inválido.")

**92. Tradutor de Texto Automático.**

In [None]:
import re

# Dicionário de tradução de palavras-chave
traducoes = {
    "hello": "olá",
    "world": "mundo",
    "example": "exemplo"
}

# Função para traduzir texto com base no dicionário
def traduzir_texto(texto):
    padrao = re.compile(r'\b(' + '|'.join(map(re.escape, traducoes.keys())) + r')\b')
    resultado = padrao.sub(lambda x: traducoes[x.group()], texto)
    return resultado

# Texto de exemplo a ser traduzido
texto = "Hello, world! This is an example of text translation."

# Traduzir o texto
texto_traduzido = traduzir_texto(texto)

print("Texto original:", texto)
print("Texto traduzido:", texto_traduzido)

**93. Extrator de Códigos de Cupons.**

In [None]:
import re

# Expressão regular para extrair códigos de cupons promocionais
padrao_cupom = r'[A-Z0-9]{6}-[A-Z0-9]{6}'

# Texto de exemplo com códigos de cupons
texto = "Use o código promocional ABC123-DEF456 para obter um desconto de 20%. Válido até XYZ789-UVW123."

# Use re.findall() para encontrar códigos de cupons no texto
cupons = re.findall(padrao_cupom, texto)

print("Códigos de cupons encontrados:")
for cupom in cupons:
    print(cupom)

**94. Gerador de Documentos Personalizados.**

In [None]:
import re

# Modelo de documento com espaços reservados
modelo_documento = "Olá [NOME], seu número de telefone é [TELEFONE]."

# Dicionário de informações para preencher no documento
informacoes = {
    "NOME": "João da Silva",
    "TELEFONE": "123-456-7890"
}

# Função para preencher o modelo de documento com informações
def preencher_documento(modelo, informacoes):
    for chave, valor in informacoes.items():
        modelo = re.sub(r'\[' + chave + r'\]', valor, modelo)
    return modelo

# Preencher o modelo de documento com informações
documento_preenchido = preencher_documento(modelo_documento, informacoes)

print("Documento personalizado:")
print(documento_preenchido)

**95. Analisador de Código Fonte.**

In [None]:
import re

# Função para analisar um arquivo de código fonte
def analisar_codigo_fonte(arquivo):
    with open(arquivo, 'r') as f:
        codigo = f.read()

    # Encontrar variáveis no código
    variaveis = re.findall(r'\w+\s*=\s*.+', codigo)

    # Encontrar funções no código
    funcoes = re.findall(r'def\s+\w+\s*\(', codigo)

    # Encontrar comentários no código
    comentarios = re.findall(r'#.*', codigo)

    # Imprimir as informações encontradas
    print("Variáveis encontradas:")
    for variavel in variaveis:
        print(variavel)

    print("\nFunções encontradas:")
    for funcao in funcoes:
        print(funcao)

    print("\nComentários encontrados:")
    for comentario in comentarios:
        print(comentario)

# Nome do arquivo de código fonte a ser analisado
arquivo_codigo_fonte = "codigo_fonte.py"

# Executar a análise do código fonte
analisar_codigo_fonte(arquivo_codigo_fonte)

**96. Conversor de Unidades de Medida.**

In [None]:
import re

# Função para converter unidades de medida
def converter_unidades(texto):
    # Expressões regulares para identificar unidades de medida
    padrao_metros = r'(\d+)\s*metros?'
    padrao_pes = r'(\d+)\s*pés?'

    # Converter metros para pés
    texto = re.sub(padrao_metros, lambda x: f'{float(x.group(1)) * 3.28084:.2f} pés', texto)

    # Converter pés para metros
    texto = re.sub(padrao_pes, lambda x: f'{float(x.group(1)) / 3.28084:.2f} metros', texto)

    return texto

# Texto de exemplo com unidades de medida
texto_com_medidas = "A sala tem 5 metros de comprimento e 10 pés de largura."

# Converter unidades de medida no texto
texto_convertido = converter_unidades(texto_com_medidas)

print("Texto original:", texto_com_medidas)
print("Texto convertido:", texto_convertido)

**97. Validador endereços residenciais.**

In [None]:
import re

# Função para validar um endereço residencial
def validar_endereco(endereco):
    # Expressão regular para validar um endereço residencial
    padrao_endereco = r'^\d+\s\w+\s\w+'

    if re.match(padrao_endereco, endereco):
        return True
    else:
        return False

# Endereço de exemplo a ser validado
endereco_exemplo = "123 Rua da Amostra"

# Validar o endereço
if validar_endereco(endereco_exemplo):
    print("O endereço é válido.")
else:
    print("O endereço não é válido.")

**98. Ferramenta de Limpeza de Texto.**

In [None]:
import re

# Função para limpar um texto
def limpar_texto(texto):
    # Remover caracteres especiais e números
    texto = re.sub(r'[^a-zA-Z\s]', '', texto)

    # Remover espaços em excesso
    texto = re.sub(r'\s+', ' ', texto)

    # Converter para letras minúsculas
    texto = texto.lower()

    return texto

# Texto de exemplo a ser limpo
texto_exemplo = "Este é um exemplo de  texto, com vários caracteres especiais, números e   espaços em excesso!"

# Limpar o texto
texto_limpo = limpar_texto(texto_exemplo)

print("Texto original:", texto_exemplo)
print("Texto limpo:", texto_limpo)

**99. Validação de documentos básicos.**

In [None]:
import re

# Função para validar CPF
def validar_cpf(cpf):
    # Expressão regular para CPF
    cpf_regex = re.compile(r'^\d{3}\.\d{3}\.\d{3}-\d{2}$')
    return bool(cpf_regex.match(cpf))

# Função para validar CNPJ
def validar_cnpj(cnpj):
    # Expressão regular para CNPJ
    cnpj_regex = re.compile(r'^\d{2}\.\d{3}\.\d{3}\/\d{4}-\d{2}$')
    return bool(cnpj_regex.match(cnpj))

# Função para validar RG
def validar_rg(rg):
    # Expressão regular para RG (formato: XX.XXX.XXX-X)
    rg_regex = re.compile(r'^\d{2}\.\d{3}\.\d{3}-\d{1}$')
    return bool(rg_regex.match(rg))

# Função para validar número de telefone
def validar_telefone(telefone):
    # Expressão regular para número de telefone (formato: (XX) XXXXX-XXXX)
    telefone_regex = re.compile(r'^\(\d{2}\) \d{5}-\d{4}$')
    return bool(telefone_regex.match(telefone))

# Solicitar ao usuário o tipo de documento e o documento
tipo_documento = input("Escolha o tipo de documento (CPF, CNPJ, RG, Telefone): ").upper()
documento = input("Insira o documento: ")

if tipo_documento == 'CPF':
    if validar_cpf(documento):
        print("CPF válido.")
    else:
        print("CPF inválido.")
elif tipo_documento == 'CNPJ':
    if validar_cnpj(documento):
        print("CNPJ válido.")
    else:
        print("CNPJ inválido.")
elif tipo_documento == 'RG':
    if validar_rg(documento):
        print("RG válido.")
    else:
        print("RG inválido.")
elif tipo_documento == 'TELEFONE':
    if validar_telefone(documento):
        print("Número de telefone válido.")
    else:
        print("Número de telefone inválido.")
else:
    print("Tipo de documento não suportado.")

**100. Validador de Placas de Veículos.**

In [None]:
import re

# Função para validar uma lista de placas de veículo brasileiras (padrão Mercosul)
def validar_placas(placas):
    # Expressão regular para validar uma placa de veículo no novo padrão brasileiro (Mercosul)
    padrao_placa = r'^[A-Z]{3}\d[A-Z]\d{2}$'

    placas_validas = []
    placas_invalidas = []

    for placa in placas:
        if re.match(padrao_placa, placa):
            placas_validas.append(placa)
        else:
            placas_invalidas.append(placa)

    return placas_validas, placas_invalidas

# Lista de placas de exemplo a serem validadas
placas_exemplo = ["AAA1A11", "XYZ2B22", "1234CDE", "MNO5F55"]

# Validar as placas
placas_validas, placas_invalidas = validar_placas(placas_exemplo)

print("Placas válidas:")
for placa in placas_validas:
    print(placa)

print("\nPlacas inválidas:")
for placa in placas_invalidas:
    print(placa)