# Expressões Regulares

Expressões regulares são padrões usados pra combinar ou encontrar ocorrências de sequências de caracteres em uma string. Em Python, expressões regulares são geralmente usadas para manipular strings e realizar tarefas como validação de entrada de dados, extração de informações de strings e substituição de texto.

In [1]:
import re

In [2]:
texto = "Meu e-mail é exemplo@gmail.com e você pode me contatar em outro_email@yahoo.com."

In [3]:
# Expressão regular para contar quantas vezes o caracter arroba aparece no texto
resultado = len(re.findall("@", texto))

In [4]:
print("O caractere '@' apareceu", resultado, "vezes no texto.")

O caractere '@' apareceu 2 vezes no texto.


In [5]:
# Expressão regular para extrair a palavra que aparece após a palavra "você" em um texto
resultado = re.findall(r'você (\w+)', texto)

In [7]:
print("A palavra após 'você' é:", resultado[0])

A palavra após 'você' é: pode


Nota: O r antes da string que representa a expressão regular em Python é usado para indicar que a string é uma string literal raw. Isso significa que as barras invertidas () não são interpretadas como caracteres de escape, mas são incluídas na expressão regular como parte do padrão.

In [9]:
# Expressão regular para extrair endereços de e-mail de uma string
emails = re.findall(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', texto)

In [10]:
print(emails)

['exemplo@gmail.com', 'outro_email@yahoo.com']


https://docs.python.org/3.9/library/re.html

In [11]:
text = "O aluno estava incrivelmente perdido, mas encontrou a DSA e rapidamente começou a aprender."

In [12]:
# Extraindo os advérbios da frase
for m in re.finditer(r"\w+mente\b", text):
    print('%02d-%02d: %s' % (m.start(), m.end(), m.group(0)))

15-28: incrivelmente
60-71: rapidamente


## REGEX com ChatGPT

Música:

In [13]:
# Variável do tipo string
# ''' aspas simples formam uma docstring, formato que permite atribuir uma string a uma variável em varias linhas
musica = '''
Um belo sonho veio então despertar minha vontade
Tudo vale a pena pra te encontrar
Me livrei de tudo aquilo e consegui mudar
Tudo que foi feito em troca de uma amizade
Mas felicidade é poder estar com quem
Você gosta em algum lugar
É foda ser louco advogado do mundo
Mas, como tudo deve ser
É foda ser tachado de doido
Vagabundo mas, como tudo deve ser
Foi quando te encontrei
Ouvindo o som e olhando o mar
Foi quando te encontrei
Ouvindo o som do mar rolar
Eu não nasci ontem, bem quando e como por onde mais
Como tudo deve ser
Com as balizas do nosso sistema
Sigo imprimindo meu sonho na história
Como tudo deve ser
Um belo sonho veio então despertar minha vontade
Tudo vale a pena pra te reencontrar
Me livrei de tudo aquilo e consegui mudar
Tudo que foi feito em troca de uma amizade mas
Foi quando te encontrei
Ouvindo o som e olhando o mar
Foi quando te encontrei
Ouvindo o som do mar rolar
Eu não preciso de promessas
E acho que você também,
Eu não tento ser perfeito
E acho que você também
Dias e noites, pensando no que fiz
Eu sou um vencedor
Eu lutei pelo o que eu quis
Mas quando não se pode mais mudar tanta coisa errada
Vamos viver os nossos sonhos
Temos tão pouco tempo
Foi quando te encontrei
Ouvindo o som e olhando o mar
Foi quando te encontrei
Ouvindo o som do mar rolar
Foi quando te encontrei,
Ouvindo o som e olhando o mar
Foi quando te encontrei
Ouvindo o som do mar rolar
Foi quando te encontrei,
Ouvindo o som e olhando o mar
Ouvindo o som o mar rolar
O mar
'''

In [14]:
print(musica)


Um belo sonho veio então despertar minha vontade
Tudo vale a pena pra te encontrar
Me livrei de tudo aquilo e consegui mudar
Tudo que foi feito em troca de uma amizade
Mas felicidade é poder estar com quem
Você gosta em algum lugar
É foda ser louco advogado do mundo
Mas, como tudo deve ser
É foda ser tachado de doido
Vagabundo mas, como tudo deve ser
Foi quando te encontrei
Ouvindo o som e olhando o mar
Foi quando te encontrei
Ouvindo o som do mar rolar
Eu não nasci ontem, bem quando e como por onde mais
Como tudo deve ser
Com as balizas do nosso sistema
Sigo imprimindo meu sonho na história
Como tudo deve ser
Um belo sonho veio então despertar minha vontade
Tudo vale a pena pra te reencontrar
Me livrei de tudo aquilo e consegui mudar
Tudo que foi feito em troca de uma amizade mas
Foi quando te encontrei
Ouvindo o som e olhando o mar
Foi quando te encontrei
Ouvindo o som do mar rolar
Eu não preciso de promessas
E acho que você também,
Eu não tento ser perfeito
E acho que você também
D

In [16]:
# 1- Crie um REGEX para contar quantas vezes o caracter "a" aparece em todo o texto da música.
# 2- Crie um REGEX em Python para contar quantas vezes a palavra mar aparece na música
# 3- Crie um REGEX em Python para extrair as palavras seguidas por virgula
# 4- Crie um REGEX que retorne as palavras com acento, mas somente os caracteres na palavra que são anteriores ao caracter acentuado


In [17]:
# 1- Crie um REGEX para contar quantas vezes o caracter "a" aparece em todo o texto da música.
match = re.findall("a", musica)
count = len(match)

print("O caractere 'a' aparece", count, "vezes no texto.")

O caractere 'a' aparece 101 vezes no texto.


In [19]:
# 2- Crie um REGEX em Python para contar quantas vezes a palavra mar aparece na música
palavra = "mar"

ocorrencias = re.findall(r'\b' + re.escape(palavra) + r'\b', musica, re.IGNORECASE)

contagem = len(ocorrencias)

print(f"A palavra '{palavra}' aparece {contagem} vezes no texto.")

A palavra 'mar' aparece 11 vezes no texto.


In [20]:
# 3- Crie um REGEX em Python para extrair as palavras seguidas por virgula
# Usando a função findall para encontrar todas as palavras seguidas por vírgula
palavras_com_virgula = re.findall(r'\w+,', musica)

# Removendo as vírgulas das palavras extraídas
palavras_sem_virgula = [palavra.rstrip(',') for palavra in palavras_com_virgula]

print("Palavras seguidas por vírgula:")
for palavra in palavras_sem_virgula:
    print(palavra)

Palavras seguidas por vírgula:
Mas
mas
ontem
também
noites
encontrei
encontrei


In [23]:
# 4- Crie um REGEX que retorne as palavras com acento, mas somente os caracteres na palavra que são anteriores ao caracter acentuado

# Usando a função findall para encontrar palavras com acentos
palavras_com_acentos = re.findall(r'\b\w+(?=[áàâãéèêíïóôõöúüç])', musica, re.IGNORECASE)

# Imprimindo as palavras encontradas
for palavra in palavras_com_acentos:
    print(palavra)


ent
Voc
n
hist
ent
n
voc
tamb
n
voc
tamb
n
t
