# Expressões Regulares

**Expressões regulares são padrões usados para combinar ou encontrar ocorrências de sequências de caracteres em uma string. Em Python, expressões regulares são geralmente usadas para manipular strings e realizar tarefas como validação de entrada de dados, extração de informações de strings e substituição de texto.**

In [60]:
# regular expression
import re

In [61]:
texto = 'Meu e-mail é exemplo@gmail.com e você pode me contatar em outro_email@mail.com.'

In [62]:
# expressao regular para contar quantas vezes o caracter arroba aparece no texto
resultado = len(re.findall('@', texto))

In [63]:
print('O caractere "@" apareceu', resultado, 'vezes no texto.')

O caractere "@" apareceu 2 vezes no texto.


In [64]:
# expressao regular para extrair a palavra que aparece apos a palavra "você" em um texto
resultado = re.findall(r'você (\w+)', texto)

In [65]:
print('A palavra após "você" é:', resultado[0])

A palavra após "você" é: pode


Nota: O r antes da string que representa a expressão regular em Python é usado para indicar que a string é uma string literal raw. Isso significa que as barras invertidas não são interpretadas como caracteres de escape, mas são incluídas na expressão regular como parte do padrão.

In [66]:
# expressão regular para extrair endereços de e-mail de uma string
emails = re.findall(r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}', texto)

In [67]:
print(emails)

['exemplo@gmail.com', 'outro_email@mail.com']


In [68]:
text = 'O aluno estava incrivelmente perdido, mas encontrou a DSA e rapidamente começou a aprender.'

In [69]:
# extraindo os advérbios da frase
for m in re.finditer(r'\w+mente\b', text):
    print('%02d-%02d: %s'  % (m.start(), m.end(), m.group(0)))

15-28: incrivelmente
60-71: rapidamente


### REGEX com ChatGPT

Música: Cedo ou Tarde

NX Zero

In [70]:
musica = '''
Quando perco a fé, fico sem controle
E me sinto mal, sem esperança
E ao meu redor a inveja vai
Fazendo as pessoas se odiarem mais

Me sinto só (me sinto só)
Mas sei que não estou (mas sei que não estou)
Pois levo você no pensamento
Meu medo se vai (meu medo se vai)
Recupero a fé (recupero a fé)
E sinto que algum dia ainda vou te ver

Cedo ou tarde
Cedo ou tarde

Cedo ou tarde a gente vai se encontrar
Tenho certeza, numa bem melhor
Sei que quando canto você pode me escutar

Você me faz querer viver
E o que é nosso está guardado em mim
E em você
E apenas isso basta

Me sinto só (me sinto só)
Mas sei que não estou (mas sei que não estou)
Pois levo você no pensamento
Meu medo se vai (meu medo se vai)
Recupero a fé (recupero a fé)
E sinto que algum dia ainda vou te ver

Cedo ou tarde
Cedo ou tarde

Cedo ou tarde a gente vai se encontrar
Tenho certeza, numa bem melhor
Sei que quando canto você pode me escutar

Uh, uh-uh-uh
Uh, oh (oh)

Cedo ou tarde a gente vai se encontrar
Tenho certeza, numa bem melhor
Sei que quando canto você pode me escutar
Cedo ou tarde a gente vai se encontrar
Tenho certeza, numa bem melhor
Sei que quando canto você pode me escutar
'''

In [71]:
print(musica)


Quando perco a fé, fico sem controle
E me sinto mal, sem esperança
E ao meu redor a inveja vai
Fazendo as pessoas se odiarem mais

Me sinto só (me sinto só)
Mas sei que não estou (mas sei que não estou)
Pois levo você no pensamento
Meu medo se vai (meu medo se vai)
Recupero a fé (recupero a fé)
E sinto que algum dia ainda vou te ver

Cedo ou tarde
Cedo ou tarde

Cedo ou tarde a gente vai se encontrar
Tenho certeza, numa bem melhor
Sei que quando canto você pode me escutar

Você me faz querer viver
E o que é nosso está guardado em mim
E em você
E apenas isso basta

Me sinto só (me sinto só)
Mas sei que não estou (mas sei que não estou)
Pois levo você no pensamento
Meu medo se vai (meu medo se vai)
Recupero a fé (recupero a fé)
E sinto que algum dia ainda vou te ver

Cedo ou tarde
Cedo ou tarde

Cedo ou tarde a gente vai se encontrar
Tenho certeza, numa bem melhor
Sei que quando canto você pode me escutar

Uh, uh-uh-uh
Uh, oh (oh)

Cedo ou tarde a gente vai se encontrar
Tenho certeza, n

In [72]:
# Crie um REGEX para contar quantas vezes o caractere "a" aparece em todo o texto da musica
resultado = len(re.findall('a', musica))

In [73]:
print(f'O caractere "a" apareceu {resultado} vezes na música.')

O caractere "a" apareceu 83 vezes na música.


In [74]:
# Crie um REGEX em Python para contar quantas vezes a palavra "cedo" aparece no texto da música
resultado = len(re.findall(r'\bCedo\b', musica))

In [75]:
print(f'A palavra "Cedo" apareceu {resultado} vezes na música.')

A palavra "Cedo" apareceu 8 vezes na música.


In [76]:
# Crie um REGEX em Python para extrair as palavras seguidas por vírgula
resultado = re.findall(r'\b\w+,', musica)

In [77]:
print(f'As palavras seguidas por vírgula na música são: {resultado}')

As palavras seguidas por vírgula na música são: ['fé,', 'mal,', 'certeza,', 'certeza,', 'Uh,', 'Uh,', 'certeza,', 'certeza,']


In [78]:
# Crie um REGEX que extrai qualquer palavra cujo antecessor seja a palavra "você", e o sucessor seja a palavra "me"
resultado = re.findall(r'(?<=\bMeu\s)\w+(?=\sse\b)', musica)

In [79]:
print(f'Palavra(s) encontrada(s): {resultado[0]}')

Palavra(s) encontrada(s): medo


In [80]:
# Crie um REGEX que retorne as palavras com acento, mas somente os caracteres na palavra que são anteriores ao caracter com acento.
resultado = re.findall(r'\b(\w*?)(?=[áéíóúãõâêîôûäëïöüàèìòù])', musica)

In [82]:
print(f'Palavra(s) encontrada(s): {resultado}')

Palavra(s) encontrada(s): ['f', 's', 's', 'n', 'n', 'voc', 'f', 'f', 'voc', 'Voc', '', 'est', 'voc', 's', 's', 'n', 'n', 'voc', 'f', 'f', 'voc', 'voc', 'voc']
