# Regex
Expressões regulares (também conhecidas como regex ou regexp) são sequências de caracteres que formam um padrão de busca. Elas são utilizadas para buscar, validar e manipular texto com base nesse padrão. As expressões regulares fornecem uma poderosa linguagem para especificar padrões de texto de maneira concisa e flexível.

In [146]:
import re

In [147]:
texto = "Eu bebo café todos os dias"

In [148]:
# Nos mostra a quantidade de ocorrências do argumento passado
resultado = len(re.findall("o", texto))

In [149]:
resultado

4

In [150]:
# Procura por ocorrências de palavras seguintes à palavra passado como parâmetro
resultado = re.findall(r'bebo (\w+)', texto)

In [151]:
resultado

['café']

In [152]:
# Regex capaz de identificar contas de email em uma string
texto_emails = "Eu possuo duas contas de email, a principal é: regex.py@gmail.com. E a outra py.datasci@outlook.com"

In [153]:
emails = re.findall(r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b', texto_emails)

In [154]:
emails

['regex.py@gmail.com', 'py.datasci@outlook.com']

In [155]:
musica = '''
Tô correndo atrás de tudo aquilo que esse mundo tem pra me dar
O que essa vida tem pra me dar?
E a falta do básico, nos fez querer ter mais que o necessário
Salário baixo e sonhos de um milionário
Meu desejo virou meu adversário
Castelos imaginários, personagens e cenários
Navegar sem naufragar por esses mares
Na executiva o sorriso da comissária
Viver pouco como um rei ou muito como um zé?
Essa eu ainda não sei responder
O porco com a lei e eu seguindo na fé
De que ele nunca vai me prender
Nunca vou me submeter
Nunca vão me deter, éramos as cinzas e agora somos o fogo
E não a nada que eu não possa fazer
Tem coisas que só acredito vendo
Coisas que nem acredito que tô vendo
Ver e ficar quieto, a rua tem dois mandamentos
Uns ficam de olho nos rendimentos
Já é tarde pra seu arrependimento
Pra abrir sua mente não sou cirurgião
Mas sei qual é o procedimento
Quando criança eu sonhava em crescer e ter todo o melhor dessa vida
Hoje sou um homem crescido, e a criança em mim ainda é viva
A vida é um filme de ação, de terror ou de tragédia
Eu só não posso ter um fim de comédia e vice-versa
Vitorioso e não um vice que versa
Heróis vestem capa, salvam pátrias detém balas
Medalhas de prata não valem nada
Batalhas são quadros de um passado inalterado
E o que resta sempre são quadros
Os copos gelados, trazem corpos gelados à tona
Dizem que a morte é o preço da honra, eu não sei
Homens seguem leis, e mesmo assim morrem por causa das leis
Vi um homem de muitos quilos morrendo por poucas gramas
Vi um homem desconhecido morrendo atrás de fama
Um homem morrer de amor pela mulher que não o ama
De um quadro grave faço quadro de arte
Rimando a vida somos a voz da cidade
Que nos divide em facções, drogas e armas
Broncas e áreas
Temos um jeito de nascer, mais de 1000 pra morrer
E quem ta preparado para o qual vai ser?
Robocop é o herói só na TV, então nem sempre a arte imita a vida
Sobre o que ninguém vai falar, só nós podemos falar
Começar uma nova e terminar uma antiga briga
E a situação não muda, vocês sabem o que plantam e o que colhem na muda
Na gorjeta miúda, um de confiança se tornou um Judas
E o mal assombra e o barco afunda
Na pequena fenda feita com a sonda
Do medo, depois da infância são caros os brinquedos
Errei quando pedi sua ajuda
Se não pode com eles, junte-se a eles, faça parte deles
Infiltre-se neles e quando tu estiver lá dentro
Mate todos eles
Tentamos conversar, tentamos resolver
Eles fingem não escutar, mas agora eles vão ver
Fizemos o inferno subir, fizemos o céu descer
Heróis vestem capa, salvam pátrias detém balas
Medalhas de prata não valem nada
Batalhas são quadros de um passado inalterado
E o que resta sempre são quadros
Ouro, tesouro, sorte ou agouro se eu não mato eu morro
Sangue nas pinturas pelos diamantes, nas molduras
Tô correndo atrás de tudo aquilo que esse mundo tem pra me dar
O que essa vida tem pra me dar?'''

In [156]:
# Retorna a qunatidade de vezes que a palavra quadros aparece na música
quadros = len(re.findall(r"\bquadros\b", musica))

In [157]:
print(f"A palavra quadros aparece {quadros} vezes na música")

A palavra quadros aparece 4 vezes na música


In [158]:
# Retorna quais palavras aparecem antes da interrogação
interrogacao = re.findall(r'\b(\w+)\s*\?', musica)

In [159]:
interrogacao

['dar', 'zé', 'ser', 'dar']

In [160]:
# Palavras encontradas entre 'o' e 'da'
oda = re.findall(r'\bo\s+(\w+)\s+da\b', musica)

In [161]:
oda

['sorriso', 'preço']

In [162]:
# Todas palavras com acentuação
acento = re.findall(r'\b\w*[áéíóúãõç]\w*\b', musica)

In [163]:
acento

['atrás',
 'básico',
 'necessário',
 'Salário',
 'milionário',
 'adversário',
 'imaginários',
 'cenários',
 'comissária',
 'zé',
 'não',
 'fé',
 'vão',
 'éramos',
 'não',
 'não',
 'só',
 'Já',
 'é',
 'não',
 'cirurgião',
 'é',
 'criança',
 'criança',
 'é',
 'é',
 'ação',
 'tragédia',
 'só',
 'não',
 'comédia',
 'não',
 'Heróis',
 'pátrias',
 'detém',
 'não',
 'são',
 'são',
 'é',
 'preço',
 'não',
 'atrás',
 'não',
 'faço',
 'facções',
 'áreas',
 'é',
 'herói',
 'só',
 'então',
 'ninguém',
 'só',
 'nós',
 'Começar',
 'situação',
 'não',
 'miúda',
 'confiança',
 'são',
 'não',
 'faça',
 'lá',
 'não',
 'vão',
 'céu',
 'Heróis',
 'pátrias',
 'detém',
 'não',
 'são',
 'são',
 'não',
 'atrás']

In [164]:
# Palavras precedidas por 'a'
depois_a = re.findall(r'\ba\s+(\w+)\b', musica)

In [165]:
depois_a

['falta',
 'lei',
 'nada',
 'rua',
 'criança',
 'morte',
 'vida',
 'voz',
 'arte',
 'vida',
 'situação',
 'sonda',
 'eles']