## Expressão Regular

<p style="font-size: 16px; text-style: jutifying;">Expressão regular são utilizadas para construir reconhecedores de Linguages Regulares. Ao construir um reconhecedor de Liguagem Regular, podemos encontrar todas as palavras que pertencem a linguagem e realizar a computação desejada sobre elas.</p>

## Principais funções 

* ### sub: realiza a substituição de toda ocorrência que der match com a regex
* ### findall: retorna uma lista com toda sbstring que der match com a regex
* ### search: retorna um objeto Match com a primeira substring que der match com a regex
* ### match: retorna um objeto Match com a primeira subtring que der match com a regex, a partir do início
* ### fullmatch: retorna um objeto Match, se a string toda der match com a regex
* ### split: retorna uma lista de string, tendo como critério  de quebra o match da regex
* ### finditer: retorna um iterável de objetos Match, de toda substring que der match com a regex

## Principais caracteres especiais 

| Caracter | Descrição                              |
|----------|----------------------------------------|
| []       | conjunto                               |
| [^]      | negação do conjunto                    |
| .        | qualquer caractere                     |
| ^        | começa com                             |
| $        | termina com                            |
| *        | zero ou mais ocorrências               |
| +        | uma ou mais ocorrências                |
| ?        | zero ou uma ocorrência                 |
| {n}      | exatamente n ocorrências               |
| {n,k}    | no mínimo n e no máximo k ocorrências  |
| {n,}     | pelo menos n ocorrências               |
| {,k}     | no máximo k ocorrências                |
| \|       | ou                                     |
| (?=)     | match prefixo                          |
| (?<=)    | match sufixo                           |

## Exemplo 1: Escreva um programa que substitua todos os dígitos por _

In [1]:
import re
msg = "93456 Renato 5"
regex = re.compile(r"[0-9]")
saida = regex.sub("_", msg)
print(saida)

_____ Renato _


In [None]:
import re
msg = "93456 Renato 5"
regex = re.compile(r"[0-9]+")
saida = regex.sub("_", msg)
print(saida)

_ Renato _


In [None]:
import re
msg = "93456 Renato 5"
regex = re.compile(r"\d+")
saida = regex.sub("_", msg)
print(saida)

_ Renato _


In [4]:
import re
msg = "93456 Renato 5"
saida = re.sub(r"[^0-9]", "_", msg)
print(saida)

93456________5


## Exemplo 2: Escreva um programa que substitua tudo o que não for dígito por _

In [None]:
import re
msg = "93456 Renato 5"
regex = re.compile(r"\D")
saida = regex.sub("_", msg)
print(saida)

93456________5


In [None]:
import re
msg = "93456 Renato 5"
regex = re.compile(r"\D+")
saida = regex.sub("_", msg)
print(saida)

93456_5


In [None]:
import re
msg = "93456 Renato 5"
regex = re.compile(r"[^0-9]+")
saida = regex.sub("_", msg)
print(saida)

93456_5


In [None]:
import re
msg = "93456 Renato 5"
saida = re.sub(r"[^0-9]+", "_", msg)
print(saida)

93456_5


## findall

## Exemplo 3: Escreva um programa para encontrar todos os dígitos e armazenar em uma lita

In [12]:
import re
msg = "93456 Renato 5"
saida = re.findall(r"[0-9a-z]*",msg)
print(saida)

['93456', '', '', 'enato', '', '5', '']


In [8]:
import re
msg = "93456 Renato 5"
regex = re.compile(r"[0-9]+")
saida = regex.findall(msg)
print(saida)

['93456', '5']


## Exemplo 4: Escreva um progrma para verificar se a string começa com letra maiúscula

In [21]:
import re
msg = "RenaTo 5"
regex = re.compile(r"[A-Z]")
saida = regex.findall(msg)
print(saida)

['R', 'T']


## Exemplo 5: Escreva um programa para verificar se a string termina com ponto

In [22]:
import re
msg = "Renato 5."
regex = re.compile(r".*\.$")
saida = regex.match(msg)
print(saida)

<re.Match object; span=(0, 9), match='Renato 5.'>


In [None]:
import re
msg = "Renato 5."
regex = re.compile(r"\.$")
saida = regex.search(msg)
print(saida)

<re.Match object; span=(8, 9), match='.'>


## Acessando os índices

In [23]:
import re
msg = "Renato 5."
regex = re.compile(r"\.$")
saida = regex.search(msg)
print(saida.span())

(8, 9)


## Acessando o valor

In [24]:
import re
msg = "Renato 5?"
regex = re.compile(r"[.!,?;]$")
saida = regex.search(msg)
print(saida.group())

?


## Exemplo 6: Escreva um programa para gerar um lista de tokens a cada espaço, vírgula ou pontuação encontrada

In [None]:
import re
msg = "Olá, me chamo Renato. E você, como se chama?"
regex = re.compile(r"[\s.!?,]")
saida = regex.split(msg)
print(saida)

['Olá', '', 'me', 'chamo', 'Renato', '', 'E', 'você', '', 'como', 'se', 'chama', '']


## Exemplo 7: Escreva um programa para encontrar a posição de todas a palavras com letra maiúscula

In [25]:
import re
msg = "Olá, me chamo Renato. E você, como se chama?"
regex = re.compile(r"\b[A-Z]\w*")
for item in regex.finditer(msg):
    print(item)

<re.Match object; span=(0, 3), match='Olá'>
<re.Match object; span=(14, 20), match='Renato'>
<re.Match object; span=(22, 23), match='E'>


## Exemplo 8: Escreva um programa para verificar se a string contém somente letras minúsculas ou espaço

In [None]:
import re
msg = "renato hidaka"
regex = re.compile(r"[a-z\s]+")
saida = regex.fullmatch(msg)
print(saida)

<re.Match object; span=(0, 13), match='renato hidaka'>


## Exemplo 9: Escreva um programa para verificar se a string possui ao menos uma letra amiúscula, uma minúscula, um dígito, um caracter especial e no mínimo 8 caracteres

In [None]:
import re
msg = "Aa2@dsdsdsa!sa"


saida = len(msg) >= 8 and\
        re.search(r"[0-9]", msg) and\
        re.search(r"[a-z]", msg) and\
        re.search(r"[A-Z]", msg) and\
        re.search(r"[!@#$%&*+=]", msg)
        
if saida:
    print("ok")
else:
    print("fail")


ok


## Exemplo 10: Escreva um programa para encontrar um padrão de telefone precedido pela palavra telefone ou tel

import re
msg = "99 telefone 99 99269-9999"
saida = re.search(r"(?<=tel )\d{2} \d{5}-\d{4}|(?<=telefone )\d{2} \d{5}-\d{4}", msg)
print(saida)\d{2} \d{5}-\d{4}

In [None]:
import re
msg = "99 telefone 99 99269-9999"
saida = re.search(r"(?<=tel )\d{2} \d{5}-\d{4}", msg) or\
        re.search(r"(?<=telefone )\d{2} \d{5}-\d{4}", msg)
print(saida)

<re.Match object; span=(12, 25), match='99 99269-9999'>


## Exemplo 11: Escreva um programa para encontrar uma  palavra sucedida pela palavra onde.

In [None]:
import re
msg = " 9 outro telefone onde te8"
saida = re.search(r"\w+(?=\sonde)", msg)
print(saida)

<re.Match object; span=(9, 17), match='telefone'>


## Exercício

## 1- Escreva um programa para reconhecer as strings que sejam sequências de letras A e de tamanho par.

## 2- Escreva um programa para remover de uma string tudo o que não for espaço ou letra.

## 3- Escreva um programa para classificar senhas, tal que:

* ### muito forte: senha com no nínimo 10 caracteres, contendo letra maiúscula, minúscula, dígito e pelo menos três caracteres especiais.
* ### forte: senha com no mínomo 8 caracteres, contendo letra maiúscula, minúscula, dígito e caracteres especiais.
* ### média: senha com no mínomo 6 caracteres, contendo pelo menos letra maiúscula, minúscula e dígito.
* ### fraca: senha com no mínimo 6 caracteres que não seja senha classificada com força média.
* ### inválida: toda senha que não é fraca.

## 4- Escreva um programa para encontrar todas as ocorrências de telefones celulares que tenha ou não ddd especificado e que usem ou não hífen.

## 5- Escreva um programa para reconhecer uma string contendo somente zeros e uns e que tenha pelo menos três ocorrências do dígito um.

## 6- Escreva um programa para reconehcer uma string contendo somente zeros e uns e que não tenha dois uns consecutivos.

## 7- Escreva um programa para informar o índice inicial e final de todas as substring que tenham o prefixo R$

## 8- Escreva um programa para informar se uma string representa uma expressão aritmética válida que contenha somente os operadores + - * e /, e que as operações sejam realizados somenet com números inteiros.

## 9- Escreva um programa para encontrar todas as ocorrências de plavras que inicie com letra maiúscula.

## 10- Escreva um programa para reconhecer uma string contendo somente as letras A C T G e que as substrings AC ou TG apareçam pelo menos duas vezes não importando a ordem.