## Revisão - Expressão regular (Python)

![image.png](img/01.png)

### Introdução

- Expressão Regular: Um método formal de se especificar um padrão de texto.


- Expressão Regular: Como o brinquedo LEGO, várias pecinhas diferentes, cada uma com sua característica, que juntas compõem estruturas completas e podem ser arranjadas com infinitas combinações diferentes.


- Expressão Regular: Uma composição de símbolos, caracteres com funções especiais, que, agrupados entre si e com caracteres literais, formam uma seqüência, uma expressão. Essa expressão é interpretada como uma regra, que indicará sucesso se uma entrada de dados qualquer casar com essa regra, ou seja, obedecer exatamente a todas as suas condições.

###### Fonte: Aurelio

#### Anatomia básica de uma expressão regular

![image.png](img/02.png)

### Tabela de caracteres/estruturas especiais

##### Notas
- Comumente letras em maiúsculo tem o significado contrário de seus respectivos caracteres minúsculos;
- String é um texto qualquer;
- Fronteira são caracteres não alfanuméricos;
- Coincidência ou match é o ato de um conjunto de texto ser válido para uma determinada expressão regular.


|Caractere |	Significado                                                                       |
|----------|---------------------------------------------------------------------------------------
|\b	| Fronteira de palavra (início ou fim de uma palavra). |
|\B	| Não é uma fronteira de palavra (não início ou não fim de uma palavra). |
|^	| Início de uma palavra ou linha ou negação quando em uma expressão agrupada (entre []).|
|$	| Fim de uma linha.|
|\w	| Caracteres alfanuméricos e underline ([A-Za-z0-9_]).|
|\W	| Caracteres não alfanuméricos e underline ([^A-Za-z0-9_]).|
|\d	| Coincide apenas dígitos ([0-9]).|
|\D	| Coincide apenas não dígitos ([^0-9]).|
|\s	| Coincide qualquer caracter de espaço em branco.|
|\S	| Coincide qualquer caracter que não seja de espaço em branco.|
|\A	| A coincidência ocorre no primeiro caractere.|
|\Z	| A coincidência ocorre no final do último caractere de uma string ou linha (antes de \n).|
|\z	| A coincidência ocorre no final do último caractere de uma string, ignorando linhas.|
|\G	| A coincidência ocorre a partir do ponto no qual a última coincidência terminou.|
|\t	| TAB.|
|\n	| Nova linha.|
|[\b] |	Backspace.|
|\r	| Retorno de carro.|
|\	| Quando seguido de um caractere especial das expressões regulares, realiza coincidência daquele caractere.|
|*	| Coincidência dos caracteres precedidos ZERO ou mais vezes.|
|+	| Coincidência dos caracteres precedidos UMA ou mais vezes.|
|{n}	| Coincidência dos caracteres precedidos exatamente n vezes.|
|{n,m} | Coincidência dos caracteres precedidos entre n (número mínimo de repetições) e m (número máximo de repetições) vezes. Pode-se deixar vazios tanto n ({,m}) quanto m ({n,}), o que causa coincidência apenas com o valor indicado.|
|?	| Caracteres precedentes são opcionais. Equivale a {0,1}.|
|.	| Coincide qualquer caracter.|
|[ ]	| Utilizado para agrupamento de expressões.|
|[caracteres] |	Coincidência de quaisquer caracteres presentes entre os colchetes.|
|[c1-c2]	| Coincidência de quaisquer caracteres alfanuméricos entre c1 e c2 (em order alfabética/numérica).|
|x"pip"y	| Coincide os caracteres x ou y.|
|( )	| Utilizado para agrupamento de caracteres. Cria um grupo não nomeado.|

#### Operadores aprendidos em aula

![image.png](img/04.png)

Dito em aula que também existe o () sig. agrupamento

#### FindIter

In [None]:
# Expressões regulares em Python

# importando o módulo de expressão regular
import re

In [None]:
alunos = '''
Camila Morais de Melo
Cristiane de Massena
Daniel Magalhães Bicalho
Sandra Pereira
Renata Williams
Philipe Augusto Ferreira
Cleiriane
Vania
Solange
Juciana
Lucas Ribeiro
Lair
Julia Dornas
Juliana Soares Viana
DYEGO SOUZA
Pedro Henrique Lourencini
Jéssica Veiga
RENATA SANTANA DIAS
Paula
Anderson
Rudyard Sarquis
JESSICA BARBOSA DAS CHAGAS
Rafael
Thiago Silva Mendes
Edvandro
Alisson Batista Oliveira
Daiane França
Valmir Batista Prestes de Souza
Andre Emidio
Anderson Aparecido Tossani
Luís Vinícius Costa Damaceno
Adolfo
George Moraes
Nicholas Correa
Dieison Gularte
Milena Merlo Rodrigues
Pedro
Adriano
Julio Freitas
Tulio Nogueira
Inácio Américo Gomes Slompo
'''

pattern = "[A-Z][a-z].+"
for macth in re.finditer(pattern,alunos):
    print(macth)

![image.png](img/05.png)

In [None]:
# importando o módulo de expressão regular
import re

html = '''exclamation	!	U+0021 (33)	HTML 2.0	(Refer HTML5 W3School)	ISOnum	exclamation mark
quot	"	U+0022 (34)	HTML 2.0	HTMLspecial	ISOnum	quotation mark (APL quote)'''

pattern = "(\w+)\t(.)\tU\+0*(\w+) \(\d+\)\t.*$"
for macth in re.finditer(pattern,html):
    print(macth)

![image.png](img/06.png)

#### Search

In [None]:
string = "Teste de expressão regular em Python 3."

# procurando por um padrão
resultado = re.search('regular', string)

# capturando o resultado da pesquisa
print(resultado.group(0))

In [None]:
# caso nada seja encontrado o resultado seria None
resultado = re.search('nada', string)

if resultado:
    print("Encontrado")
else:
    print("Não encontrado")

In [None]:
# os padrões são organizados em grupos
resultado = re.search('(reg)(ular)', string)
#Com os parenteses pode ser agrupado
print("grupo 1:", resultado.group(1))
print("grupo 2:", resultado.group(2))

In [None]:
# Passando zero para o método retorna ambos os grupos.
print("grupo 0:", resultado.group(0))

#### Match

In [None]:
# função match
string = "Teste de expressão regular em Python 3."

resultado =  re.match('regular', string)
print(resultado)

resultado = re.match('...................(regular)', string)
print(resultado)

In [None]:
# substring do inicio até a palavra `regular`
print(resultado.group(0))

# apenas a palavra regular
print(resultado.group(1), '\n')

In [None]:
# podemos obter os mesmos resultados
# utilizando ferramentas apropriadadas
resultado = re.match('.{19}(regular)', string)
print(resultado.group(0))

In [None]:
# apenas a palavra regular
print(resultado.group(1), '\n')

resultado = re.match('.*(regular)', string)
print(resultado.group(0))

In [None]:
# apenas a palavra regular
print(resultado.group(1), '\n')
print(re.findall("((reg)(ular))", string))

In [None]:
import re
list = []

for i in range(int(input())):
    comando = input()
    
    operacao = comando.split()
    
    if re.search("insert",operacao[0]) != None: 
        list.insert(int(operacao[1]),int(operacao[2]))
    if re.search("print",operacao[0]) != None:
        print(list)
    if re.search("remove",operacao[0]) != None:
	    list.remove(int(operacao[1]))
    if re.search("append",operacao[0]) != None:
        list.append(int(operacao[1]))
    if re.search("sort",operacao[0]) != None:
        list.sort()
    if re.search("pop",operacao[0]) != None:
        list.pop(operacao[1])
    if re.search("reverse",operacao[0]) != None:
        list.reverse()

In [None]:
log = '''
0.0000 (0.0000) -  - [START] MainThread (141414001)
0.0000 (0.0000) -  - Init TestRegex class
0.0158 (0.0158) - 141414001 - [INFO] Before call method Invoice.insert
0.0158 (0.0000) - 141414001 - [INV] [INSERT] Inserting new invoice...
0.0591 (0.0433) - 141414001 - [ERROR] While executing Repository method: Invoice items insert failed: Invoice card detail insert failed
0.0592 (0.0001) - 141414001 - [INFO] Repository DBConn closed 
0.0641 (0.0050) - 141414001 - [INFO] RequestInfo:141414001
0.0642 (0.0000) - 141414001 - [END] - Invoice.insert MainThread (OriginalThread: MainThread)


0.0000 (0.0000) -  - [START] MainThread (141414002)
0.0000 (0.0000) -  - Init TestRegex class
0.0152 (0.0152) - 141414002 - [INFO] Before call method Cardholder.cardTransfer
0.0549 (0.0397) - 141414002 - [ERROR] While executing Repository method: Card of list is not from from_entity_id
0.0550 (0.0001) - 141414002 - [INFO] Repository DBConn closed 
0.0599 (0.0049) - 141414002 - [INFO] RequestInfo:141414002 
0.0599 (0.0000) - 141414002 - [END] - Invoice.insert MainThread (OriginalThread: MainThread)
'''

regex = "ERROR.*:"
for macth in re.finditer(regex,log):
    print(macth)

print()

regex = "RequestInfo:.*"
for macth in re.finditer(regex,log):
    print(macth)

#### Resumão das Expressões Regulares numa folha A4 (PDF)

http://piazinho.com.br/download/expressoes-regulares-3-tabelas.pdf

#### Ferramentas de apoio: 
- Regex101 (https://regex101.com/ )
        ★ Atualiza enquanto digita, destaca texto casado, mostra o conteúdo dos grupos, faz substituição de textos, referência rápida, sintaxes JavaScript, Python e Perl.
        
- Regexper (http://regexper.com/)
        ★ Cria diagramas que descrevem o funcionamento de uma expressão regular.

- My Regex Tester (https://www.myregextester.com/index.php)
        ★ Destaca texto casado, explica a expressão, otimiza a expressão, mostra código pronto da linguagem, sintaxe JavaScript, Java, VB.NET, C#.NET, PHP e ASP.

#### Lição de casa

RegexOne (https://regexone.com/)

  ★ Tutorial com exemplos interativos que a cada lição vai te ensinando um pouco sobre as expressões.

### Testadores online

- RegexPal (http://regexpal.com/)
        ★ Atualiza enquanto digita, destaca texto casado, referência rápida, sintaxe JavaScript.

- Regex101 (https://regex101.com/)
        ★ Atualiza enquanto digita, destaca texto casado, mostra o conteúdo dos grupos, faz substituição de textos, referência rápida, sintaxes JavaScript, Python e Perl.

- Debuggex (https://www.debuggex.com/)
        ★ Cria um gráfico de sua expressão regular. Bom para entender como sua expressão é interpretada pelo computador. Sintaxe JavaScript, Python e PCRE.

- Rubular (http://www.rubular.com/)
        ★ Atualiza enquanto digita, destaca texto casado, referência rápida, sintaxe Ruby.

- RegExr (https://regexr.com/)
        ★ Atualiza enquanto digita, destaca texto casado, referência rápida, precisa do Flash Player 9, sintaxe ActionScript.

- regex (http://regex.larsolavtorvik.com/)
        ★ Atualiza enquanto digita, destaca texto casado, referência rápida, mostra código pronto da linguagem, sintaxe JavaScript, Perl, Python e PHP.

- HiFi RegExp Tool (http://www.gethifi.com/tools/regex)
        ★ Atualiza enquanto digita, destaca texto casado, referência rápida, exemplo de código em JavaScript, sintaxe JavaScript.

- JRX (http://cuneytyilmaz.com/prog/jrx/)
        ★ Atualiza enquanto digita, destaca texto casado, referência rápida, sintaxe JavaScript.

- Regexper (http://regexper.com/)
        ★ Cria diagramas que descrevem o funcionamento de uma expressão regular.

- Regular Expression Generator (http://www.txt2re.com/)
        ★ Gerador de Expressões Regulares. Você digita o texto que quer casar e ele gera um programa pronto para extrair este texto, em várias linguagens, entre elas Python, Perl, PHP, Ruby, Java e javaScript.

- RegexOne (https://regexone.com/)
        ★ Tutorial com exemplos interativos que a cada lição vai te ensinando um pouco sobre as expressões.

Referências/recursos:

- http://www.rexegg.com/regex-quickstart.html#chars
- http://aurelio.net/regex/
- http://aurelio.net/blog/2012/05/04/resumao-das-expressoes-regulares-numa-folha-a4-pdf/

#### Livros

![image.png](img/03.png)