# Padr√µes de Repeti√ß√£o com Quantificadores

A esta altura, voc√™ j√° deve estar um pouco cansado de escrever `[A-z0-9][A-z0-9][A-z0-9]` s√≥ para corresponder a tr√™s caracteres alfanum√©ricos mai√∫sculos. Agora imagine se voc√™ tivesse que corresponder a 20 caracteres alfanum√©ricos üò±? N√£o parece horr√≠vel?

```
[A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9][A-z0-9]
```

Bem, n√£o se preocupe. Os quantificadores vieram para o resgate! Podemos consolidar tudo isso aqui. üòÇ

```
[A-z0-9]{20}
```

E podemos fazer muito, muito mais.

## Quantificadores Fixos

Esta regex que voc√™ viu, `[A-z0-9]{20}`, tem um n√∫mero entre colchetes `{20}`, que especifica quantas vezes o padr√£o anterior deve ser repetido. Podemos ver que ele corresponde exatamente a 20 caracteres alfanum√©ricos `[A-z0-9]`.

In [None]:
from re import fullmatch 

fullmatch(pattern="[A-z0-9]{20}", string="Achd46") != None

In [None]:
fullmatch(pattern="[A-z0-9]{20}", string="hgbjh734hgfhsabfghhf") != None

Como voc√™ pode imaginar, um **quantificador** repete um padr√£o de regex e o exemplo acima √© um quantificador fixo.

## Quantificadores M√≠n./M√°x.

Usando dois n√∫meros separados por v√≠rgula, podemos especificar um **quantificador m√≠n./m√°x.** para repetir um padr√£o um n√∫mero m√≠n./m√°x. de vezes.

```
pattern{min,max}
```

Por exemplo, podemos corresponder a c√≥digos de companhias a√©reas e aeroportos que tenham dois ou tr√™s caracteres alfab√©ticos, respectivamente.

In [None]:
fullmatch(pattern="[A-Z]{2,3}", string="DL") != None 

In [None]:
fullmatch(pattern="[A-Z]{2,3}", string="JFK") != None 

In [None]:
fullmatch(pattern="[A-Z]{2,3}", string="ALPHA") != None 

Podemos corresponder de 1 a 100 d√≠gitos num√©ricos.

In [None]:
fullmatch(pattern="[0-9]{1,100}", string="25482") != None 

In [None]:
fullmatch(pattern="[0-9]{1,100}", string="98465462164984335498465649849463574546325775455") != None 

Se deixarmos o `m√°x.` em branco, podemos capturar um n√∫mero ilimitado de d√≠gitos. Abaixo, correspondemos a pelo menos 3 d√≠gitos com um m√°ximo ilimitado.

In [None]:
fullmatch(pattern="[0-9]{3,}", string="98") != None 

In [None]:
fullmatch(pattern="[0-9]{3,}", string="98465462164984335498465649849463574546325775455") != None 

Tamb√©m podemos ter um m√≠nimo de 0, o que torna a presen√ßa desse padr√£o completamente opcional. Abaixo, correspondemos a um `x` e uma letra mai√∫scula, mas podem existir de 0 a 3 d√≠gitos entre eles.

In [None]:
fullmatch(pattern="x[0-9]{0,3}[A-Z]", string="xZ") != None 

In [None]:
fullmatch(pattern="x[0-9]{0,3}[A-Z]", string="x75Z") != None 

## Quantificadores Abreviados

Certos quantificadores m√≠nimo/m√°ximo, especificamente `{1,}`, `{0,}` e `{0,1}`, s√£o t√£o comuns que recebem suas abrevia√ß√µes: `+`, `*` e `?`, respectivamente.

|Abreviado|Equivalente|Descri√ß√£o|
|---------|-----------|---------|
|`+`      |`{1,}`     |Corresponde a uma ou mais inst√¢ncias de um padr√£o|
|`*`      |`{0,}`     |Corresponde a 0 ou mais inst√¢ncias de um padr√£on|
|`?`      |`{0,1}`    |Corresponde a apenas 0 ou 1 inst√¢ncia de um padr√£o|

Abaixo, correspondemos a qualquer sequ√™ncia de d√≠gitos e, em seguida, a uma sequ√™ncia de letras mai√∫sculas.

In [None]:
fullmatch(pattern="[0-9]+[A-Z]+", string="746234WHISKEY") != None 

Novamente, o `+` √© equivalente a `{1,}`, portanto, a mesma tarefa poderia ter sido realizada dessa forma. Ele especifica que "pelo menos uma inst√¢ncia deste padr√£o deve existir, e eu capturarei todas as que existirem depois disso".

In [None]:
fullmatch(pattern="[0-9]{1,}[A-Z]{1,}", string="746234WHISKEY") != None 

Tamb√©m podemos tornar a sequ√™ncia de d√≠gitos completamente opcional usando `*` em vez de `+`, o que equivale a usar `{0,}` em vez de `{1,}`.

In [None]:
fullmatch(pattern="[0-9]*[A-Z]{1,}", string="746234WHISKEY") != None 

In [None]:
fullmatch(pattern="[0-9]*[A-Z]{1,}", string="WHISKEY") != None 

In [None]:
fullmatch(pattern="[0-9]*[A-Z]{1,}", string="746234") != None 

O `?` √© outra abrevia√ß√£o comum, que √© o mesmo que `{0,1}`. √â frequentemente chamado de **opcional**, pois indica que uma inst√¢ncia de um padr√£o pode estar presente, mas n√£o necessariamente. Abaixo, combinamos duas letras do alfabeto, mas elas podem ser precedidas por um √∫nico d√≠gito.

In [None]:
fullmatch(pattern="[0-9]?[A-Z]{2}", string="AZ") != None 

In [None]:
fullmatch(pattern="[0-9]?[A-Z]{2}", string="4AZ") != None 

## Quantificadores Ganancioso contra Pregui√ßosos

Mudando para um contexto de correspond√™ncia parcial usando `search()`, observe o que acontece quando procuro por uma sequ√™ncia de letras. Tamb√©m mostrarei que voc√™ pode acessar as correspond√™ncias por √≠ndice usando colchetes `[ ]` no objeto `Match`. Usaremos o √≠ndice `[0]` para obter a primeira correspond√™ncia.

In [None]:
from re import search 

search(pattern="[XY0-9]+", string="XXYY9637ALPHA")[0]

Sem surpresas. Capturou tudo at√© o `7`. Mas pergunte a si mesmo: por que n√£o parou no primeiro `X`? Isso satisfaria a express√£o regular `[XY0-9]+`, certo? O motivo √© que as express√µes regulares s√£o, por padr√£o, **gananciosas**, o que significa que elas capturam o m√°ximo de texto poss√≠vel para um determinado padr√£o at√© que o padr√£o n√£o possa mais ser correspondido. Se voc√™ quiser tornar a express√£o regular **pregui√ßosa** ou parar o mais cedo poss√≠vel assim que o padr√£o for satisfeito, adicione um ponto de interroga√ß√£o ap√≥s o quantificador `+?`.

In [None]:
search(pattern="[XY0-9]+?", string="XXYY9637ALPHA")[0]

N√£o confunda o ponto de interroga√ß√£o sendo usado em um contexto diferente. Anteriormente, o us√°vamos como uma abrevia√ß√£o para um quantificador `{0,1}`, mas se estiver depois de outro quantificador, ser√° um modificador pregui√ßoso. Eu, pessoalmente, n√£o uso modificadores pregui√ßosos com frequ√™ncia, e esses exemplos simples podem n√£o fazer sentido para sua utilidade. Afinal, voc√™ pode obter o mesmo comportamento apenas procurando por uma inst√¢ncia neste caso.

In [None]:
search(pattern="[XY0-9]", string="XXYY9637ALPHA")[0]

Mas quando aprendemos a construir express√µes regulares mais complexas e se voc√™ estiver percorrendo documentos, elas podem ser √∫teis. Elas tamb√©m s√£o uma ferramenta √∫til quando sua regex est√° capturando mais do que o esperado e a modifica√ß√£o pregui√ßosa √© mais simples do que uma express√£o regular mais complexa.

## Exerc√≠cio

Escreva uma express√£o regular que corresponda a uma s√©rie de d√≠gitos, depois a um espa√ßo, depois a uma s√©rie de letras mai√∫sculas, depois a outro espa√ßo e, por fim, √† palavra "FIM". Coloque a string da express√£o regular no ponto de interroga√ß√£o `?` abaixo.

DICA: lembre-se de que `\s` √© um padr√£o de express√£o regular para um espa√ßo e n√£o se esque√ßa de usar uma string bruta `r"minha express√£o regular"`, pois haver√° uma barra invertida.

In [None]:
from re import fullmatch 

fullmatch(pattern=?, string="5766264 TANGO FIM") != None

### RESPOSTA A BAIXO

|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
|<br>
v 

In [None]:
from re import fullmatch 

fullmatch(pattern=r"[0-9]+\s[A-Z]+\sFIM", string="5766264 TANGO FIM") != None