**Regular Expressions (Regex) - Python**

In [2]:
# Importando biblioteca
import re

**Caracteres:**

In [None]:
# .  - Entende qualquer valor exceto uma nova linha (\n)
# \. - Para buscar o caracter "."

texto = '''
ar\nra
arara
arbra
'''
padrao = re.compile("ar.ra") 
check = padrao.findall(texto)
print(check)

['arara', 'arbra']


In [8]:
# ^  - Irá testar o início da string
#[^] - Irá considerar todos os caracteres EXCETO o indicado

texto = "arara"
p1 = re.compile("^a") # se uma string começar com 'a'.. 
p2 = re.compile("[^a]") # busca todos os caracteres menos 'a'
check = p1.findall(texto)
check2 = p2.findall(texto)
print(check)
print(check2)

['a']
['r', 'r']


In [12]:
# \d - Qualquer caracter que SEJA um algarismo de 0 a 9
# \D - Qualquer caracter que NÃO SEJA um algarismo de 0 a 9

texto = "arara1992"
p1 = re.compile(r"\d") # 'r' para dizer que é relacionado ao REGEX
p2 = re.compile(r'\D')
check = p1.findall(texto)
check2 = p2.findall(texto)
print(check)
print(check2)

['1', '9', '9', '2']
['a', 'r', 'a', 'r', 'a']


In [14]:
# \s - Qualquer caracter que SEJA vazio
# \S - Qualquer caracter que NÃO SEJA vazio

texto = ''' 

arara 1992

'''

p1 = re.compile(r"\s")
p2 = re.compile(r"\S")
check = p1.findall(texto)
check2 = p2.findall(texto)
print(check)
print(check2)

[' ', '\n', '\n', ' ', '\n', '\n']
['a', 'r', 'a', 'r', 'a', '1', '9', '9', '2']


In [6]:
# \w - Qualquer caracter que SEJA alfanumérico
# \W - Qualquer caracter que NÃO SEJA alfanumérico

texto = '''

_arara@ 1992_

'''

p1 = re.compile(r'\w')
p2 = re.compile(r'\W')
check = p1.findall(texto)
check2 = p2.findall(texto)
print(check)
print(check2)

['_', 'a', 'r', 'a', 'r', 'a', '1', '9', '9', '2', '_']
['\n', '\n', '@', ' ', '\n', '\n']


**Métodos de checagem:**

In [11]:
texto = 'arara'

p1 = re.compile(r'r')
check_findall = p1.findall(texto)
check_match = p1.match(texto)  # início da string
check_search = p1.search(texto) # qualquer parte da string
check_finditer = p1.finditer(texto) # iterador
print(check_findall)
print(check_match)
print(check_search)
print(check_finditer)

print(texto[0]) # span(0, 1)

['r', 'r']
None
<re.Match object; span=(1, 2), match='r'>
<callable_iterator object at 0x7f022909e250>
a


In [12]:
# exemplo com finditer

correspondencias = check_finditer

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(1, 2), match='r'>
<re.Match object; span=(3, 4), match='r'>


**Estruturas**

**[] Character set**

In [16]:
texto = '''
Arara 1992
'''

p = re.compile(r'[a-zA-Z0-9]')
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(1, 2), match='A'>
<re.Match object; span=(2, 3), match='r'>
<re.Match object; span=(3, 4), match='a'>
<re.Match object; span=(4, 5), match='r'>
<re.Match object; span=(5, 6), match='a'>
<re.Match object; span=(7, 8), match='1'>
<re.Match object; span=(8, 9), match='9'>
<re.Match object; span=(9, 10), match='9'>
<re.Match object; span=(10, 11), match='2'>


In [20]:
texto = '''
Arara 1992
'''

p = re.compile(r'[a-zA-Z] [0-9]') # dois padrões
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(5, 8), match='a 1'>


In [26]:
texto = '''
Arara 1992
Arara1992  
Ara 192
'''

p = re.compile(r'[a-zA-Z]+ [0-9]+') # + > caracter que aparece uma ou mais vezes
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(1, 11), match='Arara 1992'>
<re.Match object; span=(24, 31), match='Ara 192'>


**Quantificadores**

In [32]:
# * - 0 ou mais

texto = '''
Arara
'''

p = re.compile(r'[ra]*')
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(0, 0), match=''>
<re.Match object; span=(1, 1), match=''>
<re.Match object; span=(2, 6), match='rara'>
<re.Match object; span=(6, 6), match=''>
<re.Match object; span=(7, 7), match=''>


In [33]:
# + - 1 ou mais

texto = '''
Arara
'''

p = re.compile(r'[ra]+')
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(2, 6), match='rara'>


In [34]:
# ? - 0 ou um

texto = '''
Arara
'''

p = re.compile(r'[ra]?')
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(0, 0), match=''>
<re.Match object; span=(1, 1), match=''>
<re.Match object; span=(2, 3), match='r'>
<re.Match object; span=(3, 4), match='a'>
<re.Match object; span=(4, 5), match='r'>
<re.Match object; span=(5, 6), match='a'>
<re.Match object; span=(6, 6), match=''>
<re.Match object; span=(7, 7), match=''>


In [35]:
# {3} - número axato de repetições

texto = '''
Arara
'''

p = re.compile(r'[ra]{2}')
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(2, 4), match='ra'>
<re.Match object; span=(4, 6), match='ra'>


In [36]:
# {3, 4} - de 3 a 4 min e max

texto = '''
Arara
'''

p = re.compile(r'[ra]{2,4}')
correspondencias = p.finditer(texto)

for correspondencia in correspondencias:
  print(correspondencia)

<re.Match object; span=(2, 6), match='rara'>


**Exemplo de classe com uso de re.search()**

In [3]:
import re

class Estoque:
  def __init__(self, item, preco):
    self.item = item
    self.preco = preco

  def aplica_desconto(self, percentual):
    self.preco = self.preco - (self.preco * (percentual / 100) )

  @property # decorator
  def preco(self):
    return self._preco # tem _ no preco

  @preco.setter
  def preco(self, novo_preco):
    if isinstance(novo_preco, str):
      novo_preco = re.search(r'(\d+)', novo_preco)
    self._preco = novo_preco

calcado001 = Estoque('Tênis Adidas 44', 299)
calcado001.aplica_desconto(20)


print(f'{calcado001.item} // Valor com desconto: R$ {calcado001.preco}')

Tênis Adidas 44 // Valor com desconto: R$ 239.2
