Regex

Conceito

É uma forma flexível de identificar cadeias de caracteres que contenham determinados padrões dentro de strings.

Módulo re

import re

Padrão de utilização

re.método(r'padrão', texto_a_ser_escaneado)

re.search

Retorna um objeto Match, com a posição da primeira ocorrência do padrão

Retorna None

  string = "Este é um teste de expressões regulares em python, outro teste"
  print(re.search(r'teste', string))

  #retorna `<re.Match object; span=(10, 15), match='teste'>`

re.findall

Encontra todas as ocorrências do padrão encontradas no texto

Retorna uma lista

  string = "Este é um teste de expressões regulares em python, outro teste"
  print(re.findall(r'teste', string))
  # retorna `['teste', 'teste']`

re.sub

Serve para subtituir algo dentro do texto

  string = "Este é um teste de expressões regulares em python, outro teste"
  print(re.sub(r'teste','Olá Mundo', string)

  #retorna `Este é um Olá Mundo de expressões regulares em python, outro Olá Mundo`

  #Usando o param count=1 fica assim.
  print(re.sub(r'teste','Olá Mundo', string, count=1))

  # retorna `Este é um Olá Mundo de expressões regulares em python, outro teste`

re.compile

Serve para compilar regex.

Reutilizar regex em alguns casos.

  string = "Este é um teste de expressões regulares em python, outro teste"
  regex = re.compile(r'teste')
  print(regex.search(string))
  print(regex.findall(string))
  print(regex.sub("def", string))

Metacaracteres

São caracteres especiais, que possuem outros significados dentro de regex.

Para escapá-los é necessário usa o '' antes do metacaractere

  import re

  texto = '''João trouxe     lindas flores para o seu amor, Maria, no dia 10 de Janeiro de 2022.

  Foi um ano excelente na vida de joão. Teve 5 filhos, todos adultos atualmente. maria , hoje sua esposa, ainda faz aquele café com pão de queijo às tardes de domingo.
  Não canso de ouvir Maria gritar:
  "Joooooooãoooooo, o café tá pronto, Veeemmm!!!.
  '''

  # Metacaractere: | (pipe) -> OU
  print(re.findall(r'João|Maria', texto))

  # retorna ['João', 'Maria', 'Maria']


  # Metacaractere: . (ponto) -> Seleciona quqlquer caractere, com exceção da quebra de linha.
  print(re.findall(r'.oão|Maria|adul..s', texto))

  # retorna ['João', 'Maria', 'joão', 'adultos', 'Maria', 'ooão']


  # Metacaractere: [] (colchetes) -> Seleciona um conjunto de caracteres envolvidos nestes.
  print(re.findall(r'[Jj]oão|[Mm]aria|adul..s', texto))

  # retorna ['João', 'Maria', 'joão', 'adultos', 'maria', 'Maria']

  # Metacaractere: [] (colchetes) -> Seleciona um conjunto de caracteres em range[a-z].
  print(re.findall(r'[a-zA-Z]oão|[a-zA-Z]aria|adul..s', texto))

  # retorna  ['João', 'Maria', 'joão', 'adultos', 'maria', 'Maria', 'ooão']

Flags

Mudam o comportamento do regex

  import re

  texto = '''João trouxe     lindas flores para o seu amor, Maria, no dia 10 de Janeiro de 2022.

  Foi um ano excelente na vida de joão. Teve 5 filhos, todos adultos atualmente. maria , hoje sua esposa, ainda faz aquele café com pão de queijo às tardes de domingo.
  Não canso de ouvir Maria gritar:
  "Joooooooãoooooo, o café tá pronto, Veeemmm!!!.
  '''

  print(re.findall(r'joãO|MarIA|adultOs', texto, flags=re.IGNORECASE))

  # retorna ['João', 'Maria', 'joão', 'adultos', 'maria', 'Maria']

Quantificadores

Também são metacaracteres, porém com a função de quantificar.

  import re

  texto = '''João trouxe     lindas flores para o seu amor, Maria, no dia 10 de Janeiro de 2022.

  Foi um ano excelente na vida de joão. Teve 5 filhos, todos adultos atualmente. maria , hoje sua esposa, ainda faz aquele café com pão de queijo às tardes de domingo.
  Não canso de ouvir Maria gritar:
  "Joooooooãoooooo, o café tá pronto, Veeemmm!!!. jão - jã
  '''

* (asteristico) == 0 ou n (ilimitadas vezes)

    # * == 0 ou n vezes
    print(re.findall(r'jo*ão*', texto, flags=re.I))
    print(re.findall(r'jo{0,}ão{0,}', texto, flags=re.I))

    # retorna ['João', 'joão', 'Joooooooãoooooo', 'jão', 'jã']

observação sobre quantificadores

Não inporta a ordem dos itens no range, pois cada item é testado individualmente.

 texto2 = "Ela ama ser amada amaa amaad"

 print(re.findall(r'ama[da]{0,2}', texto2))
 print(re.findall(r'ama[da]*', texto2))

 # retorna ['ama', 'amada', 'amaa', 'amaad']

+ (soma) == 1 ou n (ilimitadas vezes)

    # + == 1 ou n vezes
    print(re.findall(r'jo+ão+', texto, flags=re.I))
    print(re.findall(r'jo{1,}ão{1,}', texto, flags=re.I))

    # retorna ['João', 'joão', 'Joooooooãoooooo']

? (interrogação) == 0 ou 1

    # ? == 0 ou 1 vez
    print(re.findall(r'jo?ão?', texto, flags=re.I))
    print(re.findall(r'jo{0,1}ão{0,1}', texto, flags=re.I))

    # retorna ['João', 'joão', 'jão', 'jã']

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
.gitignore		.gitignore
README.md		README.md
basics.py		basics.py
cpf_validation.py		cpf_validation.py
grupos_retrovisores.py		grupos_retrovisores.py
metacaracteres.py		metacaracteres.py
quant_gulosos_lazy.py		quant_gulosos_lazy.py
quantificadores.py		quantificadores.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Regex

Conceito

Módulo re

Padrão de utilização

re.search

re.findall

re.sub

re.compile

Metacaracteres

Flags

Quantificadores

* (asteristico) == 0 ou n (ilimitadas vezes)

observação sobre quantificadores

+ (soma) == 1 ou n (ilimitadas vezes)

? (interrogação) == 0 ou 1

{n} valor dentro das chaves == valor específico

{min, max} valor dentro das chaves == valores em um intervalo

About

Uh oh!

Releases

Packages

Languages

RodrigoFMuniz/Regex-python

Folders and files

Latest commit

History

Repository files navigation

Regex

Conceito

Módulo re

Padrão de utilização

re.search

re.findall

re.sub

re.compile

Metacaracteres

Flags

Quantificadores

* (asteristico) == 0 ou n (ilimitadas vezes)

observação sobre quantificadores

+ (soma) == 1 ou n (ilimitadas vezes)

? (interrogação) == 0 ou 1

{n} valor dentro das chaves == valor específico

{min, max} valor dentro das chaves == valores em um intervalo

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages