<a href="https://colab.research.google.com/github/fellypesb/LFA/blob/main/RegEx.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# <center>**Implementação básica de Expressões Regulares**</center>
Atividade desenvolvida durante as aulas de Linguagens Formais e Autômatos, ministrada pelo Prof. Dr. Fábio Lobato na Universidade Federal do Oeste do Pará - UFOPA

**Discente:** Fellype Siqueira Barroso

In [1]:
# Importação da biblioteca que dá suporte a RegEx no python
import re

# **Implementação: 1**

Uma das principais formas de realizar cadastro em sistemas e aplicativos nos dias atuais, é por meio de um email e senha. Diversos aplicativos, no entanto, restringe o domínio de emails que podem ser cadastrados por fins de segurança. Nesta implementação, buscou-se construir uma $RegEx$ capaz de validar emails de apenas três diferentes domínios:

- Gmail
- Hotmail
- Outlook

In [2]:
def email_pattern(email_list:list):
    pattern = re.compile(r'^\w{3,}([-.+]\w+)*(@gmail\.com|@hotmail\.com|@outlook\.com)$')
    for item in email_list:
      m = pattern.match(item)
      if m:
        print('Match found:', m.group())

# Bateria de testes

test_list = ['@gmail.com',
             'fellypecsiqueira@gmail.com',
             '123@hotmail.com',
             '@outlook.com',
             'f@hotmail.com',
             'fabio.lobato@outlook.com',
             'LFA.duvidas@gmail.com',
             'fellypesiqueira+teste@gmail.com',
             'fabio_lobato@hotmail.com']

email_pattern(test_list)

Match found: fellypecsiqueira@gmail.com
Match found: 123@hotmail.com
Match found: fabio.lobato@outlook.com
Match found: LFA.duvidas@gmail.com
Match found: fellypesiqueira+teste@gmail.com
Match found: fabio_lobato@hotmail.com


## **Explicação da $RegEx$ 1**



`^` Meta caracter que busca _matches_ no início da linha;  

`\w` Shorthads que corresponde a qualquer caractere de texto, incluindo sublinhado;  

`{3,}` Quantificador que especifica que uma palavra deve conter no mínimo 3 (três) caracteres;  

`[-.+]` Especifica um conjunto de caracteres permitidos naquela posição;

`\w+` Corresponde a uma ou mais ocorrências de qualquer caracter de texto;

`*` Fechamento de kleine. Indica 0 ou mais ocorrências do símbolo que o precede;  

`(@gmail\.com|@hotmail\.com|@outlook\.com)$` Especifica que os sufixos permitidos são apenas um dos 3 (três) que estão separados pelo operador pipe;

`|` Operador pipe, funciona de forma semelhante ao operador lógico Or;


`\.` O símbolo '.' funciona como um coringa que representa qualquer caractere diferente de uma quebra de linha. Quando se torna necessário apenas o seu significado literal na expressão, como neste caso, utiliza-se o operador de escape '\\' como seu precedente.

`$` Meta caracter que busca _matches_ no final da linha;


## **Implementação: 2**
Sabendo que o número telefônico brasileiro é formado por 9 dígitos + o prefixo de código de área (DDD) indicando o localidade ao qual pertence. Buscou-se construir uma $RegEx$ capaz de indenticar esse tipo de informação. Além disso, os números deveriam conter parênteses entre o DDD e um hífen de separação entre o 5° e 6° dígitos.

In [3]:
def cell_phone_pattern(number_list:list):
  pattern = re.compile(r'[(][1-9]{2}[)] [9]\d{4}[-]\d{4}')
  for item in number_list:
    m = pattern.match(item)
    if m:
      print('Match found:', m.group())

# Bateria de testes

test_list = ['(30) 99106-9464',
             '(300) 99147-7866',
             '(3) 983747-9464',
             '(94) 94878-5678',
             '(87) 09389-7654',
             '(93) 99106-9464',
             '(87) 09389-77654',
             '(99) 95672-5678',
             '45672-5678 (99)']

cell_phone_pattern(test_list)

Match found: (94) 94878-5678
Match found: (93) 99106-9464
Match found: (99) 95672-5678


## **Explicação da $RegEx$ 2**

`[(]` Especifica que apenas o caracter '(' é permitido naquela posição;  

`[1-9]{2}` Indica que apenas dígitos entre 1 (um) e 9 (nove) são permitidos, e que deve-se ter 2 (duas) ocorrências desses dígitos. Esses dois digitos representam o DDD associado ao número, que, de acordo com a resolução 263 da ANATEL, pode ser um dos 67 codigos de área existentes que variam de 11 até 99;  

`[)]` Especifica que apenas o caracter ')' é permitido naquela posição;

`[9]\d{4}` Indica que o primeiro dígito do número telefônico deve ser o 9, seguido de 4 (quatro) ocorrências de dígitos entre 0 (zero) e 9 (nove). Segundo o plano nacional de numeração, o dígito 9 (nove) no início de um número telefônico faz referência ao serviço de comunição móvel;  

`[-]` Especifica que apenas o caracter '-' é permitido naquela posição;  

`\d{4}` Indica que deve ocorrer uma sequência de 4 (quatro) dígitos entre 0 (zero) e 9 (nove) naquela posição.




# **Implementação: 3**
O superlativo expressa qualidades num grau muito elevado ou em grau máximo. Nesta implementação, buscou-se construir uma $RegEx$ capaz de identificar adjetivos com o sufixo $-issimo$.

In [4]:
def suffix_pattern(word_list):
    pattern = re.compile(r'^[a-zA-Z]+issimo$')
    for item in word_list:
      m = pattern.match(item)
      if m:
        print('Match found: ', m.group())

test_list = ['felicissimo',
             'issimo',
             'fidelissimo',
             '12345issimo',
             'crudelissimo',
             'inteligentissimo',
             'magris.simo']

suffix_pattern(test_list)

Match found:  felicissimo
Match found:  fidelissimo
Match found:  crudelissimo
Match found:  inteligentissimo


## **Explicação da $RegEx$ 3**

`^[a-zA-Z]+` Indica que no início da string pode ocorrer uma ou mais ocorrências de carateres alfabéticos tanto minúsculos quanto maiúsculo;

`issimo$` Indica que o sufixo da string deve ser formado pelo conjunto de caracteres -issimo;