## Curso de Python para Machine Learning
---
### Aula 1.2 - Funções da biblioteca padrão

> ### Itertools

In [2]:
import itertools
contador = itertools.count()

In [3]:
print(type(contador))
print(contador)
next(contador)
print(contador)

<class 'itertools.count'>
count(0)
count(1)


**Combinações**

A biblioteca itertools tem um método que retorna as combinações possíveis de um objeto python  
O retorno é um objeto iterável  
A ordem não importa nesse caso

In [20]:
itertools.combinations('ABC',2) # retorna um objeto iterável

<itertools.combinations at 0x7fe1c4b48170>

In [21]:
list(itertools.combinations('ABC',2)) # convertendo o retorno em uma lista

[('A', 'B'), ('A', 'C'), ('B', 'C')]

**Permutações**

Outro método da biblioteca itertools é o *permutations*, que retorna as permutações possíveis em um conjunto  
Nesse caso a ordem importa, dessa forma cada elemento é tratado como único de acordo com sua posição  
OBS.: Caso o parametro `r` não seja informado, será considerado o comprimento total da lista informada

In [17]:
list(itertools.permutations([1,2,3]))

[(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)]

In [18]:
list(itertools.permutations([1,2]))

[(1, 2), (2, 1)]

In [19]:
list(itertools.permutations([1,2,3,4], r = 2))

[(1, 2),
 (1, 3),
 (1, 4),
 (2, 1),
 (2, 3),
 (2, 4),
 (3, 1),
 (3, 2),
 (3, 4),
 (4, 1),
 (4, 2),
 (4, 3)]

**Produto Cartesiano**

Na matemática, produto cartesiano é o resultado dos pares ordenados entre dois conjuntos - A e B - de forma que um elemento perterce a *A* e o outro elemento pertence a *B*

In [16]:
A = (1,2)
B = (3,4)
list(itertools.product(A,B))

[(1, 3), (1, 4), (2, 3), (2, 4)]

In [15]:
# Produto Cartesiano de um conjunto sobre ele mesmo
list(itertools.product(A,repeat=2))

[(1, 1), (1, 2), (2, 1), (2, 2)]

In [24]:
# Produto cartesiano entre 3 conjunto
list(itertools.product(['Carlos','Pedro'],['Mara','Karla'],['João','Andrea']))

[('Carlos', 'Mara', 'João'),
 ('Carlos', 'Mara', 'Andrea'),
 ('Carlos', 'Karla', 'João'),
 ('Carlos', 'Karla', 'Andrea'),
 ('Pedro', 'Mara', 'João'),
 ('Pedro', 'Mara', 'Andrea'),
 ('Pedro', 'Karla', 'João'),
 ('Pedro', 'Karla', 'Andrea')]

> ### Expressões Regulares - REGEX

Podemos trabalhar com expressões regulares em Python importando a biblioteca `re`

In [10]:
import re

Podemos utilizar o método `search` para procurar uma ocorrência de padrão - uma expressão regular - em um texto  
O método `search` retorna um objeto do tipo `Match`, esse objeto contém os índices onde a primeira ocorrência foi encontrada.

In [11]:
frase = 'o rato roeu a roupa do rei de roma'

In [16]:
texto_ro = re.search(r'ro',frase)
print(texto_ro)

<re.Match object; span=(7, 9), match='ro'>


Para retornar o texto encontrado de acordo com o padrão informando, basta utilizar `group(0)` ou `[0]`

In [99]:
print(texto_ro.group(0))
print(texto_ro[0])

ro
ro


Para encontrar todas as ocorrências de um certo padrão pesquisado, podemos utilizar `findall`

In [103]:
print(re.findall(r'ro',frase))

['ro', 'ro', 'ro']


**Exemplos de uso de alguns padrões de expressões regulares mais utilizados**

In [106]:
low = 'abcdefghijklmnopqrstuvwxyz'
up = 'ABCDEFGHIJKLMNOPQRSTUVWXYZ'
digits = '0123456789'
simbols = '+-*/.,?!;:<>-_\n'
all = low + ' ' + up + ' ' + digits + ' ' + simbols

Um caractere qualquer, exceto nova linha

In [105]:
print(re.findall(r'.',low))
print(re.findall(r'.',up))
print(re.findall(r'.',digits))
print(re.findall(r'.',simbols))

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']
['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z']
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
['+', '-', '*', '/', '.', ',', '?', '!', ';', ':', '<', '>', '-', '_']


---
Um dígito qualquer de 0 a 9

In [104]:
print(re.findall(r'\d',low))
print(re.findall(r'\d',up))
print(re.findall(r'\d',digits))
print(re.findall(r'\d',simbols))

[]
[]
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
[]


---
Um caractere qualquer, exceto um dígito de 0 a 9

In [96]:
print(re.findall(r'\D',low))
print(re.findall(r'\D',up))
print(re.findall(r'\D',digits))
print(re.findall(r'\D',simbols))

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']
['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z']
[]
['+', '-', '*', '/', '.', ',', '?', '!', ';', ':', '<', '>', '-', '_', '\n']


---
Um espaço em branco ((espaço, tabulação, nova linha)

In [108]:
print(re.findall(r'\s',all))

[' ', ' ', ' ', '\n']


---
Início de uma string - nesse caso `a` ou `A` no começo de string

In [119]:
print(re.findall(r'^a|^A',low))
print(re.findall(r'^a|^A',up))
print(re.findall(r'^a|^A',digits))
print(re.findall(r'^a|^A',simbols))

['a']
['A']
[]
[]


Fim de uma string - nesse caso `Z` ou `9` no final de string

In [120]:
print(re.findall(r'Z$|9$',low))
print(re.findall(r'Z$|9$',up))
print(re.findall(r'Z$|9$',digits))
print(re.findall(r'Z$|9$',simbols))

[]
['Z']
['9']
[]


---
Qualquer caractere entre os especificadas - nesse caso `a` a `m`, `O` a `X`, `*`, `<`, `>`, `;`, `,`

In [140]:
print(re.findall(r'[a-mO-X*<>;,]',low))
print(re.findall(r'[a-mO-X*<>;,]',up))
print(re.findall(r'[a-mO-X*<>;,]',digits))
print(re.findall(r'[a-mO-X*<>;,]',simbols))

['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm']
['O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X']
[]
['*', ',', ';', '<', '>']


---
Qualquer caractere, exceto os especificados (Contrário ao exemplo acima)

In [144]:
print(re.findall(r'[^a-mO-X*<>;,]',low))
print(re.findall(r'[^a-mO-X*<>;,]',up))
print(re.findall(r'[^a-mO-X*<>;,]',digits))
print(re.findall(r'[^a-mO-X*<>;,]',simbols))

['n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z']
['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'Y', 'Z']
['0', '1', '2', '3', '4', '5', '6', '7', '8', '9']
['+', '-', '/', '.', '?', '!', ':', '-', '_', '\n']


---
Uma expressão *OU* outra - nesse caso `abc` ou `MNO` ou `567` ou `<>`

In [169]:
print(re.findall(r'abc|MNO|567|<>',low))
print(re.findall(r'abc|MNO|567|<>',up))
print(re.findall(r'abc|MNO|567|<>',digits))
print(re.findall(r'abc|MNO|567|<>',simbols))

['abc']
['MNO']
['567']
['<>']


**Quantificadores**

Podemos usar quantificadores para informar quantas vezes um certo padrão se repete ou não

Quantificador | Situação
--------------|---------
*|	0 ou mais
+|	1 ou mais
?|	0 ou um
{3}|	Número exato
{3,4}|	Faixa de números (mínimo, máximo)



In [181]:
print(re.findall(r'\d{5}',digits)) # Sequência de 5 números quaisquer
print(re.findall(r'.{8}',low)) # Sequência de 8 caracteres quaisquer
print(re.findall(r'\d{2,5}','O número dele é (85) 98772-6644')) # Sequência de números com tamanho de 2 a 5

['01234', '56789']
['abcdefgh', 'ijklmnop', 'qrstuvwx']
['85', '98772', '6644']


**Exemplo Prático 1**

Extrair os números de telefones com o DDD da string informanda

In [235]:
texto = '''Laura Maria da Silva
(46) 93201-6392
(89) 42010-7411
(61) 47405-4895
Rua José Geraldo
carlamaria@hotmail.com
Le@d Dell Technologies'''

Primeiro extraindo somente os DDD de cada número

In [236]:
padrao1 = r'\W\d{2}\W' # Um caractere não verbal seguido de dois números seguido de outro caractere não verbal
re.findall(padrao1,texto)

['(46)', '(89)', '(61)']

Extraindo a primera parte do telefone

In [237]:
padrao2 = r'\s\d{5}' # Um espaço seguido de cinco números
re.findall(padrao2,texto)

[' 93201', ' 42010', ' 47405']

Por último extraindo os últimos 4 digitos do telefone

In [238]:
padrao3 = r'-\d{4}' # Um traço seguido de quatro números
re.findall(padrao3,texto)

['-6392', '-7411', '-4895']

Podemos juntar todos os padrões que pesquisamos que o resultado serão os números de telefones completos

In [239]:
padrao = padrao1 + padrao2 + padrao3
print(padrão)

\W\d{2}\W\s\d{5}-\d{4}


In [240]:
re.findall(padrao,texto)

['(46) 93201-6392', '(89) 42010-7411', '(61) 47405-4895']

**Exemplo Prático 2**

Extrair os e-mails de um texto

In [241]:
texto2 = 'contato@dellead.com, franciscojose@yahoo.com.br, ana.julia@universidade.edu, francisca-321-aline@meu-trabalho.net, Le@d Dell Technologies'

In [268]:
re.findall(r'[\w_.-]+@[\w-]+\.[\w.]+',texto2)

['contato@dellead.com',
 'franciscojose@yahoo.com.br',
 'ana.julia@universidade.edu',
 'francisca-321-aline@meu-trabalho.net']

> ### Logging

**Gerenciamento de logs**

In [1]:
import logging

É possível usar o módulo de logging no python para registrar o que está acontecendo com algum programa, registrar avisos ou erros que acontecerem durante a execução.

Existem 5 níveis de mensagens de log:

Nível   | Valor | Explicação
--------|-------|-----------
DEBUG   | 10    | Para verificar se todo os comandos estão executando conforme esperado
INFO    | 20    | Informações sobre a execução do programa
WARNING | 30    | Para erros que não inteferem na execuão do programa
ERROR   | 40    | Para erros que interferem de alguma forma transitória com a execução do programa
CRITICAL| 50    | Para erros que impedem o correto funcionamento do programa

*Mensagens de Log*

In [2]:
FORMAT_MSG = "%(asctime)s | %(levelname)s -> %(message)s"
logging.basicConfig(
    filename="logs.log",
    format=FORMAT_MSG
)
logger = logging.getLogger()

In [3]:
logger.debug("Mensagem de Debug 1!")
logger.info("Mensagem de Informação 1!")
logger.warning("Mensagem de Aviso 1!")
logger.error("Mensagem de Erro 1!")
logger.critical("Mensagem de Erro Crítico 1!")

In [4]:
with open("logs.log", "r") as log1:
    print(log1.read())

2021-11-13 17:12:41,730 | ERROR -> Mensagem de Erro 1!
2021-11-13 17:12:41,730 | CRITICAL -> Mensagem de Erro Crítico 1!



O comportamento padrão é registrar somente mensagens com valor 30 ou maior, ou seja, mensagens de Debugs e Infos são ignoradas.  
Para alterar isso, mudamos o `level` para o nível que desejarmos

In [5]:
logger.setLevel(logging.DEBUG)

In [6]:
logger.debug("Mensagem de Debug 2!")
logger.info("Mensagem de Informação 2!")
logger.warning("Mensagem de Aviso 2!")
logger.error("Mensagem de Erro 2!")
logger.critical("Mensagem de Erro Crítico 2!")

In [7]:
with open("logs.log", "r") as log1:
    print(log1.read())

2021-11-13 17:12:41,730 | ERROR -> Mensagem de Erro 1!
2021-11-13 17:12:41,730 | CRITICAL -> Mensagem de Erro Crítico 1!
2021-11-13 17:12:56,600 | DEBUG -> Mensagem de Debug 2!
2021-11-13 17:12:56,600 | INFO -> Mensagem de Informação 2!
2021-11-13 17:12:56,600 | ERROR -> Mensagem de Erro 2!
2021-11-13 17:12:56,601 | CRITICAL -> Mensagem de Erro Crítico 2!



**Exempĺo de Programa de divisão entre dois números usando logging**

In [1]:
import logging
logging.basicConfig(
    filename="division.log",
    level=logging.INFO,
    format="%(asctime)s | %(levelname)s | %(message)s"
)
divLogger = logging.getLogger()

In [2]:
divLogger.info("<<<<<< Programa Iniciado!")
for _ in range(3):
    try:
        divLogger.info("Loop For Iniciado!")
        print("Vamos dividir dois números!")
        n1 = int(input("Digite o primeiro número: "))
        n2 = int(input("Digite o segundo número : "))
        divLogger.info("Realizando a divisão dos números!")
        division = n1/n2
        print(f"O resultado da divisão é {division}")
    except ZeroDivisionError:
        print("Operação impossível")
        divLogger.warning("Divisão por Zero não é possível!")
    except Exception as erro:
        divLogger.error(erro)
        print("Tente Novamente")
    finally:
        print("──────────────────────────────────")
        divLogger.info("Loop For Finalizado")
divLogger.info(">>>>>> Programa Finalizado!")

Vamos dividir dois números!


Digite o primeiro número:  1
Digite o segundo número :  0


Operação impossível
──────────────────────────────────
Vamos dividir dois números!


Digite o primeiro número:  0
Digite o segundo número :  0


Operação impossível
──────────────────────────────────
Vamos dividir dois números!


Digite o primeiro número:  51
Digite o segundo número :  11


O resultado da divisão é 4.636363636363637
──────────────────────────────────


In [3]:
with open("division.log","r") as division:
    print(division.read())

2021-11-13 17:39:27,546 | INFO | <<<<<< Programa Iniciado!
2021-11-13 17:39:27,547 | INFO | Loop For Iniciado!
2021-11-13 17:39:30,232 | INFO | Realizando a divisão dos números!
2021-11-13 17:39:30,232 | INFO | Loop For Finalizado
2021-11-13 17:39:30,233 | INFO | Loop For Iniciado!
2021-11-13 17:39:31,520 | INFO | Realizando a divisão dos números!
2021-11-13 17:39:31,520 | INFO | Loop For Finalizado
2021-11-13 17:39:31,521 | INFO | Loop For Iniciado!
2021-11-13 17:39:33,953 | INFO | Realizando a divisão dos números!
2021-11-13 17:39:33,954 | INFO | Loop For Finalizado
2021-11-13 17:39:33,955 | INFO | >>>>>> Programa Finalizado!

