# Library roulette

<img src="images/python-logo.jpg" alt="Python" style="width: 300px;"/>

Neste notebook vão poder ver algumas outras libraries e funcionalidades do Python, sem uma explicação detalhada sobre cada uma.
O principal objectivo é despertar a vossa curiosidade e servir como ponto de partida para o estudo autónomo.

## Data / hora

In [None]:
from datetime import date, datetime

In [None]:
date.today()

In [None]:
datetime.now()

In [None]:
datetime.now().strftime("%Y-%m-%d %H:%M:%S")

In [None]:
date_str = "2020...04...10"

actual_datetime = datetime.strptime(date_str, "%Y...%m...%d")

actual_datetime.date()

### Com o Pandas:

In [None]:
import pandas as pd

In [None]:
idx = pd.date_range(start='2020-04-01', end='2020-04-10')

df = pd.DataFrame(index=idx)

df['values'] = list(range(10))

In [None]:
df

In [None]:
df.loc['2020-04-03':'2020-04-07']

## Números aleatórios

In [None]:
import numpy as np

In [None]:
np.random.random()

In [None]:
for i in range(5):
    print(np.random.randint(0, 10))

In [None]:
np.random.random((3, 3))

## Input

In [None]:
x = input("Escreva um número: ")

In [None]:
print(x)

## Web Scraping

Permite extrair dados de páginas web. Vamos "scrapar" a página inicial da Wikipedia:

In [None]:
from bs4 import BeautifulSoup
import requests

In [None]:
# Scraping da página inicial da Wikipedia
webpage = requests.get('http://en.wikipedia.org/wiki/Main_Page')

In [None]:
webpage.text[0:100]

In [None]:
soup = BeautifulSoup(webpage.text, 'html.parser')

In [None]:
print(soup.get_text()[0:1000])

## Regular Expressions

Permite procurar expressões em texto. Vamos encontrar todos os números numa sequência de caractéres:

In [None]:
import re

In [None]:
lixo = "srgçsouurhoshgoru151355sngoiroinsogn9784sfniosenroisnefinio098120398ksdfonsofdnos123alnda"

In [None]:
re.findall("[0-9]+", lixo)

Agora vamos verificar se um email é válido:

In [None]:
expressão_email = "^([a-zA-Z0-9_\-\.]+)@([a-zA-Z0-9_\-\.]+)\.([a-zA-Z]{2,5})$"

email_certo = "john.doe@gmail.com"
email_errado = "#$john_at_gmail.com"

if re.match(expressão_email, email_certo):
    print(f'{email_certo} : é um email válido.')
else:
    print(f'{email_certo} : é um email inválido.')
    
if re.match(expressão_email, email_errado):
    print(f'{email_errado} : é um email válido.')
else:
    print(f'{email_errado} : é um email inválido.')
 

## Time / Multiprocessing

Vamos ver quanto tempo demora um loop com um grande número de iterações. Depois vamos parallelizar este loop, e comparar o tempo.

In [None]:
import time
import multiprocessing

In [None]:
ITERACOES = 10000000

def quadrado(x):
    return x ** 2

start = time.time()

quadrados = []
for i in range(ITERACOES):
    quadrados.append(quadrado(i))

end = time.time()
print(f'Sequencialmente, demorou {end-start} segundos.')
    

In [None]:
start = time.time()

pool = multiprocessing.Pool(processes=4) 
quadrados = pool.map(quadrado, range(ITERACOES))

end = time.time()

print(f'Em paralelo, demorou {end-start} segundos.')

## Algumas outras...

* os: operações com o sistema operativo, listar ficheiros em pastas, etc;
* pickle: guardar e carregar objectos;
* json: serialização de dados no formato JSON (muito importante!);
* Pillow: processamento de imagens;
* pygame: programação de jogos;
* sqlalchemy: conexão com bases de dados.

Recomendação pessoal do instrutor: **streamlit** - library para criar facilmente pequenas apps para data science/machine learning (https://www.streamlit.io/)