### Disciplina de Análise de Dados    
### Curso de Gestão de Dados
### Universidade Federal do Piauí
##### Prof. Arlino Magalhães
arlino@ufpi.edu.br | @arlino.magalhaes


# Revisão de Python

Referência: Grus, Joel. Data Science do Zero. Capítulo 2. Disponível em: Minha Biblioteca, Editora Alta Books, 2021. 
| Link da Minha Biblioteca: https://integrada.minhabiblioteca.com.br/books/9788550816463

### Exceções

Erros podem ser tratados através de exceções com o objetivo de não causar falhas 
durante a execução do programa.

In [1]:
try:
    print(0 / 0)
except ZeroDivisionError: print("cannot divide by zero")

cannot divide by zero


### Listas

Uma lista é uma coleção de dados, parecida com um *array*.

In [2]:
integer_list = [1, 2, 3]
heterogeneous_list = ["string", 0.1, True]
list_of_lists = [integer_list, heterogeneous_list, []]

print("integer_list == ", integer_list)
print("heterogeneous_list == ", heterogeneous_list)
print("list_of_lists == ", list_of_lists)

integer_list ==  [1, 2, 3]
heterogeneous_list ==  ['string', 0.1, True]
list_of_lists ==  [[1, 2, 3], ['string', 0.1, True], []]


In [None]:
# Recupera o tamanho de um lista
list_length = len(integer_list)

# Recupera o somatório dos elementos de uma lista
list_sum = sum(integer_list)

print("len(integer_list) == ", list_length)
print("sum(integer_list) == ", list_sum)

In [None]:
x = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

# Elmento de índice O (primeiro elemento)
zero = x[0]

# Elmento de índice 1
one = x[1]

# Pythonico (pythonic) para o último elemento
nine = x[-1]

# Pythonico para o penúltimo elemento
eight = x[-2]

print("x[0] == ", zero)
print("x[1] == ", one)
print("x[-1] == ", nine)
print("x[-2] == ", eight)

In [None]:
# Recupera os três primeiros elementos
first_three = x[:3]

# Recupera os elementos após o terceiro elemento
three_to_end = x[3:] # [3, 4, ..., 9]

# Recupera os elementos após o primeiro elemento e antes do quinto
one_to_four = x[1:5] # [1, 2, 3, 4]

# Recupera o últimos tês elementos
last_three = x[-3:] # [7, 8, 9]

print("x[:3] == ", first_three)
print("x[3:] == ", three_to_end)
print("x[1:5] == ", one_to_four)
print("x[-3:] == ", last_three)

In [None]:
# IN verifica se um elemento está em uma lista
1 in [1, 2, 3] # Verdadeiro
0 in [1, 2, 3] # Falso

print("1 in [1, 2, 3] == ", 1 in [1, 2, 3])
print("0 in [1, 2, 3] == ", 6 in [1, 2, 3])

In [None]:
# Concatena listas
x.extend([10, 11, 12])

x

In [None]:
# Concatena listas
x = x + [13, 14, 15]

x

In [None]:
# Ordena listas
x = [4, 1, 2, 3]

y = sorted(x) # y é [1, 2, 3, 4], x não mudou
x.sort() # agora x é [1, 2, 3, 4]

print("y == ", y)
print("x == ", x)

### Tuplas

As tuplas são muito parecidas com as listas, mas não podem ser modificadas. 

In [None]:
my_tuple = (1, 2)
other_tuple = 3, 4
print("my_tuple = ", my_tuple)
print("other_tuple = ", other_tuple)

try:
    my_tuple[1] = 3
except TypeError: print("cannot modify a tuple")

As tuplas são uma forma eficaz de usar funções para retornar múltiplos valores:

In [None]:
def sum_and_product(x, y): 
    return (x + y), (x * y)

sp = sum_and_product(2, 3)
s, p = sum_and_product(2, 3)

print("Soma e produto = ", sp)
print("Soma = ", s, ", Produto = ", p)

### Dicionários

O dicionário (dict) associa valores a chaves e permite a rápida recuperação do valor 
correspondente a uma determinada chave.

In [None]:
empty_dict = {}
empty_dict2 = dict()
grades = {"Joel": 80, "Tim": 95}
joels_grade = grades["Joel"]

print("empty_dict = ", empty_dict)
print("empty_dict2 = ", empty_dict2)
print("grades = ", grades)
print("Joel = ", joels_grade)

In [None]:
# Buscar uma chave inexistente gera um KeyError
try:
    kates_grade = grades["Kate"] 
except KeyError: print("no grade for Kate!")

In [None]:
joel_has_grade = "Joel" in grades # Verdadeiro
kate_has_grade = "Kate" in grades # Falso

print("\"Joel\" in grades = ", joel_has_grade)
print("\"Kate\" in grades = ", kate_has_grade)

In [None]:
# O método get retorna um valor padrão (em vez de gerar uma exceção) quando
# uma chave inexistente é buscada.

joels_grade = grades.get("Joel", 0)
kates_grade = grades.get("Kate", 0)
no_ones_grade = grades.get("No One")

print("Joel = ", joels_grade)
print("Kate = ", kates_grade)
print("No One = ", no_ones_grade)

In [None]:
print("antes = ", grades)

grades["Tim"] = 99
grades["Kate"] = 100

print("depois = ", grades)

In [None]:
num_students = len(grades)

num_students

In [None]:
tweet = {
    "user" : "joelgrus",
    "text" : "Data Science is Awesome", 
    "retweet_count" : 100,
    "hashtags" : ["#data", "#science", "#datascience", "#awesome", "#yolo"]
}

tweet

In [None]:
tweet_keys = tweet.keys() # iterável para as chaves
tweet_values = tweet.values() # iterável para os valores
tweet_items = tweet.items() # iterável para as tuplas (chave, valor)

print(tweet_keys)
print(tweet_values)
print(tweet_items)

In [None]:
"user" in tweet_keys
"user" in tweet 
"joelgrus" in tweet_values

print("\"user\" in tweet_keys ==", "user" in tweet_keys)
print("\"user\" in tweet ==", "user" in tweet)
print("\"joelgrus\" in tweet_values ==", "joelgrus" in tweet_values)

### Contadores

O Counter (contador) conta a quantidade de cada elemento em um lista

In [None]:
from collections import Counter

list_counts = Counter([0, 1, 2, 2, 0, 0, 0])

list_counts

### Conjuntos

O set (conjunto) é uma coleção de elementos distintos.

In [None]:
primes_below_10 = {2, 3, 5, 7}

primes_below_10

In [None]:
# Criando um conjunto e adicionado valores

s = set() # s está vazio
s.add(1) # s agora é {1}
s.add(2) # s agora é {1, 2}
s.add(2) # s ainda é {1, 2}

# Verificando a existência de valores
y = 2 in s # Verdadeiro
y = 3 in s # Falso

In [None]:
# Converte uma lista para um conjunto
list_to_set = set([0, 1, 2, 2, 3, 3, 3, 4, 4, 4, 4])

list_to_set

### Testes Automatizados e asserção

Assert pode conferir se um código está correto.

In [None]:
assert 1 + 1 == 2

assert 1 + 1 == 2, "1 + 1 não é igual 2"

In [None]:
assert 1 + 1 == 3, "1 + 1 não é igual 2"

### Expressões Regulares

As expressões regulares são uma forma de procurar textos através de padrões definidos.

In [None]:
import re

p = re.compile('[a-c]+')
p

In [None]:
lista = [ 'www.google.com', 'https://www.google.com', 'google.com.br' ]
# Verifica textos que comecem com "www"
for string in lista:
     print(re.search("^www", string))

#### RegEx básico em Python

Veja mais informações de como usar RegEx no link abaixo.

https://medium.com/pyladiesbh/regex-básico-em-python-31dcb7fac046