## Essencial do Python para Data Science

Este material foi criado baseado no livro: Data Science do Zero de Joel Grus.

### Estilo de formação do cídigo

In [1]:
# Python utiliza indentação para delimitar o bloco de código
for i in [1, 2]:
    print(i)
    for j in [3, 4]:
        print(j)
    print("j done") # final do loop do j
print("i done") # final do loop do i

1
3
4
j done
2
3
4
j done
i done


### Carregando os modulos

In [2]:
# Todos os modulos (bibliotecas) devem ser importados como abaixo:
import re
# Você ainda pode querer definir um nome mais declarativo ou simples fazendo isso:
import re as regex
import matplotlib.pyplot as plt
# Ainda é possível fazer o import de uma função específica:
from collections import Counter

### Definindo funções

In [3]:
# Para definir uma função em Python devemos utilizar a palavra reservada def como abaixo:
def my_sum(a, b):
    return a + b

my_sum(2, 2) # chamando a função soma!

4

In [4]:
# Você também poderia escrever a função acima inline como abaixo:
def my_soma_in_line(a, b): return a + b

my_soma_in_line(2, 2)

4

In [5]:
# Você ainda pode atribuir funções para variaveis como abaixo:
def old_double(x): return x * 2;
new_double = old_double
print(new_double(2))

print("...")
# E então fazer coisas confusas como isso:

def apply_function(function): return function(1)
apply_function(new_double) # Mas como eu poderia passar o argumento junto?


4
...


2

#### Documentação simples sobre funções

In [6]:
# Neste momento quem sabe chegou a hora de criar uma documentação, as coisas começaram a ficar mais complexas..
# Para isso, uma boa prática é fazer como abaixo:
def soma(a, b):
    """Esta função soma a+b"""
    return a + b

soma(2, 2)

4

In [7]:
# Ainda sobre funções em Python, você pode querer definir os valores e as vezes até trocar a ordem dos argumentos..
def subtract(a=0,b=0): return a-b

print(subtract(10, 5))

print("...")

def other_subtract(a, b): return a-b;

print(other_subtract(b=10, a=5))

5
...
-5


### Strings (cadeia de caracteres)

In [8]:
# Definimos Strings em python por aspas simples ou duplas:
name = "Emanoel"
print(name)
# Também podemos utilizar alguns codificadores de caracteres..
apply_tab_in_name = "Ema\tnoel"
print(apply_tab_in_name)
print("...")
# Ainda é possivel utilizar a barra invertida definindo o inicio da String como:
usando_barra = r"caminho\arquivo.text"
print(usando_barra)
sem_usar_r = "caminho\arquivo.text" # sem a utilização do r no inicio..
print(sem_usar_r)
# Perceba que isso é bastante importante na utilização de path de arquivos ou diretórios

Emanoel
Ema	noel
...
caminho\arquivo.text
caminhorquivo.text


### Listas

In [9]:
# Listas em python são bastante parecidas com arrays como em qualquer outra linguagem
integer_list = [1, 2, 3]
print("Tamanho da lista de números:", len(integer_list))
print("...")
lista_misturada = ["String", 0.1, True] # Perceba que não existe um padrão definido como em Java por exemplo..
lista_misturada_com_inteiros = [integer_list, lista_misturada]
print("Tamanho da lista misturada com inteiros:", len(lista_misturada_com_inteiros))
# Perceba que o tamanho considera a quantidade de elementos, desconsiderando os elementos da sub lista..
# Você também pode querer somar todos os elementos da lista de inteiros:
print("soma dos elementos da lista inteiros:", sum(integer_list))
print("...")
# Assim como em Java (minha linguagem com maior domínio) é possível fazer manipulações sobre os indices:
x = list(range(10)) # definindo uma lista de comprimento 0..9
zero = x[0] # obtendo o primeiro elemento da lista, neste caso o zero
print(zero)
# No entanto, python tem alguns super poderes e lhe deixar fazer algo como isso:
nine = x[-1] # obtendo o ultimo elemento da lista, neste caso o nove
print(nine)
eigth = x[-2] # obtendo o penúltimo elemento da lista
print(eigth)
print("...")
# Ainda consigo fazer coisas mais "humanas" hehehe
x[0] = -1 # acabei de definir o primeiro elemento da lista como -1

print("Escrevendo minha lista modificada:")
for i in x:
    print(i)

# Você ainda pode fazer outras manipulações sobre a lista como abaixo:
first_three = x[:3] # obter os primeiros três elementos
print(first_three)
range_of_elements = x[2:5] # obter os elementos entre os indices especificados
print(range_of_elements)
three_to_end = x[3:] # desconsiderando os elementos antes do terceiro
print(three_to_end) 
## ainda seguindo esta ideia é possível fazer um cópia da lista
copy = x[:]
print(copy)
print("...")
# Tem muita coisa ainda que python faz sobre listas, abaixo você encontra várias operações:
1 in [1, 2] # verificando se o número 1 está contido sobre a lista, retorna true
print(1 in [1, 2])
0 in [1, 2] # retorna false
print(0 in [1, 2])
# A operação acima deve ser realizada com cuidado, ela irá percorrer todos os elementos da lista
# o que em muitos casos isso pode acabar por ser custoso..
print("...")
# Você ainda pode desejar fazer um apend sobre a lista adicionando um novo elemento ou concatenando uma outra lista
x = [1, 2, 3]
print(x)
x.append(4)
x.append(5)
print(x)
x.extend([6, 7, 8, 9])
print(x)
print("...")
# Quem sabe deseja realizar uma separação de elementos, então:
a, b =  [1, 2]

Tamanho da lista de números: 3
...
Tamanho da lista misturada com inteiros: 2
soma dos elementos da lista inteiros: 6
...
0
9
8
...
Escrevendo minha lista modificada:
-1
1
2
3
4
5
6
7
8
9
[-1, 1, 2]
[2, 3, 4]
[3, 4, 5, 6, 7, 8, 9]
[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]
...
True
False
...
[1, 2, 3]
[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5, 6, 7, 8, 9]
...


### Tuplas

In [17]:
# Tuplas são como listas, no entanto, são imutáveis!
# Quase todas as operações realizadas sobre listas se aplicam a tuplas

# Para definir uma tupla realizamos a seguinte declaração:
my_tuple = (1, 2)
# ou então:
other_tuple = 1, 2

# Ao tentar realizar uma modificação sobre algum valor como realizavamos sobre listas retornara um erro..
try:
   my_tuple[0] = 3
except TypeError:
    print("cannot modify a tuple")
    
# Com elas conseguimos retornar multiplos valores a partir das funções
def sum_and_product(x, y):
    return (x + y),(x * y)

result = sum_and_product(2, 3)
print(result)

a, b = sum_and_product(2, 3)
print("valor do a:", a)
print("valor do b:", b)


cannot modify a tuple
(5, 6)
valor do a: 5
valor do b: 6


### Dicionários

In [25]:
# Dicionários também é uma das principais estruturas em python.. lembrando algo parecido com mapas em Java
dici = {"João":80, "Pedro":20}
idade = dici["João"]
print("idade:", idade)
print("...")

person  = { # uma forma mais interessante de declarar um dicionário
    "name": "Emanoel",
    "year": 27
}

# No python ja existem alguams implementações que podem te auxiliar, como por exemplo:
keys = person.keys() # retorna uma lista de chaves do dicionario
print(keys)

values = person.values()
print(values) # retorna uma lista de chaves de valores do dicionario

items = person.items()
print(items) # retorna uma tupla (chave, valor)

print("...")
print("dicionario contem a chave name?", "name" in person)
print("dicionario contem o valor Emanoel?", "Emanoel" in values) # perceba que estou usando a lista de valores

print("...")
# Alguns assuntos um pouco mais avançados sobre dicionário:
# defaultdict é um utilitario de collections para auxiliar na adição/procura de chaves

from collections import defaultdict

word = defaultdict(int) # recebendo o valor padrão quando não encontrar a chave procurada..
word["apple"] = 1
word["orange"] = 1
print(word)

# também é possivel utilizar listas 
dd_list = defaultdict(list)
dd_list["apple"].append(1)
print(dd_list)

# e fazer algumas "misturas"
dd_list = defaultdict(dict) # iniciando um dicionario vazio
dd_list["fruit"]["apple"] = 1
dd_list["other"] = "rice")
print(dd_list)

idade: 80
...
dict_keys(['name', 'year'])
dict_values(['Emanoel', 27])
dict_items([('name', 'Emanoel'), ('year', 27)])
...
dicionario contem a chave name? True
dicionario contem o valor Emanoel? True
...
defaultdict(<class 'int'>, {'apple': 1, 'orange': 1})
defaultdict(<class 'list'>, {'apple': [1]})


AttributeError: 'dict' object has no attribute 'append'