#### Chapter 2 - A crash course in Python

In [6]:
#### Whitespace Formatting
# Python uses indentation:

for i in [1, 2, 3, 4, 5]:
    print (i)
    for j in [1, 2, 3, 4, 5]:
        print (j)
        print(i + j)
print('done looping')
# whitespaces is ignored inside parentheses and brackets
# use backslash statements continue onto the next line
two_plus_three = 2 + \
                3
print(two_plus_three)

1
1
2
2
3
3
4
4
5
5
6
2
1
3
2
4
3
5
4
6
5
7
3
1
4
2
5
3
6
4
7
5
8
4
1
5
2
6
3
7
4
8
5
9
5
1
6
2
7
3
8
4
9
5
10
done looping
5


In [8]:
import re
my_regex = re.compile('[0-9]+', re.I)
# re é usada para operações para correspondência de expressões regulares
# use alias:
import re as regex
my_regex = regex.compile('[0-9]+', regex.I)

In [None]:
# para visualização de dados:
import matplotlib.pyplot as plt
# se for necessario alguns especificos valores de um modelo, pode-se explicitar
from collections import defaultdict, Counter
lookup = defaultdict(int)
my_counter = Counter()


In [9]:
# Não se deve importar o modulo completo, pois pode rescrever variaveis
match = 10
from re import *
print(match)

<function match at 0x0000019D70AB76D0>


#### Arithmetic

In [10]:
# default do Python arredonda para baixo, devemos entao usar:
from __future__ import division
# // -> int division

2.5

#### Functions

In [11]:
# Uma função é uma regra que leva 0 ou + inputs e retorna o correspondente output.

def double(x):
    """
    Aqui coloca-se a docstring a explicar o que a função faz
    por exemplo, esta função multiplica o input por 2
    """
    return x * 2

double(5)

10

In [13]:
# As funções em Python são de primeira-clase,
# o que quer dizer que podedmos atribuir-las a variaveis
# e passa-las em outras funções como argumentos

def apply_to_one(f):
    """
    Chama a função f com 1 como argumento
    """
    return f(1)

my_double = double
x = apply_to_one(my_double)
print(x)

2


In [14]:
# É tambem possivel criar pequenas funções anónimas, os lambdas:
y = apply_to_one(lambda x: x + 4)
print(y)

5


In [None]:
# Posso tambem atribuir lambdas a variaveis:
another_double = lambda x: 2 * x # don't do this
def another_double(x): return 2 * x # do this instead

In [17]:
# Posso dar argumentos de default, que serão substituidos facilmente:
def my_print(message='my default message'):
    print(message)

my_print()
my_print('Hello World!')

my default message
Hello World!


In [22]:
# Por vezes, é util especificar os argumentos pelo nome
def subtract(a=0, b=0):
    return a - b

subtract(10, 5) # return 5
subtract(0, 5) # return -5
subtract(b = 5) # igual à anterior

-5

#### Strings

In [23]:
single_quoted = 'data science'
double_quouted = "data science"
# backslashes para encode caracteres especiais.
tab_string = '/t' # tab
len(tab_string) # 1


#### Exceptions

In [None]:
# Quando alguma coisa pode correr mal utilizamos a expressão try and expect:
try:
    print (0 / 0)
except ZeroDivisionError:
    print('cannot divide by zero')

#### Lists

In [None]:
int_list = [1, 2, 3]
heterogeneous_list = ['string', 0.1, True]
list_of_lists = [ int_list, heterogeneous_list, [] ]

list_length = len(int_list) # tamanho
list_sum = sum(int_list) # soma
# index
x = range(10) # lista de 0 a 9
zero = x[0] # index 0 valor 0
last = z[-1] # ultimo valor da lista

# slice lists
first_three = x[:3] # [0,1,2]
three_to_end = x[3:] #[3,4,...9]
copy_of_x = x[:]

# in - boolean verifica uma afirmação
1 in [1,2,3] # True
0 in [1,2,3] # False

# concatenar listas - MODIFICA LISTA ORIGINAL
x = [1,2,3]
x.extends([4,5,6])
# se nao quiser modificar a lista original pode-se +
x = [1,2,3]
y = x + [4,5,6]
# Append - adiciona ao final da lista o valor passado
x = [1,2,3]
x.append(0)

# Unpack - porem tem que ter o mesmo numero de elementos de ambos os lados
x, y = [1,2] # x=1, y=2

# utiliza-se _, quando não vamos usar um valor:
_, y = [1,2] # y == 2, o outro elemento nao interessava


#### Tuples

In [None]:
# Tuples são IMMUTAVEIS, enquanto as listas sao MUTAVEIS
my_list = [1,2]
my_tuple = (1,2)
other_tuple = 3, 4
my_list[1] = 3 # [1,3]

try:
    my_typle[1] = 3
except TypeError:
    print('connot modify a tuple')

# tuples, são uma forma conveniente de return varios valores de uma dada função
def sum_and_product(x,y):
    return(x + y),(x * y)

sp = sum_and_product(2,3) # (5, 6)
s, p = sum_and_product(5,10) # s is 15, p is 50

# TUPLES e LISTAS podem ser usadas para multiplas atribuições:
x, y = 1, 2
x, y = y, x # trocar variaveis


#### Dictionaries

In [None]:
# Associa values com keys
empty_dict = {}
empty_dict2 = dict()
grades = {'Joel':80, 'Tim':95 }

joels_grades = grades['Joel'] # 80
try:
    kates_grades = grades['Kate']
except KeyError:
    print('no grades for Kate!')

# Verificar a existencia de uma key
joel_has_grades = 'Joel' in grades #True
kate_has_grades = 'Kate' in grades #False

# Tem um metodo get que retorna o value de uma dada key
joel_grades = grades.get('Joel', 0) # igual a 80
kate_grades = grades.get('Kate', 0) # igual a 0
no_ones_grade = grades.get('No One') # default é None

# Atribuir values a uma dada key
grades['Tim'] = 99 # substitui o antigo valor com 99
grades['Kate'] = 100 # adiciona uma nova entrada
num_students = len(grades) # 3

# dictionaries são uma forma de representar dados estruturados

tweet = {
    'user':'joelgrus',
    'text':'Data Science is Awesome',
    'retweet_count': 100,
    'hashtags':['#data','#science','#datascience','#awesome','#yolo',]
}
tweet_keys = tweet.keys() # list of keys
tweet_values = tweet.values() # list of values
tweet_items = tweet.items() # list of (key, value) tuples

"user" in tweet_keys # True, lento
"user" in tweet # True, mais rapido pois dics sao mais rapidos que listas
"joelgrus" in tweet_values # True

# Dicts keys são IMUTAVEIS, nao podemos usar listas como keys apenas como values.
# Mas podemos usar tuple como keys



#### defaultdict

In [None]:
# Contar palavras num documento
word_counts = {} # dict vazio para colocar key que sao as palavras e um contador para da palavra
for word in document: # corre cada palavra do documento
    if word in word_counts: # se a palvra está no contador
        word_counts[word] += 1 # adicionar 1 ao valor da key
    else: # senão estiver
        word_counts[word] = 1 # criar uma key com a nova palavra e coloca-la com o valor 1

# com try, except
word_counts = {}
for word in document:
    try:
        word_counts[word] += 1
    except KeyError:
        word_counts[word] = 1

# 3 forma
word_counts = {}
for word in document:
    previous_count = word_counts.get(word, 0) # retira o valor de uma key e armazena-o na variavel
    word_counts[word] = previous_count + 1 # adiciona 1 ao valor antigo

### defaultdict é como um dict normal, porém quando se tenta procurar uma key
### que não contem, primeiro adiciona o valor para esta com uma função zero-argument
### que é dada quando criada
from collections import defaultdict

word_counts = defaultdict(int)
for word in document:
    word_counts[word] += 1 #se não houver uma dada palavra é criada uma key com a palavra com o valor de 0 e adiciona 1 a cada ocorrencia
    

# são usadas normalmente
dd_list = defaultdict(list) # list() cria uma lista vazia
dd_list[2].append(1) # {2:[1]}

dd_dict = defaultdict(dict)
dd_dict['Joel']['City'] = 'Seattle' #{'Joel' : {'City':Seattle'}}

dd_pair = defaultdict(lamda: [0,0])
dd_pair[2][1] = 1 # {2: [0,1]}

#### Counter