# <span style="color:blue">Programação Python para Ciência de Dados</span>
## <span style="color:blue">Módulo 2: Python II</span>
---

__Conteúdo:__
- Referências
- Operações em tipos sequenciais (sequence types)
- Comprehensions
- Funções avançadas
- Arquivos E/S (File I/O)

__Referencias:__
- Mark Lutz, Learning Python, O'Reilly, 2013
- Eric Matthes, Python Crash Course: A Hands-On, Project-Based Introduction to Programming, No Starch Press, 2015

---
## Referências 

Atribuição manipula referências:
```python
x = y
```
não é feita cópia do conteúdo de $y$, isto é, $x$ apenas passa a referênciar o que $y$ referencia.


Constantes são imutáveis:
- inteiros (integer) e números reais (float)
- strings
- tuplas

então o que realmente ocorre, no que diz respeito a referências, é o seguinte:

In [1]:
x = 3
x = x+1
print(x)

4


```python
x = 3
```
o número 3 é uma constante criada na memória, e a variável $x$ referencia ao endereço dessa constante 
```python
x = x+1
```
na expressão x+1, o valor 3 referenciado por x é recuperado, adicionado 1 e o resultado 4 é colocado em um novo endereço de memória. $x$ é atualizado de maneira a referenciar o endereço da nova constante 4.


In [2]:
x = 3
print(id(x))
x = x+1
print(id(x))

94731079287904
94731079287936


In [3]:
# Por que a variável y não muda com x?
x = 3
y = x
x = x+1
print(x,y)

4 3


In [4]:
# Por que a variável y muda com x?
x = [3]
y = x
x.append(1)
y.append(2)
print(x,y)

[3, 1, 2] [3, 1, 2]


In [5]:
# Por que a variável y não muda com x?
x = [3]
y = x
x = x+[1]
y = y+[2]
print(x,y)

[3, 1] [3, 2]


---
## Operações em sequências

### <span style="color:blue">"in"</span>
- Verifica se um valor está em uma sequência 
- Testa substrings em strings 
- Verifica se valor é uma chave de um dicionário

In [6]:
t = [1,2,3,4,5]
print(3 in t)
print(7 in t)
print(3 not in t)
print(7 not in t)

True
False
False
True


In [7]:
s = 'abcde'
print('cd' in s)
print('acd' in s)

True
False


In [43]:
d = {'Brasil' : 'PT-BR', 'Espanha' : 'Es'}
print('Brasil' in d)

True


__Atenção__:
o perador `in` também é usado em `for` loops (assim como em list comprehension), porém, com um objetivo diferente. 

### <span style="color:blue">"+"</span>
- produz uma nova sequência em que o valor é a concatenação dos argumentos


In [8]:
a = (1,2,3)
print(id(a))
b = (4,5,6)
a = a+b
print(a)
print(id(a))

140713463680888
(1, 2, 3, 4, 5, 6)
140713523460232


In [1]:
print([1,2,3]+[4,5,6])
print('hello'+'world')

[1, 2, 3, 4, 5, 6]
helloworld


### <span style="color:blue">"*"</span>
- argumentos devem ser um inteiro e uma sequência
- produz uma nova sequência em que os elementos são replicados o número de vezes do inteiro

In [10]:
print(3*(1,2,3))
print(2*[1,2,3])
print(5*'ab')

(1, 2, 3, 1, 2, 3, 1, 2, 3)
[1, 2, 3, 1, 2, 3]
ababababab


### Operações exclusivas de listas

### <span style="color:blue">"append"</span>, <span style="color:blue">"insert"</span> e <span style="color:blue">"extend"</span>

In [11]:
lst = [1,2,3,4,5]
lst.append('a') # acrescenta elemento ao final da lista
print(lst)
lst.insert(1,'b') # insere em posição especificada (pode ser muito custoso)
print(lst)
lst.extend(['c','d']) # acrescenta elementos de uma outra lista ao final da anterior
print(lst)

[1, 2, 3, 4, 5, 'a']
[1, 'b', 2, 3, 4, 5, 'a']
[1, 'b', 2, 3, 4, 5, 'a', 'c', 'd']


In [2]:
l = list(range(10))
print(l)
l.append('a')
print(l)
l.append(['a'])
print(l)
l[-1].append('b')
print(l)
l.extend(['c','d'])
print(l)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a']
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', ['a']]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', ['a', 'b']]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', ['a', 'b'], 'c', 'd']


__Atenção:__
- `extend` usa a lista em questão enquanto o `+` cria uma nova lista
- `extend` assume uma LISTA como argumento enquanto `append` assume um elemento como argumento (o elemento pode ser uma outra lista)

### <span style="color:blue">"index"</span>, <span style="color:blue">"count"</span>, <span style="color:blue">"reverse"</span>, <span style="color:blue">"sort"</span> e <span style="color:blue">"remove"</span>

In [7]:
xst = ['a', 'b', 'c', 'b','e','b']
print(xst)
print('index',xst.index('b')) # dá o indice da primeira ocorrência
print('count',xst.count('b')) # conta o numero de ocorrências
xst.sort() # ordena os elementos da lista "in place" 
print('sorted',xst)
xst.reverse() # reverte a ordem dos elementos na lista "in place"
print('reversed',xst)

['a', 'b', 'c', 'b', 'e', 'b']
index 1
count 3
sorted ['a', 'b', 'b', 'b', 'c', 'e']
reversed ['e', 'c', 'b', 'b', 'b', 'a']


__Atenção:__ Todas as operações _sort_ e _reverse_ são _"in place"_ (modificam a variável em questão) 

### <span style="color:blue">"remove"</span>, <span style="color:blue">"pop"</span> e <span style="color:blue">"del"</span>

In [8]:
print(xst)
xst.remove('b') # remove primeira ocorrencia
print('removig the first b',xst)

del xst[1] # remove pelo indice
print('delete element in position 1 ',xst)

xst.pop() # remove do topo (ultima posição) da lista (tende a ser um pouco mais eficiente que os anteriores)
print('popped',xst)

['e', 'c', 'b', 'b', 'b', 'a']
removig the first b ['e', 'c', 'b', 'b', 'a']
delete element in position 1  ['e', 'b', 'b', 'a']
popped ['e', 'b', 'b']



### <span style="color:blue">"sorted"</span>, <span style="color:blue">"max"</span>, <span style="color:blue">"min"</span>

In [17]:
import random
seq = [random.random() for i in range(3)]

#print(seq)
print('sorted:', sorted(seq)) #sortED não modifica a sequência
print('original:', seq)
print('max:', max(seq))
print('min:', min(seq))

sorted: [0.28099898080227304, 0.5190578862162447, 0.9362888526747843]
original: [0.9362888526747843, 0.28099898080227304, 0.5190578862162447]
max: 0.9362888526747843
min: 0.28099898080227304


---
## Comprehension
Controi uma nova lista aplicando uma expressão para cada item em um sequência
```python
l = [expression for target in object]
```
é equivalente a:
```python
l=[]
for target in object:
    l.append(expression)
```

In [19]:
cst = [i**2 for i in range(-9,10)]
print(cst)

[81, 64, 49, 36, 25, 16, 9, 4, 1, 0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Comprehension é mais eficiente do que `for` loop 

In [20]:
%%timeit
cst = [i**2 for i in range(-100,100)]

52 µs ± 1.18 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [21]:
%%timeit
l = []
for i in range(-100,100):
    l.append(i**2)

56.2 µs ± 524 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


### __Comprehension com Filtragem__:
```python
l = [expression for target in object if condition]
```
é equivalente a:
```python
l=[]
for target in object:
    if condition:
        l.append(expression)
```

In [19]:
l = [x**2 for x in range(-10,10) if x%2 != 0] # inclui apenas números ímpares
print(l)

[81, 49, 25, 9, 1, 1, 9, 25, 49, 81]


__OBS__: a condição `if` funciona como filtro. Mas quando uma declaração do tipo `if` `else` precisa ser usada, então é inserida antes do for loop

In [23]:
l = [x**2  if x%2 != 0 else 0 for x in range(-10,10)] # impares intercalados com zero
print(l)

[0, 81, 0, 49, 0, 25, 0, 9, 0, 1, 0, 1, 0, 9, 0, 25, 0, 49, 0, 81]


### __Laços Encapsulados (Nested Loops)__:
```python
l = [expression	for target1 in object1 if condition1
					for target2 in object2 if condition2
					...]
```
é equivalente a:
```python
l=[]
for target1 in object1:
    if condition1:
        for target2 in object2:
            if condition2:
                ...
```

In [21]:
l = [x+y for x in range(-10,10) for y in range(10) if y < x]
print(l)

[1, 2, 3, 3, 4, 5, 4, 5, 6, 7, 5, 6, 7, 8, 9, 6, 7, 8, 9, 10, 11, 7, 8, 9, 10, 11, 12, 13, 8, 9, 10, 11, 12, 13, 14, 15, 9, 10, 11, 12, 13, 14, 15, 16, 17]


In [24]:
# codigo equivalente ao comprehension

l=[]
for x in range(-10,10):
    for y in range(10):
        if y < x:
            l.append(x+y)
            
print(l)

[1, 2, 3, 3, 4, 5, 4, 5, 6, 7, 5, 6, 7, 8, 9, 6, 7, 8, 9, 10, 11, 7, 8, 9, 10, 11, 12, 13, 8, 9, 10, 11, 12, 13, 14, 15, 9, 10, 11, 12, 13, 14, 15, 16, 17]


### Dictionary Comprehension
Também é possível criar dicionários usando comprehension

In [23]:
dt = {x:x**2 for x in range(10)}
print(dt)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}


---
## Objetos função
Uma função criada pelo comando `def` é um objeto em Python

In [25]:
def echo(x):
    print(x)
    
echo('Hello 1')
x = echo
x('Hello 2')

Hello 1
Hello 2


Os parâmetros de uma função podem assumir valores "default" que são utilizados quando o parâmetro não é fornecido

In [40]:
def echo2(x=10,y=7):
    print(x+y)
    
echo2()
echo2(x=1)
echo2(1)
echo2(x=1,y=0)

17
8
8
1


Toda função retorna algo. Se o comando _return_ não é especificado, _None_ é retornado como resultado

In [42]:
def soma1(x):
    x+1
    
def soma2(x):
    return(x+2)
    
print(soma1(1))
print(soma2(1))

None
3


Assim como um objeto, funções podem ser passadas como argumento para outras funções

In [25]:
def echo(x):
    print(x)
    
def call_echo(f,t):
    f(t)

call_echo(echo,'Hello')

Hello


Uma função pode retornar um objeto função

In [26]:
def f1(param1):
    def f2(param2):
        print(param1+param2)
    return(f2)

g = f1('Hello ') # param1 is stored as a variable of f2
g('World')

Hello World


In [27]:
f1('Hello ')('world')

Hello world


---
## Funções Lambda
- _Funções lambda (Lambda Functions)_ são funções que podem ser chamadas mas não possuem nome
- Uma `lambda` é uma expressão, não uma declaração, então pode ser usada em lugares do código em que `def` não é válido
```python
lambda arg1,arg2,...,argn: expression
```

In [28]:
f1_l = lambda x: x**2
print(f1_l(2))

f2_l = lambda x,y: x+y
print(f2_l(2,3))

4
5


In [29]:
f3_l = lambda x: 'even' if x%2==0 else 'odd'
eo = [i for i in range(10) if f3_l(i) == 'even' ]
print(eo)

[0, 2, 4, 6, 8]


In [30]:
l = [i for i in range(-10,10)]
l.sort(key=lambda x: abs(x))
print(l)

[0, -1, 1, -2, 2, -3, 3, -4, 4, -5, 5, -6, 6, -7, 7, -8, 8, -9, 9, -10]


---
## Programação Funcional

### map
```python
map(func,iterable)
```
aplica 'func' a todos os elementos do 'iterable'

In [31]:
def echo2(a):
    return(a+'_hi')
    
l = list(map(echo2,'abcd'))
print(l)

['a_hi', 'b_hi', 'c_hi', 'd_hi']


In [32]:
l = list(map(lambda x: x+'_oi','abcd'))
print(l)

['a_oi', 'b_oi', 'c_oi', 'd_oi']


### filter 
```python
filter(func,iterable)
```
retorna todos os elementos do 'iterable' em que 'func' retorna <span style='color:blue'> True </span> 

In [33]:
l = list(filter(lambda x: x%2==0,range(10)))
print(l)

[0, 2, 4, 6, 8]


### reduce 
```python
reduce(func,iterable)
```
aplica 'func' acumulativamente aos itens do 'iterable', da esquerda para a direita, de maneira a reduzir a sequência 'iterable' a apenas um elemento
- a função 'func' sempre precisa receber dois argumentos

In [29]:
from functools import reduce

r = reduce(lambda x,y: x+y,range(10))
print(r)

# equivalent to
x = 0
for y in range(10):
    x = x + y
print(x)

45
45


In [30]:
reduce(lambda x, y : x + y, [[[i]] for i in range(10)], [-1])
# [-1] é o inicializador, primeiro valor de x

[-1, [0], [1], [2], [3], [4], [5], [6], [7], [8], [9]]

---
## Arquivos E/S (File I/O)
- Python manipula naturalmente arquivos _ascii_, mas arquivos binários também são possíveis de serem usados
- O conteúdo de um arquivo é um string, não um objeto. Então o usuário deve fazer a conversão de/para string 
- Arquivos são lidos/escritos em buffers, o que significa que deve-se assegurar o dump para disco no código Python
   - fechar um arquivo (comando close em Python) ou usar o comando `flush` força os dados em buffer a serem escritos em disco

### open
```python
open(filename, mode)
``` 
retorna um obejeto arquivo.<br>

"mode" pode ser
- ‘r’ para leitura (read)
- ‘w’ para escrita(write)
- ‘a’ para acrescentar (append)
- ‘r+’ para leitura e escrita

Se o arquivo não pode ser aberto, o interpretador envia a mensagem de erro IOError<br>
Métodos no objeto arquivo são usados para ler, escrever e controlar o arquivo


In [27]:
%%writefile data.txt
# o comando acima envia o conteúdo desta célula para
# um arquivo texto chamado 'data.txt'

hello world
today is Wednesday
winter is comming

Overwriting data.txt


In [31]:
# instanciando um objeto 'arquivo'
f = open('data.txt','r')

### read
```python
f.read(size)
``` 
lê "size" bytes, ou o arquivo inteiro se "size" é omitido
```python
f.readline() 
``` 
lê uma única linha
```python
for line in f: 
```
lê cada linha do arquivo atribuindo-a a variável "line" 
```python
f.readlines() 
```
retorna uma lista contendo todas as linhas do arquivo


In [32]:
f = open('data.txt','r')
lines = f.readlines()
print(lines)

# for l in f:
#     print(l)

['# o comando acima envia o conteúdo desta célula para\n', "# um arquivo texto chamado 'data.txt'\n", '\n', 'hello world\n', 'today is Wednesday\n', 'winter is comming\n']


In [35]:
with open('data.txt', 'r') as f:  # garante que o arquivo será fechado corretamente quando finalizado
    for line in f:
        print(line)

# o comando acima envia o conteúdo desta célula para

# um arquivo texto chamado 'data.txt'



hello world

today is Wednesday

winter is comming



### write
```python
f.write()
```
escreve um string no arquivo
```python
f.writelines()
```
escreve uma lista de strings no arquivo

In [38]:
f = open('data2write.txt', 'w')
lst = ['hello world\n','today is Saturday\n', 
       'winter is comming\n']
for i in lst:
    f.write(i)

f.close() # this is mandatory to flush data to disk

In [39]:
lst = ['hello world\n','today is Saturday\n', 
       'winter is comming\n']
with open('data2write.txt', 'w') as f:
    f.writelines(lst)