# <span style="color:blue"> MBA em Ciência de Dados</span>
# <span style="color:blue">Programação para Ciência de Dados</span>

## <span style="color:blue">Python Parte II</span>
**Material Produzido por Luis Gustavo Nonato**<br>
**Cemeai - ICMC/USP São Carlos**

---
__Conteúdo:__
- Referências
- Operações
- Comprehensions
- Funções e parâmetros

__Referencias:__
- Mark Lutz, Learning Python, O'Reilly, 2013
- Eric Matthes, Python Crash Course: A Hands-On, Project-Based Introduction to Programming, No Starch Press, 2015

---
## Referências 

Uma atribuição feita a uma variável gera uma referência a um endereço de memória. Por exemplo:
```python
x = [3.1]
y = x
```
No exemplo acima, a variável `x` é uma referência para o endereço de memória onde uma lista contendo o número `3.1` está armazenda.
Quando atribuimos  `y=x` as variáves `x` e `y` fazem referência para o mesmo endereço de memória. Desta forma, se a lista for modificada ambas as variáveis `x` e `y` são afetadas. 

In [5]:
# ilustrando referência a endereços de memória 
x = [3.1]
y = x

# o comando id() mostra o endereço de memória referenciado pela variávial
print("x e y referenciam o mesmo endenreço de memória")
print(id(x))
print(id(y))

x e y referenciam o mesmo endenreço de memória
4406252488
4406252488


In [6]:
y.append(5.3) # adionamos um novo valor a lista via variável y
# como x e y fazem referência ao mesmo endereço de memória, a lista fica alterada para ambos, muito embora não 
# se tenha operado sobre x
print(x) 
print(y)

[3.1, 5.3]
[3.1, 5.3]


A situação é diferente porém quando se manipula elementos imutáveis.
Números _inteiros_ ou _reais_, assim como _strings_ e _tuplas_, são imutáveis.

Quando se atribui um elemento imutável a uma variável, a referência ao endereço de memória onde o imutável está armazenado se torna fixa. 
Se modificarmos a variável por meio de qualquer operação, um novo valor é gerado em outra posição da memória. 

In [3]:
x = 3   # x faz referência ao endereço de memória onde o número 3 está armazenado
print('Endereco onde o numero 3 esta armazenado:',id(x))
x = x+1 # a operação + resulta no número 4, que é armazenado em um novo endereço de memória
print('Endereco onde o resultado de x+1 esta armazenado:',id(x)) 

Endereco onde o numero 3 esta armazenado 4365812912
Endereco onde o resultado de x+1 esta armazenado 4365812944


No exemplo acima, a atribuição
```python
x = 3
```
cria o número inteiro (imutável) 3, armazena-o em um endereço de memória, e cria, na variável `x`, uma referência a tal endereço. Quando a operação 
```python
x = x+1
```
é executada, o valor 3 referenciado por `x` é recuperado, adicionado 1 e o resultado 4 é colocado em um novo endereço de memória, fazendo que `x` referêncie o endereço onde a constante 4 está armazenada.


## Operações em elementos tipo sequências

Operações binárias como <font color='blue'>'+'</font>, <font color='blue'>'-'</font> e <font color='blue'>'*'</font>
podem ser aplicadas à sequências, como visto anteriormente. Porém, existem outras operação binárias importantes:

### <span style="color:blue">"in"</span>
- Verifica se um valor está em uma sequência
- Testa substrings em strings 
- Verifica se valor é uma chave de um dicionário
- Pode ser combinada com <span style="color:blue">"not"</span> para verificar se o valor, substring, ou chave  NÃO está presente

In [6]:
t = [1,2,3,4,5]
print(3 in t)
print(7 in t)
print(3 not in t)
print(7 not in t)

True
False
False
True


In [7]:
s = 'abcde'
print('cd' in s)
print('acd' in s)
print('acd' not in s)

True
False
True


In [9]:
d = {'Brasil' : 1, 'Espanha' : 0}
print('Brasil' in d)
print('Espanha' not in d)

True
False


__Atenção__:
o perador <font color='blue'>'in'</font> também é usado em loops <font color='blue'>'for'</font>, porém, com uma conotação diferente.

### <span style="color:blue">"+"</span>
- O operador <font color='blue'>'+'</font> produz uma nova sequência que concatena os argumentos


In [10]:
a = (1,2,3)
print(id(a))
b = (4,5,6)
a = a+b
print(a)
print(id(a)) # note que como a tupla (1,2,3) é imutável, o resultado de a+b é alocado em novo endereço de memória

4407084232
(1, 2, 3, 4, 5, 6)
4405973256


In [11]:
print([1,2,3]+[4,5,6])
print('hello'+'world')

[1, 2, 3, 4, 5, 6]
helloworld


### <span style="color:blue">"*"</span>
O operador <span style="color:blue">'*'</span> assume como argumentos um número inteiro e uma sequência
- por exemplo: 
```python
3 * [1,2,3] 
5 * "---" 
(1,2) * 3
```
- produz uma nova sequência com elementos replicados o número de vezes indicado pelo argumento inteiro

In [12]:
print(3*(1,2,3))
print([1,2,3]*2)
print(5*'ab')

(1, 2, 3, 1, 2, 3, 1, 2, 3)
[1, 2, 3, 1, 2, 3]
ababababab


### Operações exclusivas de listas
Listas possuem operadores (métodos) próprios para inserção e concatenação. Existem basicamente 3 métodos, os quais funcionam de forma diferente:
- <span style="color:blue">'append'</span>: insere um elemento no final da lista 
- <span style="color:blue">'insert'</span>: insere um elemento em uma posição indicada 
- <span style="color:blue">'extend'</span>: concatena listas

In [13]:
lst = [1,2,3,4,5]
lst.append('a') # insere novo elemento ao final da lista
print(lst)
lst.insert(1,'b') # insere novo elemento na posição 1 da lista (lembre-se que o primeiro elemento esta na posição 0)
print(lst)
lst.extend(['c','d']) # concatena os elementos de uma outra lista no final da lista que chama o método
print(lst)
lst.append([2,3]) # neste caso a lista [2,3] é inserida no final de lst (não realiza concatenação)
print(lst)

[1, 2, 3, 4, 5, 'a']
[1, 'b', 2, 3, 4, 5, 'a']
[1, 'b', 2, 3, 4, 5, 'a', 'c', 'd']
[1, 'b', 2, 3, 4, 5, 'a', 'c', 'd', [2, 3]]


In [25]:
l = list(range(10)) # o comendo 'range' gera números entre 0 e 9, 
                    # que são armazenados em uma lista pelo comando 'list'
print(l)
l.append('a') # adiciona 'a' no final da lista l
print(l)
l.append(['a']) # adiciona a lista ['a'] no final da lista l
print(l)
l[-1].append('b') # l[-1] corresponde ao último elemento da lista l
                  # que corresponde a lista ['a'], inserindo o elemento 'b' a esta lista
print(l)
l.extend(['c','d']) # concatena a lista ['c','d'] no final da lista l
print(l)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a']
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', ['a']]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', ['a', 'b']]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 'a', ['a', 'b'], 'c', 'd']


__Atenção:__
- <font color='blue'>'extend'</font> usa a lista em questão enquanto o operador `+` cria uma nova lista
- <font color='blue'>'extend'</font> assume uma LISTA como argumento enquanto `append` assume um elemento como argumento (o elemento pode ser uma outra lista)

Outras métodos importantes para operar listas são:
- <span style="color:blue">'index'</span>: encontra a posição na lista da primeira ocorência de um dado elemento 
- <span style="color:blue">'count'</span>: conta o número de ocorrências de um dado elemento
- <span style="color:blue">'reverse'</span>: reverte a ordem dos elementos na lista, modificando a lista original
- <span style="color:blue">'sort'</span>: ordena os elementos na lista, modificando a lista original

In [17]:
xst = ['a', 'b', 'c', 'b','e','b']
index = xst.index('b') # encontra o indice da primeira ocorrência
print("Posicao da primeira ocorrencia de 'b': ",index)
count = xst.count('b') # conta o numero de ocorrências
print("Numero de ocorrencias de 'b': ",count) 

xst.sort(reverse=True) # ordena os elementos da lista do maior para o menor 
print("Elementos ordenados:",xst)

xst.reverse() # reverte a ordem dos elementos na lista
print("Lista ordenada em ordem reversa: ",xst)

Posicao da primeira ocorrencia de 'b':  1
Numero de ocorrencias de 'b':  3
Elementos ordenados: ['e', 'c', 'b', 'b', 'b', 'a']
Lista ordenada em ordem reversa:  ['a', 'b', 'b', 'b', 'c', 'e']


__Atenção:__ Todas as operações _sort_ e _reverse_ são _"in place"_ (modificam a lista) 

Os principais métodos para remover elementos de uma lista são:
- <span style="color:blue">'remove'</span>: remove a primeira ocorrência do elemento na lista
- <span style="color:blue">'pop'</span>: remove o último elemento da lista 
- <span style="color:blue">'del'</span>: remove elemento de uma posição específica. Se nenhuma posição é especificada, toda a lista é removida da memória

In [20]:
xst = ['a', 'b', 'c', 'b','e','b']
xst.remove('b') # remove primeira ocorrencia e 'b'
print("Lista com a primeira ocorrencia de 'b' removida: ",xst)

del xst[1] # remove elemento da posição 1
print("Elemento da posição 1 (neste caso 'c') removido: ",xst)

xst.pop() # remove ultimo elemento da lista
print("Ultimo elemento (neste caso 'b') removido: ",xst)

Lista com a primeira ocorrencia de 'b' removida:  ['a', 'c', 'b', 'e', 'b']
Elemento da posição 1 (neste caso 'c') removido:  ['a', 'b', 'e', 'b']
Ultimo elemento (neste caso 'b') removido:  ['a', 'b', 'e']


### Operadores nativos do python que operam em sequências
A linguagem Python possui operadores que podem ser empregados em sequencias:
- <span style="color:blue">'sorted'</span>: ordena os elementos da sequência, gerando uma nova sequência (não afeta a sequência original)
- <span style="color:blue">'max'</span>: retorna o maior elemento da sequência
- <span style="color:blue">'min'</span>: retorna o menor elemento da sequência

In [24]:
seq = 'adeakziomltmd'

seq_ordenada_lista = sorted(seq) # ordena a sequência de caracteres e salve em uma nova variavel. 
                           # A saida do método é a sequência armazenada em uma lista.
                           # A sequencia original não é afetada
print('Sequencia ordenanda: ', seq_ordenada_lista) 
print('Sequencia original: ', seq)

# Convertendo uma lista em uma sequência de caracteres
seq_ordenada =''.join(seq_ordenada_lista)  # o comando join contatena elementos em uma string utilizando um separador.
                                           # Neste caso o separador nao é fornecido.
                                           # O simbolo '' significa que nenhum separador é fornecido.
                                           # Rode o comando com '*'.join(seq_ordenada_lista) e veja o resultado
print("Sequencia ordenada no formato string: ",seq_ordenada)

seq_max = max(seq)  # retorna o maior elemento da sequência
print('Maior elemento: ', seq_max)
seq_min = min(seq)  # retorna o menor elemento da sequência
print('Menor elemento: ', seq_min)

Sequencia ordenanda:  ['a', 'a', 'd', 'd', 'e', 'i', 'k', 'l', 'm', 'm', 'o', 't', 'z']
Sequencia original:  adeakziomltmd
Sequencia ordenada no formato string:  aaddeiklmmotz
Maior elemento:  z
Menor elemento:  a


---
## Comprehension

<span style="color:blue">Comprehension</span> é um recurso fundamental do Python que permite construir aplicar uma expressão para cada item em um sequência de forma bastante eficiente. A sintaxe de um comprehension é:
```python
lista = [expressao for variavel_local in objeto]
```
O resultado do comando acima é equivalente a:
```python
lista=[]
for variavel_local in objeto:
    lista.append(expressao)
```
Porém, o comprehension é executado pelo Python de forma muito mais eficiente. Typicamente se emprega um comprehension para construir uma lista ou um dicionário.

In [26]:
cst = [i**2 for i in range(-9,10)] # O comando range(-9,10) gera números entre -9 e 9
                                   # o comprehension pega cada número, eleva ao quadrado (i**2)
                                   # e armazena em uma lista, que é referenciada pela variavel cst
print(cst)

[81, 64, 49, 36, 25, 16, 9, 4, 1, 0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


Comprehension é mais eficiente do que um laço <font color='blue'>'for'</font>. <br>
Compare o tempo de processamento das duas células abaixo analisando o resultado da função  <font color='blue'>'%%timeit'</font><br>
Uma documentação de como o <font color='blue'>'%%timeit'</font> funciona pode ser encontrada [aqui](https://jakevdp.github.io/PythonDataScienceHandbook/01.07-timing-and-profiling.html)

In [33]:
%%timeit   # timeit é uma funcao utilizada para medir o tempo de processamento de uma célulo do jupyter notebook
cst = [i**2 for i in range(-100,100)]

53.5 µs ± 1.44 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [34]:
%%timeit
cst = []
for i in range(-100,100):
    cst.append(i**2)

60.7 µs ± 1.05 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


### Comprehension com Filtragem
Comprehension também pode ser empregada em conjunto com estruturas de decisão <font color='blue'>'if'</font>. A sintaxe neste caso se torna.
```python
variavel = [expressao for variavel_local in objeto if condicao]
```
O resultado do comando acima é equivalente a:
```python
variavel=[]
for variavel_local in objeto:
    if condicao:
        variavel.append(expressao)
```

In [19]:
l = [x**2 for x in range(-10,10) if x%2 != 0] # Cada número entre -10 e 9 é elevado ao quadrado e inserido na lista 
                                              # Porém, apenas números ímpares são selecionados devido
                                              # a condição if x%2 != 0
print(l)

[81, 49, 25, 9, 1, 1, 9, 25, 49, 81]


__OBS__: A <font color='blue'>'if'</font> funciona como filtro. 

Quando uma declaração do tipo <font color='blue'>'if' 'else'</font> precisa ser usada, ela deve ser inserida antes do laço <font color='blue'>'for'</font>

In [23]:
l = [x**2  if x%2 != 0 else 0 for x in range(-10,10)] # impares intercalados com zero
print(l)

[0, 81, 0, 49, 0, 25, 0, 9, 0, 1, 0, 1, 0, 9, 0, 25, 0, 49, 0, 81]


### Comprehension com Laços Encapsulados (Nested Loops)
Pode-se empregar comprehension com laços <font color='blue'>'for'</font> encapsulados um dentro do outro. Neste caso a sintaxe se torna:
```python
lista = [expressao for variavel_local1 in objeto1 if condicao1
					for variavel_local2 in objeto2 if condicao2]
```
O resultado do comando acima é equivalente a:
```python
lista=[]
for variavel_local1 in objeto1:
    if condicao1:
        for variavel_local2 in objeto2:
            if condicao2:
                lista.append(expressao)
```

In [35]:
l = [x+y for x in range(-10,10) for y in range(10) if y < x] # inclui na lista a soma de x+y somente se y<x
                                                             # para x variando entre -10 e 9 e y entre 0 e 9
print(l)

[1, 2, 3, 3, 4, 5, 4, 5, 6, 7, 5, 6, 7, 8, 9, 6, 7, 8, 9, 10, 11, 7, 8, 9, 10, 11, 12, 13, 8, 9, 10, 11, 12, 13, 14, 15, 9, 10, 11, 12, 13, 14, 15, 16, 17]


In [36]:
# codigo equivalente ao comprehension acima

l=[]
for x in range(-10,10):
    for y in range(10):
        if y < x:
            l.append(x+y)
            
print(l)

[1, 2, 3, 3, 4, 5, 4, 5, 6, 7, 5, 6, 7, 8, 9, 6, 7, 8, 9, 10, 11, 7, 8, 9, 10, 11, 12, 13, 8, 9, 10, 11, 12, 13, 14, 15, 9, 10, 11, 12, 13, 14, 15, 16, 17]


Comprehention também pode ser utilizado para construir dicionários. A syntaxe se torna:
```python
dicionario = {expressao_chave:expressao_valor for variavel_local in objeto}
``` 
O resultado do comando acima é equivalente a:
```python
dicionario = {}
for variavel in objeto:
    dicionario[expressao_chave]=expressao_valor
```
Da mesma forma que listas, pode-se utilizar condições <font color='blue'>'if'</font>, <font color='blue'>'if' 'else'</font> e laços <font color='blue'>'for'</font> encapsulados.

In [37]:
dt = {x:x**2 for x in range(10)} # cria um dicionário onde a chave sao números entre 0 e 9, com valores correspondendo
                                 # ao quadrado da chave
print(dt)

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}


---
## Funções e Parâmetros
Uma função em Python pode ser criada de difentes formas.

O comando <font color='blue'>'def'</font> é um dos principais mecanismos para se criar uma função.
O resultado de um comando <font color='blue'>'def'</font> é um _objeto_ do tipo 'função'.

Uma função pode ser invocada a partir de um comando, executando a sequência de código identado abaixo dela.

In [39]:
def meu_print(x):   # cria a função meu_print
    print('Imprimindo ', x, 'via funcao meu_print')
    
meu_print('Hello 1') # invoca a função meu_print com a string 'Hello 1' como parâmetro.

Imprimindo  Hello 1 via funcao meu_print


Como o resultado do <font color='blue'>'def'</font> é um _objeto_, ele pode ser atribuido a uma variável e a 
variável passa a se comportar como uma função.

In [40]:
def meu_print(x):   # cria a função meu_print
    print('Imprimindo ', x, 'via funcao meu_print')
    
x = meu_print  # a variável x é uma referência para o objeto (função) meu_print
x('Hello 2')  # pode-se utilizar x como a função meu_print

Imprimindo  Hello 2 via funcao meu_print


### Parâmetros de uma função
Os parâmetros (também chamados de argumentos) de uma função podem assumir valores pré-estabelecidos (default) que são utilizados quando o parâmetro correspondente não é fornecido.

In [41]:
def echo(x=10,y=7):  # cria a funçao echo com dois parâmetros x e y. Se os parâmetros não são fornecidos quando a 
    print(x+y)       # função é invocada, os valores pré-estabelecidos 10 e 7 são utilizados
    
echo()          # nenhum parâmetro é fornecido, os dois valores pré-estabelecidos são utilizados 

echo(x=1)       # somente o parâmetro x é fornecido, o valor pré-estabelecido de y é utilizado 

echo(x=1,y=0)   # os dois parâmetros são fornecidos, nenhum valor pré-estabelecido é utilizado

echo(1)   # quando o nome do parâmetro não é fornecido, assume-se a ordem como foram definidos na função,
          # neste o valor de x é fornecido como 1 e y não é fornecido
    
echo(1,3) # o valor de x = 1 e y = 3 são fornecidos

17
8
1
8
4


Como são objetos, funções podem ser passadas como parâmetros para outras funções.

In [48]:
def echo1(x):
    print('Impresso pela funcao echo1 ', x)
    
def echo2(x):
    print('Impresso pela funcao echo2 ', x)
    
def invoca_echo(f,t):  # o parâmetro f é uma função
    f(t)               # que é invocada dento da função invoca_echo

invoca_echo(echo1,'Hello')
invoca_echo(echo2,'World')

Impresso pela funcao echo1  Hello
Impresso pela funcao echo2  World


### Retorno de uma função
Toda função retorna algo. Se o comando <font color='blue'>'return'</font> não é especificado, o símbolo <font color='blue'>'None'</font> é retornado como resultado da função.

In [45]:
def soma1(x):   # cria a função soma1 sem especificar um valor de retorno via comando "return"
    x+1
    
def soma2(x):   # cria a função soma12 com retorno definido pelo comando "return"
    return(x+1)
    
print(soma1(2))  # como soma1 não possui um valor de retorno, o símbolo "None" é retornado automaticamente
print(soma2(2))  # o resultado x+1 (onde x vale 2) é retornado pelo comando "return"

None
3


---
## Funções Lambda
- Funções <font color='blue'>lambda</font> são funções que podem ser invocadas, mas que não possuem nome
- Uma função <font color='blue'>lambda</font> é uma expressão, não uma declaração, então pode ser usada em lugares do código em que `def` não é possível, por exemplo dentro de um comprehension. A sintaxe de uma função <font color='blue'>lambda</font> é:
```python
lambda arg1,arg2,...,argn: expressao
```

In [49]:
f1 = lambda x: x**2  # cria uma função lambda com um argumento e retorna o valor do argumento ao quadrado
                     # a variável f1 é uma referência a função lambda 
                     # o argumento x da função lambda passa a ser um parâmetro de f1
    
print(f1(2))

f2 = lambda x,y: x+y # cria uma função lambda com dois argumentos e retorna a soma dos argumentos 
                     # a variável f2 é uma referência a função lambda
                     # os argumentos x e y da função lambda passam a ser parâmetros de f2
print(f2(2,3))

4
5


In [54]:
f3 = lambda x: 'even' if x%2==0 else 'odd' # função lambda que retorn 'even' se o argumento for par (x%2==0)
                                           # e 'odd' caso contrário

lnumeros = [i for i in range(10) if f3(i) == 'even' ] # cria uma lista de números pares entre 0 e 9 
lstrings = [f3(i) for i in range(10)]  # cria uma lista de strings 'even' e 'odd' 
print(lnumeros)
print(lstrings)

[0, 2, 4, 6, 8]
['even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd', 'even', 'odd']
