# Curso Deep Learning - Exercício pré-curso Python - NumPy

Este é um notebook Jupyter contendo exercícios de programação matricial utilizando o Python e biblioteca NumPy.
Estes exercícios servem para verificar os conhecimentos da linguagem Python para manipulação matricial com a biblioteca NumPy.

Esta lista de exercício é um guia de estudo. Para fazer os exercícios será necessário estudar o Python e NumPy, consultar documentação e tutoriais disponíveis na Internet.

### Python

Estes exercícios devem ser feitos com o Python 3.
Recomenda-se utilizar o Google Colab para fazer esses exercícios (https://colab.research.google.com/)  ou instalar o Jupyter e o Python utilizando-se o [Anaconda](https://www.continuum.io/downloads) - uma distribuição focada em Data Science, contendo os principais pacotes usados nesta área.

### Jupyter notebook

Este é um Notebook Jupyter. Um notebook Jupyter é uma mistura de linguagem Markdown para formatar texto (como uma Wiki) e um programa Python. É muito usado entre as pessoas que trabalham com Data Science e Machine Learning em Python.

Se utilizar o Jupyter notebook, instale o Jupyter nbextensions que é um conjunto de ferramentas auxiliares. Habilite o "Table of Contents" do nbextensions para que este notebook fique itemizado. Para o Google Colab, não é possível instalar o nbextensions.

Você pode adicionar quantas células quiser neste notebook para deixar suas respostas bem organizadas.

# Exercícios básicos

Vamos começar! Comece imprimindo seu nome e e-mail aqui:

In [1]:
# preencha com seus dados
print('My name is Israel Campiotti')
print('My email is israelcampiotti@gmail.com')

My name is Israel Campiotti
My email is israelcampiotti@gmail.com


## Listas

Iremos utilizar muitas listas no curso Deep Learning.
Seguem alguns exercícios com lista. Python é muito bom para processar listas. Uma lista é uma sequência de elementos 
separados por vírgula dentro de chaves:

In [2]:
mylist = [5, 8, 'abc', 0, 8.3]

### Imprimindo o número de elementos de uma `mylist` e alguns de seus elementos. Veja como isso pode ser feito.

In [3]:
print(len(mylist))
print(mylist[0])
print(mylist[-1])  # observe o índice -1 (o que isso significa?)

5
5
8.3


## Seja uma lista de 10 elementos numéricos sequenciais, começando em zero

O código a seguir é típico para criar uma lista com os 10 primeiros inteiros maiores ou iguais a zero: inicializa-se lista vazia, para cada i entre 0 e menor que 10, faz append na lista a:

In [4]:
a = []
for i in range(10):
    a.append(i)
print(a)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


## List Comprehension

Esta mesma lista pode ser criada utilizando a construção denominada "List Comprehension" ou
"Compreensão de Lista" em portugues. Coloque este termo no Google adicionando python na frente na forma:
"python comprehension list" e você poderá ver vários exemplos e tutoriais sobre o assunto. É uma forma compacta que fazer um append iterativo numa lista:

Veja como o trecho acima foi reduzido para uma linha apenas:

In [5]:
a = [i for i in range(10)]
print(a)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### Analise o trecho de programa a seguir:

In [6]:
m_list = ['r', 'i', 'c', 'a', 'r', 'd', 'o']
new_list = []
for k,item in enumerate(m_list):
    new_list.append(str(k) + item)
print(new_list)

['0r', '1i', '2c', '3a', '4r', '5d', '6o']


- Explique o que o enumerate faz no programa acima:

Explicação: O enumerate enumera os itens de uma lista, retornando o indice no item, a partir de 0, e o elemento neste mesmo indice da lista

### Repita o mesmo trecho acima de criar a lista new_list, porém utilizando list comprehension:
   

In [7]:
m_list = ['r', 'i', 'c', 'a', 'r', 'd', 'o']
n_list = [
    str(k)+item for k, item in enumerate(m_list)
] # utilize aqui o list comprehension
n_list

['0r', '1i', '2c', '3a', '4r', '5d', '6o']

## Fatiamento em Python

Um conceito fundamental em Python é o do fatiamento "slicing", em inglês. É um conceito que será muito usado
durante todo o curso. Estude bem isso. Inicialmente iremos trabalhar com fatiamento de lista, mas posteriormente
com arrays (ou tensores) utilizando o NumPy

In [8]:
print(a[3:5])

[3, 4]


### Veja como criar e imprimir uma lista a partir da lista "a" já criada, porém apenas alguns elementos

In [9]:
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [10]:
# imprima os elementos ímpares de a
print(a[1::2])
# imprima os elementos pares de a
print(a[::2])
# imprima os últimos 3 elementos da lista (utilize índice negativo, pesquise na Internet)
print(a[-3:])
# Imprima os 3 primeiros elementos da lista (veja quando é possível ignorar valores iniciais e finais)
print(a[:3])

[1, 3, 5, 7, 9]
[0, 2, 4, 6, 8]
[7, 8, 9]
[0, 1, 2]


### Veja o significado do passo, i.e. o terceiro parâmetro do "fatiamento":

In [11]:
print(a[::2])
print(a[::-1])

[0, 2, 4, 6, 8]
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]


### Exercício: Imprima os elementos ímpares na order reversa, do maior para o menor

In [12]:
print(a[:2:-1])

[9, 8, 7, 6, 5, 4, 3]


## Tuplas

Dominar o conceito de tuplas é importante pois tuplas são estruturas muito utilizadas no Python.

In [13]:
b = tuple(a)
print(b)

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)


### Responda: A principal diferença entre uma lista e uma tupla é:

Resposta: Uma tupla e imutavel, enquanto uma lista nao.

# Dicionários em Python

Python possui uma estrutura de dados muito versátil denominada dicionário.
No curso Deep Learning, os parâmetros da rede neural serão armazenadas na forma de dicionário. Veja a seguir alguns exemplos de uso de dicionários:

In [14]:
rob_record = {'nome': 'Roberto', 'idade': 18}
print(rob_record['nome'])

Roberto


In [15]:
rob_record['idade'] = 20
print(rob_record)

{'nome': 'Roberto', 'idade': 20}


Lista de dicionários:

In [16]:
records = [{'nome':'Alfredo', 'idade': 23},
           {'nome':'Fernanda', 'idade': 16},
           {'nome':'Carla', 'idade':33}]

### Exercício: Acesse o nome da Fernanda: complete e descomente a linha a seguir

In [17]:
print(records[1]['nome'])

Fernanda


### Exercício: crie uma lista com todos os nomes da lista records.

O resultado deve ser uma lista ['Alfredo', 'Fernanda', 'Carla']

In [18]:
# 1. Utilizando a forma tradicional de criar lista com append
# porém sem utilizar o for i in range()
nlist = [
]
for v in records :
    nlist.append(v['nome'])
print(nlist)

['Alfredo', 'Fernanda', 'Carla']


In [19]:
# 2. Utilizando a forma de list comprehension
nlist2 = [ v['nome'] for v in records ]
print(nlist2)

['Alfredo', 'Fernanda', 'Carla']


# Exercícios usando NumPy

Os seguintes exercícios devem usar apenas o pacote NumPy.
Não se deve utilizar nenhum outro pacote adicional.
O NumPy é o pacote que ter o Python apropriado para programação científica.
A programação eficiente de matrizes multidimensionais (arrays ou tensores) é
feita através do conceito de programação matricial que evita o uso de laços
e iterações nos elementos da matriz.

Existem vários exemplos de uso de NumPy no conjunto de
notebooks tutorias disponíveis no GitHub:
- https://github.com/robertoalotufo/ia898/blob/master/master/0_index.ipynb

In [1]:
import numpy as np

Veja como é possível criar um array unidimensional e depois reformatá-lo para ser acessado como array bidimensional:

In [4]:
array = np.arange(10)
print(array)
print(array.shape)

[0 1 2 3 4 5 6 7 8 9]
(10,)


In [5]:
A = np.arange(24).reshape(4,6)
print(A)
print(A.shape)

[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]
 [12 13 14 15 16 17]
 [18 19 20 21 22 23]]
(4, 6)


### Exercício: imprimindo rows, cols, dimensions, shape and datatype

In [6]:
# imprima o número de linhas de A
print(A.shape[0])
# imprima o número de colunas de A
print(A.shape[1])
# imprima o número de dimensões de A
print(len(A.shape))
# imprima o shape de A:
print(A.shape)
# imprima o tipo de dados (dtype) dos elementos de A:
print(A.dtype)

4
6
2
(4, 6)
int64


### Reshape

In [7]:
# Seja o vetor unidimension a:
a = np.array([1,2,3,4])
print(a, a.shape)

[1 2 3 4] (4,)


### Exercício: Converta o vetor unidimensional a em uma matriz vetor coluna (4 linhas e 1 coluna) utilizando reshape

In [8]:
a = a.reshape(-1,1)
print(a)

[[1]
 [2]
 [3]
 [4]]


## Cópia por referência, cópia rasa e cópia profunda

Explique a diferença entre estes 3 tipos de cópias e dê um exemplo de cada uma.
**Resposta**:


In [9]:
# Exercício
# Indique para cada uma das expressões a seguir se a cópia é por referência, rasa ou profunda
x = a # cópia ? referencia
y = a[:2] # cópia ? rasa
z = a.reshape(4,1) # cópia ? rasa
zz = a.copy() # cópia ? profunda

In [10]:
# Explique o valor dos resultados:
z[0,0] = 5
print(a) # explique: como z somente aponta para a, entao alterar z tambem altera a
y[1] = 6
print(a) # explique: mesmo que anterior
zz[0] = 7
print(a) # explique: zz e uma copia profunda, portanto altera-lo nao muda a

[[5]
 [2]
 [3]
 [4]]
[[5]
 [6]
 [3]
 [4]]
[[5]
 [6]
 [3]
 [4]]


## Operações aritméticas

In [11]:
B = A + 10
B

array([[10, 11, 12, 13, 14, 15],
       [16, 17, 18, 19, 20, 21],
       [22, 23, 24, 25, 26, 27],
       [28, 29, 30, 31, 32, 33]])

### Array binário (booleano)

#### Exercício: Crie uma matriz booleana C com True nos elementos de B menores que 18 (não utilize loop explícito)

In [12]:
C = B < 18 # modify your code here
print(C)

[[ True  True  True  True  True  True]
 [ True  True False False False False]
 [False False False False False False]
 [False False False False False False]]


## Indexação booleana

### Exercício: explique o comando a seguir de indexação booleana

Explicação: retorna os elementos de A que possuem os indices onde os elementos de B sao menores que 18

In [13]:
A[B < 18]

array([0, 1, 2, 3, 4, 5, 6, 7])

Veja um programa que cria matriz D_loop a partir da matriz B, porém trocando os elementos menores que 18 por seus valores negativos

In [14]:
D_loop = B.copy()
for row in np.arange(B.shape[0]):
    for col in np.arange(B.shape[1]):
        if B[row,col] < 18:
            D_loop[row,col] = - B[row,col]
print(D_loop)

[[-10 -11 -12 -13 -14 -15]
 [-16 -17  18  19  20  21]
 [ 22  23  24  25  26  27]
 [ 28  29  30  31  32  33]]


### Exercício: Troque o corpo do laço do programa acima por uma única linha sem loop

In [19]:
D = B.copy()
D[B<18] = -B[B<18]  # << modifique aqui utilizando indexação booleana
print(D)

[[-10 -11 -12 -13 -14 -15]
 [-16 -17  18  19  20  21]
 [ 22  23  24  25  26  27]
 [ 28  29  30  31  32  33]]


## Redução de eixo: soma

Operações matriciais de redução de eixo são muito úteis e importantes.
É um conceito importante da programação matricial.

Estude o exemplo a seguir:

In [20]:
print(A)
print(A.shape)
As = A.sum(axis=0)
print(As)
print(As.shape)

[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]
 [12 13 14 15 16 17]
 [18 19 20 21 22 23]]
(4, 6)
[36 40 44 48 52 56]
(6,)


### Exercício: Explique o funcionamento da soma por redução de eixo. Qual foi a dimensão que desapareceu?

Resposta: a primeira dimensao desapareceu, pois a foma foi feito na direcao 0, somando os elementos das colunas

### Exercício: calcule o valor médio do array A

In [21]:
print(np.mean(A))

11.5


### Exercício: calcule o valor médio das linhas de A:

In [22]:
print(np.mean(A, 1))

[ 2.5  8.5 14.5 20.5]


## Broadcasting

### Exercício: O que significa o conceito de broadcasting em NumPy?

Resposta: e a habilidade de tratar algum array com um formato (shape) diferente do original durante alguma operacao

In [26]:
# Usando o conceito de broadcast, mude o shape do vetor a para que o broadcast possa ocorrer em G = A + a
a = np.arange(4)
print(a)
G = A + a.reshape(-1,1)
print(G)

[0 1 2 3]
[[ 0  1  2  3  4  5]
 [ 7  8  9 10 11 12]
 [14 15 16 17 18 19]
 [21 22 23 24 25 26]]


## Normalização entre 0 e 1

Seja a matriz $C$ que é a normalização da matriz $A$:
$$ C(i,j) = \frac{A(i,j) - A_{min}}{A_{max} - A_{min}} $$

Em programação matricial, não se faz o loop em cada elemento da matriz,
mas sim, utiliza-se operações matriciais. Faça o exercício a seguir
sem utilizar laços explícitos:

In [29]:
# Criar a matriz C que é a normalização de A, de modo que os valores de C estejam entre 0 e 1
C = (A - A.min())/(A.max() - A.min())
print(C)

[[0.         0.04347826 0.08695652 0.13043478 0.17391304 0.2173913 ]
 [0.26086957 0.30434783 0.34782609 0.39130435 0.43478261 0.47826087]
 [0.52173913 0.56521739 0.60869565 0.65217391 0.69565217 0.73913043]
 [0.7826087  0.82608696 0.86956522 0.91304348 0.95652174 1.        ]]


In [30]:
# Modificar o exercício anterior, porém agora faça a normalização para cada coluna de A
# de modo que as colunas da matriz D estejam entre os valores de 0 a 1.
# Dica: utilize o conceito de redução de eixo
D = (A - A.min(0))/(A.max(0) - A.min(0))
print(D)

[[0.         0.         0.         0.         0.         0.        ]
 [0.33333333 0.33333333 0.33333333 0.33333333 0.33333333 0.33333333]
 [0.66666667 0.66666667 0.66666667 0.66666667 0.66666667 0.66666667]
 [1.         1.         1.         1.         1.         1.        ]]


In [33]:
A.shape

(4, 6)

In [32]:
A.min(1).shape

(4,)

In [35]:
# Modificar o exercício anterior, porém agora faça a normalização para cada linha de A
# de modo que as colunas da matriz E estejam entre os valores de 0 a 1.
# Dica: utilize o conceito de redução de eixo, porém mantenha o mesmo número de eixos para poder fazer broadcast
E = (A - A.min(1).reshape(-1,1)) / (A.max(1).reshape(-1,1) - A.min(1).reshape(-1,1))
print(E)

[[0.  0.2 0.4 0.6 0.8 1. ]
 [0.  0.2 0.4 0.6 0.8 1. ]
 [0.  0.2 0.4 0.6 0.8 1. ]
 [0.  0.2 0.4 0.6 0.8 1. ]]


## Fatiamento em arrays (slicing)

In [36]:
# esta indexação é chamada fatiamento:
AA = A[:,1::2]
print(AA)

[[ 1  3  5]
 [ 7  9 11]
 [13 15 17]
 [19 21 23]]


In [37]:
# criar a matriz AB apenas com as linhas pares da matriz A, utilizando o conceito de fatiamento:
AB = A[::2]
print(AB)

[[ 0  1  2  3  4  5]
 [12 13 14 15 16 17]]


In [39]:
# crie a matriz AC com mesmo shape da matriz A, porém com os elementos na ordem inversa:
# trocando a ordem das linhas e das colunas
AC = A[::-1,::-1]
print(AC)

[[23 22 21 20 19 18]
 [17 16 15 14 13 12]
 [11 10  9  8  7  6]
 [ 5  4  3  2  1  0]]


## Produto matricial  (dot product)

Calcule a matriz E dada pelo produto matricial entre a matriz A e sua transposta: 
$$ E = A A^T $$

In [40]:
E = A @ A.T # modify your code here
print(E)

[[  55  145  235  325]
 [ 145  451  757 1063]
 [ 235  757 1279 1801]
 [ 325 1063 1801 2539]]


In [41]:
# Descomente a linha e explique
# por que a operação de multiplicação dá erro?
Ee = A * A.T

ValueError: operands could not be broadcast together with shapes (4,6) (6,4) 

Erro por que o operado * fazer operacao elemento por elementp (element-wise) e portanto nao consegue fazer esta operacao com matrizes de shapes diferentes

## Matrizes multidimensionais

Em deep learning, iremos utilizar matrizes multidimensionais
que são denominados como arrays no NumPy. PyTorch usa o nome de tensor para
suas matrizes multimensionais.

Matrizes de dimensões maior que 4 são de difícil intuição. A melhor forma de lidar
com elas é observando o seu *shape*.

### 3-D array

In [42]:
F = A.reshape(2,3,4)
print(F)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


#### Indexação

Estude as seguintes indexações:

In [43]:
F1 = F[1]
print(F1)
F2 = F[1,0,:]
print(F2)
F3 = F[1,0,2]
print(F3)
F4 = F[1:2,0,2]
print(F4)

[[12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]]
[12 13 14 15]
14
[14]


In [44]:
print(F1.shape)
print(F2.shape)
print(F3.shape)
print(F4.shape)

(3, 4)
(4,)
()
(1,)


### Exercício: Explique as dimensões de cada array:

F1: duas dimensoes, pois e uma matriz 2D

F2: uma dimensao, vetor de 4 elementos

F3: sem dimensao, escalar

F4: uma dimensao, vetor de um elemento

## Redução de eixo - aplicado a dois eixos simultâneos

Redução de eixo é quando a operação matricial resulta num array de menores dimensões.
Com essas operações, calcula-se estatística de colunas, linhas, etc.

### Exercício: Calcule o valor médio das matrizes F[0] e F[1], com apenas um mean no comando F.mean(??)

In [59]:
print(F.mean(2))

[[ 1.5  5.5  9.5]
 [13.5 17.5 21.5]]


## Function - split - dados treino e validação

O exercício a seguir é para separar um conjunto de dados (dataset) em dois conjuntos, um
de treinamento e outro de validação.


Defina uma função que receba como entrada uma matriz, (dataset), onde cada linha é
referente a uma amostra e cada coluna referente a um atributo das amostras. O número total de
amostras é dado pelas linhas desta matriz.
Outro parâmetro de entrada é o fator de split `split_factor`, que é um número real entre 0 e 1. 
A saída da função são duas matrizes: amostras de treinamento e amostras de validação. 
A matriz de treinamento contrá o número de linhas dado por `split_factor` vezes o número de amostras.
A matriz de validação conterá o restante das amostras.

In [60]:
# Entrada, matriz contendo 10 amostras e 9 atributos
aa = np.arange(90).reshape(10,9)
print(aa)

[[ 0  1  2  3  4  5  6  7  8]
 [ 9 10 11 12 13 14 15 16 17]
 [18 19 20 21 22 23 24 25 26]
 [27 28 29 30 31 32 33 34 35]
 [36 37 38 39 40 41 42 43 44]
 [45 46 47 48 49 50 51 52 53]
 [54 55 56 57 58 59 60 61 62]
 [63 64 65 66 67 68 69 70 71]
 [72 73 74 75 76 77 78 79 80]
 [81 82 83 84 85 86 87 88 89]]


In [61]:
# Saída da função t,v = split(aa, 0.8)  # utilizado split_factor de 80%
t = np.arange(72).reshape(8,9)
print(t)

[[ 0  1  2  3  4  5  6  7  8]
 [ 9 10 11 12 13 14 15 16 17]
 [18 19 20 21 22 23 24 25 26]
 [27 28 29 30 31 32 33 34 35]
 [36 37 38 39 40 41 42 43 44]
 [45 46 47 48 49 50 51 52 53]
 [54 55 56 57 58 59 60 61 62]
 [63 64 65 66 67 68 69 70 71]]


In [62]:
v = np.arange(72,90).reshape(2,9)
print(v)

[[72 73 74 75 76 77 78 79 80]
 [81 82 83 84 85 86 87 88 89]]


In [64]:
# Evite o uso de laço explícito
# Não utilize outras bibliotecas além do NumPy
def split(dados, split_factor):
    '''
    divide a matriz dados em dois conjuntos:
    matriz train: split_factor * n. de linhas de dados
    matriz val: (1-split_factor) * n. de linhas de dados
    parametros entrada:
        dados: matriz de entrada
        split_factor: entre 0. e 1. - fator de divisão em duas matrizes
    parametros de saída:
        train : matriz com as linhas iniciais de dados
        val: matriz com as linhas restantes
    '''
    # insert your code here
    sz = round(split_factor * len(dados))
    train = dados[:sz]
    val = dados[sz:]
    return train, val

t,v = split(aa, 0.8)
print('t=\n', t)
print('v=\n', v)

t=
 [[ 0  1  2  3  4  5  6  7  8]
 [ 9 10 11 12 13 14 15 16 17]
 [18 19 20 21 22 23 24 25 26]
 [27 28 29 30 31 32 33 34 35]
 [36 37 38 39 40 41 42 43 44]
 [45 46 47 48 49 50 51 52 53]
 [54 55 56 57 58 59 60 61 62]
 [63 64 65 66 67 68 69 70 71]]
v=
 [[72 73 74 75 76 77 78 79 80]
 [81 82 83 84 85 86 87 88 89]]


### Exercício: Teste sua função com outros valores

In [65]:
t,v = split(aa, 0.6)
print('t=\n', t)
print('v=\n', v)

t=
 [[ 0  1  2  3  4  5  6  7  8]
 [ 9 10 11 12 13 14 15 16 17]
 [18 19 20 21 22 23 24 25 26]
 [27 28 29 30 31 32 33 34 35]
 [36 37 38 39 40 41 42 43 44]
 [45 46 47 48 49 50 51 52 53]]
v=
 [[54 55 56 57 58 59 60 61 62]
 [63 64 65 66 67 68 69 70 71]
 [72 73 74 75 76 77 78 79 80]
 [81 82 83 84 85 86 87 88 89]]


# Programação Orientada a Objetos

Documentação oficial: https://docs.python.org/3/tutorial/classes.html

Forma clássica de definição de uma função:

In [66]:
data = np.array([13, 63, 5, 378, 58, 40])

def avg(d):
    return sum(d)/len(d)
    
avg(data)

92.83333333333333

## Definição da classe, variáveis, inicialização e método

Definição da classe `MyAvg`, contendo duas variávels: `id` (compartilhada) e `d`; inicialização e método `avg`.

- **Classe** é uma forma de definir um tipo abstrato de dados
- **Instância** de uma classe é chamada **objeto**
- Operadores ou funções de uma classe são chamados **métodos**
- **Variáveis de instância** são variáveis associadas à instância
- **Variáveis de classe** são variáveis compartilhada com todas as instâncias da classe

O nome de uma classe é usualmente escrita usando *Camel case* enquanto que métodos são
escritos com caixa baixa.

In [67]:
class MyAvg:
    id = 0.33                # variável compartilhada com todas as instâncias
    
    def __init__(self,data):
        self.d = data        # variável associada a cada instância 
        
    def avg(self): # método para calcular a média
        return sum(self.d)/len(self.d)

Objetos `a` e `b` são instâncias da classe `MyAvg`.
Instanciar uma classe é inicializá-la através da chamada ao método __init__:

In [68]:
a = MyAvg(data)
b = MyAvg(2*data)

Aplicação do método `avg()`, retorna a média dos dados dos objetos a e b:

In [69]:
print(a.avg())
print(b.avg())

92.83333333333333
185.66666666666666


In [72]:
# Imprima os valores dos dados associados aos objetos a e b:
print(a.d)
print(b.d)

[ 13  63   5 378  58  40]
[ 26 126  10 756 116  80]


In [74]:
# Imprima a variável compartilhada `id` de cada objeto a e b:
print(a.id)
print(b.id)

0.33
0.33


## Herança de classe

In [75]:
class MyAvgStd(MyAvg):
    def var(self): # método adicional para calcular a variância
        u = self.avg()
        return np.sqrt(np.sum((self.d - u)**2)/len(self.d))

In [76]:
c = MyAvgStd(data)

In [77]:
print('media:',c.avg())
print('variancia:',c.var())

media: 92.83333333333333
variancia: 129.294775180163


In [78]:
# imprima os dados associados ao objeto c e a sua variável compartilhada id
print(c.id)

0.33


### Exercício: convertendo a função `split` na classe `C_Split`

Implemente a classe `C_Split` para ter a mesma funcionalidade da função `split` feita acima

In [81]:
class C_Split():
    def __init__(self,d):
        self.d = d
    def split(self, split_factor):
        return split(self.d, split_factor)

In [82]:
data_train_val = C_Split(aa)
train, val = data_train_val.split(0.8)

## Classe com métodos `__len__` e `__getitem__`

Uma classe com métodos `__len__` e `__getitem__` permite que os objetos possam ser indexados e calculado o seu número de elementos.

Veja o exemplo a seguir:

In [83]:
class Word():
    def __init__(self, phrase):
        self.wordlist = phrase.split() # separa frase em uma lista de palavras
    
    def __len__(self):
        return len(self.wordlist)
    
    def __getitem__(self,x):
        return self.wordlist[x]

In [84]:
frase = 'Esta frase é formada por 7 palavras'
palavras = Word(frase)

In [85]:
palavras[3]  # permite a indexação do objeto

'formada'

In [86]:
print(len(palavras))

7


### Exercício para indexar elementos de um dicionário

Um dicionário em Python não é indexado. Por exemplo seja o dicionário `d` a seguir.
Não é possível indexar d[0] ou d[1] para buscar o primeiro ou segundo par (chave:valor).

In [87]:
d = {'a':1,'b': 2}

Implementar uma classe que receba um dicionário e permita que ele possa ser indexado.
Para converter um dicionário em uma lista de pares, use:

In [88]:
list(d.items())

[('a', 1), ('b', 2)]

Complete a definição da classe `dicdata` a seguir para que um dicionário possa ser
indexado:

In [91]:
class DicData():
    def __init__(self, dic):
        self.dic = list(dic.items())
        
    def __len__(self):
        return len(self.dic)
        
    def __getitem__(self, idx):
        return self.dic[idx]

In [92]:
dd = DicData(d)
print(len(dd))
print(dd[0])

2
('a', 1)


## Iteradores

Iteradores são uteis para serem usados em estruturas do tipo `for a in b:`.

Listas em Python são consideradas iteráveis, pois podem ser utilizadas nessa estrutura:

In [93]:
for i in ['a', 'b', 'c']:
    print(i)

a
b
c


O método do `range()` do python também é um iterável:

In [94]:
for i in range(3):
    print(i)

0
1
2


É possível acessar o iterador destas estruturas utilizando o método `iter()` do Python e então é possível percorrer seus elementos utilizado `next()`:

In [95]:
lista = ['a', 'b', 'c']
iterador = iter(lista)
print('tipo de iterador:', type(lista))
print('tipo de iterador:', type(iterador))
print(next(iterador))

tipo de iterador: <class 'list'>
tipo de iterador: <class 'list_iterator'>
a


O acesso de iteradores é sequencial e após o ultimo elemento uma exceção é levantada indicando o fim do iterador.
Descomente o último `next` e veja o tipo da exceção que acontece.

In [96]:
print(next(iterador))
print(next(iterador))
print(next(iterador))

b
c


StopIteration: 

## Criando objetos iteráveis

Para implementar um objeto iterador é preciso escrever um método `__next__()` para a classe e para que ele seja acessível como iterável também é necessário escrever um método `__iter__()`: 

In [97]:
class WordIterator():
    def __init__(self, phrase):
        self.words = phrase.split()
        
    def __iter__(self):
        self.iter_index = 0
        return self
    
    def __next__(self):
        if self.iter_index < len(self.words):
            i = self.iter_index
            self.iter_index += 1
            return self.words[i]
        else:
            raise StopIteration()

A classe acima é um iterador e é iterável. 

No método `__iter__()` reiniciamos o índice inicial para o iterador e retornamos o próprio objeto (um iterador).

No método `__next__()` retornamos a palavra do índice atual ou a exceção de parada, caso seja o fim.

In [98]:
frase = 'Esta frase é formada por 7 palavras'
iterador_de_palavras = WordIterator(frase)

In [99]:
for palavra in iterador_de_palavras:
    print(palavra)

Esta
frase
é
formada
por
7
palavras


### Exercício com iterador

Crie uma classe `DictIterator` que permita varrer os itens de um dicionário utilizando o `for`

In [106]:
class DictIterator():
    def __init__(self, dict):
        self._dict = list(dict.items())
        
    def __iter__(self):
        self.iter_index = 0
        return self
    
    def __next__(self):
        if self.iter_index < len(self._dict):
            i = self.iter_index
            self.iter_index += 1
            return self._dict[i]
        else:
            raise StopIteration()

In [107]:
d = {'a':1,'b': 2, 'c': 3}
d_iter = DictIterator(d)
for i in d_iter:
    print(i)

('a', 1)
('b', 2)
('c', 3)


## Objeto como função

É possível declarar uma classe contendo um objeto possa ser chamado (*callable object*).
Para isso, a classe deve conter o método `__call__`. Veja o exemplo a seguir:

In [108]:
class Scale():
    def __init__(self, w):
        self._w = w
    def __call__(self, x):
        return x * self._w

In [109]:
s = Scale(100.)
print(s(5))


500.0


### Exercício de classe contendo objeto chamável

Defina uma classe herdada da classe `Scale` que permita modificar a variável `self._w`.

In [110]:
class AjustaPeso(Scale):
    def wset(self, value):
        self._w = value

In [111]:
ap = AjustaPeso(100.)
print(ap(5))

500.0


In [112]:
ap.wset(10)
print(ap(5))

50


# Fim do notebook