# Data University - Python

# PYTH-101


# 1 Tipos de dados
Python possui diversos tipos de dados nativos, sendo eles:
- Tipos Númericos: **int**, **float**, **complex**
- Tipos Iteradores: **\__iter__()**, **\__next__()**, **yield**
- Tipos de Sequência: **list, tuple, range**
- Tipo de Sequência Textual: **str**
- Tipos de Sequêcias Binários (Maninpulação de Memória): **bytes, bytearray, memoryview**
- Tipos de Conjuntos: **set, fronzeset**
- Tipos Mapeadores: **dict**
- Tipos Gerenciadores de Contexto: **with**
- Outros Tipos: **Modulos, Classes e Instâncias de Classes, Funções, Métodos, Valores Booleanos, etc..**

Não iremos abordar todos os tipos da linguagem, nos atendo aos mais importantes e/ou usados no dia-a-dia. No entanto caso queira inspecionar um a um e aprender mais sobre os tipos existentes no Python, basta checar a documentação: https://docs.python.org/3.7/library/stdtypes.html 

## 1.1 Tipos Númericos

### Tipo Inteiro

In [1]:
num_int = 1
num_int

1

In [2]:
type(num_int)

int

### Tipo Real

In [3]:
num_real = 1.0
num_real

1.0

In [4]:
type(num_real)

float

### Tipo Complexo
No que se refere aos tipos númericos, o que diferencia Python de outras linguagens é o seu suporte nativo aos números complexos.


In [5]:
# z = (Re, Img)
z = complex(3,2)

In [6]:
z

(3+2j)

In [7]:
z_ = complex(3,-2)

In [8]:
z*z_

(13+0j)

### Coerção e Conversão de Tipos
Coerção de tipos em linguagem de programação se refere à inferência do tipo de uma variável que é resultado de uma operação de variáveis.

In [9]:
type(1)

int

In [10]:
type(1+1)

int

Como é intuitivo, a operação entre dois números inteiros é inteiro. Assim como a operação entre um número inteiro e um número real, será real. E, por fim, uma operação entre números inteiros, reais e complexos será complexo.

In [11]:
type(1 + 1.0)

float

In [12]:
type(1 + 1.0 + z)

complex

Nos casos acima as variáveis, foram gradativamente sendo promovidas para um tipo mais abrangente. Mas e o contrario? Podemos converter um número real para inteiro sem maiores problemas? E um complexo para inteiro?

In [13]:
int(1 + 1.0)

2

In [14]:
int(1 + 1.0 + z)

TypeError: can't convert complex to int

Num primeiro contanto esse conceitos de coerção e conversão parecem não ter muita significância. No entanto, no curso `PYTH-201` voltaremos a este tópico com exemplos práticos de como um não entendimento destes conceitos podem impactar negativamente na limpeza dos dados. 

### Operadores aritmétiecos
####   +  :  soma
####   -   :  subtração
####   /   :  divisão
####   //  :  divisão inteira
####   % : resto da divisão
####   *   : multiplicação
####   **  : exponenciação

## 1.2 Tipos de Sequência

### Listas
Talvez seja a estrutura de dados mais importante da linguagem, que é simplesmente uma coleção homogênea ou heterogênea.

#### Definições

In [15]:
# Definição de uma lista vazia
l = [] # pythonic way
l_2 = list() # non pythonic way
l, l_2

([], [])

In [16]:
type(l), type(l_2)

(list, list)

In [17]:
# Definição de uma lista homogênea
l = [1, 2, 3]
l_2 = ['joao', 'da', 'silva']
l, l_2

([1, 2, 3], ['joao', 'da', 'silva'])

In [18]:
# Definição de uma lista heterogênea
l = [1, None, 'silva']
l_2 = [[], 'toddynho', type(l)]
l, l_2

([1, None, 'silva'], [[], 'toddynho', list])

No python não há restrição quanto aos tipos dos elementos dentro de uma lista, podendo esses ser ter tipos diferentes entre si.

#### Adicionando e removendo elementos de uma lista

In [8]:
# Definindo a lista
l = [1,2,3,4]
l

[1, 2, 3, 4]

In [9]:
# Adicionando o elemento a lista
l.append(5)
l

[1, 2, 3, 4, 5]

In [10]:
# Novamente ..
l.append(5)
l

[1, 2, 3, 4, 5, 5]

In [11]:
# Agora removendo o elemento 4
l.remove(5)
l

[1, 2, 3, 4, 5]

#### Indexação

In [12]:
l

[1, 2, 3, 4, 5]

In [13]:
# Acessando o primeiro elemento
# Acessando os três priemiros elementos
# Acessando os quatro primeiros elementos, e selecionando com step de 2
l[0], l[0:3], l[0:4:2]

(1, [1, 2, 3], [1, 3])

In [14]:
# tentando acessar um indice não existente
l[5]

IndexError: list index out of range

In [15]:
# A função len retorna o tamanho da lista, e dela subtraímos um por que a indexação começa do 0 
# para acessar o último elemento
max_idx = len(l)-1
max_idx, l[max_idx]

(4, 5)

In [16]:
# ou simplesmente
l[-1]

5

In [17]:
# Acessando o primeiro elemento com indexação reversa
# Acessand os três primeiros elementos com indexação reversa
# Acessando os quatro primeiros elementos com indexação reversa, e selecionando com step de 2
l[-5], l[-5:-2], l[-5:-1:2]

(1, [1, 2, 3], [1, 3])

#### Alterando o valor de um elemento na lista

In [18]:
l

[1, 2, 3, 4, 5]

In [19]:
# Alterando o valor do 3º elemento da lista
l[2] = -3
l

[1, 2, -3, 4, 5]

In [20]:
# Equivalente de maneira reversa
l[-3] = 3
l

[1, 2, 3, 4, 5]

#### Checando a existência de um elemento na lista

In [21]:
l

[1, 2, 3, 4, 5]

In [22]:
1 in l

True

In [23]:
-1 in l

False

#### Copiando listas

In [24]:
l

[1, 2, 3, 4, 5]

In [25]:
l2 = l.copy() # Deep copy
l2

[1, 2, 3, 4, 5]

In [26]:
l2[1]=-1

In [27]:
l

[1, 2, 3, 4, 5]

Quando utilizamos o método copy, estamos efetivamente copiando os elementos da lista `l` para a lista `l2` e ambas são independetes. Diferente de quando fazemos:

In [28]:
l3 = l

In [29]:
l3[1]=-1

In [30]:
l

[1, -1, 3, 4, 5]

Nessa situação não fizemos uma cópia, simplesmente fizemos `l3` referenciar os elementos de `l`, assim a alteração de elementos via `l3` ou `l` implica na alteração de um elementos comum à ambas listas.

#### Concatenando listas

In [31]:
l

[1, -1, 3, 4, 5]

In [32]:
l2

[1, -1, 3, 4, 5]

In [33]:
l + l2

[1, -1, 3, 4, 5, 1, -1, 3, 4, 5]

### Tuplas
São estruturas de dados semelhantes as listas, com uma diferença substancial, elas são imutáveis. Uma vez definidas, não conseguimos alterá-las

#### Definições

In [34]:
t = (1,2)
t2 = ((1,2), None, ('Joao', 'Maria'), [1,2,3])
t3 = 1,2
t4 = tuple(l)

In [35]:
t

(1, 2)

In [36]:
t2

((1, 2), None, ('Joao', 'Maria'), [1, 2, 3])

In [37]:
t3

(1, 2)

In [38]:
t4

(1, -1, 3, 4, 5)

#### Tentando adicionar ou remover elementos de uma tupla

In [39]:
help(tuple)

Help on class tuple in module builtins:

class tuple(object)
 |  tuple(iterable=(), /)
 |  
 |  Built-in immutable sequence.
 |  
 |  If no argument is given, the constructor returns an empty tuple.
 |  If iterable is specified the tuple is initialized from iterable's items.
 |  
 |  If the argument is a tuple, the return value is the same object.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __getnewargs__(self, /)
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash__(self, /)
 |      Return hash(self).
 |  
 |  __iter__(self, /)
 |      Implement iter(self).
 |  
 |  __le__(self, value, /)
 |

Não há métodos para adicinar ou remover elementos numa tupla.

#### Indexação

In [51]:
t2

((1, 2), None, ('Joao', 'Maria'), [1, 2, 3])

In [52]:
# Acessando o primeiro elemento da tupla t2, que é a tupla (1,2)
t2[0]

(1, 2)

In [53]:
# Acessando o último elemento da tupla (1,2)
t2[0][-1]

2

In [54]:
# Acessando os quatro primeiros elementos da tupla t2, e selecionando com step de 2
t2[0:4:2]

((1, 2), ('Joao', 'Maria'))

In [55]:
# Acessando o último elemento da tupla t2
t2[-1] 

[1, 2, 3]

#### Tentando alterar o valor de um elemento da tupla

In [56]:
t2

((1, 2), None, ('Joao', 'Maria'), [1, 2, 3])

In [57]:
t2[1] = 1

TypeError: 'tuple' object does not support item assignment

Como era de se esperar não conseguimos alterar o valor do segundo elemtno da tupla `t2`. No entanto...

In [58]:
t2[-1].append(4)

In [59]:
t2

((1, 2), None, ('Joao', 'Maria'), [1, 2, 3, 4])

Pode paracer um comportamento estranho já que o conteúdo do último elemento da tupla `t2`, que era a lista `[1, 2, 3]` foi alterado, sendo adicionado o elemento `4` ao final da mesma. Como em Python toda variável é um objeto, na tupla `t2` tem-se a referência para a lista `[1, 2, 3]` que permace inalterada após a adicionarmos a lista o elemento `4`. Já se tentarmos atribuir a `t2[-1]` qualquer valor, encontraremos a mesnagem de `TypeError` que encontramos anteriormente.

In [40]:
t2[-1] = 'vai dar ruim!'

TypeError: 'tuple' object does not support item assignment

#### Tuplas em retorno de funções ou métodos

As tuplas tem um uso interessante no retorno de funções ou métodos (que seram tratados mais adiante). Com as tuplas é possível que as funções retornem mais de um valor, como no exemplo abaixo:

In [61]:
# definindo a função
def sqrt_square_and_cube(a):
    return a**(1/2), a**2, a**3

In [62]:
sqrt_square_and_cube(3)

(1.7320508075688772, 9, 27)

In [63]:
# Também podemos atribuir os valores retornados pela tupla individualmente à variaveis
sqrt, square, cube = sqrt_square_and_cube(3)

In [64]:
sqrt, square, cube

(1.7320508075688772, 9, 27)

### Range
O tipo Range está muito ligado ao fluxo de programação `for` e, por isso, será abordado posteriormente. Mas essecialmente, um range nada mais é que uma coleção de valores a serem consumidos incrementalmente.

## 1.3 Tipo de Sequência Textual

### str
Strings no Python, assim como as tuplas são objetos imutáveis. Uma vez definidos não podem ser alterados.
As strings são atribuídas via qualquer texto entre aspas simples ou duplas, indiferentemente.

In [41]:
str_a = 'Data'
str_b = "Data"

In [42]:
str_a == str_b

True

Para adicionar caracteres espciais a uma string (tab, nova linha..) usa-se uma contrabarra antes do caracter:

In [57]:
str_class = 'Data University\tPYTH-201\nPag-2020'

In [58]:
print(str_class)

Data University	PYTH-201
Pag-2020


Tentando alterar o conteúdo da string:

In [59]:
str_class[0:5] = 'Universidade Dados'

TypeError: 'str' object does not support item assignment

No entanto, nós podemos indexar os elementos de uma string tal qual uma lista e criar novas strings, da maneira que nos for conveniente

In [60]:
str_class2 = 'Universidade Dados' + str_class[15:]

In [61]:
print(str_class2)

Universidade Dados	PYTH-201
Pag-2020


Concatenando...

In [62]:
str_class3 = str_class + '\n' + str_class2
print(str_class3)

Data University	PYTH-201
Pag-2020
Universidade Dados	PYTH-201
Pag-2020


#### split

O método `.split()` quebra a string em `n` substrings de acordo com o demarcador selecionado

In [63]:
str_class3.split('\n')

['Data University\tPYTH-201',
 'Pag-2020',
 'Universidade Dados\tPYTH-201',
 'Pag-2020']

#### format

''.format() é um comando muito útil quando vamos construir strings. Por exemplo, ao criar nomes de arquivos podemos parametrizar o diretório, o nome do arquivo e sua extensão: 

In [64]:
fake_dir = 'diretorio/zoeiro/'
fake_file = 'quero'
fake_ext = 'todd'

In [65]:
file = '{}{}.{}'.format(fake_dir, fake_file, fake_ext)

In [66]:
print(file)

diretorio/zoeiro/quero.todd


A classe `str` possuí muitos métodos já prontos para realizarmos tratamento de texto, conversão para lower/upper case, chegagem númerica e alfanúmerica, remoção de espaços.. Basta utilizar o comando, `help(str)` para ter a descrição dos mesmos

In [77]:
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

## 1.4 Tipos de Conjuntos

### set
O tipo set, é equivalente ao `distinct` de sql, retorna os elementos distintos de uma sequência, seja numérica ou não

In [78]:
pares_repetidos = [0, 0, 2, 2, 2, 4, 4, 4, 4, 6, 6, 8]
pares_repetidos

[0, 0, 2, 2, 2, 4, 4, 4, 4, 6, 6, 8]

In [67]:
set(pares_repetidos)

NameError: name 'pares_repetidos' is not defined

In [68]:
pares_vogais_repetidos = [0, 0, 2, 2, 2, 4, 4, 4, 4, 6, 6, 8, 'a', 'a', 'a', 'e', 'e', 'u', 'u', 'u', 'u']
pares_vogais_repetidos

[0,
 0,
 2,
 2,
 2,
 4,
 4,
 4,
 4,
 6,
 6,
 8,
 'a',
 'a',
 'a',
 'e',
 'e',
 'u',
 'u',
 'u',
 'u']

In [69]:
set(pares_vogais_repetidos)

{0, 2, 4, 6, 8, 'a', 'e', 'u'}

## 1.5 Tipos Mapeadores

### Dicionários - dict
Dicionários é uma estrutura de dados que associa um valor a uma chave. E, dado, que você tenha a chave o valor correspondente associado a ela é recuperado de forma efeciente.
Para os nerds de plantão: https://spectrum.ieee.org/tech-history/silicon-revolution/hans-peter-luhn-and-the-birth-of-the-hashing-algorithm, breve histórico do nascimento das funções hash nos primórdios da computação e que são hoje usados nos dicionários.

#### Definições

In [82]:
# Definição de dicionários vazios
dic = {} # pythonic way
dic_2 = dict() # non pythonic way
dic, dic_2

({}, {})

In [73]:
# Definição de dicionários com chaves e valores
dic_data = {
    'STAT-101':'Caerê/Eliza',
    'STAT-301':'Caerê/Eliza',
    'PAG-101':'Ramon',
    'PAG-201':'Rodrigo'
}
dic_aleatorio = {0:'José', 'Maria':1, 2: [1, 2, 3]}

In [74]:
dic_data

{'STAT-101': 'Caerê/Eliza',
 'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo'}

In [75]:
dic_aleatorio

{0: 'José', 'Maria': 1, 2: [1, 2, 3]}

#### Indexação
A indexação nos dicionários são feitas a partir da chave, que retorna o valor associado

In [76]:
dic_data

{'STAT-101': 'Caerê/Eliza',
 'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo'}

In [77]:
dic_data['STAT-101']

'Caerê/Eliza'

In [78]:
dic_data.keys()

dict_keys(['STAT-101', 'STAT-301', 'PAG-101', 'PAG-201'])

In [79]:
dic_data.values()

dict_values(['Caerê/Eliza', 'Caerê/Eliza', 'Ramon', 'Rodrigo'])

Embora ainda não tenhamos abordados o fluxo de controle `for`, os trechos de código abaixo são muito comuns quando utilizamos dicionários.

In [80]:
for chave in dic_data.keys():
    print('dic_data[{}] = {}'.format(chave, dic_data[chave]))

dic_data[STAT-101] = Caerê/Eliza
dic_data[STAT-301] = Caerê/Eliza
dic_data[PAG-101] = Ramon
dic_data[PAG-201] = Rodrigo


Que é equivalente a:

In [91]:
for chave in dic_data:
    print('dic_data[{}] = {}'.format(chave, dic_data[chave]))

dic_data[STAT-101] = Caerê/Eliza
dic_data[STAT-301] = Caerê/Eliza
dic_data[PAG-101] = Ramon
dic_data[PAG-201] = Rodrigo


Que é equivalente a:

In [92]:
for chave, valor in dic_data.items():
    print('dic_data[{}] = {}'.format(chave, valor))

dic_data[STAT-101] = Caerê/Eliza
dic_data[STAT-301] = Caerê/Eliza
dic_data[PAG-101] = Ramon
dic_data[PAG-201] = Rodrigo


Quando tentamos acessar uma chave inexistente, naturalmente temos o seguinte erro:

In [93]:
dic_data['TODD']

KeyError: 'TODD'

#### Adicionando e removendo elementos de um dicionário
Para adicionar um novo par chave:valor a um dicionário é muito simples, basta realizar a atribuição:

In [94]:
dic_data

{'STAT-101': 'Caerê/Eliza',
 'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo'}

In [81]:
dic_data['BUS-102'] = 'Vini Ota'

In [82]:
dic_data

{'STAT-101': 'Caerê/Eliza',
 'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo',
 'BUS-102': 'Vini Ota'}

No entanto, devemos ter cuidado para não sobrescrever dados acidentalmente

In [97]:
dic_data['STAT-101'] = 1

In [98]:
dic_data

{'STAT-101': 1,
 'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo',
 'BUS-102': 'Vini Ota'}

Para remoção de um item do dicionário utilizamos o método `pop(chave)`

In [83]:
_ = dic_data.pop('STAT-101')

In [84]:
dic_data

{'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo',
 'BUS-102': 'Vini Ota'}

O `_` no retorno do `pop`, indica que embora esteja atribuindo um valor a uma variável, nós enquanto programadores não estamos interessados no seu valor, que no caso é 1 ( valor correspondente a chave removida). Em fóruns como `stackoverflow` vocês podem encontrar esse tipo de notação.

In [101]:
_

1

#### Checando a existência de uma chave, ou um valor no dicionário

In [102]:
dic_data

{'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo',
 'BUS-102': 'Vini Ota'}

In [103]:
'STAT-301' in dic_data # ou dic_data.keys()

True

In [104]:
'Vini Ota' in dic_data.values()

True

## 1.6 Tipos Gerenciadores de Contexto

Os tipos gerenciadores de contexto dizem respeito a determinação de um contexto durante a execução do programa, exemplo disse é a visibilidade de streams para leitura ou escrita de dados em arquivos. Diretiva associada `with`.

## 1.7 Outros Tipos

Os outros tipos de dados serão apresentados, quando oportunos, na sequência deste notebook.

# 2 Comparações, Operações Bitwise, Operadores Booleanos e Valores Verdade

## 2.1 Comparações

####  == : igual
####  !=  : diferente
####  <   : menor
####  <= : menor ou igual
####  >   : maior
####  >= : maior ou igual
#### is   : identidade de objetos
#### is not : negação de identidade de objetos

## 2.2 Operações Bitwise

Operações bitwise, são comparações feitas bit a bit, que só fazem sentido no contexto em que estamos lidando com números inteiros. Pode parecer um pouco abstrato no momento, mas são operações muito eficientes e recorrentes quando utilizamos a biblioteca `pandas` e queremos fazer segmentações em um `dataframe`.

#### x | y  - Ou (lógico) bit a bit de x e y
#### x ^ y - Ou exclusivo (lógico) bit a bit de x e y
#### x & y - E (lógico) bit a bit de x e y
#### ~x     - Inversão dos bits de x (negação)

# 2.3 Operadores Booleanos

#### x or y: disjunção (ou inclusivo)
#### x and y: conjução (e)
#### not x : negação (não)

Tanto a conjunção quanto a disjunção são curto-cirtcuitadas. Ou seja, o `y`só é avaliado caso não seja possível ter a resposta lógica avaliando apenas o `x`.

## 2.4 Valores Verdade

Os valores booleanos de Python são `True` e `False`. Sendo que os seguintes são sempre interpretados como `False`:

In [85]:
False
None # Objeto nulo
[] # Lista vazia
{} # Dionário vazio
() # Tupla vazia
'' # String vazia
set() # Conjunto vazio
0  # Zero inteiro
0.0 # Zero real

0.0

In [106]:
a = []
if not a:
    print('Lista vazia interpretada como False')

Lista vazia interpretada como False


Aa demais variações não nulas das formas acima são interpretadas como `True`. Por exemplo, `True`, `[1]`, `{'Joao':'Silva'}`

In [107]:
a = [1]
if a:
    print('Lista não vazia interpretada com True')

Lista não vazia interpretada com True


### Funções all e any
As funções all e any, retornam respectivamente, `True` se todos os elementos de uma lista são interpretados como tal e se pelo menos um deles são `truthy`

In [86]:
all([False, None, [], {}, (), '', set(), 0, 0.0])

False

In [87]:
any([False, None, [], {}, (), '', set(), 0, 0.0])

False

In [88]:
all([True, type(str), ['a'], {0:1}, (1), 'a', set([1]), 1, 1.0])

True

In [89]:
any([False, None, [], {}, (), '', set(), 0, 1.0])

True

# 3 Fluxos de Controle

O contexto seja do fluxo de controle, definição de funções, atribuição de variáveis em Python é delimitado pela identação. Seja a identação feita com `espaços` ou `tabs`. No entanto, de acordo com o `PEP8` https://www.python.org/dev/peps/pep-0008/#tabs-or-spaces, o uso de espaços é recomendado em relação ao `tab`. Mas se eu uso `tab` estou fora do padrão? Provavelmente não se você usa um editor de texto descente, ele já faz a substiuição automática do `tab` por 4 `espaços` ou a quantidade que você definiu.

`Spaces over Tabs - Sillicon Valley`: https://www.youtube.com/watch?v=SsoOG6ZeyUI

## 3.1 If, elif, else

In [112]:
if 10 > 100:
    mensagem = 'Algo de muito errado está acontencendo.'
elif 10 > 1000:
    mensagem = 'Piorou, deu ruim de vez!'
else:
    mensagem = 'Se chegou aqui, é porque a lógica ainda está do nosso lado!'

mensagem

'Se chegou aqui, é porque a lógica ainda está do nosso lado!'

## 3.2 Operador ternário

In [113]:
x = 100
multiplo_dez = '{} é multiplo de 10'.format(x) if x % 10 == 0 else '{} Não é multiplo de 10'.format(x)
multiplo_dez

'100 é multiplo de 10'

## 3.3 Loops - While e For

In [114]:
contador = 0
while contador < 5:
    print(contador)
    contador += 1

0
1
2
3
4


Que é equivalente a:

In [91]:
for i in range(5):
    print(i)

0
1
2
3
4


In [92]:
for i in range(5):
    if i == 0:
        continue # pula para o próximo iterator de range, no caso 1.
    if i == 3:
        break # sai do loop
    print(i)

1
2


# 4 Exceções

Quando acontece de errado do ponto de vista da linguagem, o Python dispara algum tipo de exceção. Já tivemos os seguintes exemplos de exeções neste notebook: Tentativa de converter um número complexo para inteiro (`TypeError`), acessar uma posição não existente na lista (`IndexError`), alterar uma string (`TypeError`). Estas situções podem ser tratados utilizando o `try`e `catch`.

In [93]:
try:
    print(2/0)
except ZeroDivisionError:
    print('Tentando dividir por zero gênio!')

Tentando dividir por zero gênio!


Python tem um filosofia, de `easier to ask for forgiveness than permission`, ou simplesmente, `EAFP` (https://docs.python.org/3.7/glossary.html). Por conta disso no Python, diferentemente de outras linguagens o uso de exceções e blocos de try-catch não se restrigem ao tratamento de situações erro, mas são encorajdos a serem utilizados dentro da lógica de programação. Veja o exemplo abaixo:

In [95]:
dic_data

{'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo',
 'BUS-102': 'Vini Ota'}

In [96]:
if 'PYTH-101' in dic_data:
    print('dic_data[{}] = {}'.format('PYTH-101',dic_data['PYTH-101']))
else:
    dic_data['PYTH-101'] = 'JP'
    print('PYTH-101:JP adicionado ao dicionário')    

PYTH-101:JP adicionado ao dicionário


In [97]:
try:
    print('dic_data[{}] = {}'.format('PYTH-101',dic_data['PYTH-101']))
except KeyError:
    dic_data['PYTH-101'] = 'JP'
    print('PYTH-101:JP adicionado ao dicionário')

dic_data[PYTH-101] = JP


In [121]:
dic_data

{'STAT-301': 'Caerê/Eliza',
 'PAG-101': 'Ramon',
 'PAG-201': 'Rodrigo',
 'BUS-102': 'Vini Ota',
 'PYTH-101': 'JP'}

Ambos trechos de código acima são equivalentes, tentam acessar o valor `JP` dada a chave `PYTH-101` dentro dicionário `dic_data`. Se a chave existir, eximbimos o `item` `PYTH-101:JP`, caso contrário adicinamos no `item` `PYTH-101:JP` no dicionário `dic_data`. Qual está em mais confirmadade com o `EAFP`?

In [122]:
# _ = dic_data.pop('PYTH-101')

# 5 Funções

Funções são blocos de códigos feitos para realizar uma tarefa em específica, visando a automatização do código como um todo ao mesmo tempo que contribui para o aumento da legibilidade do script em questão. As funções em Python são definidas pela primitiva `def`.

In [98]:
def soma_dois_numeros(a, b):
    return a + b

As funções podem possuir parâmetros ou não. Parâmetros são variáveis as necessárias para que a função execute sua tarefa. No caso acima, a função `soma_dois_numeros` possui dois paramêtros `a` e `b`, sobre eles é feita a soma e com primitiva `return` retornamos o valor computado ao trecho de código responsável pela chamada desta função.

In [99]:
soma = soma_dois_numeros(10, 20)
soma

30

As funções podem ter também parâmetros opcionais, para fazermos isso temos que atribuir um valor `default` a esse parâmetro.

In [100]:
def soma_dois_numeros_v2(a, b=1):
    return a + b

In [101]:
soma_dois_numeros_v2(20)

21

A função `soma_dois_numeros_v2`, o segundo parâmetro é sempre 1, caso não seja explicitado seu valor ao realizar a chamada da função. Uma observação importante, os parâmetros opcionais devem ser definidos após a definição de todos parâmetros obrigatórios, caso contrário o interpretador do Python não consegueria interpretar qual parâmetro é obrigatório e qual seria opcional.

In [102]:
def soma_dois_numeros_v2(a=1, b):
    return a + b

SyntaxError: non-default argument follows default argument (<ipython-input-102-413fe8bee94f>, line 1)

Naturalmente, podemos criar diferentes funções e estas funções podem ser utilizadas para construção de outras funções.

In [104]:
def soma_tres_numeros(a, b, c):
    soma_parcial = soma_dois_numeros(a,b)
    return soma_parcial + c

In [105]:
soma_tres_numeros(10, 20, 30)

60

# 6 Orientação a Objetos e Classes

Python é uma linguagem que embora permita nós não utilizarmos o paradiguima de programação orientado a objetos, ela é uma linguagem inerentemente orientada objetos. Todos os tipos de dados apresentados na seção 1, são dentro da linguagem `Classes`. 

Da mesma forma que as funções são usadas para automatizar tarefas específicas, podemos enxergar as `Classes` como um conjunto de funções (denominadas métodos) e variáveis (denominadas atributos) que juntas fornecem ao programador as funcionalidades essenciais manipulação de determinado dado dentro do programa principal.

Com a utilização de `Classes` o código escrito ganha uma maior legibilidade e modularidade, permitindo que possamos realizar automações mais complexas e de forma mais confiável.

Abaixo exemplificamos essa teoria, como a construção da classe `CustomSet`, da qual se espera um  comportamento similar ao tipo de dados (que também é uma classe) `set` já apresentado anteriormente. 

In [106]:
# Exemplo tirado e melhorado de: Chapter 2. A Crash Course in Python da DataSciencester

# Por convenção os nomes de classes devem ser iniciados por
# letras maiusculas e as demais palavras que venham a compor
# o nome da classe também. Qualquer outro forma fora desse padrão não
# é uma boa prática.
# Ex: custom_set, Custom_Set, customSet
class CustomSet:
    
    # Aqui definimos os métodos da classe
    # Todos os métodos recebem, por convenção, o atributo self que referencia o próprio objeto
      
    def __init__(self, values=None):
        """
            Este é o construtor da classe
            Este método é chamado toda vez que instanciamos um novo objeto CustomSet
            cs1 = CustomSet() -> Cria um CustomSet vazio
            cs2 = CustomSet([1,2,3,4,4,5,6,7]) -> Cria um CustomSet com os valores [1,2,3,4,5,6,7]
        """
        # Criação de um atributo do tipo dicionário
        # O '_' indica, por convenção, que este atributo não deve ser acessado fora da própria classe.
        
        # Teoricamente um atributo ou metódo iniciado com '__' seria privado e inacessível fora do
        # contexto interno da própria classe, mas como Python usa o 'name mangling' ainda sim é possível
        # acessar os atributos/métodos privados.
        self._dict = {}
    
        if values is not None:
            for value in values:
                # Populando o self._dict a partir do método self.add
                self.add(value)
    
    
    def __repr__(self):
        """
            Sobrescrevendo o método __repr__ que está presente em todas as classes
            Este método é a representação em forma de string do objeto.
            Quando damos print(cs1) este é o método que é chamado.
        """
        return 'CustomSet:' + str(list(self._dict.keys()))
    
    def get_set_values(self):
        """
            Método que retorna os valores presentes no CustomSet.
            É necessário para ser consistente com a nomenclatura utilizada em self._dict
            Se tivessemos optados por self.dict, este método não seria necessário
        """
        return list(self._dict.keys())
    
    def add(self, value):
        """
            Implentamos o pertencimento de set a partir de um dicionário simples
            Em que a chave é o valor inserido no CustomSet
        """
        self._dict[value] = True
    
    def contains(self, value):
        """
            Verificação de existência de um valor no CustomSet
        """
        return value in self._dict
    
    def remove(self, value):
        """
            Removendo caso exista, o elemento do CustomSet
        """
        if self.contains(value):
            _ = self._dict.pop(value)

#### Instanciando um objeto CustomSet

In [107]:
custom_set = CustomSet([1, 2, 3, 4, 4, 4, 5, 5, 1])

In [108]:
custom_set

CustomSet:[1, 2, 3, 4, 5]

#### Checando pertinência

In [109]:
custom_set.contains(1)

True

In [110]:
custom_set.contains('Toddynho')

False

#### Acessando os valores

In [111]:
custom_set.get_set_values()

[1, 2, 3, 4, 5]

In [112]:
custom_set.get_set_values()[3]

4

#### Adicionando um elemento

In [113]:
custom_set.add(5)

In [114]:
custom_set

CustomSet:[1, 2, 3, 4, 5]

#### Removendo um elemento

In [139]:
custom_set.remove(1)

In [140]:
custom_set

CustomSet:[2, 3, 4, 5]

Como podemos ver todos os métodos necessários foram implementados para a manipulação de um conjunto com comportamento similar ao tipo `set` padrão do Python. Criação, acesso, checagem de pertinência, adição e remoção de elementos foram feitos de maneira semalhante ao apresentado nos Tipos de Dados Sequências.

De posse dessa classe nós podemos simplesmente utilizá-la dentro de um pograma, que ganhará muito em legibilidade, modularidade e confiabilidade em comparação com uma versão de um mesmo programa em que todas essas funções e atributos não fossem encapsualdos dentro de uma Classe.

# 7 Módulos e Pacotes

Até o momento neste notebook utilizamos recursos nativos no ambiente padrão do Python. No entanto, a medida que um projeto (bem projetado) for crescendo se faz necessário a criação de módulos e organizá-los em pacotes (pacotes são um conjunto de módulos organizados hierarquicamente). Por exemplo, ao invés de colocarmos o código da classe `CustomSet` aqui no corpo do notebook, poderíamos ter colocado sua definição em um arquivo `.py` a parte e utilizando as primitivas `from` e `import` teríamos acesso ao conteúdo do agora `módulo` `CustomSet`.

Mas esse tipo de organização não se restringe às classes definidas pelo programador. Existem módulos/bibliotecas padrão do próprio Python que devemos importá-las quando formos utilizá-las, exemplo disto são os módulos `os` (responsável pela interface com o sistema operacional) e `datetime` (manipulação de datas e timestamps)

### os

In [115]:
import os

O import quando é feito desta maneira é chamado de `forma absoluta`, porque conseguimos apartir do objeto `os` referenciar todos as classes, métodos e demais objetos contidos no módulo.

In [116]:
# Diretório absoluto
os.getcwd()

'/home/michellima/Documents/estudos_python/101_python_pag'

In [117]:
# Diretório até a pasta anterior à corrente 
os.path.dirname(os.getcwd())

'/home/michellima/Documents/estudos_python'

In [118]:
# Listando os arquivos/diretórios na pasta corrente
os.listdir()

['.ipynb_checkpoints', 'python-101.ipynb']

Essas funções acima são bem simples e tornam possível automatizar o código utilizando diretórios relativos quando precisamos persistir ou ler dados do disco.

### datetime, timedelta, date, time

In [119]:
from datetime import datetime, timedelta, date, time

O import quando é feito desta maneira é chamado de `forma relativa`, porque conseguimos referenciar apenas acessar aquele método ou classe que explicitamente importamos. Abaixo segue alguns exemplos de uso do módulo, exemplos retirados de: https://www.programiz.com/python-programming/datetime

#### Acessando a Data e Horário correntes

In [120]:
datetime.now()

datetime.datetime(2020, 1, 21, 11, 42, 10, 104999)

In [121]:
print(datetime.now())

2020-01-21 11:44:05.284051


In [122]:
dt = datetime.now()
print(dt)

2020-01-21 11:44:06.142753


In [123]:
dt.year, dt.hour, dt.minute, dt.hour, dt.minute, dt.second, dt.microsecond

(2020, 11, 44, 11, 44, 6, 142753)

#### Acessando a Data corrente

In [150]:
date.today()

datetime.date(2020, 1, 21)

In [151]:
print(date.today())

2020-01-21


#### Criando uma data a partir de um timestamp

In [152]:
date.fromtimestamp(1326244364)

datetime.date(2012, 1, 10)

In [153]:
print(date.fromtimestamp(1326244364))

2012-01-10


Um timestamp no sistema UNIX é a quantidade de segundos contados a partir de 1º de Janeiro de 1970, UTC.

#### Acessando o timestamp do horário corrente

In [154]:
datetime.now().timestamp()

1579579770.519864

#### Criando um horario qualquer

In [124]:
print(time(hour=11, minute=50, second=56))

11:50:56


#### Diferença entre dates

In [125]:
t1 = date(year = 2018, month = 7, day = 12)
t2 = date(year = 2017, month = 12, day = 23)
t3 = t1 - t2
print("t3 =", t3)

t3 = 201 days, 0:00:00


In [157]:
t3.total_seconds()

17366400.0

# 8 Leitura e Escrita em Arquivos

Nessa seção abordaremos a leitura e escrita de arquivos `txt` com Python, no curso de `PYTH-201` iremos tratar da leitura e escrita de arquivos `csv` e `json`. Mas caso queira por conta própria explorar os demais tipos de arquivo, segue a referência: https://docs.python.org/3.7/tutorial/inputoutput.html (Dê uma olhada no formato `pickle`).

### Leitura de um arquivo txt

A leitura de um arquivo, nesse caso txt, em Python pode ser como mostrado no trecho de código. Com o uso do `with` nos delimitamos o contexto no qual o `handler` do arquivo `zen_of_python.txt`, `f`, é utilizado. Para efetivamente sermos capazes de referenciar o arquivo `zen_of_python.txt` precisamos apenas da primitiva `open` como mostrado abaixo. Feito isto simplesmente iteramos em `f` linha a linha.

In [127]:
file_lines = []
with open(os.getcwd() + '/zen_of_python.txt') as f:
    for line in f:
        file_lines.append(line)
        print(line.rstrip())

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Escrita de um arquivo txt

De maneira similar para escrevermos em um arquivo, utilizamos novamente `with`,`open` e atribuímos a um handler `f`. Mas desta vez, como estamos escrevendo, usamos `f.write(line)`

In [159]:
with open(os.getcwd() + '/zen_of_python_2.txt', 'w') as f:
    for line in file_lines:
        f.write(line)

Checando se o arquivo criado de fato tem o conteúdo esperado.

In [160]:
!cat zen_of_python_2.txt

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


# 9 List Comprehension, Map, Zip e Filter

`List comprehension`, `map`, `zip` e `filter`, são funções ou técnicas muito concisas que permite realizar operações interessantes em poucas linhas de código. Outra funcionalidade muito interessante é o `lambda`, no entato apresentaremos no próximo curso `PYTH-201` aplicando diretamente em dataframes.

Referências: 
https://realpython.com/list-comprehension-python/
https://www.learnpython.org/en/Map,_Filter,_Reduce
https://realpython.com/python-zip-function/

## 9.1 List Comprehension

Se queremos gerar uma lista somente com números pares, talvez o método mais intuitivo, seja este:

In [128]:
impares = []
for n in range(30):
    if n % 2 != 0:
        impares.append(n)

In [129]:
impares

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29]

Sendo um pouco mais esperto..

In [130]:
impares = []
for n in range(1,30,2):
    impares.append(n)

In [131]:
impares

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29]

As 2 formas acima geram uma lista de números ímpares como esperado. No entanto usando `list comprehension` conseguimos o mesmo, em apenas uma linha..

In [132]:
impares = [x for x in range(1,30,2)]

In [166]:
impares

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29]

E podemos adicionar restrições também, por exemplo, gerar os número impares mútliplos de 3:

In [167]:
impares_mult3 = [x for x in range(1,30,2) if x % 3 ==0]

In [168]:
impares_mult3

[3, 9, 15, 21, 27]

No entanto se quisermos adicionar uma condição de `if-else` dentro da `list comprehension`, a sintaxe muda um pouco:

In [133]:
[x if x % 3 ==0 else None for x in range(1,30,2)]

[None, 3, None, None, 9, None, None, 15, None, None, 21, None, None, 27, None]

## 9.2 Map

A função `map` tem o seguinte formato `map(function, iterable)`. Ou seja passamos para o `map` uma função que será aplicada sobre um iterable (listas, tuplas, dicionários..). Ao aplicarmos o mapeamento, este ocorre em parelelo. No entanto, temos que converter o `map`, que é resultado da operação para o tipo de `iterable` desejado.

In [134]:
nomes_com_espaco = ['Joao ', 'Jose ', 'George', 'Juliana ', 'Julieta ']

Para retirar estes espaços, poderíamos resolver este problema com `list comprehension` também..

In [135]:
nomes_sem_espaco = [x.rstrip() for x in nomes_com_espaco]

In [136]:
nomes_sem_espaco

['Joao', 'Jose', 'George', 'Juliana', 'Julieta']

Mas utilizando `maps` é ainda mais simples e eficiente, umas vez que ocorre em paralelo..

In [173]:
nomes_sem_espaco = map(str.rstrip, nomes_com_espaco)

In [174]:
type(nomes_sem_espaco)

map

In [175]:
list(nomes_sem_espaco)

['Joao', 'Jose', 'George', 'Juliana', 'Julieta']

Mas na realidade fazemos assim:

In [176]:
nomes_sem_espaco = list(map(str.rstrip, nomes_com_espaco))
nomes_sem_espaco

['Joao', 'Jose', 'George', 'Juliana', 'Julieta']

## 9.3 Zip

`zip` é uma outra função que permite ganhos de eficiência computacional, uma vez que suas operações são realizadas em paralelo. O `zip` permite agregar diferentes `iterables`, sendo indicado por exemplo para criação de dicionários e tuplas a partir de listas.

In [137]:
alunos = ['Zé', 'Joãozinho', 'Mônica']
notas = [5, -1, 8]

In [138]:
notas_5b = dict(zip(alunos, notas))

In [139]:
notas_5b

{'Zé': 5, 'Joãozinho': -1, 'Mônica': 8}

Desta forma criamos o dicionário `notas_5b`, em que as chaves vieram da lista `alunos` e os valores da lista `notas`

In [140]:
notas_5b = tuple(zip(alunos, notas))

In [141]:
notas_5b

(('Zé', 5), ('Joãozinho', -1), ('Mônica', 8))

De forma similar criamos a tupla `notas_5b` utilizando `zip`

# 9.4 Filter

Como o próprio nome sugere `filter`, faz um filtro em um `iterable`, tendo a assinatura `filter(function, iterable`. Para que a filtro ocorra, naturalmente o a `function` em questão deve retornar um `boolean`. E assim como o `map` temos que converter o `filter` no `iterable` desejado.

In [142]:
impares

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29]

Voltando a nossa lista de números ímpares, vamos utlizar o `filter` para gerar novamente a lista de números  ímpares múltiplos de 3.

In [143]:
def filtro_mult_3(n):
    return n%3 == 0

In [144]:
impares_mult3_filter = filter(filtro_mult_3, impares)

In [145]:
impares_mult3_filter

<filter at 0x7f4824654c50>

Definida a função de filtro, no nosso caso `filtro_mult_3` após aplicarmos o `filter` a lista `impares` basta converter o filter `impares_mult3_filter` para uma lista.

In [146]:
list(impares_mult3_filter)

[3, 9, 15, 21, 27]

In [147]:
impares_mult3

NameError: name 'impares_mult3' is not defined

Que felizmente temos o mesmo o resultado quando utilizamos `list comprehension`. Se você curtiu esse conteúdo já deixa seu like aí, se inscreve no canal e compartilha com seus amigos e até `PYTH-201` ;)

PS: Sem brincadeira agora, se tiver de fato interessado, pesquise sobre `lambda` no Python e veja suas combinações com essas quatro funções demonstradas. Você vai ver que algumas coisas ainda podem ser melhoradas.