# Python 101
Este é um notebook opcional para ajudá-lo a se familiarizar com Python caso você seja novo em Python ou precise de uma revisão. O material aqui é um curso intensivo de Python; recomendo fortemente o [tutorial oficial do Python](https://docs.python.org/3/tutorial/) para um mergulho mais profundo. Considere ler [esta página](https://docs.python.org/3/tutorial/appetite.html) na documentação do Python para obter informações sobre Python.


## Basic data types
### Números
Números em Python podem ser representados como inteiros (por exemplo, `5`) ou floats (por exemplo, `5.0`). Podemos realizar operações com eles:

In [1]:
5 + 6

11

In [2]:
2.5 / 3

0.8333333333333334

### Booleanos

Podemos verificar a igualdade, o que nos dá um valor Booleano:

In [3]:
5 == 6

False

In [4]:
5 < 6

True

Essas declarações podem ser combinadas com operadores lógicos: `not`, `and`, `or`.

In [5]:
(5 < 6) and not (5 == 6)

True

In [6]:
False or True

True

In [7]:
True or False

True

### Strings
Usando strings, podemos manipular texto em Python. Esses valores devem ser cercados por aspas - simples (`'...'`) é o padrão, mas as aspas duplas (`"..."`) também funcionam:

In [8]:
'Olá'

'Olá'

Também podemos realizar operações em strings. Por exemplo, podemos verificar seu comprimento com `len()`:

In [9]:
len('Olá')

3

Podemos selecionar partes da string especificando o **índice**. Note que em Python o 1º caractere está no índice 0:

In [10]:
'Olá'[0]

'O'

Podemos concatenar strings com `+`:

In [11]:
'Olá' + ' ' + 'mundo'

'Olá mundo'

Podemos verificar se caracteres estão na string com o operador `in`:

In [12]:
'O' in 'Olá'

True

## Variáveis
Note que simplesmente digitar texto causa um erro. Erros em Python tentam nos dar pistas sobre o que deu errado em nosso código. Neste caso, temos uma exceção `NameError`, que nos diz que `'hello'` não está definido. Isso significa que o [interpretador Python](https://docs.python.org/3/tutorial/interpreter.html) procurou por uma **variável** chamada `hello`, mas não encontrou nenhuma.

In [13]:
Olá

NameError: name 'Olá' is not defined

Variáveis nos fornecem uma maneira de armazenar tipos de dados. Definimos uma variável usando a sintaxe `nome_da_variavel = valor`:

In [14]:
x = 5
y = 7
x + y

12

O nome da variável não pode conter espaços; geralmente usamos `_` em seu lugar. Os melhores nomes de variáveis são descritivos:

In [15]:
titulo_do_livro = 'Hands-On Data Analysis with Pandas'

Variáveis podem ser de qualquer tipo de dado. Podemos verificar qual é o tipo usando `type()`, que é uma **função** (mais sobre isso depois):

In [16]:
type(x)

int

In [17]:
type(titulo_do_livro)

str

Se precisarmos ver o valor de uma variável, podemos imprimi-la usando a função `print()`:

In [18]:
print(titulo_do_livro)

Hands-On Data Analysis with Pandas


## Collections of Items

### Listas
Podemos armazenar uma coleção de itens em uma lista:

In [19]:
['olá', ' ', 'mundo']

['olá', ' ', 'mundo']

A lista pode ser armazenada em uma variável. Note que os itens na lista podem ser de diferentes tipos:

In [20]:
minha_lista = ['olá', 3.10, True, 'Python']
type(minha_lista)

list

Podemos verificar quantos elementos há na lista com `len()`:

In [21]:
len(minha_lista)

4

Também podemos usar o operador `in` para verificar se um valor está na lista:

In [22]:
'mundo' in minha_lista

False

Podemos selecionar itens na lista da mesma forma que fizemos com strings, fornecendo o índice para selecionar:

In [23]:
minha_lista[1]

3.1

Python também nos permite usar valores negativos, então podemos facilmente selecionar o último item:

In [24]:
minha_lista[-1]

'Python'

Outra característica poderosa de listas (e strings) é o **slicing**. Podemos pegar os 2 elementos do meio na lista:

In [25]:
minha_lista[1:3]

[3.1, True]

... ou pegar de dois em dois:

In [26]:
minha_lista[::2]

['olá', True]

Até podemos selecionar a lista de trás para frente:

In [27]:
minha_lista[::-1]

['Python', True, 3.1, 'olá']

Nota: Esta sintaxe é `[inicio:fim:passo]`, onde a seleção é inclusiva do índice de início, mas exclusiva do índice de fim. Se `inicio` não for fornecido, é utilizado `0`. Se `fim` não for fornecido, é utilizado o número de elementos (4, no nosso caso); isso funciona porque o índice de `fim` é exclusivo. Se `passo` não for fornecido, é 1.

Podemos usar o método `join()` em um objeto de string para concatenar todos os itens de uma lista em uma única string. A string na qual chamamos o método `join()` será usada como separador, aqui estamos separando com um pipe (|):

In [28]:
'|'.join(['x', 'y', 'z'])

'x|y|z'

### Tuplas

Tuplas são semelhantes a listas; no entanto, elas não podem ser modificadas após a criação, ou seja, são **imutáveis**. Em vez de colchetes, usamos parênteses para criar tuplas:

In [29]:
minha_tupla = ('a', 5)
type(minha_tupla)

tuple

In [30]:
minha_tupla[0]

'a'

Objetos imutáveis não podem ser modificados:

In [31]:
minha_tupla[0] = 'b'

TypeError: 'tuple' object does not support item assignment

### Dicionários

Podemos armazenar mapeamentos de pares chave-valor usando dicionários:

In [32]:
shopping_lista = {
    'vegetais': ['spinach', 'kale', 'beets'],
    'frutas': 'bananas',
    'carne': 0
}
type(shopping_lista)

dict

Para acessar os valores associados a uma chave específica, usamos a notação de colchetes novamente:

In [33]:
shopping_lista['vegetais']

['spinach', 'kale', 'beets']

Podemos extrair todas as chaves com `keys()`:

In [34]:
shopping_lista.keys()

dict_keys(['vegetais', 'frutas', 'carne'])

Podemos extrair todos os valores com `values()`:

In [35]:
shopping_lista.values()

dict_values([['spinach', 'kale', 'beets'], 'bananas', 0])

Finalmente, podemos chamar `items()` para obter pares de (chave, valor):

In [36]:
shopping_lista.items()

dict_items([('vegetais', ['spinach', 'kale', 'beets']), ('frutas', 'bananas'), ('carne', 0)])

### Sets

Um set é uma coleção de itens únicos; um uso comum é remover duplicatas de uma lista. Eles são escritos com chaves também, mas observe que não há mapeamento de chave-valor:

In [37]:
meu_set = {1, 1, 2, 'a'}
type(meu_set)

set

Quantos itens há neste set?

In [38]:
len(meu_set)

3

Colocamos 4 itens, mas o conjunto tem apenas 3 porque os duplicados são removidos:

In [39]:
meu_set

{1, 2, 'a'}

We can check if a value is in the set:

In [40]:
2 in meu_set

True

## Funções

Podemos definir funções para encapsular nosso código para reuso. Já vimos algumas funções: `len()`, `type()` e `print()`. Todas são funções que recebem **argumentos**. Note que as funções não precisam aceitar argumentos, caso em que são chamadas sem passar nada (por exemplo, `print()` versus `print(minha_string)`).

*Observação: também podemos criar listas, sets, dicionários e tuplas com funções: `list()`, `set()`, `dict()` e `tuple()`.*

### Definindo funções

Usamos a palavra-chave `def` para definir funções. Vamos criar uma função chamada `add()` com 2 parâmetros, `x` e `y`, que serão os nomes que o código da função usará para se referir aos argumentos que passamos ao chamá-la:

In [41]:
def add(x, y):
    """Esta é uma docstring. É usada para explicar como o código funciona e é opcional (mas encorajada)."""
    # este é um comentário; ele nos permite anotar o código
    print('Realizando a adição')
    return x + y

Depois de executar o código acima, nossa função está pronta para ser usada:

In [42]:
type(add)

function

Vamos somar alguns números:

In [43]:
add(1, 2)

Realizando a adição


3

### Valores de retorno

Podemos armazenar o resultado em uma variável para uso posterior:

In [44]:
resultado = add(1, 2)

Realizando a adição


Note que o comando print não foi capturado em `resultado`. Esta variável terá apenas o que a função **retorna**. Isso é o que a linha `return` na definição da função fez:

In [45]:
resultado

3

Note que as funções não precisam retornar nada. Considere `print()`:

In [46]:
print_resultado = print('olá mundo')

olá mundo


Se olharmos para o que recebemos de volta, veremos que é um objeto do tipo `NoneType`:

In [47]:
type(print_resultado)

NoneType

Em Python, o valor `None` representa valores nulos. Podemos verificar se nossa variável *é* `None`:

In [48]:
print_resultado is None

True

*Aviso: certifique-se de usar operadores de comparação (por exemplo, >, >=, <, <=, ==, !=) para comparar com valores diferentes de `None`.*

### Argumentos de função

*Observe que os argumentos de função podem ser qualquer coisa, até mesmo outras funções. Veremos vários exemplos disso no livro.*

A função que definimos requer argumentos. Se não fornecermos todos eles, causará um erro:

In [49]:
add(1)

TypeError: add() missing 1 required positional argument: 'y'

Podemos usar `help()` para verificar quais argumentos a função precisa (observe que a docstring é exibida aqui):

In [50]:
help(add)

Help on function add in module __main__:

add(x, y)
    Esta é uma docstring. É usada para explicar como o código funciona e é opcional (mas encorajada).



Também receberemos erros se passarmos tipos de dados que `add()` não pode lidar:

In [51]:
add(set(), set())

Realizando a adição


TypeError: unsupported operand type(s) for +: 'set' and 'set'

Vamos discutir o tratamento de erros no livro.

## Declarações de Fluxo de Controle

Às vezes queremos variar o caminho que o código segue com base em algum critério. Para isso, temos `if`, `elif` e `else`. Podemos usar `if` sozinho:

In [52]:
def make_positive(x):
    """Retorna o valor absoluto de x"""
    if x < 0:
        x *= -1
    return x

Chamar essa função com entrada negativa faz com que o código sob a declaração `if` seja executado:

In [53]:
make_positive(-1)

1

Chamar esta função com entrada positiva faz com que o código sob a declaração `if` seja ignorado, mantendo o número positivo:

In [54]:
make_positive(2)

2

Às vezes, precisamos de uma declaração `else` também:

In [55]:
def add_or_subtract(operation, x, y):
    if operation == 'add':
        return x + y
    else:
        return x - y

Isso aciona o código sob a declaração `if`:

In [56]:
add_or_subtract('add', 1, 2)

3

Como a verificação booleana na declaração `if` foi `False`, isso aciona o código sob a declaração `else`:

In [57]:
add_or_subtract('subtract', 1, 2)

-1

Para lógica mais complicada, também podemos usar `elif`. Podemos ter qualquer número de declarações `elif`. Opcionalmente, podemos incluir `else`.

In [58]:
def calculate(operation, x, y):
    if operation == 'add':
        return x + y
    elif operation == 'subtract':
        return x - y
    elif operation == 'multiply':
        return x * y
    elif operation == 'division':
        return x / y
    else:
        print("Este caso não foi tratado.")

O código continua verificando as condições nas declarações `if` de cima para baixo até encontrar `multiply`:

In [59]:
calculate('multiply', 3, 4)

12

O código continua verificando as condições nas declarações `if` de cima para baixo até encontrar a declaração `else`:

In [60]:
calculate('power', 3, 4)

Este caso não foi tratado.


## Loops
### Laços `while`
Com os laços `while`, podemos executar código até que alguma condição de parada seja atendida:

In [61]:
done = False
value = 2
while not done:
    print('Ainda continuando...', value)
    value *= 2
    if value > 10:
        done = True

Ainda continuando... 2
Ainda continuando... 4
Ainda continuando... 8


Note que isso também pode ser escrito movendo a condição para a declaração `while`:

In [62]:
value = 2
while value < 10:
    print('Ainda continuando...', value)
    value *= 2

Ainda continuando... 2
Ainda continuando... 4
Ainda continuando... 8


### Laços `for`

Com os laços `for`, podemos executar nosso código *para cada* elemento em uma coleção:

In [63]:
for i in range(5):
    print(i)

0
1
2
3
4


Podemos usar laços `for` com listas, tuplas, sets e dicionários também:

In [64]:
for element in minha_lista:
    print(element)

olá
3.1
True
Python


In [65]:
for key, value in shopping_lista.items():
    print('Para', key, 'nós precisamos comprar', value)

Para vegetais nós precisamos comprar ['spinach', 'kale', 'beets']
Para frutas nós precisamos comprar bananas
Para carne nós precisamos comprar 0


Com os laços `for`, não precisamos nos preocupar em verificar se alcançamos a condição de parada. Por outro lado, os laços `while` podem causar loops infinitos se não nos lembrarmos de atualizar as variáveis.

## Imports

Nós estivemos trabalhando com a parte do Python que está disponível sem importar funcionalidades adicionais. A biblioteca padrão do Python que vem com a instalação do Python é dividida em vários **módulos**, mas muitas vezes só precisamos de alguns deles. Podemos importar o que precisamos: um módulo na biblioteca padrão, uma biblioteca de terceiros, ou código que escrevemos. Isso é feito com uma declaração `import`:

In [66]:
import math

print(math.pi)

3.141592653589793


Se precisarmos apenas de uma pequena parte desse módulo, podemos fazer o seguinte:

In [67]:
from math import pi

print(pi)

3.141592653589793


*Atenção: tudo o que você importa é adicionado ao namespace, então se você criar uma nova variável/função/etc. com o mesmo nome, ela irá sobrescrever o valor anterior. Por esse motivo, precisamos ter cuidado com os nomes das variáveis, por exemplo, se você nomear algo como `sum`, você não poderá mais usar a função `sum()` integrada para somar números. Usar notebooks ou um IDE ajudará a evitar esses problemas com destaque de sintaxe.*

## Instalando Pacotes de Terceiros

**NOTA: Vamos cobrir a configuração do ambiente no texto; isso é apenas para referência.**

Podemos usar [`pip`](https://pip.pypa.io/en/stable/reference/), [`conda`](https://docs.conda.io/projects/conda/en/latest/commands.html) ou [`poetry`](https://python-poetry.org/docs/) para instalar pacotes, dependendo de como criamos nosso ambiente virtual. O texto passa pelos comandos para criar ambientes virtuais com `venv`, `conda` ou `pyproject.toml`. O ambiente **DEVE** estar ativado antes de instalar os pacotes para este texto; caso contrário, é possível que interfiram em outros projetos em sua máquina ou vice-versa.

Para instalar um pacote, podemos usar `pip3 install <nome_do_pacote>`. Opcionalmente, podemos fornecer uma versão específica para instalar `pip3 install pandas==0.23.4`. Sem essa especificação, obteremos a versão mais estável. Quando temos muitos pacotes para instalar (como para este livro), geralmente usamos um arquivo `requirements.txt`: `pip3 install -r requirements.txt`.

*Nota: executar `pip3 freeze > requirements.txt` enviará a lista de pacotes instalados no ambiente ativado e suas respectivas versões para o arquivo `requirements.txt`.*

## Classes

*NOTA: Vamos discutir isso mais adiante no livro, no capítulo 7. Por enquanto, é importante estar ciente da sintaxe desta seção.*

Até agora, usamos Python como uma linguagem de programação funcional, mas também temos a opção de usá-lo para **programação orientada a objetos**. Você pode pensar em uma `classe` como uma forma de agrupar funcionalidades semelhantes juntas. Vamos criar uma classe de calculadora que pode lidar com operações matemáticas para nós. Para isso, usamos a palavra-chave `class` e definimos **métodos** para realizar ações na calculadora. Esses métodos são funções que recebem `self` como primeiro argumento. Ao chamá-los, não passamos nada para esse argumento (exemplo após este):

In [68]:
class Calculator:
    """Esta é a docstring da classe."""

    def __init__(self):
        """Este é um método e é chamado quando criamos um objeto do tipo `Calculator`."""
        self.on = False

    def ligar(self):
        """Este método liga a calculadora."""
        self.on = True

    def add(self, x, y):
        """Realiza a adição se a calculadora estiver ligada."""
        if self.on:
            return x + y
        else:
            print('A calculadora não está ligada')

Para usar a calculadora, precisamos **instanciar** um objeto do tipo `Calculator`. Como o método `__init__()` não tem parâmetros além de `self`, não precisamos fornecer nada:

In [69]:
minha_calc = Calculator()

Vamos tentar somar alguns números:

In [70]:
minha_calc.add(1, 2)

A calculadora não está ligada


Oops!! A calculadora não está ligada. Vamos ligá-la:

In [71]:
minha_calc.ligar()

Vamos tentar novamente:

In [72]:
minha_calc.add(1, 2)

3

Podemos acessar **atributos** do objeto com notação de ponto. Neste exemplo, o único atributo é `on`, e ele é definido no método `__init__()`:

In [73]:
minha_calc.on

True

Note que também podemos atualizar atributos:

In [74]:
minha_calc.on = False
minha_calc.add(1, 2)

A calculadora não está ligada


Finalmente, podemos usar `help()` para obter mais informações sobre o objeto:

In [75]:
help(minha_calc)

Help on Calculator in module __main__ object:

class Calculator(builtins.object)
 |  Esta é a docstring da classe.
 |  
 |  Methods defined here:
 |  
 |  __init__(self)
 |      Este é um método e é chamado quando criamos um objeto do tipo `Calculator`.
 |  
 |  add(self, x, y)
 |      Realiza a adição se a calculadora estiver ligada.
 |  
 |  ligar(self)
 |      Este método liga a calculadora.
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)



... e também para um método:

In [76]:
help(minha_calc.add)

Help on method add in module __main__:

add(x, y) method of __main__.Calculator instance
    Realiza a adição se a calculadora estiver ligada.



## Próximos Passos
Este foi um curso intensivo em Python. De maneira alguma espera-se que você seja um especialista na linguagem para começar a trabalhar com o livro.

<hr>
<div style="overflow: hidden; margin-bottom: 10px;">
    <div style="float: left;">
        <a href="./1-checking_your_setup.ipynb">
            <button>&#8592; Checando seu ambiente</button>
        </a>
        <a href="../ch_02/1-pandas_data_structures.ipynb">
            <button>Chapter 2 &#8594;</button>
        </a>
    </div>
</div>
<hr>