# Dicas de sintaxe do Python

Você já pensou em aprender Python para analisar dados, mas não sabe por onde começar? Esse tutorial foi feito para você. Aqui focaremos nos pontos básicos que você precisa saber sobre a linguagem.

Seguiremos as seguintes etapas:

- Usando Notebooks
- Tipos embutidos
    - Strings
    - Números e operações matemáticas
    - Booleanos
- Atribuição de variável
- Métodos de string
- Comentários
- A função print()
- Coleções de dados
    - Listas
    - Dicionários
- Estrutura de repetição `for`
- Declarações `if`

Mas antes, vamos aprender como funciona os Notebooks de desenvolvimento.

# Usando Notebooks

Há muitas maneiras de escrever e rodar um código Python no seu computador. Uma delas - o método que estamos usando aqui - é usar os notebooks. Noteboks são plataformas que permitem escrever códigos e documenta-los. Podem ser online como o [Google Colab](https://colab.research.google.com/), ou offline como o [Jupyter Notebook](https://jupyter.org/), em ambos os casos rodarão direto do seu navegador.<p>
Ele é útil para deixar seu código com explicações sobre o que acontece em cada etapa do processo. Você pode encontrar alguns exemplos de uso de notebook na aba [tutoriais da Escola de Dados](https://escoladedados.org/tutoriais/), como este sobre [cruzar dados de desmatamento e agropecuária usando Python](https://escoladedados.org/tutoriais/dados-de-desmatamento-e-agropecuaria-python/).

Basicamente o funcionamento de um notebook consiste em incluir novas células e executá-las. <p>
*  **Para adicionar uma nova célula ao seu notebook**: 
    * **Jupyter Notebook:**  Clique no ícone  `+` embaixo do menu `File` e escolha se quer texto (markdown) ou código (Code) no menu suspenso embaixo do menu `Widgets`.
    * **Google Colab:** Clique em `+ Código` ou `+ Texto`, embaixo do menu `Arquivo`.

*  **Para executar uma célula de código:** Pressione `Shift` + `Enter`.

**Erro comum:** O notebook não "sabe" o código que está na célula até que ele seja executado. Por exemplo, se você definir uma variável chamada `meu_nome` em uma célula e depois tentar acessar essa mesma variável em outra célula sem executar a célula que contém a variável antes, você receberá um erro:
`NameError: name 'meu_nome' is not defined`. A possivel solução desse erro é rodar a célula onde está a variável. 

Pronto, agora estamos prontos para iniciar nossos aprendizados em Python!

# Tipos embutidos

Assim como Excel e outros softwares de processamento de dados, Python reconhece uma gama de diferentes tipos de dados, sendo que três deles receberão mais ênfase:

- Strings (texto)
- Números (inteiros, números com casas decimais e mais)
- Booleanos (`True`(verdadeiro) e `False`(falso)).

Você pode usar a função embutida [`type()`](https://docs.python.org/pt-br/3/library/functions.html#type) para verificar o tipo de dado de um valor qualquer. Rode a célula para visualizar um exemplo:

In [6]:
type(45)

int

# Strings



Uma string é um conjunto de caracteres - letras, números, o que quer que seja - acompanhado de aspas simples ou duplas, não importando qual, contanto que as aspas de início e fim sejam iguais. O código nesse notebook usa aspas simples. O guia de estilo do Python não recomenda alternar entre aspas, ["escolha uma regra e vá com ela até o fim."](https://www.python.org/dev/peps/pep-0008/#string-quotes). <br>Rode a célula para ver um exemplo:

In [19]:
'Olá Mundo!'

'Olá Mundo!'

In [20]:
"Python é uma linguagem de programação"

'Python é uma linguagem de programação'

Se a sua string possuir apostrófos ou citações, você tem duas opções para fazer o sinal. <br>Execute as células seguintes para conferir:  

1.   _Acrescentar_ uma barra invertida antes do caractere em questão (`\`):

In [11]:
"Já tomou um copo d\'água hoje?"

"Já tomou um copo d'água hoje?"

2.   Mudar as aspas simples para aspas duplas (opção recomendada):

In [10]:
"Já tomou um copo d'água hoje?"

"Já tomou um copo d'água hoje?"

Quando você chama a funcão `type()` em uma string, o Python irá lhe retornar `str`.

In [8]:
type('Olá!')

str

Chamando a [função `str()`](https://docs.python.org/pt-br/3/library/stdtypes.html#str) em um valor qualquer, irá lhe retornar aquele mesmo valor convertido em string.

In [7]:
str(45)

'45'

Você pode utilizar uma função dentro de outra função:

In [None]:
type(str(45))

Também pode passar um valor boleano e a função identificará como string:

In [None]:
str(True)

Se você "adicionar" strings com um sinal de mais `+`, elas serão concatenadas:

In [17]:
'SEXTA' + '-' + 'FEIRA'

'SEXTA-FEIRA'

# Números e operações matemáticas


Python reconhece uma infinidade de tipos de dados numéricos. Os dois mais comuns são: 
*   integers (números inteiros)

In [None]:
12

*   floats (números com casas decimais).

In [21]:
12.4

12.4

Assim como acontece quando chama a função `str()` e ela converte qualquer valor em string, chamar a função `int()` em um tipo de dado númerico (mesmo que este esteja no formato string) tentará forçá-lo a ser um inteiro.

In [None]:
type(12)

In [None]:
int(35.6)

In [None]:
int('45')

O mesmo acontece quando utiliza a função `float()`.

In [None]:
type(12.4)

In [None]:
float(46)

In [None]:
float('45')

O Python permite realizar operações matemáticas das mais [básicas](https://www.digitalocean.com/community/tutorials/how-to-do-math-in-python-3-with-operators) até as mais [avançadas](https://docs.python.org/pt-br/3/library/math.html).

In [None]:
4+2

In [None]:
10-9

In [None]:
5*10

In [None]:
1000/10

Para elevar um número à potência de outro número, utilize dois asterísticos `**`.

In [28]:
5**2

25

# Booleanos

Assim como o Excel, que possui os tipos `VERDADEIRO` e `FALSO`, Python possui tipos booleanos. Eles são `True` e `False` -- perceba que eles não devem vir acompanhados de aspas e que apenas as iniciais devem ser maiúsculas.

Normalmente valores booleanos são retornados quando você está trabalhando com algum tipo de declaração condicional - comparando valores, verificando se uma string está dentro de outra string, se um valor está contido em uma lista, etc. 

In [None]:
True

In [None]:
False

In [None]:
type(True)

Os [operadores lógicos do Python](https://docs.python.org/pt-br/3/reference/expressions.html#comparisons) são:

- `>` maior que
- `<` menor que
- `>=` maior que ou igual a
- `<=` menor que ou igual a
- `==` igual a
- `!=` diferente de

In [None]:
4 > 6

In [None]:
10 == 10

Python é uma linguagem case sensitive, ou seja, a mesma palavra pode ser entendida como uma palavra diferente simplesmente porque uma letra está maiuscula ou minúscula. 

In [30]:
'Python' == 'python'

False

# Atribuição de variável

O sinal de igual (`=`) atribui um valor a uma variável cujo nome você irá definir. Se você quiser fazer uso desse valor basta que você chame o nome da variável. Nomes de variáveis podem ser qualquer coisa que nós quiseremos, [contanto que você siga algumas regrinhas básicas](https://thehelloworldprogram.com/python/python-variable-assignment-statements-rules-conventions-naming/).

Este pode ser um conceito complicado de entender de primeira! Para mais detalhes, [aqui vai uma explicação muito boa do Digital Ocean](https://www.digitalocean.com/community/tutorials/how-to-use-variables-in-python-3).

In [38]:
meu_nome = 'Francisco'

In [None]:
meu_nome

In [36]:
meu_numero_preferido = 10 + 3

In [37]:
meu_numero_preferido

13

Você também pode _reatribuir_ um valor diferente para o nome de uma variável, porém uma boa prática é criar uma variável com nome diferente.

In [40]:
meu_nome = 'Maria'

In [None]:
meu_nome

Também é comum se referir a variáveis previamente definidas em uma expressão:

In [42]:
times_da_nfl = 32
times_da_mlb = 30
times_da_nba = 30
times_da_nhl = 31

quantidade_de_times_profissionais = times_da_nfl + times_da_mlb + times_da_nba + times_da_nhl

In [43]:
quantidade_de_times_profissionais

123

# Métodos de string


Voltando a falar de strings, é importante ressaltar que esses objetos possuem uma série de [métodos](https://docs.python.org/pt-br/3/library/stdtypes.html#string-methods) muito úteis - vamos usar uma string como exemplo para ilustrar os mais comuns.

In [46]:
minha_string = '    Oi, amigos!'
minha_string

'    Oi, amigos!'

A função `upper()` capitaliza todos os caracteres de uma string:

In [45]:
minha_string.upper()

'    OI, AMIGOS!'

`lower()` converte para minúsculos:

In [47]:
minha_string.lower()

'    oi, amigos!'

`replace()` irá substituir um trecho de texto com outro trecho a ser especificado por você:

In [48]:
minha_string.replace('amigos', 'inimigos')

'    Oi, inimigos!'

`count()` irá contar a quantidade de vezes que um caractere ou grupo de caracteres aparece na sua string:

In [49]:
minha_string.count('o')

1

Perceba que `count()` diferencia entre minúsculas e maiúsculas. Se o que você deseja é contar todas as letras 'o', você deve converter sua string original para maiúscula ou minúscula anteriormente.

In [50]:
minha_string.upper().count('O')

2

`split()` irá fatiar a string e armazená-la em uma [lista](#Listas) (iremos falar mais sobre elas já já) baseado em um delimitador. Caso você não defina um delimitador, o delimitador definido por padrão é um espaço em branco:

In [51]:
minha_string.split()

['Oi,', 'amigos!']

In [52]:
minha_string.split(',')

['    Oi', ' amigos!']

In [53]:
minha_string.split('Pitt')

['    Oi, amigos!']

A função `strip()` remove espaços em branco das extremidade da sua string (mas não os espaços em branco internos):

In [54]:
minha_string.strip()

'Oi, amigos!'

Tem uma coisa muito incrível chamada "encadeamento de método" que te permite combinar métodos - é só adicioná-los um ao final do outro. Digamos que nós quiséssemos remover um espaço em branco da nossa string _e_ colocá-la em maiúsculo:

In [55]:
minha_string.strip().upper()

'OI, AMIGOS!'

Apesar disso, nossa string original permanece inalterada:

In [56]:
minha_string

'    Oi, amigos!'

Mas por que isso? É que a gente não atribuiu os resultados de nenhuma dessas operações a qualquer variável. Uma prática muito comum, especialmente quando estamos limpando dados, é atribuir os resultados a uma nova variável:

In [58]:
minha_string_limpa = minha_string.strip().upper()

In [59]:
minha_string_limpa

'OI, AMIGOS!'

# Comentários



Uma linha comentada - uma nota que você não quer que seja interpretada como código pelo Python - começa com um sinal de `#`. Esse recurso é utilizado para que você e outros colaboradores entendam o que está acontecendo naquele ponto do seu código e o porquê de estar acontecendo.

Em geral, você deve usar essa ferramenta logo acima da linha de código que você deseja comentar:

In [None]:
liquidacao_media = 40827348.34328237

# convertendo este valor para int porque não precisamos de casas decimais nesse caso
int(liquidacao_media)

Comentários de mais de uma linha são colocados entre três aspas (ou três apóstrofos):

`'''
este
é um longo
comentário
'''`

ou

`"""
este é outro
longo
comentário
"""`

# A função `print()`



Até então, nós executamos as células deste notebook para pegar o último valor retornado pelo código que escrevemos. Usar a função [`print()`](https://docs.python.org/pt-br/3/library/functions.html#print) é uma forma de imprimir na tela coisas específicas do seu código. Esta é também uma ferramenta bem útil para depuração de código.

Para exibir múltiplos elementos na mesma linha, separe-os com uma vírgula.

In [None]:
print('Olá!')

In [None]:
print(meu_nome)

In [None]:
print('Olá,', meu_nome)

# Coleções de dados

Agora iremos abordar duas maneiras que você pode usar Python para agrupar dados em uma coleção: listas e dicionários.

**Listas**

Uma _lista_ é um conjunto de itens separados por vírgulas dentro de colchetes: `[]`.

Aqui vai uma lista de ingredientes, cada um sendo uma string, que combinados formam a receita de um molho.

In [70]:
ingredientes_para_o_molho = ['tomate', 'cebola', 'pimenta', 'limão', 'coentro']

Para acessar um item de uma lista você deve informar sua posição numérica na lista - o seu _índice_ (1, 2, 3, etc.) - dentro de colchetes imediatamente após o nome da variável da lista. Assim como em muitas outras linguagens de programação, em Python a contagem começa em 0. Isso significa que o primeiro item de uma lista é o item `0`.

In [62]:
ingredientes_para_o_molho[0]

'tomate'

In [63]:
ingredientes_para_o_molho[1]

'cebola'

Você pode usar _índices negativos_ para acessar itens do lado direito da lista - e, na verdade, `[-1]` é um termo comum para acessar "o último item da lista" quando não está tão nítido assim quantos elementos há na lista em questão.

In [None]:
ingredientes_para_o_molho[-1]

Se o que você precisa é pegar um trecho com alguns itens da sua lista, você só precisa usar dois pontos (mais ou menos como no Excel!). 

Se quer acessar os primeiros três itens, por exemplo, é só fazer assim:

In [65]:
ingredientes_para_o_molho[0:3]

['tomate', 'cebola', 'pimenta']

Você poderia ter deixado de fora o 0 do começo - quando você não informa o primeiro número, o Python por padrão define para "o primeiro item na lista." Da mesma forma, se você deixar de fora o último número, o padrão definido pelo Python é "o último item da lista."

In [66]:
ingredientes_para_o_molho[:3]

['tomate', 'cebola', 'pimenta']

Observe que essa fatia nos devolve os itens 0, 1 e 2. O item 3 no nosso conjunto é o primeiro item que nós _não_ queremos. Isso pode parecer confuso em um primeiro momento. Vamos obeservar mais alguns exemplos:

In [67]:
# tudo na lista, exceto o primeiro item
ingredientes_para_o_molho[1:]

['cebola', 'pimenta', 'lima', 'coentro']

In [93]:
# o segundo, terceiro e quarto itens
ingredientes_para_o_molho[1:4]

['cebola', 'pimenta', 'limão']

In [71]:
# os dois últimos itens
ingredientes_para_o_molho[-2:]

['limão', 'coentro']

Para saber quantos itens uma lista tem é só usar a funcão `len()`

In [72]:
len(ingredientes_para_o_molho)

5

Para adicionar itens a uma lista, use o método `append()`:

In [82]:
ingredientes_para_o_molho

['tomate', 'cebola', 'pimenta', 'limão', 'coentro', 'maionese']

In [83]:
ingredientes_para_o_molho.append('areia')

In [85]:
ingredientes_para_o_molho

['tomate', 'cebola', 'pimenta', 'limão', 'coentro', 'maionese', 'areia']

O único problema aqui é que ficou meio _nojento_, haha. Para remover um item de uma lista, use o método `pop()`. Se você não informar o índice númerico do item específico que você quer remover, o valor padrão do método é "o último item da lista".

In [86]:
ingredientes_para_o_molho.pop()

'areia'

In [87]:
ingredientes_para_o_molho

['tomate', 'cebola', 'pimenta', 'limão', 'coentro', 'maionese']

Você pode usar as expressões [`in` e `not in`](https://docs.python.org/pt-br/3/reference/expressions.html#membership-test-operations) para verificar se um item pertence àquela lista (e irá lhe retornar um booleano):

In [88]:
'limão' in ingredientes_para_o_molho

True

In [89]:
'coentro' not in ingredientes_para_o_molho

False

# Dicionários


Um dicionário é um conjunto de pares de chave/valor, separados por vírgula, dentro de chaves: `{}`. Vamos fazer uma receita inteira de molho:

In [90]:
molho = {
    'ingredientes': ingredientes_para_o_molho,
    'instrucoes': 'Corte todos os ingredientes e cozinhe eles por um tempinho.',
    'porcoes': 12
}

Para retornar um valor de um dicionário, você deve chamar o nome da sua respectiva chave dentro de colchetes `[]` imediatamente após o nome da variável do dicionário em questão. 

In [91]:
molho['porcoes']

12

In [92]:
molho['ingredientes']

['tomate', 'cebola', 'pimenta', 'limão', 'coentro', 'maionese']

Para adicionar um novo conjunto de chave/valor a um dicionário, atribua uma nova chave dentro de colchetes ao dicionário desejado e defina o valor logo após o `=`: 

In [94]:
molho['esta_uma_delicia'] = True

In [95]:
molho

{'esta_uma_delicia': True,
 'ingredientes': ['tomate',
  'cebola',
  'pimenta',
  'limão',
  'coentro',
  'maionese'],
 'instrucoes': 'Corte todos os ingredientes e cozinhe eles por um tempinho.',
 'porcoes': 12}

Para excluir um par chave/valor de um dicionário, utilize o comando `del` antes o nome do dicionário acompanhado da chave específica:

In [96]:
del molho['esta_uma_delicia']

In [97]:
molho

{'ingredientes': ['tomate',
  'cebola',
  'pimenta',
  'limão',
  'coentro',
  'maionese'],
 'instrucoes': 'Corte todos os ingredientes e cozinhe eles por um tempinho.',
 'porcoes': 12}

# Indentação

Espaços em branco fazem a diferença para o Python. Às vezes você precisará identar pedaços de código para que as coisas funcionem. Isso pode ser confuso! `IndentationError` é um tipo muito comum de erro, até mesmo para programadores mais experientes. Inclusive, o Notebook tentará ser prestativo e vai te dar uma mãozinha inserindo uma quantidade "significativa de espaços em branco" pra você.

Você pode usar tabs ou espaços, só não misture os dois. [O guia de estilo do Python](https://www.python.org/dev/peps/pep-0008/) recomenda que você indente seu código em grupos de quatro espaços, então será isso o que nós usaremos.

# Estrutura de repetição `for`



Você deve usar um `for` para iterar sobre uma coleção de coisas. A declaração começa com a palavra-chave `for` (em minúsculas), e então uma variável temporária chamada, por exemplo, `nome_da_variavel`. Você pode chamar essa variável como quiser, desde que ela percorra a coleção. Então insira a palavra-chave `in` e em seguida a coleção que você está percorrendo (ou o nome da sua variável), e então dois pontos. Após isso vamos colocar um bloco indentado de código com instruções sobre o que fazer com cada item na coleção.

Digamos que temos uma lista de números atribuida à variável `lista_de_numeros`.

In [98]:
lista_de_numeros = [1, 2, 3, 4, 5, 6]

É possível percorer os elementos da lista e imprimir cada um deles na tela:

In [99]:
for numero in lista_de_numeros:
    print(numero)

1
2
3
4
5
6


Podemos também exibir na tela cada número da lista _multiplicado_ por 6:

In [100]:
for numero in lista_de_numeros:
    print(numero*6)

6
12
18
24
30
36


... ou qualquer outra coisa que você queira fazer. Observe que a escolha de nome da variável chamada de `numero` na sua repetição é totalmente aleatória. Isso também funcionária:

In [101]:
for banana in lista_de_numeros:
    print(banana)

1
2
3
4
5
6


Talvez seja desafiador, em um primeiro momento, diferenciar o que é uma "palavra reservada do Python" e o que é o nome de uma variável que você pode definir. Isso, no entanto, vem com a prática.

Também dá pra iterar sobre os elementos de uma string. Vamos percorrer sobre as letras nesta sentença:

In [103]:
sentenca = 'Olá, Sexta-Feira'

for letra in sentenca:
    print(letra)

O
l
á
,
 
S
e
x
t
a
-
F
e
i
r
a


Então: Strings são iteráveis, assim como listas, logo, você pode utilizar os mesmos métodos:

In [104]:
# pegue os primeiros cinco caracteres
sentenca[:5]

'Olá, '

In [105]:
# descubra o tamanho da sentenca
len(sentenca)

16

In [106]:
'Olá' in sentenca

True

Você pode percorrer os elementos de um dicionário também - só tenha em mente que dicionários _não registram a ordem que os itens foram adicionados nele_.

Quando você está iterando sobre um dicionário, a variável que você colocou após o `for` irá se remeter às chaves. Vamos percorrer sobre nosso dicionário `molho` ali de cima:

In [107]:
for chave in molho:
    print(chave)

ingredientes
instrucoes
porcoes


Para pegar o _valor_ do item de um dicionário em uma iteração você deve usar a chave para se referir a ela mesma no dicionário:

In [108]:
for chave in molho:
    print(molho[chave])

['tomate', 'cebola', 'pimenta', 'limão', 'coentro', 'maionese']
Corte todos os ingredientes e cozinhe eles por um tempinho.
12


# Declarações `if`


Assim como no Excel, você pode lançar mão da estrutura "SE" para lidar com lógica condicional.

No Python, essas declarações começam com a palavra-chave `if` (em minúsculas), a condição a ser avaliada, seguida de dois pontos, e então uma nova linha de bloco de código indentado para então executar o código se a condição encontrada for `True` (verdadeira).

In [109]:
if 4 < 6:
    print('4 é menor do que 6')

4 é menor do que 6


Você também pode adicionar um `else` com um bloco de código indentado caso a condição encontrada for `False` (falsa).

In [110]:
if 4 > 6:
    print('4 é maior do que 6?!')
else:
    print('4 não é maior do que 6.')

4 não é maior do que 6.


Se você precisar, você pode adicionar múltiplas condições com `elif`.

In [111]:
NOSSO_PLACAR = 6
PLACAR_DO_OUTRO_TIME = 8

if NOSSO_PLACAR > PLACAR_DO_OUTRO_TIME:
    print('ganhamos!')
elif PLACAR_DO_OUTRO_TIME < NOSSO_PLACAR:
    print('empatamos!')
else:
    print('perdemos!')

perdemos!


Agora que você entendeu como funciona a linguagem Python, já pode dar seus primeiros passos [aprendendo a biblioteca Pandas usando este notebook](https://github.com/escola-de-dados/teaching-guide-intro-to-pandas/blob/master/introdu%C3%A7%C3%A3o_ao_pandas.ipynb)