# **Prática de programação em Python**
Neste notebook, vamos conhecer a linguagem Python e entender como os conceitos vistos até aqui são aplicados em uma linguagem de programação.  

*Por que Python?*
> O Python é uma linguagem de alto nível — uma linguagem de programação que se aproxima da linguagem natural —, considerada um canivete suíço no mundo da programação e conta com uma das maiores comunidades do mundo. Na área de dados, o Python se destaca por conta das incontáveis bibliotecas que permitem desde a manipulação de dados em diferentes formatos, a geração de gráficos para análises, até a construção de inteligências artificiais, passando por todo o ciclo de vida dos dados.


## **Variáveis**
Em Python, as variáveis podem ser definidas por qualquer nome, desde que sejam utilizadas apenas letras e números ou o símbolo underline, e, obrigatoriamente, comecem com letras. É importante frisar que não podem haver espaços em branco nos nomes das variáveis, pois isso gera erros.  

Nomear uma variável requer especificidade, pois o nome dela tem que facilitar o entendimento na hora da programação. Assim, se queremos salvar um nome em uma variável, precisamos pensar em definições como `nome` ou `nome_sobrenome` ao invés de `variavel`.
Vejamos alguns exemplos:

In [None]:
# Exemplos de variáveis que funcionam
nome_1 = "Nome"
verdadeiro = True
numero_dias_ano = 365
pi = 3.14

# Exemplos de variáveis que NÃO funcionam
# carro um = "Chevete"
# 1animal = "Papagaio"
# qualquer texto pode ser escrito aqui

### **O uso do "=" nas variáveis**
Definir uma variável requer uma atribuição. Assim como na nossa receita, onde a variável `cumbuca` recebia 300g de farinha, em Python, precisamos dizer que `numero_dias_ano` recebe 365, e o sinal utilizado para essa atribuição é o **=** (igual). Então, a partir de agora, no contexto da programação, o sinal de **=** deve ser lido como "**recebe**". Voltando a nossa analogia com a cozinha, aqui estamos vendo os valores das variávies.

Lendo as nossas variáveis anteriores:
* `nome_1` **recebe** "Nome"
* `nome_sobrenome` **recebe** "Nome Sobrenome"
* `numero_dias_ano` **recebe** 365

### **Tipos de dados**
Cada uma das variáveis recebeu um dado diferente, entre textos e números. Em Python, cada um desses tipos de dados tem uma nomenclatura específica. Vamos ver a seguir cada uma delas:

In [None]:
print(f"""
Variáveis e seus tipos:

A variável nome_1 é do tipo {type(nome_1)}
A variável verdadeiro é do tipo {type(verdadeiro)}
A variável numero_dias_ano é do tipo {type(numero_dias_ano)}
A variável pi é do tipo {type(pi)}
""")


Variáveis e seus tipos:

A variável nome_1 é do tipo <class 'str'>
A variável verdadeiro é do tipo <class 'bool'>
A variável numero_dias_ano é do tipo <class 'int'>
A variável pi é do tipo <class 'float'>



#### **Entendendo os tipos de dados**
Como foi apontado na saída do nosso código, os tipos de dados pertencem a determinadas classes. São elas:
* `str`: classe das strings (ou sequência de texto) — são dados textuais;  
    Strings sempre devem ser declaradas entre aspas (podem ser aspas simples ou duplas).
    
* `bool`: classe dos booleanos — verdadeiro, falso;  
    Em Python, dados booleanos assumem apenas dois valores: True e False.

* `int`: classe dos números inteiros;  
    Os números inteiros são declarados diretamente, sem o uso de aspas;

* `float`: classe dos números de ponto flutuante — números que possuem casas decimais.  
    Os números de ponto flutuante devem conter o ponto e suas casas decimais para serem declarados: 3.14 (atentem-se que não usamos vírgula e sim ponto).

## **Funções**
No conteúdo, vimos funções como estruturas que recebem entradas, realizam operações nessa entrada e devolvem uma saída, e o exemplo usado foi a soma.  
Vamos ver uma função de soma escrita em Python:

In [None]:
def soma(numero_1, numero_2):

    resultado = numero_1 + numero_2

    return resultado

### **Lendo a função de soma**
Na primeira linha vemos `def soma(numero_1, numero_2)`. Nela temos:
* `def`: é a palavra que usamos para definir a função — *def* é a abreviação de *define*;
* `soma`: esse é o nome da função, chamamos ela de função soma;
* `(numero_1, numero_2)`: é a entrada da função. Estamos dizendo que serão inseridos dois dados, que foram chamados de numero_1 e numero_2 para facilitar o entendimento;
* `resultado = numero_1 + numero_2`: essa é a operação principal da função soma. Nela, somamos os números da entrada e guardamos o valor dessa soma na variável `resultado`;
* `return resultado`: é a saída da função, o resultado dela. O `return` é a operação de retorno da função, assim, podemos ler "retorne o resultado".

Traduzindo a nossa função do Python para o português, temos:  
```
Estou definindo uma função chamada soma que:
1. Recebe dois números;
2. Soma os dois números e salva o resultado;
3. Retorna o resultado da soma.
```
❗ *Percebam que após a primeira linha há um espaço (semelhante à um recuo de parágrafo) antes da escrita do código. O nome desse espaçamento é **identação**, e serve para indicar que as linhas seguintes fazem parte daquele bloco de código. Assim,  separamos o que é código da função e o que faz parte do resto do programa.*

### **Testando a soma**
O teste da função é bem simples. Como o nome dela é `soma`, basta chamarmos o seu nome e indicarmos quais números queremos somar.

In [None]:
soma(2, 5)

14

O nome dessa ação que estamos fazendo é **chamada de função**. Para a função soma, a chamada é:  
`soma(numero, outro_numero)` — a vírgula é entendida como um separador de argumentos, ou seja, usamos ela para separar o primeiro número da soma do segundo.

### **Hora de praticar**
Escolham dois números e executem a função soma na célula abaixo:


In [None]:
# escreva o seu código aqui
soma(2, 4.1234)

6.1234

## **Loops**
Os loops são as estruturas que vão nos poupar de ter o trabalho massante de repetir muitas vezes uma determinada ação.  
Para entender melhor, voltemos à soma. Vamos imaginar que aplicamos uma prova com 5 questões e, no momento de corrigir, queremos criar um programa que some as pontuações e retorne o resultado.

Poderíamos tentar usar a nossa função `soma`?   
Sim, mas seria um trabalho moroso, pois só é possível somar 2 números por vez, então seria necessário repetir essa chamada de função 4 vezes.

Mas, com loops, podemos melhorar esse código e deixar todo o trabalho duro para o computador.

In [None]:
pontuacao_questoes = [1, 1.5, 1, 0.9, 2]

resultado = 0

for pontuacao in pontuacao_questoes:
    resultado = soma(resultado, pontuacao)

print(resultado)

6.4


### **Entendendo o loop**
1. Vamos começar transformando as pontuações da prova em uma lista. Ou seja, vamos anotar cada uma das notas e guardar para somar — fizemos isso usando uma lista que possui 5 posições, uma para cada pontuação.  
    `pontuacao_questoes = [1, 1.5, 1, 0.9, 0]`

2. Depois, estabelecemos a pontuação inicial do discente — como toda prova que ainda não foi corrigida não tem pontuação, definimos que o aluno começa com a nota 0, por isso `resultado = 0`.  

3. Para somar todas as pontuações, precisamos pegar cada uma delas e colocar na nossa conta. Essa ação é o **loop**, ou estrutura de repetição, e acontece na linha `for pontuacao in pontuacao_questoes:`, que pode ser lida como "*para cada pontuação na lista de pontuações das questões*.

4. Por fim, usamos a nossa função `soma` para somar as pontuações de cada questão e atualizar o valor do resultado da prova — a nota final.


Em Python, existe também a estrutura de repetição `While`. Apesar dela não ser abordada diretamente aqui, deixaremos um material de leitura para quem tiver curiosidade:  
[Tutorial de Laços While em Python](https://www.freecodecamp.org/portuguese/news/tutorial-de-lacos-while-em-python-exemplos-de-sintaxe-while-true-e-lacos-infinitos/)

## **Bibliotecas**
As bibliotecas são uma das grandes vantagens de se utilizar Python, pois temos acesso à um leque *quase* infinito de métodos, funções, operações, que já foram construídas e funcionam bem.  
Para acessar uma biblioteca em Python precisamos fazer duas ações:
1. Instalar a biblioteca — processo equivalente a instalar um programa no seu computador;
2. Importar a biblioteca. Depois de instalada, é a importação dela para o nosso ambiente que possibilita o uso.

Vamos instalar e usar uma biblioteca que já tem pronta esse código que criamos para somar as notas da prova. O nome da biblioteca é `numpy`.

### **Instalando a biblioteca**
A instalação é bem simples e acontece usando o bloco de código. A estrutura para instalar uma biblioteca no ambiente do Google Colab é:  
`!pip install nome-da-biblioteca`

Para a biblioteca que vamos utilizar, basta rodar a célula abaixo e esperar ela apresentar o símbolo ✅ que indica o fim da instalação.

In [None]:
!pip install numpy



### **Importando e usando o numpy**
A importação — ou seja, chamar a biblioteca para ser usada — ocorre através da palavra `import`. Então, ao escrevermos `import numpy`, estamos indicando no nosso programa que as funcionalidades da biblioteca `numpy` serão importadas e poderão ser usadas.

*E o uso?*  
Usar uma função da biblioteca importada depende de chamarmos essa função indicando que ela faz parte da biblioteca.   
Vamos dizer que queremos usar a função `sum` da biblioteca `numpy`. A estrutura para isso é:  
`numpy.sum`

Voltemos a prova que corrigimos. Com a função `sum` da biblitoeca que importamos, é possível somar todas as pontuações da nossa lista apenas inserindo ela como a variável de entrada na função.

In [None]:
import numpy

pontuacao_questoes = [1, 1.5, 1, 0.9, 2.2]

resultado = numpy.sum(pontuacao_questoes)

print(resultado)

6.6000000000000005


## **Estruturas de Dados**
Até aqui, aprendemos a declarar variáveis e também quais tipos de dados podemos utilizar no Python. Agora, vamos incrementar esses conhecimentos, entendendo como podemos criar estruturas de dados.

As estruturas de dados nativas do Python são: listas, tuplas, conjuntos e dicionários. No curso, veremos como funcionam as **listas** e os **dicionários**.



### **Listas**
Em Python, uma lista é implementada como uma série de valores (itens) separados por vírgula e entre colchetes. Assim como fizemos na lista de pontuações das questões: `pontuacao_questoes = [1, 1.5, 1, 0.9, 0]`.

As listas permitem a adição de mais de um tipo de dado, ou seja, podemos mesclar itens numéricos com textuais. Porém, no contexto desse curso, focaremos em listas com apenas um tipo de dado por lista.

Vejamos abaixo mais alguns exemplos:

In [None]:
nomes = ["Ana", "João", "Fernando", "Maria"]

comidas = ["arroz", "feijão", "batata", "macarrão"]

idades = [32, 19, 40, 56]

print(nomes, comidas, idades)

['Ana', 'João', 'Fernando', 'Maria'] ['arroz', 'feijão', 'batata', 'macarrão'] [32, 19, 40, 56]


### **Dicionários**
Em Python, dicionários são delimitados por chaves: `{ }`, e contém uma lista de pares `chave:valor` separada por vírgulas.  
Essas estruturas são ótimas para armazenar dados de maneira organizada, semelhante à uma tabela.


In [None]:
cafezinho = {
    "tipo": "especial",
    "qtd_de_cafe": 70,
    "qtd_agua": 1000,
    "temperatura_agua": 96
}

Através do dicionário construído, é possível recuperar várias informações sobre o `cafezinho` utilizando apenas as chaves correspondentes.

In [None]:
print(f"""
O café que vamos fazer é {cafezinho["tipo"]}.
Para passarmos {cafezinho["qtd_de_cafe"]}g de café, precisamos de {cafezinho["qtd_agua"]}ml de água.
E, para garantir que vamos extrair todo o sabor do café, sem deixá-lo amargo, a água deve estar a {cafezinho["temperatura_agua"]}ºC.
""")


O café que vamos fazer é especial.
Para passarmos 70g de café, precisamos de 1000ml de água.
E, para garantir que vamos extrair todo o sabor do café, sem deixá-lo amargo, a água deve estar a 96ºC.



### **Tabelas**
Como apresentamos anteriormente, o Python não possui, de maneira nativa, a implementação de tabelas. Porém, podemos construí-las utilizando bibliotecas como o `pandas`.  
Outra coisa interessante é que podemos transformar os dicionários em tabelas, o que facilita bastante a nossa vida. E uma boa forma de fazer isso é criando dicionários onde cada chave possui uma lista como valor. Assim, temos a estrutura de uma coluna de tabela, onde a chave é o nome da coluna e a lista são os valores.

Vejamos abaixo como criamos tabelas usando o `pandas`.


In [None]:
# Primeiro, vamos instalar a biblioteca pandas - esse é o espaço para vocês praticarem
!pip install pandas



In [None]:
# Agora, façam a importação
import pandas

dicionario_cafezinho = {
    "tipo": ["especial", "espresso"],
    "qtd_cafe": [70, 15],
    "qtd_agua": [1000, 50],
    "temperatura_agua": [96, 95]
}

pandas.DataFrame(dicionario_cafezinho)

Unnamed: 0,tipo,qtd_cafe,qtd_agua,temperatura_agua
0,especial,70,1000,96
1,espresso,15,50,95


#### **Entendendo a criação da tabela**
Para a biblioteca `pandas`, a tabela é representada através de uma estrutura específica, chamada `DataFrame` (de forma literal, é um quadro de dados).

Então, o que aconteceu na criação dessa tabela foi o seguinte:
1. Incrementamos o nosso dicionário sobre cafézinhos, acrescentando outro tipo de café e os valores para cada linha do dicionário;
2. Importamos a função `DataFrame` da biblioteca `pandas` e inserimos o nosso `dicionario_cafezinho` como variável de entrada;
3. Nessa operação, o `pandas` transformou o dicionário em um quadro de dados, e exibiu ele, numa estrutura que é visualmente igual a uma tabela.

## **Próximos passos**
Nesse Notebook, apresentamos brevemente a linguagem de programação Python, trazendo as implementações dos conceitos vistos até aqui.
A assimilação de todo esse conteúdo exige tempo, dedicação e leitura, então os notebooks do curso servem não só para o momento síncrono, como também de material de consulta.

No próximo módulo, vamos adentrar na **organização e pré-processamento de dados**, trazendo boas práticas de tabulação, apresentando princípios de organização e aplicações em Python, mostrando como limpar, transformar e salvar os nossos dados.


---
<p align="left">
    <small>
    <strong>Ciência de Dados para Pesquisa </strong></br>
    <I> Módulo 1 - Introdução à ciência de dados e Python </I>
    </small>
</p>