# Módulo 2: Mão na Massa com Pandas 🐼

Bem-vindo(a) ao nosso primeiro exercício prático! Aqui, vamos usar a biblioteca **Pandas** para carregar, explorar e limpar um conjunto de dados real da nossa lanchonete fictícia.

**Objetivos:**
1. Carregar dados de um arquivo `.csv` diretamente do GitHub.
2. Fazer uma exploração inicial para entender a estrutura dos dados.
3. Identificar e tratar dados ausentes (a famosa "faxina" dos dados).

### Passo 1: Importando a biblioteca Pandas

Tudo começa importando a ferramenta que vamos usar. Por convenção, a comunidade Python apelidou o `pandas` de `pd` para facilitar a escrita do código.

In [None]:
import pandas as pd

### Passo 2: Carregando os Dados do GitHub

Vamos carregar o arquivo `vendas_lanchonete.csv` que está no nosso repositório. Para isso, usamos a URL "raw" do arquivo.

O Pandas é inteligente o suficiente para ler um CSV diretamente de uma URL!

In [None]:
# Substitua pela URL raw do SEU repositório depois de enviar os arquivos
url = 'https://raw.githubusercontent.com/Miriam1s/mini_curso_inobar/main/dados/vendas_lanchonete.csv'

# Usamos a função read_csv() para ler os dados e criar um DataFrame
df = pd.read_csv(url)


### Passo 3: Explorando os Dados (O Primeiro Contato)

Agora que os dados estão carregados no nosso DataFrame `df`, vamos usar alguns comandos para "conversar" com eles e entendê-los melhor.

In [None]:
# O comando .head() nos mostra as 5 primeiras linhas do nosso DataFrame
# É ótimo para ter uma "amostra grátis" dos dados
df.head()

In [None]:
# O comando .info() nos dá um resumo técnico: o tipo de cada coluna e se há valores nulos
df.info()

In [None]:
# O comando .describe() nos dá estatísticas descritivas para as colunas numéricas
df.describe()

### Passo 4: Limpeza e Tratamento (A Faxina dos Dados)

Percebeu no `.info()` que as colunas `Valor` e `Forma_Pagamento` têm valores faltando? Dados do mundo real raramente são perfeitos. Vamos consertar isso.

In [None]:
# Primeiro, vamos contar quantos valores nulos existem em cada coluna
df.isnull().sum()

Temos duas estratégias principais:
1. **Remover** as linhas com dados faltantes.
2. **Preencher** os dados faltantes com algum valor (como a média, a moda, ou um valor padrão).

Vamos preencher o valor com 0 e a forma de pagamento com 'Não Informado'.

In [None]:
df['Valor'].fillna(0, inplace=True)
df['Forma_Pagamento'].fillna('Não Informado', inplace=True)

# Vamos verificar se a limpeza funcionou
df.isnull().sum()

**Parabéns!** Você carregou, explorou e limpou seu primeiro conjunto de dados. Agora ele está pronto para análises mais profundas, que veremos no próximo módulo.