# 📘 Aula 5 – Leitura de Arquivos e Introdução ao `pandas`
**Objetivos da Aula**:
- Compreender o que é a biblioteca `pandas` e sua utilidade.
- Aprender a carregar arquivos `.csv` com `pandas`.
- Visualizar e explorar a estrutura dos dados.
- Trabalhar com colunas e linhas em um DataFrame.
- Consolidar os conceitos por meio de exercícios e revisão.

## 🧠 Parte 1 – O que é o `pandas`?
`pandas` é uma biblioteca do Python para análise e manipulação de dados tabulares, como planilhas ou tabelas de banco de dados.

### 📌 Estruturas principais:
- `Series`: coluna única
- `DataFrame`: tabela com linhas e colunas (como Excel)

In [None]:
# Se estiver fora do Colab
 #!pip install pandas

## 📂 Parte 2 – Lendo arquivos CSV com `pandas`

In [None]:
import pandas as pd

In [None]:
import pandas as pd

dados = pd.read_csv("/content/vendas.csv", sep=";") #tenho um DataFrame

dados.head() #5 primeiras linhas

Unnamed: 0,produto,quantidade,preco_unitario,valor_total,custo_total
0,Notebook,10,3500.0,35000.0,28000.0
1,Mouse,50,80.0,4000.0,2500.0
2,Teclado,30,120.0,3600.0,2100.0
3,Monitor,20,900.0,18000.0,14000.0
4,Impressora,15,750.0,11250.0,9000.0


## 🔍 Parte 3 – Explorando os dados

In [None]:
#dados.head() #5 primeiras observações
#dados.tail() #5 últimas observações
#dados.columns # aparece os títulos das colunas
#dados.shape # número de linhas e múmero de colunas
#dados.info() #tipo de dados de cada coluna
#dados.describe() #estatísticas descritivas

Unnamed: 0,quantidade,preco_unitario,valor_total,custo_total
count,5.0,5.0,5.0,5.0
mean,25.0,1070.0,14370.0,11120.0
std,15.811388,1407.018124,12961.847862,10646.454809
min,10.0,80.0,3600.0,2100.0
25%,15.0,120.0,4000.0,2500.0
50%,20.0,750.0,11250.0,9000.0
75%,30.0,900.0,18000.0,14000.0
max,50.0,3500.0,35000.0,28000.0


In [None]:
#visualização "avançada" do dataframe.

display(dados)

Unnamed: 0,produto,quantidade,preco_unitario,valor_total,custo_total
0,Notebook,10,3500.0,35000.0,28000.0
1,Mouse,50,80.0,4000.0,2500.0
2,Teclado,30,120.0,3600.0,2100.0
3,Monitor,20,900.0,18000.0,14000.0
4,Impressora,15,750.0,11250.0,9000.0


## 🧱 Parte 4 – Trabalhando com colunas e linhas

In [None]:
# Acessar colunas
#print(dados["produto"])

print(dados[["produto", "quantidade"]])

      produto  quantidade
0    Notebook          10
1       Mouse          50
2     Teclado          30
3     Monitor          20
4  Impressora          15


In [None]:
# Filtrar valores
dados_filtrados = dados[dados["valor_total"] > 4000]
print(dados_filtrados)

      produto  quantidade  preco_unitario  valor_total  custo_total
0    Notebook          10          3500.0      35000.0      28000.0
3     Monitor          20           900.0      18000.0      14000.0
4  Impressora          15           750.0      11250.0       9000.0


In [None]:
# Criar nova coluna
dados["lucro"] = dados["valor_total"] - dados["custo_total"]
dados.head()

Unnamed: 0,produto,quantidade,preco_unitario,valor_total,custo_total,lucro
0,Notebook,10,3500.0,35000.0,28000.0,7000.0
1,Mouse,50,80.0,4000.0,2500.0,1500.0
2,Teclado,30,120.0,3600.0,2100.0,1500.0
3,Monitor,20,900.0,18000.0,14000.0,4000.0
4,Impressora,15,750.0,11250.0,9000.0,2250.0


## 📊 Parte 5 – Exemplo prático: analisando vendas

In [None]:
dados = pd.read_csv("vendas.csv", sep=";")
dados["lucro"] = dados["valor_total"] - dados["custo_total"]
print("Lucro total:", dados["lucro"].sum())
dados[dados["lucro"] > 500]

## 📝 Parte 6 – Exercícios
### 🔹 Exercício 1
Carregue um CSV de despesas mensais. Mostre:
- As 5 primeiras linhas
- Total de despesas (coluna `valor`)
- Média das despesas

### 🔹 Exercício 2
Com uma planilha de salários (`funcionario`, `salario`, `cargo`):
- Salário médio
- Quantos ganham mais de R$ 5000?
- Crie nova coluna `salario_anual`

### 🔹 Exercício 3
Com `estoque.csv` (`produto`, `quantidade`, `preco`):
- Calcule o valor total de cada produto (quantidade × preço)
- Calcule o valor total do estoque

## 🔁 Parte 7 – Revisão da Aula
| Conceito             | Comando ou explicação            |
|----------------------|----------------------------------|
| Importar pandas      | `import pandas as pd`            |
| Ler arquivo CSV      | `pd.read_csv("arquivo.csv")`     |
| Ver primeiras linhas | `df.head()`                      |
| Acessar colunas      | `df["coluna"]`                   |
| Filtrar linhas       | `df[condição]`                   |
| Criar nova coluna    | `df["nova"] = ...`               |
| Estatísticas básicas | `df.describe()`                  |

## 🧩 Tarefa para Casa
Crie um arquivo `financeiro.csv` com as colunas:
- `mês`, `receita`, `despesa`

Escreva um programa que:
1. Carregue o arquivo
2. Crie a coluna `resultado` (receita - despesa)
3. Mostre o resultado mês a mês
4. Mostre o **saldo acumulado** (soma dos resultados)