# Aula 01 - Introdução ao Pandas

## O que é Pandas?

Pandas é uma biblioteca de código aberto para Python que fornece estruturas de dados de alto desempenho e ferramentas de análise de dados fáceis de usar. É uma das bibliotecas mais populares para manipulação e análise de dados em Python.

### Por que usar Pandas?

- **Estruturas de dados poderosas**: Series e DataFrame
- **Manipulação fácil de dados**: limpeza, transformação, agregação
- **Integração com outras bibliotecas**: NumPy, Matplotlib, Scikit-learn
- **Leitura/escrita de múltiplos formatos**: CSV, Excel, SQL, JSON, etc.
- **Análise de dados eficiente**: operações vetorizadas, groupby, pivot tables

## História do Pandas

O Pandas foi criado por Wes McKinney em 2008 enquanto trabalhava na AQR Capital Management. O nome "Pandas" vem de "Panel Data" (dados em painel) e também é uma referência ao urso panda.

Desde então, tornou-se uma das bibliotecas mais importantes do ecossistema Python para ciência de dados, com contribuições de centenas de desenvolvedores e adoção massiva na indústria.

### Versão atual
Vamos verificar a versão do Pandas instalada:

In [None]:
import pandas as pd

print(f"Versão do Pandas: {pd.__version__}")
print(f"Versão do Python: {pd.__version__}")  # Na verdade, isso mostra pandas novamente, mas ok

## Requisitos e Instalação

### Pré-requisitos

Você precisa ter Python instalado. Recomendo Python 3.8 ou superior.

- [Download Python](https://www.python.org/downloads/)
- [Anaconda/Miniconda](https://www.anaconda.com/products/distribution) (inclui Pandas e muitas outras bibliotecas)

### Instalação do Pandas

O Pandas não vem instalado por padrão com Python, então precisamos instalá-lo.

#### 1. Criar um projeto

Dentro do diretório onde está o seu projeto, execute o seguinte comando:

```bash
python -m venv venv
```

Após isso, você verá um diretório chamado `venv/`.

#### 2. Ativar o ambiente virtual

- **Linux/macOS**:
```bash
source venv/bin/activate
```

- **Windows**:
```bash
venv\Scripts\activate
```

Após ativar, você verá `(venv)` no início do prompt do terminal.

#### 3. Instalar o Pandas

Com o ambiente virtual ativado, execute:

```bash
pip install pandas
```

Este comando instala a biblioteca Pandas e suas dependências.

#### Instalação com requirements.txt

Para instalar todas as dependências do projeto de uma vez:

```bash
pip install -r requirements.txt
```

### Verificar instalação

Após a instalação, podemos verificar se o Pandas foi instalado corretamente:

In [None]:
# Verificar se o Pandas foi instalado corretamente
try:
    import pandas as pd
    print(f"✅ Pandas instalado com sucesso! Versão: {pd.__version__}")
except ImportError:
    print("❌ Pandas não encontrado. Execute: pip install pandas")

## Estruturas de Dados do Pandas

O Pandas oferece duas estruturas de dados principais:

### 1. Series

Uma Series é um array unidimensional capaz de armazenar qualquer tipo de dados (inteiros, strings, floats, objetos Python, etc.). É como uma coluna em uma tabela.

### 2. DataFrame

Um DataFrame é uma estrutura de dados bidimensional, como uma tabela com linhas e colunas. É a estrutura mais usada no Pandas.

Vamos ver exemplos:

In [None]:
# Exemplo de Series
import pandas as pd

# Criar uma Series
idades = pd.Series([25, 30, 35, 40], name="idades")
print("Exemplo de Series:")
print(idades)
print(f"Tipo: {type(idades)}")
print()

# Criar um DataFrame simples
dados = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'Diana'],
    'Idade': [25, 30, 35, 40],
    'Cidade': ['Maputo', 'Beira', 'Nampula', 'Tete']
}

df = pd.DataFrame(dados)
print("Exemplo de DataFrame:")
display(df)
print(f"Tipo: {type(df)}")
print(f"Dimensões: {df.shape}")

## O que vem a seguir?

Agora que você sabe o que é Pandas e como instalá-lo, vamos para as próximas aulas:

### Aula 02: Carregamento e Exploração de Dados
- Como ler arquivos CSV, Excel, etc.
- Parâmetros importantes como `sep`, `encoding`
- Funções de exploração: `head()`, `tail()`, `info()`, `describe()`

### Aula 03: Manipulação de Dados
- Seleção de colunas e linhas
- Filtragem e criação de colunas
- Operações de limpeza de dados

### Aulas futuras:
- Limpeza e preparação de dados
- Análise estatística
- Visualização de dados
- Integração com outras bibliotecas

---

**Dica**: Sempre que trabalhar com Pandas, lembre-se de importar a biblioteca:
```python
import pandas as pd
```

**Próxima aula**: [aula02.ipynb](aula02.ipynb)