---
## Biblioteca "**Pandas**"
---

### 2. Pandas 
 - A biblioteca Pandas é uma das ferramentas mais populares em Python para análise e manipulação de dados. Ela fornece estruturas de dados e funções poderosas para trabalhar com dados tabulares, como tabelas e planilhas. 

### 1. Estruturas de Dados Principais
#### - Series:
- É uma estrutura de dados unidimensional, semelhante a um vetor ou uma coluna em uma planilha. Pode conter dados de qualquer tipo (inteiros, strings, floats, etc.).

#### - DataFrame:
- É uma estrutura de dados bidimensional, semelhante a uma tabela ou uma planilha, onde você tem linhas e colunas. É a estrutura de dados mais usada no Pandas para análise e manipulação de dados.

---
## Como utilizar o Pandas
---
#### Aqui está um guia básico sobre como começar a usar o Pandas:

1. Intalação:

- Se você ainda não tem o Pandas instalado, pode instalá-lo usando pip:

`pip install pandas`

2. Importação
---
- Antes de utiliza-lo, precisa importar no seu script ou notebook:  

In [5]:
import pandas as pd

3. Criando Estruturas de Dados
---
- Séries:

In [6]:
# Criando uma Series

data = [10, 20, 30, 40]
series = pd.Series(data)
print(series)


0    10
1    20
2    30
3    40
dtype: int64


- DataFrame

In [7]:
# Criando um DataFrame a partir de um dicionário
data = {
    'Nome': ['Ana', 'José', 'Maria'],
    'Idade': [28, 34, 29]
}
df = pd.DataFrame(data)
print(df)

    Nome  Idade
0    Ana     28
1   José     34
2  Maria     29


4. Leitura e Escrita de Arquivos
---
- Ler de um arquivo CSV:

In [None]:
df = pd.read_csv('caminho/para/o/arquivo.csv')


- Escrever em um arquivo CSV:

In [None]:
df.to_csv('caminho/para/o/arquivo.csv', index=False)


5. Manipulação de Dados
---

- Visualizar as primeiras linhas:

In [10]:
print(df.head())  # Exibe as primeiras 5 linhas


    Nome  Idade
0    Ana     28
1   José     34
2  Maria     29


- Selecionar colunas:

In [11]:
colunas = df[['Nome', 'Idade']]


- Filtrar linhas:

In [12]:
filtro = df[df['Idade'] > 30]


- Adicionar novas colunas:

In [13]:
df['NovaColuna'] = [1, 2, 3]


- Remover colunas:

In [14]:
df = df.drop('NovaColuna', axis=1)


- Agrupar e resumir dados:


In [9]:
resumo = df.groupby('Nome').sum()


6. Manipulação Avançada
---
- Merge (junção de DataFrames):

In [15]:
df1 = pd.DataFrame({'ID': [1, 2], 'Nome': ['Ana', 'José']})
df2 = pd.DataFrame({'ID': [1, 2], 'Idade': [28, 34]})
merged_df = pd.merge(df1, df2, on='ID')


- Pivot Tables (tabelas dinâmicas):

In [16]:
pivot = df.pivot_table(values='Idade', index='Nome', aggfunc='mean')


---
#### Exemplos de uso:
----
Aqui está um exemplo mais completo que lê um arquivo CSV, faz algumas manipulações e salva o resultado:

In [None]:
import pandas as pd

# Ler dados de um arquivo CSV
df = pd.read_csv('dados.csv')

# Exibir as primeiras linhas
print(df.head())

# Filtrar dados
df_filtrado = df[df['Idade'] > 30]

# Adicionar uma nova coluna
df_filtrado['NovaColuna'] = df_filtrado['Idade'] * 2

# Salvar o DataFrame filtrado em um novo arquivo CSV
df_filtrado.to_csv('dados_filtrados.csv', index=False)
