

1. **DataFrame:** O DataFrame é uma estrutura de dados bidimensional, semelhante a uma tabela em um banco de dados ou a uma planilha. Ele é a estrutura de dados fundamental no pandas para armazenar e manipular dados tabulares. Cada coluna em um DataFrame é uma Series.

2. **Series:** A Series é uma estrutura de dados unidimensional que pode armazenar diversos tipos de dados, como números inteiros, valores de ponto flutuante, strings, etc. Uma Series é a estrutura subjacente de cada coluna em um DataFrame.

3. **Leitura e Escrita de Dados:** O pandas fornece funções para ler e escrever dados em diversos formatos, incluindo CSV, Excel, JSON, SQL, entre outros. Isso permite que os cientistas de dados carreguem e salvem dados de diferentes fontes.

4. **Indexação e Seleção:** O pandas oferece várias maneiras de indexar e selecionar dados em um DataFrame ou Series. Isso inclui indexação por rótulos, índices numéricos, condições booleanas, entre outros.

5. **Filtragem e Limpeza de Dados:** As operações de filtragem permitem que você selecione um subconjunto de dados com base em condições. O pandas também oferece recursos para lidar com dados ausentes, como preenchimento e remoção de valores nulos.

6. **Agregação e Groupby:** Você pode realizar operações de agregação em seus dados usando a função `groupby()`. Isso permite que você agrupe os dados com base em uma ou mais colunas e, em seguida, aplique funções de agregação, como soma, média, contagem, etc.

7. **Manipulação de Colunas:** O pandas permite que você crie, renomeie, exclua e reordene colunas em um DataFrame. Isso é útil para preparar os dados antes de realizar análises.

8. **Operações Vetorizadas:** O pandas suporta operações vetoriais, o que significa que você pode aplicar funções e operações em uma coluna inteira ou em várias colunas simultaneamente, sem a necessidade de loops explícitos.

9. **Visualização de Dados:** Embora o pandas não seja uma biblioteca de visualização de dados por si só, ele oferece integração com outras bibliotecas, como Matplotlib e Seaborn, para visualizar seus dados de forma eficiente.

10. **Manipulação de Datas e Horas:** O pandas fornece ferramentas para trabalhar com datas e horários, incluindo conversões de formato, operações de deslocamento de datas e cálculos de intervalo de tempo.





1. **Leitura e Escrita de Dados:**

```python
import pandas as pd

# Lendo um arquivo CSV
data = pd.read_csv('dados.csv')

# Salvando um DataFrame em um arquivo CSV
data.to_csv('novo_dados.csv', index=False)
```

2. **Indexação e Seleção:**

```python
# Selecionando colunas específicas
coluna_especifica = data['Nome_da_Coluna']

# Fatiando linhas
subconjunto = data[10:20]

# Selecionando linhas com base em uma condição
dados_filtrados = data[data['Idade'] > 25]
```

3. **Filtragem e Limpeza de Dados:**

```python
# Preenchendo valores nulos com a média da coluna
data['Salario'].fillna(data['Salario'].mean(), inplace=True)

# Removendo linhas com valores nulos
data_limpo = data.dropna()

# Substituindo valores específicos
data['Genero'].replace('M', 'Masculino', inplace=True)
```

4. **Agregação e Groupby:**

```python
# Agrupando por categoria e calculando a média dos salários
media_salario_por_categoria = data.groupby('Categoria')['Salario'].mean()

# Contando o número de ocorrências por categoria
contagem_categoria = data['Categoria'].value_counts()
```

5. **Manipulação de Colunas:**

```python
# Renomeando colunas
data.rename(columns={'Idade': 'IdadeAnos'}, inplace=True)

# Criando uma nova coluna
data['Nascimento'] = pd.to_datetime(data['DataNascimento'])

# Excluindo uma coluna
data.drop('Genero', axis=1, inplace=True)
```

6. **Operações Vetorizadas:**

```python
# Aplicando uma função em uma coluna
data['IdadeDias'] = data['IdadeAnos'].apply(lambda anos: anos * 365)

# Operações entre colunas
data['SalarioTotal'] = data['Salario'] * data['HorasTrabalhadas']
```

7. **Manipulação de Datas e Horas:**

```python
# Convertendo coluna de datas para formato de data
data['DataVenda'] = pd.to_datetime(data['DataVenda'])

# Calculando a diferença de tempo entre duas datas
data['TempoDecorrido'] = data['DataVenda'] - data['DataCadastro']
```

Lembre-se de que esses são apenas exemplos básicos. O pandas possui uma ampla gama de recursos e funcionalidades, e a documentação oficial é uma excelente fonte para explorar mais detalhes e exemplos: https://pandas.pydata.org/docs/