## Leitura de Dados

### O Pandas oferece uma variedade de funções para ler diferentes tipos de dados, como CSV, Excel, JSON, SQL, entre outros. Essas funções geralmente têm parâmetros que permitem personalizar a leitura dos dados, como separadores de colunas, delimitadores de texto, codificação de caracteres, entre outros. Alguns exemplos de parâmetros comuns são:

#### sep: especifica o separador de colunas no arquivo (padrão é , para arquivos CSV);
#### header: especifica a linha que contém os nomes das colunas (padrão é 0);
#### index_col: especifica a coluna que deve ser usada como índice (padrão é None);
#### na_values: especifica os valores que devem ser tratados como valores ausentes (padrão é None).

In [None]:
import pandas as pd

# Lendo um arquivo CSV
df_csv = pd.read_csv('dados.csv')

# Lendo um arquivo Excel
df_excel = pd.read_excel('dados.xlsx')


## Visualização e manipulação de dados


### O Pandas oferece uma ampla gama de funções para visualizar e manipular dados, incluindo:

#### head(): exibe as primeiras linhas do DataFrame (padrão é 5);
#### tail(): exibe as últimas linhas do DataFrame (padrão é 5);
#### info(): exibe informações sobre as colunas do DataFrame, incluindo o tipo de dados e o número de valores não nulos;
#### describe(): exibe estatísticas descritivas para as colunas numéricas do DataFrame;
#### sort_values(): classifica o DataFrame com base em uma ou mais colunas;
#### groupby(): agrupa o DataFrame com base em uma ou mais colunas e aplica uma função de agregação aos grupos resultantes.


In [None]:
# Exibindo as primeiras linhas do DataFrame
print(df.head())

# Exibindo as últimas linhas do DataFrame
print(df.tail())

# Exibindo informações sobre as colunas do DataFrame
print(df.info())

# Exibindo estatísticas descritivas para as colunas numéricas do DataFrame
print(df.describe())

# Classificando o DataFrame com base em uma ou mais colunas
df_sorted = df.sort_values(by=['coluna1', 'coluna2'])

# Agrupando o DataFrame com base em uma ou mais colunas
df_grouped = df.groupby(['coluna1', 'coluna2']).sum()


### Manipulação de dados


### O Pandas também oferece muitas funções para manipular dados, incluindo:

#### drop(): remove linhas ou colunas do DataFrame;
#### fillna(): preenche valores ausentes (NaN) com um valor específico;
#### replace(): substitui valores em todo o DataFrame;
#### drop_duplicates(): remove linhas duplicadas do DataFrame;
#### merge(): combina dois DataFrames com base em uma ou mais colunas.

In [None]:
# Removendo linhas ou colunas do DataFrame
df_drop = df.drop(columns=['coluna1', 'coluna2'])
df_drop_row = df.drop(index=[0, 1, 2])

# Preenchendo valores ausentes (NaN) com um valor específico
df_fillna = df.fillna(0)

# Substituindo valores em todo o DataFrame
df_replace = df.replace({'coluna1': {'valor1': 'novo_valor1', 'valor2': 'novo_valor2'}})

# Removendo linhas duplicadas do DataFrame
df_drop_duplicates = df.drop_duplicates()

# Combinando dois DataFrames com base em uma ou mais colunas
df_merged = pd.merge(df1, df2, on='coluna1')


### Análise de dados

### O Pandas oferece muitas funções para análise de dados, incluindo:

#### sum(): calcula a soma das colunas numéricas do DataFrame;
#### mean(): calcula a média das colunas numéricas do DataFrame;
#### median(): calcula a mediana das colunas numéricas do DataFrame;
#### min(): retorna o valor mínimo de cada coluna numérica do DataFrame;
#### max(): retorna o valor máximo de cada coluna numérica do DataFrame;
#### std(): calcula o desvio padrão das colunas numéricas do DataFrame;
#### corr(): calcula a correlação entre as colunas numéricas do DataFrame.
### Essas funções podem ser usadas em conjunto com outras funções do Pandas para realizar análises mais avançadas, como análise de séries temporais, análise de texto, análise de dados geoespaciais, entre outros.

### Além disso, o Pandas oferece muitas outras funções e recursos avançados, como suporte a dados hierárquicos, suporte a dados em tempo real, suporte a dados esparsos

In [None]:
# Calculando a soma das colunas numéricas do DataFrame
print(df.sum())

# Calculando a média das colunas numéricas do DataFrame
print(df.mean())

# Calculando a mediana das colunas numéricas do DataFrame
print(df.median())

# Retornando o valor mínimo de cada coluna numérica do DataFrame
print(df.min())

# Retornando o valor máximo de cada coluna numérica do DataFrame
print(df.max())

# Calculando o desvio padrão das colunas numéricas do DataFrame
print(df.std())

# Calculando a correlação entre as colunas numéricas do DataFrame
print(df.corr())
