## Leitura de Dados

### pd.read_csv(): lê um arquivo CSV e retorna um objeto DataFrame com os dados.
### pd.read_excel(): lê um arquivo Excel e retorna um objeto DataFrame com os dados.

In [None]:
import pandas as pd

# Lendo um arquivo CSV
df_csv = pd.read_csv('dados.csv')

# Lendo um arquivo Excel
df_excel = pd.read_excel('dados.xlsx')


## Visualização e manipulação de dados


### df.head(): exibe as primeiras linhas do DataFrame.
### df.tail(): exibe as últimas linhas do DataFrame.
### df.info(): exibe informações sobre as colunas do DataFrame, como nome, tipo e número de valores não nulos.
### df.describe(): exibe estatísticas descritivas para as colunas numéricas do DataFrame.
### df.shape: retorna uma tupla com o número de linhas e colunas do DataFrame.
### df.columns: retorna uma lista com o nome das colunas do DataFrame.
### df.sort_values(): classifica o DataFrame com base em uma ou mais colunas.
### df.groupby(): agrupa o DataFrame com base em uma ou mais colunas e permite executar operações agregadas nos grupos resultantes.

In [None]:
# Exibindo as primeiras linhas do DataFrame
print(df.head())

# Exibindo as últimas linhas do DataFrame
print(df.tail())

# Exibindo informações sobre as colunas do DataFrame
print(df.info())

# Exibindo estatísticas descritivas para as colunas numéricas do DataFrame
print(df.describe())

# Classificando o DataFrame com base em uma ou mais colunas
df_sorted = df.sort_values(by=['coluna1', 'coluna2'])

# Agrupando o DataFrame com base em uma ou mais colunas
df_grouped = df.groupby(['coluna1', 'coluna2']).sum()


### Manipulação de dados


### df.drop(): remove linhas ou colunas do DataFrame.
### df.fillna(): preenche valores ausentes (NaN) com um valor específico.
### df.replace(): substitui valores em todo o DataFrame.
### df.drop_duplicates(): remove linhas duplicadas do DataFrame.
### df.merge(): combina dois DataFrames com base em uma ou mais colunas.

In [None]:
# Removendo linhas ou colunas do DataFrame
df_drop = df.drop(columns=['coluna1', 'coluna2'])
df_drop_row = df.drop(index=[0, 1, 2])

# Preenchendo valores ausentes (NaN) com um valor específico
df_fillna = df.fillna(0)

# Substituindo valores em todo o DataFrame
df_replace = df.replace({'coluna1': {'valor1': 'novo_valor1', 'valor2': 'novo_valor2'}})

# Removendo linhas duplicadas do DataFrame
df_drop_duplicates = df.drop_duplicates()

# Combinando dois DataFrames com base em uma ou mais colunas
df_merged = pd.merge(df1, df2, on='coluna1')


### Análise de dados

### df.sum(): calcula a soma das colunas numéricas do DataFrame.
### df.mean(): calcula a média das colunas numéricas do DataFrame.
### df.median(): calcula a mediana das colunas numéricas do DataFrame.
### df.min(): retorna o valor mínimo de cada coluna numérica do DataFrame.
### df.max(): retorna o valor máximo de cada coluna numérica do DataFrame.
### df.std(): calcula o desvio padrão das colunas numéricas do DataFrame.
### df.corr(): calcula a correlação entre as colunas numéricas do DataFrame.

In [None]:
# Calculando a soma das colunas numéricas do DataFrame
print(df.sum())

# Calculando a média das colunas numéricas do DataFrame
print(df.mean())

# Calculando a mediana das colunas numéricas do DataFrame
print(df.median())

# Retornando o valor mínimo de cada coluna numérica do DataFrame
print(df.min())

# Retornando o valor máximo de cada coluna numérica do DataFrame
print(df.max())

# Calculando o desvio padrão das colunas numéricas do DataFrame
print(df.std())

# Calculando a correlação entre as colunas numéricas do DataFrame
print(df.corr())
