# Pandas em poucos minutos

---



### Instalação e importação

In [None]:
import pandas as pd

### DataFrames e Series

In [None]:
dados = {
    "Nome": ["Ana", "Bruno", "Carlos"],
    "Idade": [25, 47, 32],
}
df = pd.DataFrame(dados)
df

In [None]:
s = pd.Series([10, 20, 30])
s

### Lendo tabelas

In [None]:
df = pd.read_csv('funcionarios.csv')
df

### Manipulação básica de dados

In [None]:
df.head()

In [None]:
df.tail()

In [None]:
df[['Nome', 'Idade']]

In [None]:
df['Idade']

### Séries booleanas e filtros

In [None]:
df['Idade'] > 30

In [None]:
df[df['Idade'] > 30]

In [None]:
df[df['Salário'] > 5000]

### Combinando filtros

In [None]:
filtro_maior_que_30 = df['Idade'] > 30
filtro_mais_de_5mil = df['Salário'] > 5000

df[filtro_maior_que_30 & filtro_mais_de_5mil]

### Criando e removendo colunas

In [None]:
df['Salário Anual'] = df['Salário'] * 12
df

In [None]:
df = df.drop('Salário Anual', axis=1)
df

### Resumindo dados

In [None]:
df.info()

In [None]:
df.describe()

In [None]:
df['Salário'].sum()

In [None]:
df['Salário'].mean()

### Limpeza de dados

In [None]:
df = pd.read_csv('funcionarios_nulos.csv')
df

In [None]:
df.dropna()

In [None]:
df.dropna(subset="Idade")

In [None]:
media_idade = df['Idade'].mean()
df['Idade'] = df['Idade'].fillna(media_idade)
df

In [None]:
df['Idade'] = df['Idade'].astype(int)
df

### Contando ocorrências

In [None]:
df = pd.read_csv('funcionarios.csv')

In [None]:
df['Ativo'].value_counts()

In [None]:
df['ID Departamento'].value_counts()

### Operações de agregação

In [None]:
df.groupby('ID Departamento')

In [None]:
df.groupby('ID Departamento')['Salário'].mean()

In [None]:
df.groupby('ID Departamento')['Salário'].sum()

In [None]:
df.groupby('ID Departamento')['Salário'].max()

### Ordenando dados

In [None]:
df.sort_values(by='Salário')

In [None]:
df.sort_values(by='Salário', ascending=False)

### Combinando dados

In [None]:
df_dept = pd.read_csv('departamentos.csv')
df_dept

In [None]:
df_final = pd.merge(df, df_dept)
df_final

In [None]:
df_final = pd.merge(df, df_dept, left_on='ID Departamento', right_on='ID Departamento')
df_final

In [None]:
df_novos = pd.read_csv('novos_funcionarios.csv')
df_novos

In [None]:
df_todos = pd.concat([df, df_novos], ignore_index=True)
df_todos

### Escrevendo dados em arquivos

In [None]:
df_todos.to_excel('todos_funcionarios.csv')