MODULO 1: Introducao ao pandas

 Vamos cobrir o essencial: carregar dados, inspecioná-los e fazer as primeiras manipulações.

Passo 1: Impotando a biblioteca

In [6]:
#Importando o pandas
import pandas as pd

Passo 2: Carregando os dados

Simularei um conjunto de dados sobre pacientes de uma clinica odontologica. Arquivo 001.csv

In [7]:
# Carregando o arquivo do nosso data frame de exemplo
df = pd.read_csv('001.csv')

Passo 3: Explorando o data frame

Uma vez que os dados estão carregados, a primeira coisa a fazer é inspecioná-los para entender sua estrutura.

In [5]:
# Mostra as primeiras 5 linhas do df

print("Primeiras 5 linhas")
print(df.head())

# Mostra as ultimas 5 linhas do df
print("Ultimas 5 linhas")
print(df.tail())

# Fornece um resum do DF, incluido tipos de dados
print("Info do Data Frame")
print(df.info())

# Mostra as estatisticas descritivas para colunas numericas
print("Estatisticas descritivas")
print(df.describe())

Primeiras 5 linhas
   ID_Paciente             Nome  Idade Sexo   Tratamento   Valor Data_Consulta
0            1       João Silva     25    M      Limpeza   150.0    2025-08-01
1            2      Maria Souza     30    F  Clareamento   800.0    2025-08-05
2            3     Pedro Santos     45    M        Canal  1200.5    2025-08-08
3            4        Ana Costa     22    F     Extração   350.0    2025-08-10
4            5  Carlos Ferreira     55    M     Implante  5000.0    2025-08-12
Ultimas 5 linhas
   ID_Paciente              Nome  Idade Sexo   Tratamento   Valor  \
5            6     Fernanda Lima     33    F      Limpeza   150.0   
6            7  Gustavo Oliveira     29    M  Clareamento   800.0   
7            8   Sofia Rodrigues     40    F        Canal  1200.5   
8            9     Bruno Almeida     28    M     Extração   350.0   
9           10    Julia Carvalho     60    F     Implante  5000.0   

  Data_Consulta  
5    2025-08-15  
6    2025-08-18  
7    2025-08-20  
8  

O que você deve observar na saída:

df.head(): Confirma se os dados foram carregados corretamente.

df.info(): Mostra quantas linhas (entradas) e colunas existem, e, crucialmente, os tipos de dados de cada coluna (int64, float64, object). Veja que Data_Consulta é do tipo object (texto), algo que precisaremos tratar no futuro.

df.describe(): Dá uma visão rápida sobre as colunas numéricas, mostrando a contagem, média, desvio padrão, mínimo e máximo.

Passo 4: Selecionando Colunas e Linhas

A seleção de dados é uma das operações mais comuns.

In [8]:
# Selecionando uma unica coluna(resultado é uma Series)
nome_pacientes = df['Nome']
print('\n Coluna de nomes')
print(nome_pacientes)

# Selecionando multiplas colunas (resultado é um novo DataFrame)
dados_basicos = df[['Nome', 'Idade', 'Tratamento']]
print('Imprimindo nome, idade e tratamento do paciente')
print(dados_basicos)

# Selecionando a primeira linha
primeiro_paciente = df.iloc[0]
print("Dados do primeiro paciente")
print(primeiro_paciente)


 Coluna de nomes
0          João Silva
1         Maria Souza
2        Pedro Santos
3           Ana Costa
4     Carlos Ferreira
5       Fernanda Lima
6    Gustavo Oliveira
7     Sofia Rodrigues
8       Bruno Almeida
9      Julia Carvalho
Name: Nome, dtype: object
Imprimindo nome, idade e tratamento do paciente
               Nome  Idade   Tratamento
0        João Silva     25      Limpeza
1       Maria Souza     30  Clareamento
2      Pedro Santos     45        Canal
3         Ana Costa     22     Extração
4   Carlos Ferreira     55     Implante
5     Fernanda Lima     33      Limpeza
6  Gustavo Oliveira     29  Clareamento
7   Sofia Rodrigues     40        Canal
8     Bruno Almeida     28     Extração
9    Julia Carvalho     60     Implante
Dados do primeiro paciente
ID_Paciente               1
Nome             João Silva
Idade                    25
Sexo                      M
Tratamento          Limpeza
Valor                 150.0
Data_Consulta    2025-08-01
Name: 0, dtype: object


Passo 5: Filtragem de dados

Filtrar dados é como usar um filtro do excel para encontrar um subconjunto de dados que atende a uma condicao

In [9]:
# Filtrando pacientes do sexo feminino
Pacientes_f = df[df['Sexo'] == 'F']
print("Pacientes do sexo feminino")
print(Pacientes_f)

# Filtrando pacientes do sexo masculino
paciente_m = df[df['Sexo'] == 'M']
print("Pacientes do sexo masculino")
print(paciente_m)

# Filtrando pacientes com mais de 30 anos
pacientesAcima30 = df[df['Idade'] > 30]
print("Paciente com mais de 30 anos de idade")
print(pacientesAcima30)


Pacientes do sexo feminino
   ID_Paciente             Nome  Idade Sexo   Tratamento   Valor Data_Consulta
1            2      Maria Souza     30    F  Clareamento   800.0    2025-08-05
3            4        Ana Costa     22    F     Extração   350.0    2025-08-10
5            6    Fernanda Lima     33    F      Limpeza   150.0    2025-08-15
7            8  Sofia Rodrigues     40    F        Canal  1200.5    2025-08-20
9           10   Julia Carvalho     60    F     Implante  5000.0    2025-08-25
Pacientes do sexo masculino
   ID_Paciente              Nome  Idade Sexo   Tratamento   Valor  \
0            1        João Silva     25    M      Limpeza   150.0   
2            3      Pedro Santos     45    M        Canal  1200.5   
4            5   Carlos Ferreira     55    M     Implante  5000.0   
6            7  Gustavo Oliveira     29    M  Clareamento   800.0   
8            9     Bruno Almeida     28    M     Extração   350.0   

  Data_Consulta  
0    2025-08-01  
2    2025-08-08  
4 