In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.pipeline import Pipeline
from sklearn.linear_model import LinearRegression
from sklearn.tree import DecisionTreeRegressor
from sklearn.neural_network import MLPRegressor
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score

import sklearn

In [2]:
caminho = '/home/seiji/Documentos/Ebanx/ProjetoGeral/Saude-Mental-Curitiba-Regiao/notebooks/dados_cheirosos.csv'
df = pd.read_csv(caminho)

In [None]:
print('=== Primeiras 5 linhas ===')
display(df.head())
print('\n=== Info do DataFrame ===')
df.info()
print('\n=== Estatísticas descritivas (todas colunas) ===')
display(df.describe(include='all'))
print('\n=== Valores nulos por coluna ===')
missing = df.isna().sum()
missing_pct = 100 * missing / len(df)
display(pd.concat([missing, missing_pct.rename('percent')], axis=1, keys=['missing','percent']))
print('\n=== Tipos de dados ===')
print(df.dtypes)
print('\n=== Amostra aleatória (5 linhas) ===')
display(df.sample(5, random_state=42))

=== Primeiras 5 linhas ===


Unnamed: 0,ano_atendimento,mes_atendimento,sexo_paciente,raca_cor_paciente,cid_categoria_geral,municipio_atendimento,municipio_residencia,quantidade_atendimentos,quantidade_aprovada_procedimento,faixa_etaria,estabelecimento_cnes,procedimento_ambulatorial
0,2014,1,F,branca,Deficiência Intelectual,Curitiba,Fazenda Rio Grande,1,1,Adolescente (13-18),Centro Psiquiátrico Metropolitano (Curitiba),Atendimento Individual
1,2014,1,F,branca,Comport. Infância/Adolescência (TDAH),Curitiba,Campo Magro,1,1,Adolescente (13-18),Centro Psiquiátrico Metropolitano (Curitiba),Atendimento Individual
2,2014,1,F,parda,Comport. Infância/Adolescência (TDAH),Curitiba,Piraquara,1,1,Adolescente (13-18),Centro Psiquiátrico Metropolitano (Curitiba),Atendimento Individual
3,2014,1,M,branca,Deficiência Intelectual,Curitiba,Fazenda Rio Grande,1,1,Adolescente (13-18),Centro Psiquiátrico Metropolitano (Curitiba),Atendimento Individual
4,2014,1,M,branca,Desenv. Psicológico,Curitiba,Colombo,1,1,Adolescente (13-18),Centro Psiquiátrico Metropolitano (Curitiba),Atendimento Individual



=== Info do DataFrame ===
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 342568 entries, 0 to 342567
Data columns (total 12 columns):
 #   Column                            Non-Null Count   Dtype 
---  ------                            --------------   ----- 
 0   ano_atendimento                   342568 non-null  int64 
 1   mes_atendimento                   342568 non-null  int64 
 2   sexo_paciente                     342568 non-null  object
 3   raca_cor_paciente                 342568 non-null  object
 4   cid_categoria_geral               342568 non-null  object
 5   municipio_atendimento             342568 non-null  object
 6   municipio_residencia              342568 non-null  object
 7   quantidade_atendimentos           342568 non-null  int64 
 8   quantidade_aprovada_procedimento  342568 non-null  int64 
 9   faixa_etaria                      342568 non-null  object
 10  estabelecimento_cnes              342568 non-null  object
 11  procedimento_ambulatorial         3425

Unnamed: 0,ano_atendimento,mes_atendimento,sexo_paciente,raca_cor_paciente,cid_categoria_geral,municipio_atendimento,municipio_residencia,quantidade_atendimentos,quantidade_aprovada_procedimento,faixa_etaria,estabelecimento_cnes,procedimento_ambulatorial
count,342568.0,342568.0,342568,342568,342568,342568,342568,342568.0,342568.0,342568,342568,342568
unique,,,2,6,15,17,27,,,5,36,13
top,,,M,branca,Transtornos de Humor (Depressão/Bipolar),Curitiba,Curitiba,,,Adulto (30-59),CAPS II Santa Felicidade (Curitiba),Atendimento Individual
freq,,,173200,170616,95107,190387,181521,,,176313,18959,143931
mean,2019.595858,6.651827,,,,,,1.90096,2.527904,,,
std,3.225092,3.431255,,,,,,3.22059,8.080367,,,
min,2014.0,1.0,,,,,,1.0,1.0,,,
25%,2017.0,4.0,,,,,,1.0,1.0,,,
50%,2019.0,7.0,,,,,,1.0,1.0,,,
75%,2023.0,10.0,,,,,,2.0,2.0,,,



=== Valores nulos por coluna ===


Unnamed: 0,missing,percent
ano_atendimento,0,0.0
mes_atendimento,0,0.0
sexo_paciente,0,0.0
raca_cor_paciente,0,0.0
cid_categoria_geral,0,0.0
municipio_atendimento,0,0.0
municipio_residencia,0,0.0
quantidade_atendimentos,0,0.0
quantidade_aprovada_procedimento,0,0.0
faixa_etaria,0,0.0



=== Tipos de dados ===
ano_atendimento                      int64
mes_atendimento                      int64
sexo_paciente                       object
raca_cor_paciente                   object
cid_categoria_geral                 object
municipio_atendimento               object
municipio_residencia                object
quantidade_atendimentos              int64
quantidade_aprovada_procedimento     int64
faixa_etaria                        object
estabelecimento_cnes                object
procedimento_ambulatorial           object
dtype: object

=== Amostra aleatória (5 linhas) ===


Unnamed: 0,ano_atendimento,mes_atendimento,sexo_paciente,raca_cor_paciente,cid_categoria_geral,municipio_atendimento,municipio_residencia,quantidade_atendimentos,quantidade_aprovada_procedimento,faixa_etaria,estabelecimento_cnes,procedimento_ambulatorial
265020,2021,10,F,não declarado,Diagnóstico Não Especificado,Curitiba,Curitiba,47,47,Adulto (30-59),CAPS AD III CIC (Curitiba),Atendimento Individual
252300,2019,12,F,branca,Uso de Outras Substâncias (Drogas Ilícitas),Pinhais,Pinhais,2,2,Adulto (30-59),CAPS AD Pinhais,Atendimento Individual
194151,2022,6,M,não declarado,Diagnóstico Não Especificado,Curitiba,Curitiba,4,4,Adulto (30-59),CAPS II Santa Felicidade (Curitiba),Atendimento em Grupo
132015,2024,2,M,branca,Esquizofrenia e Psicoses,Pinhais,Pinhais,1,1,Adulto (30-59),CAPS II Pinhais,Atendimento Individual
147955,2020,10,F,branca,Transtornos de Humor (Depressão/Bipolar),Curitiba,Curitiba,1,1,Adolescente (13-18),CAPS Infantil Centro Vida (Curitiba),Atendimento em Grupo
