# Análise Demanda de Atendimentos para Clínica Médica
Considerando cenário com 4 ou com 3 médicos atendendo

# 1. Importando bibliotecas, tabelas e conferindo os dados

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
# Importando tabelas

jan25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/janeiro25.xlsx')
fev25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/fevereiro25.xlsx')
mar25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/marco25.xlsx')
abr25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/abril25.xlsx')
mai25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/maio25.xlsx')
jun25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/junho25.xlsx')
jul25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/julho25.xlsx')
ago25 = pd.read_excel('/Users/diogenes/Documents/UPA/Demanda 25-7-2025/agosto25.xlsx')

df25 = pd.concat([jan25, fev25, mar25, abr25, mai25, jun25, jul25, ago25], ignore_index=True)
  

In [3]:
df25.shape

(91108, 49)

In [4]:
len(df25)
print(f'Número de atendimentos em 2025:{len(df25)}')

Número de atendimentos em 2025:91108


In [5]:
df25.columns

Index(['prontuario_id', 'prontuario_unico', 'paciente_sexo',
       'paciente_telefone', 'paciente_endereco_complemento',
       'paciente_data_nascimento', 'paciente_documento', 'paciente_cartao_sus',
       'paciente_uf', 'paciente_municipio', 'paciente_bairro',
       'paciente_numero_lote', 'paciente_endereco', 'paciente_cep',
       'paciente_mae', 'paciente_responsavel', 'paciente_cor_raca',
       'estabelecimento', 'queixa_principal', 'classificacao_paciente_id',
       'data_chegada', 'complemento_dados_clinicos', 'cid', 'exames_fisicos',
       'hipotese_diagnostica', 'queixa_principal_dados_clinicos',
       'antecedentes_dados_clinicos', 'data_fila', 'setor', 'verde', 'amarelo',
       'laranja', 'vermelho', 'azul', 'classificacao_nome', 'encerramento',
       'encerramento_id', 'profissional_atendimento', 'profissional_cpf',
       'profissional_conselho_uf', 'paciente_idade_ano', 'data_altera',
       'data_cadastro', 'resultados_exames', 'profissional_sigla_conselho',
  

In [6]:
df25.head(5).T

Unnamed: 0,0,1,2,3,4
prontuario_id,3977138,3977153,3977157,3977173,3977176
prontuario_unico,1705354,1705362,330453,332282,94908
paciente_sexo,F,F,M,M,F
paciente_telefone,8699255507,8694313188,- 86988666838,8699607875,86995103919 - 8699432620
paciente_endereco_complemento,,,,,
paciente_data_nascimento,02/11/2023,25/12/1967,11/01/1999,28/08/2003,04/10/1993
paciente_documento,01083406353,35241144315,08127750310,,06136020300
paciente_cartao_sus,708202131198548.0,704705776267138.0,898004836075582.0,898003962930304.0,705206481063276.0
paciente_uf,PI,PI,PI,PI,PI
paciente_municipio,TERESINA,TERESINA,TERESINA,TERESINA,TERESINA


# 2. Filtrei colunas de interesse para análise

In [7]:
# Passo 1: Definir as colunas de interesse
colunas_interesse = [
    'prontuario_id', 
    'prontuario_unico', 
    'paciente_data_nascimento', 
    'queixa_principal',
    'classificacao_paciente_id',
    'data_chegada',
    'data_fila',
    'setor',
    'verde',
    'amarelo', 
    'laranja',
    'vermelho',
    'azul',
    'classificacao_nome',
    'encerramento',
    'encerramento_id',
    'profissional_atendimento',
    'data_cadastro',
    'profissional_codigo_conselho',
    'data_atendimento'
]

print("Colunas selecionadas:")
for i, coluna in enumerate(colunas_interesse, 1):
    print(f"{i}. {coluna}")

Colunas selecionadas:
1. prontuario_id
2. prontuario_unico
3. paciente_data_nascimento
4. queixa_principal
5. classificacao_paciente_id
6. data_chegada
7. data_fila
8. setor
9. verde
10. amarelo
11. laranja
12. vermelho
13. azul
14. classificacao_nome
15. encerramento
16. encerramento_id
17. profissional_atendimento
18. data_cadastro
19. profissional_codigo_conselho
20. data_atendimento


## Copiei dataframe apenas com colunas de interesse para não alterar o original

tive que tirar complemento, cid e hipotese pq tinham muitos nulos

In [8]:
# Passo 2: Criar o dataframe filtrado
# Usamos df25[lista_colunas] para pegar só as colunas que queremos
# .copy() faz uma cópia para não alterar o original

df_filtrado = df25[colunas_interesse].copy()

# Vamos ver o resultado
print(f"Antes: {df25.shape[1]} colunas")
print(f"Depois: {df_filtrado.shape[1]} colunas")
print(f"Mantivemos {len(colunas_interesse)} colunas importantes")

Antes: 49 colunas
Depois: 20 colunas
Mantivemos 20 colunas importantes


# 3. Tipos de dados

In [9]:
# Passo 1: Ver os tipos de dados atuais
print("TIPOS DE DADOS ATUAIS:")
print(df_filtrado.dtypes)

TIPOS DE DADOS ATUAIS:
prontuario_id                     int64
prontuario_unico                  int64
paciente_data_nascimento         object
queixa_principal                 object
classificacao_paciente_id         int64
data_chegada                     object
data_fila                        object
setor                            object
verde                            object
amarelo                          object
laranja                          object
vermelho                         object
azul                             object
classificacao_nome               object
encerramento                     object
encerramento_id                 float64
profissional_atendimento         object
data_cadastro                    object
profissional_codigo_conselho      int64
data_atendimento                 object
dtype: object


In [10]:
# Passo 2: Converter IDs para string (texto)
# IDs não fazemos conta, então devem ser texto

print("Convertendo IDs para string...")
df_filtrado['prontuario_id'] = df_filtrado['prontuario_id'].astype(str)
df_filtrado['prontuario_unico'] = df_filtrado['prontuario_unico'].astype(str)
df_filtrado['classificacao_paciente_id'] = df_filtrado['classificacao_paciente_id'].astype(str)
df_filtrado['encerramento_id'] = df_filtrado['encerramento_id'].astype(str)
df_filtrado['profissional_codigo_conselho'] = df_filtrado['profissional_codigo_conselho'].astype(str)

print("IDs convertidos para string!")
df_filtrado.dtypes

Convertendo IDs para string...
IDs convertidos para string!


prontuario_id                   object
prontuario_unico                object
paciente_data_nascimento        object
queixa_principal                object
classificacao_paciente_id       object
data_chegada                    object
data_fila                       object
setor                           object
verde                           object
amarelo                         object
laranja                         object
vermelho                        object
azul                            object
classificacao_nome              object
encerramento                    object
encerramento_id                 object
profissional_atendimento        object
data_cadastro                   object
profissional_codigo_conselho    object
data_atendimento                object
dtype: object

In [32]:
# Passo 3: Converter datas
# Vamos manter todas como datetime64 para poder fazer análises

print("Convertendo  as datas para datetime64...")

# Todas as datas como datetime
df_filtrado['paciente_data_nascimento'] = pd.to_datetime(df_filtrado['paciente_data_nascimento'], dayfirst=True)
df_filtrado['data_chegada'] = pd.to_datetime(df_filtrado['data_chegada'], dayfirst=True)
df_filtrado['data_fila'] = pd.to_datetime(df_filtrado['data_fila'], dayfirst=True)
df_filtrado['data_cadastro'] = pd.to_datetime(df_filtrado['data_cadastro'], dayfirst=True)
df_filtrado['data_atendimento'] = pd.to_datetime(df_filtrado['data_atendimento'], dayfirst=True)

print("Conversão concluída")

# Verificar se deu certo
print("\nTipos das colunas de data:")
colunas_data = ['paciente_data_nascimento', 'data_chegada', 'data_fila', 'data_cadastro', 'data_atendimento']
for coluna in colunas_data:
    print(f"{coluna}: {df_filtrado[coluna].dtype}")

Convertendo  as datas para datetime64...
Conversão concluída

Tipos das colunas de data:
paciente_data_nascimento: datetime64[ns]
data_chegada: datetime64[ns]
data_fila: datetime64[ns]
data_cadastro: datetime64[ns]
data_atendimento: datetime64[ns]


In [34]:
#Verificando
df_filtrado.head().T

Unnamed: 0,0,1,2,3,4
prontuario_id,3977138,3977153,3977157,3977173,3977176
prontuario_unico,1705354,1705362,330453,332282,94908
paciente_data_nascimento,2023-11-02 00:00:00,1967-12-25 00:00:00,1999-01-11 00:00:00,2003-08-28 00:00:00,1993-10-04 00:00:00
queixa_principal,MAL ESTAR EM CRIANCA,"DOR DE CABECA (CEFALEIA), TONTURA OU VERTIGEM",QUEIMADURA POR FOGO,MORDEDURAS E PICADAS,MAL ESTAR EM ADULTO
classificacao_paciente_id,6875649,6875668,6875672,6875694,6875697
data_chegada,2025-01-01 00:25:00,2025-01-01 00:58:00,2025-01-01 01:11:00,2025-01-01 01:25:00,2025-01-01 01:45:00
data_fila,2025-01-01 00:25:00,2025-01-01 00:58:00,2025-01-01 01:11:00,2025-01-01 01:25:00,2025-01-01 01:45:00
setor,CONSULTORIO PEDIATRICO,CONSULTORIO CLINICO,SALA DE SUTURA,CONSULTORIO CLINICO,CONSULTORIO CLINICO
verde,,X,X,X,X
amarelo,X,,,,


# 4. Análise descritiva

In [35]:
# ANÁLISE DE DEMANDA

# Passo 1: Total de atendimentos (conceito: contar linhas)
total_atendimentos = len(df_filtrado)
print(f"Total de atendimentos: {total_atendimentos:,}")
print("   (Cada linha = 1 atendimento)")

# Passo 2: Descobrir período dos dados (conceito: min e max de datas)
data_minima = df_filtrado['data_chegada'].min()
data_maxima = df_filtrado['data_chegada'].max()

print(f"\nPeríodo analisado:")
print(f"   Início: {data_minima.strftime('%d/%m/%Y')}")
print(f"   Fim: {data_maxima.strftime('%d/%m/%Y')}")

# Passo 3: Calcular dias (conceito: diferença entre datas)
dias_totais = (data_maxima - data_minima).days + 1  # +1 inclui o primeiro dia
print(f"   Total: {dias_totais} dias")

# Passo 4: Média por dia (conceito: divisão simples)
media_por_dia = total_atendimentos / dias_totais
print(f"\nDEMANDA MÉDIA: {media_por_dia:.1f} pacientes/dia")
print("   (Isso é o que 'chega' na UPA por dia)")

Total de atendimentos: 91,108
   (Cada linha = 1 atendimento)

Período analisado:
   Início: 01/01/2025
   Fim: 29/08/2025
   Total: 241 dias

DEMANDA MÉDIA: 378.0 pacientes/dia
   (Isso é o que 'chega' na UPA por dia)


In [14]:
# FILTRO PARA CLÍNICA MÉDICA
df_filtrado['setor'].value_counts()

setor
CONSULTORIO CLINICO         61703
CONSULTORIO PEDIATRICO      18626
SALA DE SUTURA               5353
CONSULTORIO ODONTOLOGICO     2705
SALA DE MEDICACAO             293
SALA DE PROCEDIMENTO          191
SALA DE ESTABILIZACAO         136
OBSERVACAO                      6
CONSULTORIO ORTOPEDICO          4
CONSULTORIO COVID               3
SALA DE INALACAO                3
SALA VERMELHA                   2
SERVICO SOCIAL                  1
Name: count, dtype: int64

In [15]:
print("DIAGNÓSTICO DE VALORES NULOS:")
print(f"Valores nulos em 'setor': {df_filtrado['setor'].isna().sum()}")

DIAGNÓSTICO DE VALORES NULOS:
Valores nulos em 'setor': 2082


Claramente existem muitas opções (13) de setor para alocar, além de quase 2 mil valores nulos. Vou excluir os que claramente são cirúrgicos ou pediátrico, colocar o resto como clínica médica.

In [16]:
# ANÁLISE DE CLÍNICA MÉDICA - Lógica de Exclusão

# Passo 1: Verificar valores nulos primeiro
print("Verificando valores nulos em 'setor':")
nulos_setor = df_filtrado['setor'].isna().sum()
print(f"Valores nulos encontrados: {nulos_setor}")

# Passo 2: Tratar valores nulos (assumir clínica médica)
if nulos_setor > 0:
    print("Substituindo valores nulos por 'CONSULTORIO CLINICO'")
    df_filtrado['setor'] = df_filtrado['setor'].fillna('CONSULTORIO CLINICO')

# Passo 3: Definir setores que NÃO são clínica médica
setores_excluir = [
    'SALA DE SUTURA', 
    'CONSULTORIO PEDIATRICO', 
    'CONSULTORIO ODONTOLOGICO', 
    'CONSULTORIO ORTOPEDICO', 
    'SERVICO SOCIAL'
]

print(f"\nSetores excluídos da clínica médica: {setores_excluir}")

# Passo 4: Aplicar filtro de exclusão
df_clinica_medica = df_filtrado[~df_filtrado['setor'].isin(setores_excluir)].copy()

print(f"\nResultado:")
print(f"Total geral: {len(df_filtrado):,} atendimentos")
print(f"Clínica médica: {len(df_clinica_medica):,} atendimentos")
print(f"Percentual: {len(df_clinica_medica)/len(df_filtrado)*100:.1f}% do total")

Verificando valores nulos em 'setor':
Valores nulos encontrados: 2082
Substituindo valores nulos por 'CONSULTORIO CLINICO'

Setores excluídos da clínica médica: ['SALA DE SUTURA', 'CONSULTORIO PEDIATRICO', 'CONSULTORIO ODONTOLOGICO', 'CONSULTORIO ORTOPEDICO', 'SERVICO SOCIAL']

Resultado:
Total geral: 91,108 atendimentos
Clínica médica: 64,419 atendimentos
Percentual: 70.7% do total


## Clínica Médica


In [17]:
# ANÁLISE DE CLÍNICA MÉDICA - Lógica de Exclusão

# Definir setores que NÃO são clínica médica
setores_excluir = [
    'SALA DE SUTURA',
    'CONSULTORIO PEDIATRICO',
    'CONSULTORIO ODONTOLOGICO',
    'CONSULTORIO ORTOPEDICO',
    'SERVICO SOCIAL'
]

print(f"\nSetores excluídos da clínica médica: {setores_excluir}")

# Passo 4: Aplicar filtro de exclusão
df_clinica_medica = df_filtrado[~df_filtrado['setor'].isin(setores_excluir)].copy()

print(f"\nResultado:")
print(f"Total geral: {len(df_filtrado):,} atendimentos")
print(f"Clínica médica: {len(df_clinica_medica):,} atendimentos")
print(f"Percentual: {len(df_clinica_medica)/len(df_filtrado)*100:.1f}% do total")



Setores excluídos da clínica médica: ['SALA DE SUTURA', 'CONSULTORIO PEDIATRICO', 'CONSULTORIO ODONTOLOGICO', 'CONSULTORIO ORTOPEDICO', 'SERVICO SOCIAL']

Resultado:
Total geral: 91,108 atendimentos
Clínica médica: 64,419 atendimentos
Percentual: 70.7% do total


In [18]:
# DEMANDA DE CLÍNICA MÉDICA

# Calcular demanda diária de clínica médica
data_minima = df_clinica_medica['data_chegada'].min()
data_maxima = df_clinica_medica['data_chegada'].max()
dias_periodo = (data_maxima - data_minima).days + 1

media_clinica_dia = len(df_clinica_medica) / dias_periodo

print("DEMANDA DE CLÍNICA MÉDICA:")
print(f"Período: {data_minima.strftime('%d/%m/%Y')} a {data_maxima.strftime('%d/%m/%Y')}")
print(f"Total de dias: {dias_periodo}")
print(f"Média por dia: {media_clinica_dia:.1f} pacientes/dia")

print("\nCOMPARAÇÃO GERAL vs CLÍNICA MÉDICA:")
media_geral_dia = len(df_filtrado) / dias_periodo
print(f"Demanda geral: {media_geral_dia:.1f} pacientes/dia")
print(f"Demanda clínica médica: {media_clinica_dia:.1f} pacientes/dia")
print(f"Clínica médica representa {media_clinica_dia/media_geral_dia*100:.1f}% da demanda total")

DEMANDA DE CLÍNICA MÉDICA:
Período: 01/01/2025 a 29/08/2025
Total de dias: 241
Média por dia: 267.3 pacientes/dia

COMPARAÇÃO GERAL vs CLÍNICA MÉDICA:
Demanda geral: 378.0 pacientes/dia
Demanda clínica médica: 267.3 pacientes/dia
Clínica médica representa 70.7% da demanda total


In [None]:
# TABELA DINÂMICA

print("CONCEITO DE TABELA DINÂMICA:")
print("É como 'resumir' dados grandes em informações úteis")
print("Exemplo: 64.000 atendimentos → quantos por hora do dia?")

# Passo 1: Extrair hora da chegada
print("\nPasso 1: Extrair hora da data_chegada")
df_clinica_medica['hora_chegada'] = df_clinica_medica['data_chegada'].dt.hour
print("Criamos nova coluna 'hora_chegada' (0 a 23)")

# Passo 2: Tabela dinâmica simples - contar por hora
print("\nPasso 2: TABELA DINÂMICA - Atendimentos por hora")
print("Conceito: 'Para cada hora, contar quantos atendimentos'")
atend_por_hora = df_clinica_medica['hora_chegada'].value_counts().sort_index()

print("\nPrimeiras 6 horas:")
for hora in range(6):
    qtd = atend_por_hora.get(hora, 0)
    print(f"  {hora:2d}h: {qtd:,} atendimentos")

print("\nHorário de pico:")
hora_pico = atend_por_hora.idxmax()
qtd_pico = atend_por_hora.max()
print(f"  {hora_pico}h: {qtd_pico:,} atendimentos (maior movimento)")

CONCEITO DE TABELA DINÂMICA:
É como 'resumir' dados grandes em informações úteis
Exemplo: 64.000 atendimentos → quantos por hora do dia?

Passo 1: Extrair hora da data_chegada
Criamos nova coluna 'hora_chegada' (0 a 23)

Passo 2: TABELA DINÂMICA - Atendimentos por hora
Conceito: 'Para cada hora, contar quantos atendimentos'

Primeiras 6 horas:
   0h: 840 atendimentos
   1h: 605 atendimentos
   2h: 425 atendimentos
   3h: 391 atendimentos
   4h: 335 atendimentos
   5h: 643 atendimentos

Horário de pico:
  9h: 5,103 atendimentos (maior movimento)


In [20]:
# TURNOS REAIS: Diurno (7-19h) e Noturno (19-7h)

print("TABELA DINÂMICA POR TURNOS:")
print("Diurno: 7h às 19h (12 horas)")  
print("Noturno: 19h às 7h (12 horas)")

# Criar coluna de turno
def definir_turno(hora):
    if 7 <= hora < 19:
        return 'Diurno'
    else:
        return 'Noturno'

# Aplicar função para cada linha (conceito: aplicar regra em massa)
df_clinica_medica['turno'] = df_clinica_medica['hora_chegada'].apply(definir_turno)

# Tabela dinâmica por turno
print("\nTABELA DINÂMICA: Atendimentos por turno")
atend_por_turno = df_clinica_medica['turno'].value_counts()

for turno, qtd in atend_por_turno.items():
    percentual = qtd / len(df_clinica_medica) * 100
    media_dia_turno = qtd / dias_periodo
    print(f"{turno}: {qtd:,} atendimentos ({percentual:.1f}%)")
    print(f"         = {media_dia_turno:.1f} pacientes/dia neste turno")

print(f"\nTotal verificação: {atend_por_turno.sum():,} atendimentos")

TABELA DINÂMICA POR TURNOS:
Diurno: 7h às 19h (12 horas)
Noturno: 19h às 7h (12 horas)

TABELA DINÂMICA: Atendimentos por turno
Diurno: 48,726 atendimentos (75.6%)
         = 202.2 pacientes/dia neste turno
Noturno: 15,693 atendimentos (24.4%)
         = 65.1 pacientes/dia neste turno

Total verificação: 64,419 atendimentos


In [21]:
# CAPACIDADE vs DEMANDA COM DADOS REAIS

# Dados fornecidos
clinicos_diurno = 5
clinicos_noturno = 4

print("ANÁLISE CAPACIDADE vs DEMANDA:")
print("=" * 40)

# Pegar dados da tabela dinâmica anterior
demanda_diurno = atend_por_turno['Diurno'] / dias_periodo
demanda_noturno = atend_por_turno['Noturno'] / dias_periodo

print("TURNO DIURNO (7h-19h):")
print(f"  Demanda: {demanda_diurno:.1f} pacientes/dia")
print(f"  Capacidade: {clinicos_diurno} clínicos")
print(f"  Carga por clínico: {demanda_diurno/clinicos_diurno:.1f} pacientes/clínico/turno")

print("\nTURNO NOTURNO (19h-7h):")
print(f"  Demanda: {demanda_noturno:.1f} pacientes/dia") 
print(f"  Capacidade: {clinicos_noturno} clínicos")
print(f"  Carga por clínico: {demanda_noturno/clinicos_noturno:.1f} pacientes/clínico/turno")

ANÁLISE CAPACIDADE vs DEMANDA:
TURNO DIURNO (7h-19h):
  Demanda: 202.2 pacientes/dia
  Capacidade: 5 clínicos
  Carga por clínico: 40.4 pacientes/clínico/turno

TURNO NOTURNO (19h-7h):
  Demanda: 65.1 pacientes/dia
  Capacidade: 4 clínicos
  Carga por clínico: 16.3 pacientes/clínico/turno


In [38]:
# EXPORTAR DADOS PARA CSV

print("EXPORTANDO DADOS PARA PLANILHAS:")
print("CSV = arquivo que abre no Excel, Google Sheets, etc.")

# 1. Dados principais de clínica médica
print("\n1. Exportando dataset completo de clínica médica...")
df_clinica_medica.to_csv('clinica_medica_completo.csv', index=False, encoding='utf-8')
print("   Arquivo salvo: clinica_medica_completo.csv")

# 2. Resumo por turno (tabela dinâmica simples)
print("\n2. Criando resumo por turno...")
resumo_turno = df_clinica_medica.groupby('turno').agg({
    'prontuario_id': 'count',           # conta atendimentos
    'classificacao_nome': 'first'       # só para ter mais uma coluna
}).rename(columns={'prontuario_id': 'total_atendimentos'})

resumo_turno.to_csv('resumo_por_turno.csv', encoding='utf-8')
print("   Arquivo salvo: resumo_por_turno.csv")

# 3. Atendimentos por hora (para gráficos)
print("\n3. Criando planilha de atendimentos por hora...")
atend_por_hora_df = atend_por_hora.reset_index()
atend_por_hora_df.columns = ['hora', 'atendimentos']
atend_por_hora_df.to_csv('atendimentos_por_hora.csv', index=False, encoding='utf-8')
print("   Arquivo salvo: atendimentos_por_hora.csv")

print("\nARQUIVOS CRIADOS:")
print("- clinica_medica_completo.csv")
print("- resumo_por_turno.csv")  
print("- atendimentos_por_hora.csv)")
print("\nTodos podem ser abertos no Excel")

EXPORTANDO DADOS PARA PLANILHAS:
CSV = arquivo que abre no Excel, Google Sheets, etc.

1. Exportando dataset completo de clínica médica...
   Arquivo salvo: clinica_medica_completo.csv

2. Criando resumo por turno...
   Arquivo salvo: resumo_por_turno.csv

3. Criando planilha de atendimentos por hora...
   Arquivo salvo: atendimentos_por_hora.csv

ARQUIVOS CRIADOS:
- clinica_medica_completo.csv
- resumo_por_turno.csv
- atendimentos_por_hora.csv)

Todos podem ser abertos no Excel


## Estratificação por classificação de risco

In [39]:
# ANÁLISE POR GRAVIDADE - Classificação Manchester

print("ANALISANDO CLÍNICA MÉDICA POR GRAVIDADE:")

# Primeiro, ver quantos temos de cada cor
print("\nContagem por classificação de cor:")
print(f"Vermelho: {(df_clinica_medica['vermelho'] == 'X').sum():,}")
print(f"Laranja: {(df_clinica_medica['laranja'] == 'X').sum():,}")  
print(f"Amarelo: {(df_clinica_medica['amarelo'] == 'X').sum():,}")
print(f"Verde: {(df_clinica_medica['verde'] == 'X').sum():,}")
print(f"Azul: {(df_clinica_medica['azul'] == 'X').sum():,}")

# Verificar se há casos sem classificação
sem_classificacao = df_clinica_medica[
    (df_clinica_medica['vermelho'] != 'X') & 
    (df_clinica_medica['laranja'] != 'X') & 
    (df_clinica_medica['amarelo'] != 'X') & 
    (df_clinica_medica['verde'] != 'X') & 
    (df_clinica_medica['azul'] != 'X')
]
print(f"Sem classificação: {len(sem_classificacao):,}")

print(f"\nTotal verificação: {len(df_clinica_medica):,} atendimentos")

# Ver exemplos de cada tipo
print("\nExemplos por gravidade:")
for cor in ['vermelho', 'laranja', 'amarelo', 'verde', 'azul']:
    casos = df_clinica_medica[df_clinica_medica[cor] == 'X']
    if len(casos) > 0:
        print(f"{cor.capitalize()}: {len(casos)} casos")
        # Mostrar algumas queixas principais
        queixas = casos['queixa_principal'].value_counts().head(3)
        for queixa, qtd in queixas.items():
            print(f"  - {queixa}: {qtd} casos")

ANALISANDO CLÍNICA MÉDICA POR GRAVIDADE:

Contagem por classificação de cor:
Vermelho: 143
Laranja: 2,124
Amarelo: 12,690
Verde: 46,096
Azul: 2,827
Sem classificação: 539

Total verificação: 64,419 atendimentos

Exemplos por gravidade:
Vermelho: 143 casos
  - MAL ESTAR EM ADULTO: 39 casos
  - OUTRAS QUEIXAS: 31 casos
  - RELATO DE CONVULSAO: 14 casos
Laranja: 2124 casos
  - MAL ESTAR EM ADULTO: 471 casos
  - DOR DE CABECA (CEFALEIA), TONTURA OU VERTIGEM: 187 casos
  - OUTRAS QUEIXAS: 147 casos
Amarelo: 12690 casos
  - MAL ESTAR EM ADULTO: 1898 casos
  - DOR DE CABECA (CEFALEIA), TONTURA OU VERTIGEM: 1460 casos
  - FEBRE / SINAIS DE INFECCAO: 860 casos
Verde: 46096 casos
  - DOR DE CABECA (CEFALEIA), TONTURA OU VERTIGEM: 4573 casos
  - DIARREIA E/OU VOMITOS E/OU NAUSEAS: 4060 casos
  - MAL ESTAR EM ADULTO: 4058 casos
Azul: 2827 casos
  - MEDICACAO EXTERNA: 460 casos
  - MOSTRAR RESULTADOS EXAMES: 258 casos
  - OUTRAS QUEIXAS: 207 casos


In [41]:
# DEMANDA DOS CLÍNICOS GERAIS (excluindo emergência)

print("NOVA DISTRIBUIÇÃO DE MÉDICOS:")
print("Um médico na sala vermelha: fica com atendimentos  vermelhos e laranjas")
print("Demais clínicos : atendem amarelos + verdes + azuis + sem classificação")
print()

# Separar casos críticos (vermelho + laranja) dos demais
casos_criticos = df_clinica_medica[
    (df_clinica_medica['vermelho'] == 'X') | 
    (df_clinica_medica['laranja'] == 'X')
]

casos_gerais = df_clinica_medica[
    (df_clinica_medica['amarelo'] == 'X') | 
    (df_clinica_medica['verde'] == 'X') | 
    (df_clinica_medica['azul'] == 'X') |
    ((df_clinica_medica['vermelho'] != 'X') & 
     (df_clinica_medica['laranja'] != 'X') & 
     (df_clinica_medica['amarelo'] != 'X') & 
     (df_clinica_medica['verde'] != 'X') & 
     (df_clinica_medica['azul'] != 'X'))  # sem classificação
]

print("DIVISÃO DOS CASOS:")
print(f"Casos críticos (vermelho + laranja): {len(casos_criticos):,}")
print(f"Casos gerais (demais): {len(casos_gerais):,}")
print(f"Total: {len(casos_criticos) + len(casos_gerais):,}")
print(f"Conferência: {len(df_clinica_medica):,} (deve ser igual)")

# Demanda diária
demanda_criticos_dia = len(casos_criticos) / dias_periodo
demanda_gerais_dia = len(casos_gerais) / dias_periodo

print(f"\nDEMANDA DIÁRIA:")
print(f"Sala vermelha: {demanda_criticos_dia:.1f} pacientes críticos/dia")
print(f"Demais clínicos: {demanda_gerais_dia:.1f} pacientes gerais/dia")

NOVA DISTRIBUIÇÃO DE MÉDICOS:
Um médico na sala vermelha: fica com atendimentos  vermelhos e laranjas
Demais clínicos : atendem amarelos + verdes + azuis + sem classificação

DIVISÃO DOS CASOS:
Casos críticos (vermelho + laranja): 2,267
Casos gerais (demais): 62,152
Total: 64,419
Conferência: 64,419 (deve ser igual)

DEMANDA DIÁRIA:
Sala vermelha: 9.4 pacientes críticos/dia
Demais clínicos: 257.9 pacientes gerais/dia


In [42]:
# ANÁLISE POR TURNO DOS CLÍNICOS GERAIS

print("DEMANDA DOS CLÍNICOS GERAIS POR TURNO:")
print("Diurno: 4 clínicos (excluindo 1 da sala vermelha)")
print("Noturno: 3 clínicos (excluindo 1 da sala vermelha)")
print()

# Adicionar coluna turno aos casos gerais se não existir
casos_gerais['hora_chegada'] = casos_gerais['data_chegada'].dt.hour
casos_gerais['turno'] = casos_gerais['hora_chegada'].apply(lambda h: 'Diurno' if 7 <= h < 19 else 'Noturno')

# Demanda por turno para clínicos gerais
demanda_gerais_por_turno = casos_gerais['turno'].value_counts()

demanda_gerais_diurno = demanda_gerais_por_turno['Diurno'] / dias_periodo  
demanda_gerais_noturno = demanda_gerais_por_turno['Noturno'] / dias_periodo

# Nova capacidade
clinicos_gerais_diurno = 4  # 5 - 1 emergência
clinicos_gerais_noturno = 3  # 4 - 1 emergência

print("RESULTADOS:")
print(f"Turno DIURNO (7h-19h):")
print(f"  Demanda casos gerais: {demanda_gerais_diurno:.1f} pacientes/dia")
print(f"  Clínicos gerais disponíveis: {clinicos_gerais_diurno}")
print(f"  Carga por clínico: {demanda_gerais_diurno/clinicos_gerais_diurno:.1f} pacientes/clínico/turno")

print(f"\nTurno NOTURNO (19h-7h):")
print(f"  Demanda casos gerais: {demanda_gerais_noturno:.1f} pacientes/dia")
print(f"  Clínicos gerais disponíveis: {clinicos_gerais_noturno}")
print(f"  Carga por clínico: {demanda_gerais_noturno/clinicos_gerais_noturno:.1f} pacientes/clínico/turno")

print(f"\nCOMPARAÇÃO:")
carga_diurno = demanda_gerais_diurno/clinicos_gerais_diurno
carga_noturno = demanda_gerais_noturno/clinicos_gerais_noturno

if carga_diurno > carga_noturno:
    diferenca = carga_diurno - carga_noturno
    print(f"DIURNO tem carga {diferenca:.1f} pacientes/clínico MAIOR que noturno")
else:
    diferenca = carga_noturno - carga_diurno  
    print(f"NOTURNO tem carga {diferenca:.1f} pacientes/clínico MAIOR que diurno")

DEMANDA DOS CLÍNICOS GERAIS POR TURNO:
Diurno: 4 clínicos (excluindo 1 da sala vermelha)
Noturno: 3 clínicos (excluindo 1 da sala vermelha)

RESULTADOS:
Turno DIURNO (7h-19h):
  Demanda casos gerais: 196.1 pacientes/dia
  Clínicos gerais disponíveis: 4
  Carga por clínico: 49.0 pacientes/clínico/turno

Turno NOTURNO (19h-7h):
  Demanda casos gerais: 61.8 pacientes/dia
  Clínicos gerais disponíveis: 3
  Carga por clínico: 20.6 pacientes/clínico/turno

COMPARAÇÃO:
DIURNO tem carga 28.4 pacientes/clínico MAIOR que noturno


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  casos_gerais['hora_chegada'] = casos_gerais['data_chegada'].dt.hour
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  casos_gerais['turno'] = casos_gerais['hora_chegada'].apply(lambda h: 'Diurno' if 7 <= h < 19 else 'Noturno')


In [28]:
# SIMULAÇÃO: Redução de 1 médico no turno diurno

print("RESUMO DA ANÁLISE REALIZADA:")
print(f"Total de atendimentos analisados: {len(df_filtrado):,}")
print(f"Clínica médica: {len(df_clinica_medica):,} ({len(df_clinica_medica)/len(df_filtrado)*100:.1f}%)")
print(f"Turno diurno (7h-19h): {len(casos_gerais[casos_gerais['turno'] == 'Diurno']):,} atendimentos")
print(f"Turno noturno (19h-7h): {len(casos_gerais[casos_gerais['turno'] == 'Noturno']):,} atendimentos")
print(f"Período analisado: {dias_periodo} dias")
print()

print("SIMULAÇÃO: Reduzir 1 clínico do turno diurno")
print("=" * 50)

# Cenário atual
clinicos_diurno_atual = 4
clinicos_noturno_atual = 3
carga_diurno_atual = demanda_gerais_diurno / clinicos_diurno_atual
carga_noturno_atual = demanda_gerais_noturno / clinicos_noturno_atual

# Cenário proposto
clinicos_diurno_novo = 3
clinicos_noturno_novo = 3
carga_diurno_nova = demanda_gerais_diurno / clinicos_diurno_novo
carga_noturno_nova = demanda_gerais_noturno / clinicos_noturno_novo

print("CENÁRIO ATUAL:")
print(f"Diurno: {demanda_gerais_diurno:.1f} pacientes ÷ {clinicos_diurno_atual} clínicos = {carga_diurno_atual:.1f} pacientes/médico/turno")
print(f"Noturno: {demanda_gerais_noturno:.1f} pacientes ÷ {clinicos_noturno_atual} clínicos = {carga_noturno_atual:.1f} pacientes/médico/turno")

print("\nCENÁRIO PROPOSTO (3 clínicos diurnos):")
print(f"Diurno: {demanda_gerais_diurno:.1f} pacientes ÷ {clinicos_diurno_novo} clínicos = {carga_diurno_nova:.1f} pacientes/médico/turno")
print(f"Noturno: {demanda_gerais_noturno:.1f} pacientes ÷ {clinicos_noturno_novo} clínicos = {carga_noturno_nova:.1f} pacientes/médico/turno")

print("\nIMPACTO:")
aumento_carga = carga_diurno_nova - carga_diurno_atual
percentual_aumento = (aumento_carga/carga_diurno_atual)*100

print(f"Sobrecarga adicional no diurno: +{aumento_carga:.1f} pacientes por médico")
print(f"Aumento percentual da sobrecarga de trabalho: +{percentual_aumento:.1f}%")

diferenca_atual = abs(carga_diurno_atual - carga_noturno_atual)
diferenca_nova = abs(carga_diurno_nova - carga_noturno_nova)
variacao_diferenca = diferenca_nova - diferenca_atual

print(f"\nDiferença entre turnos:")
print(f"Cenário atual: {diferenca_atual:.1f} pacientes/clínico")
print(f"Cenário simulado: {diferenca_nova:.1f} pacientes/clínico")
print(f"Variação: +{variacao_diferenca:.1f} (pacientes a mais para cada clínico por turno)")

print("\nOBSERVAÇÕES IMPORTANTES:")
print("1. Taxa de ocupação real: Clínicos não atendem ininterruptamente durante 12h")
print("2. Tempo produtivo estimado: 80% do turno (pausas, escrever no prontuário, refeinções, pacientes mais complexos)")
print("3. Picos de demanda: é sempre diurno")

print("\nCONCLUSÃO:")
print(f"A redução proposta resultaria em:")
print(f"• Sobrecarga de {aumento_carga:.1f} pacientes adicionais por clínico no turno diurno")
print(f"• Aumento de {percentual_aumento:.1f}% na carga de trabalho diurna")  
print(f"• Maior disparidade entre os plantões ({variacao_diferenca:.1f} pacientes a mais/clínico)")
print(f"• Potencial comprometimento da qualidade assistencial no horário de maior movimento")

RESUMO DA ANÁLISE REALIZADA:
Total de atendimentos analisados: 91,108
Clínica médica: 64,419 (70.7%)
Turno diurno (7h-19h): 47,268 atendimentos
Turno noturno (19h-7h): 14,884 atendimentos
Período analisado: 241 dias

SIMULAÇÃO: Reduzir 1 clínico do turno diurno
CENÁRIO ATUAL:
Diurno: 196.1 pacientes ÷ 4 clínicos = 49.0 pacientes/médico/turno
Noturno: 61.8 pacientes ÷ 3 clínicos = 20.6 pacientes/médico/turno

CENÁRIO PROPOSTO (3 clínicos diurnos):
Diurno: 196.1 pacientes ÷ 3 clínicos = 65.4 pacientes/médico/turno
Noturno: 61.8 pacientes ÷ 3 clínicos = 20.6 pacientes/médico/turno

IMPACTO:
Sobrecarga adicional no diurno: +16.3 pacientes por médico
Aumento percentual da sobrecarga de trabalho: +33.3%

Diferença entre turnos:
Cenário atual: 28.4 pacientes/clínico
Cenário simulado: 44.8 pacientes/clínico
Variação: +16.3 (pacientes a mais para cada clínico por turno)

OBSERVAÇÕES IMPORTANTES:
1. Taxa de ocupação real: Clínicos não atendem ininterruptamente durante 12h
2. Tempo produtivo esti

In [29]:
# ANÁLISE POR DIA DA SEMANA - Variabilidade da Demanda

print("DEMANDA POR DIA DA SEMANA:")
print("Identificar padrões de variação semanal")
print()

# Extrair dia da semana da data de chegada
df_clinica_medica['dia_semana'] = df_clinica_medica['data_chegada'].dt.day_name()

# Traduzir para português
traducao_dias = {
    'Monday': 'Segunda-feira',
    'Tuesday': 'Terça-feira', 
    'Wednesday': 'Quarta-feira',
    'Thursday': 'Quinta-feira',
    'Friday': 'Sexta-feira',
    'Saturday': 'Sábado',
    'Sunday': 'Domingo'
}

df_clinica_medica['dia_semana_pt'] = df_clinica_medica['dia_semana'].map(traducao_dias)

# Contar atendimentos por dia da semana
atend_por_dia = df_clinica_medica['dia_semana_pt'].value_counts()

# Ordenar pelos dias da semana
ordem_dias = ['Segunda-feira', 'Terça-feira', 'Quarta-feira', 'Quinta-feira', 'Sexta-feira', 'Sábado', 'Domingo']
atend_por_dia_ordenado = atend_por_dia.reindex(ordem_dias)

print("Total de atendimentos por dia:")
total_geral = len(df_clinica_medica)
semanas_aproximadas = dias_periodo // 7 + 1
for dia, qtd in atend_por_dia_ordenado.items():
    percentual = qtd / total_geral * 100
    media_diaria = qtd / semanas_aproximadas
    print(f"{dia:15s}: {qtd:6,} atendimentos ({percentual:5.1f}%) - média ~{media_diaria:.0f}/dia")

# Identificar variabilidade
dia_maior = atend_por_dia_ordenado.idxmax()
dia_menor = atend_por_dia_ordenado.idxmin()
maior_qtd = atend_por_dia_ordenado.max()
menor_qtd = atend_por_dia_ordenado.min()
variacao = ((maior_qtd - menor_qtd) / menor_qtd) * 100

print(f"\nVariabilidade semanal:")
print(f"Maior movimento: {dia_maior} ({maior_qtd:,} atendimentos)")
print(f"Menor movimento: {dia_menor} ({menor_qtd:,} atendimentos)")
print(f"Variação: {variacao:.1f}% entre o dia de maior e menor movimento")

print(f"\nImplicações para dimensionamento:")
print(f"• Diferença de {maior_qtd - menor_qtd:,} atendimentos entre pico e vale")
print(f"• Necessidade de flexibilidade na escala de profissionais")
print(f"• Possível ajuste de plantões conforme demanda semanal")

DEMANDA POR DIA DA SEMANA:
Identificar padrões de variação semanal

Total de atendimentos por dia:
Segunda-feira  : 10,251 atendimentos ( 15.9%) - média ~293/dia
Terça-feira    :  9,767 atendimentos ( 15.2%) - média ~279/dia
Quarta-feira   :  9,994 atendimentos ( 15.5%) - média ~286/dia
Quinta-feira   : 10,050 atendimentos ( 15.6%) - média ~287/dia
Sexta-feira    :  9,105 atendimentos ( 14.1%) - média ~260/dia
Sábado         :  8,228 atendimentos ( 12.8%) - média ~235/dia
Domingo        :  7,024 atendimentos ( 10.9%) - média ~201/dia

Variabilidade semanal:
Maior movimento: Segunda-feira (10,251 atendimentos)
Menor movimento: Domingo (7,024 atendimentos)
Variação: 45.9% entre o dia de maior e menor movimento

Implicações para dimensionamento:
• Diferença de 3,227 atendimentos entre pico e vale
• Necessidade de flexibilidade na escala de profissionais
• Possível ajuste de plantões conforme demanda semanal


In [45]:
# TABELAS DINÂMICAS

print("CRIANDO TABELAS COM DADOS CONSOLIDADOS...")

# TABELA 1: Resumo Consolidado
resumo_consolidado = pd.DataFrame({
    'INDICADOR': [
        'Total de Atendimentos (Jan-Ago 2025)',
        'Clínica Médica (excluindo especialidades)',
        'Casos Gerais (excluindo Vermelho + Laranja)',
        'Demanda Diurno (7h-19h)',
        'Demanda Noturno (19h-7h)',
        'Clínicos Gerais Diurno (Atual)',
        'Clínicos Gerais Noturno (Atual)',
        'Carga por Clínico Diurno (Atual)',
        'Carga por Clínico Noturno (Atual)'
    ],
    'VALOR': [
        f'{len(df_filtrado):,}',
        f'{len(df_clinica_medica):,}',
        f'{len(casos_gerais):,}',
        f'{demanda_gerais_diurno:.1f} pacientes/dia',
        f'{demanda_gerais_noturno:.1f} pacientes/dia',
        f'{clinicos_gerais_diurno} médicos',
        f'{clinicos_gerais_noturno} médicos',
        f'{carga_diurno_atual:.1f} pac/clínico/turno',
        f'{carga_noturno_atual:.1f} pac/clínico/turno'
    ]
})

resumo_consolidado.to_csv('RESUMO_CONSOLIDADO.csv', index=False, encoding='utf-8')
print("✓ Tabela criada: RESUMO_CONSOLIDADO.csv")

# TABELA 2: Comparação de Cenários (Exatamente como calculamos)
cenarios_consolidados = pd.DataFrame({
    'CENARIO': [
        'Atual (4 diurno + 3 noturno)',
        'Proposto (3 diurno + 3 noturno)'
    ],
    'CLINICOS_DIURNO_7h_19h': [4, 3],
    'CLINICOS_NOTURNO_19h_7h': [3, 3],
    'DEMANDA_DIURNO': [f'{demanda_gerais_diurno:.1f}', f'{demanda_gerais_diurno:.1f}'],
    'DEMANDA_NOTURNO': [f'{demanda_gerais_noturno:.1f}', f'{demanda_gerais_noturno:.1f}'],
    'CARGA_PAC_CLINICO_DIURNO': [f'{carga_diurno_atual:.1f}', f'{carga_diurno_nova:.1f}'],
    'CARGA_PAC_CLINICO_NOTURNO': [f'{carga_noturno_atual:.1f}', f'{carga_noturno_nova:.1f}'],
    'AUMENTO_CARGA_DIURNO': ['0.0', f'+{aumento_carga:.1f}'],
    'AUMENTO_PERCENTUAL_DIURNO': ['0.0%', f'+{percentual_aumento:.1f}%']
})

cenarios_consolidados.to_csv('CENARIOS_CONSOLIDADOS.csv', index=False, encoding='utf-8')
print("✓ Tabela criada: CENARIOS_CONSOLIDADOS.csv")

# TABELA 3: Distribuição por Turnos (Dados base)
turnos_consolidados = pd.DataFrame({
    'TURNO': ['Diurno (7h-19h)', 'Noturno (19h-7h)', 'TOTAL'],
    'ATENDIMENTOS_CASOS_GERAIS': [
        len(casos_gerais[casos_gerais['turno'] == 'Diurno']),
        len(casos_gerais[casos_gerais['turno'] == 'Noturno']),
        len(casos_gerais)
    ],
    'PERCENTUAL': [
        f'{len(casos_gerais[casos_gerais["turno"] == "Diurno"])/len(casos_gerais)*100:.1f}%',
        f'{len(casos_gerais[casos_gerais["turno"] == "Noturno"])/len(casos_gerais)*100:.1f}%',
        '100.0%'
    ],
    'MEDIA_PACIENTES_DIA': [
        f'{demanda_gerais_diurno:.1f}',
        f'{demanda_gerais_noturno:.1f}',
        f'{demanda_gerais_diurno + demanda_gerais_noturno:.1f}'
    ]
})

turnos_consolidados.to_csv('TURNOS_CONSOLIDADOS.csv', index=False, encoding='utf-8')
print("✓ Tabela criada: TURNOS_CONSOLIDADOS.csv")

print(f"\n 3 TABELAS CRIADAS:")
print("RESUMO_CONSOLIDADO.csv")
print("CENARIOS_CONSOLIDADOS.csv") 
print("TURNOS_CONSOLIDADOS.csv")

CRIANDO TABELAS COM DADOS CONSOLIDADOS...
✓ Tabela criada: RESUMO_CONSOLIDADO.csv
✓ Tabela criada: CENARIOS_CONSOLIDADOS.csv
✓ Tabela criada: TURNOS_CONSOLIDADOS.csv

 3 TABELAS CRIADAS:
RESUMO_CONSOLIDADO.csv
CENARIOS_CONSOLIDADOS.csv
TURNOS_CONSOLIDADOS.csv
