In [6]:
"""Módulo para carregar os dados de produção no banco de dados."""

import pandas as pd
from database import conectar_db
from carregar import transform_data
from extracao import carregar_xpaths


def ajusta_producao(df):
    """Ajusta o DataFrame de produção."""
    df['Uf'] = df['Uf'].str.upper()
    # Para as colunas que não sejam Uf, Municipio e mes
    try:
        for col in (df.columns.difference(['Uf', 'Municipio', 'Mes'])):
            df[col] = pd.to_numeric(df[col], errors='coerce').fillna(0).astype(int)
    except Exception as e:
        print(f"Erro ao converter a coluna {col} para inteiro: {e}")

    return df


def valida_producao(df):
    """Valida os dados de produção."""
    # Verifica se possui nulos
    if df.isnull().values.any():
        raise ValueError("Existem valores nulos no DataFrame.")
    # Verifica se os tipos estão corretos


def ler_producao(nome_arq):
    """Lê o arquivo de produção."""
    return pd.read_csv(nome_arq, sep=",", encoding='utf-8')




In [7]:
df = ler_producao("data/consolidado/producao_conduta.csv")
df

  return pd.read_csv(nome_arq, sep=",", encoding='utf-8')


Unnamed: 0,Uf,Ibge,Municipio,Agendamento p/ NASF,Agendamento para grupos,Alta do episódio,Encaminhamento interno no dia,Encaminhamento intersetorial,Encaminhamento p/ CAPS,Encaminhamento p/ internação h,Encaminhamento p/ serviço de a,Encaminhamento p/ serviço espe,Encaminhamento p/ urgência,Retorno p/ cuidado continuado/,Retorno para consulta agendada,Mes,Ano
0,PB,250077.0,APARECIDA,0.0,1.0,794.0,0.000,0.0,0.0,0.0,0.0,14.0,1.0,504.0,69.0,MAR,2017.0
1,MG,315720.0,SANTA BÁRBARA,54.0,41.0,1.76,42.000,4.0,19.0,3.0,0.0,298.0,10.0,1.67,1.139,MAR,2017.0
2,PR,412215.0,RIO BONITO DO IGUAÇU,3.0,2.0,2.221,0.000,1.0,0.0,0.0,8.0,69.0,0.0,199.0,1.166,MAR,2017.0
3,AP,160070.0,TARTARUGALZINHO,0.0,0.0,344.0,6.000,0.0,0.0,0.0,0.0,7.0,0.0,334.0,594.0,MAR,2017.0
4,SC,420160.0,ARROIO TRINTA,1.0,0.0,49.0,0.000,0.0,0.0,0.0,0.0,1.0,0.0,2.0,1.0,MAR,2017.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
616606,BA,293000.0,SEBASTIÃO LARANJEIRAS,0.0,0.0,777.0,0.000,0.0,0.0,0.0,0.0,25.0,0.0,280.0,286.0,SET,2022.0
616607,BA,291400.0,IPIRÁ,10.0,19.0,1.182,14.000,0.0,0.0,0.0,1.0,217.0,1.0,1.102,728.0,SET,2022.0
616608,SC,420550.0,FRAIBURGO,0.0,8.0,5.578,2.067,10.0,3.0,4.0,230.0,205.0,42.0,1.761,1.435,SET,2022.0
616609,SC,421260.0,PERITIBA,0.0,0.0,932.0,0.000,0.0,0.0,0.0,0.0,71.0,0.0,38.0,79.0,SET,2022.0


In [8]:
df = ajusta_producao(df)
df


Unnamed: 0,Uf,Ibge,Municipio,Agendamento p/ NASF,Agendamento para grupos,Alta do episódio,Encaminhamento interno no dia,Encaminhamento intersetorial,Encaminhamento p/ CAPS,Encaminhamento p/ internação h,Encaminhamento p/ serviço de a,Encaminhamento p/ serviço espe,Encaminhamento p/ urgência,Retorno p/ cuidado continuado/,Retorno para consulta agendada,Mes,Ano
0,PB,250077,APARECIDA,0,1,794,0,0,0,0,0,14,1,504,69,MAR,2017
1,MG,315720,SANTA BÁRBARA,54,41,1,42,4,19,3,0,298,10,1,1,MAR,2017
2,PR,412215,RIO BONITO DO IGUAÇU,3,2,2,0,1,0,0,8,69,0,199,1,MAR,2017
3,AP,160070,TARTARUGALZINHO,0,0,344,6,0,0,0,0,7,0,334,594,MAR,2017
4,SC,420160,ARROIO TRINTA,1,0,49,0,0,0,0,0,1,0,2,1,MAR,2017
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
616606,BA,293000,SEBASTIÃO LARANJEIRAS,0,0,777,0,0,0,0,0,25,0,280,286,SET,2022
616607,BA,291400,IPIRÁ,10,19,1,14,0,0,0,1,217,1,1,728,SET,2022
616608,SC,420550,FRAIBURGO,0,8,5,2,10,3,4,230,205,42,1,1,SET,2022
616609,SC,421260,PERITIBA,0,0,932,0,0,0,0,0,71,0,38,79,SET,2022


In [9]:
df = transform_data(df)
df

Unnamed: 0,Uf,Ibge,Municipio,Agendamento p/ NASF,Agendamento para grupos,Alta do episódio,Encaminhamento interno no dia,Encaminhamento intersetorial,Encaminhamento p/ CAPS,Encaminhamento p/ internação h,Encaminhamento p/ serviço de a,Encaminhamento p/ serviço espe,Encaminhamento p/ urgência,Retorno p/ cuidado continuado/,Retorno para consulta agendada,Data
0,PB,250077,APARECIDA,0,1,794,0,0,0,0,0,14,1,504,69,2017-03-01
1,MG,315720,SANTA BÁRBARA,54,41,1,42,4,19,3,0,298,10,1,1,2017-03-01
2,PR,412215,RIO BONITO DO IGUAÇU,3,2,2,0,1,0,0,8,69,0,199,1,2017-03-01
3,AP,160070,TARTARUGALZINHO,0,0,344,6,0,0,0,0,7,0,334,594,2017-03-01
4,SC,420160,ARROIO TRINTA,1,0,49,0,0,0,0,0,1,0,2,1,2017-03-01
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
616606,BA,293000,SEBASTIÃO LARANJEIRAS,0,0,777,0,0,0,0,0,25,0,280,286,2022-09-01
616607,BA,291400,IPIRÁ,10,19,1,14,0,0,0,1,217,1,1,728,2022-09-01
616608,SC,420550,FRAIBURGO,0,8,5,2,10,3,4,230,205,42,1,1,2022-09-01
616609,SC,421260,PERITIBA,0,0,932,0,0,0,0,0,71,0,38,79,2022-09-01


In [11]:
from extracao import carregar_xpaths



In [56]:
def cadastra_tipo_atendimento(tipo_atendimento):
    """Cadastra o tipo de atendimento no banco de dados."""
    conn = conectar_db()
    cursor = conn.cursor()
    cursor.execute("INSERT INTO tipo_atendimento (descricao) VALUES (%s)", (tipo_atendimento,))
    conn.commit()
    cursor.close()
    conn.close()
    print(f"Tipo de atendimento {tipo_atendimento} cadastrado com sucesso.")


def cadastra_grupo(grupo, tipo_atendimento):
    """Cadastra o grupo no banco de dados."""
    conn = conectar_db()
    cursor = conn.cursor()
    cursor.execute("INSERT INTO grupo_filtros (descricao, tipo_atendimento_id) VALUES (%s, %s)", (grupo, tipo_atendimento))
    conn.commit()
    cursor.close()
    conn.close()


def get_id_tipo_atendimento(tipo_atendimento):
    """Retorna o id do tipo de atendimento."""
    conn = conectar_db()
    cursor = conn.cursor()
    cursor.execute("SELECT id FROM tipo_atendimento WHERE descricao = %s", (tipo_atendimento,))
    id_tipo_atendimento = cursor.fetchone()[0]
    cursor.close()
    conn.close()

    return id_tipo_atendimento


def get_id_grupo(grupo, id_tipo_atendimento):
    """Retorna o id do grupo."""
    conn = conectar_db()
    cursor = conn.cursor()
    cursor.execute("SELECT id FROM grupo_filtros WHERE descricao = %s and tipo_atendimento_id = %s", (grupo, id_tipo_atendimento))
    id_grupo = cursor.fetchone()[0]
    cursor.close()
    conn.close()

    return id_grupo


def valida_tipo_atendimento_bd(tipo_atendimento):
    """Verifica se o tipo de atendimento está cadastrado no banco de dados."""
    conn = conectar_db()
    cursor = conn.cursor()
    cursor.execute("SELECT * FROM tipo_atendimento")
    tipos = cursor.fetchall()
    cursor.close()
    conn.close()
    if not any(tipo_atendimento == tipo[1] for tipo in tipos):
        print("Atendimento não cadastrado no banco de dados.")
        cadastra_tipo_atendimento(tipo_atendimento)
        id_atendimento = get_id_tipo_atendimento(tipo_atendimento)
    else:
        # Pegar o id do tipo de atendimento
        id_atendimento = [tipo[0] for tipo in tipos if tipo[1] == tipo_atendimento][0]

    return id_atendimento


def valida_grupos_bd(id_atendimento, grupo):
    """Verifica se o banco de dados possui a hierarquia correta."""
    conn = conectar_db()
    cursor = conn.cursor()
    cursor.execute("SELECT * FROM grupo_filtros")
    grupos = cursor.fetchall()
    if not any((grupo == g[1] and id_atendimento == g[2])for g in grupos):
        print("Grupo não cadastrado no banco de dados.")
        cadastra_grupo(grupo, id_atendimento)
        id_grupo = get_id_grupo(grupo, id_atendimento)
    else:
        # Pegar o id do grupo
        id_grupo = [g[0] for g in grupos if (grupo == g[1] and id_atendimento == g[2])][0]
    cursor.close()
    conn.close()

    return id_grupo

xpaths = carregar_xpaths()
xpath = xpaths['producao_conduta']
tipo_atendimento = xpath['tipo_atendimento']
grupo = xpath['grupo']


1 2


In [49]:
def valida_colunas_bd(df, id_grupo):
    """Valida se as colunas do DataFrame estão registradas no banco de dados."""
    conn = conectar_db()
    cursor = conn.cursor()
    cursor.execute("SELECT * FROM filtros WHERE grupo_filtro_id = %s", (id_grupo,))
    colunas = cursor.fetchall()
    for col in df.columns.difference(['Uf', 'Municipio', 'Mes', 'Ibge', 'Data']):
        if not any(col == c[1] for c in colunas):
            print(f"Coluna {col} não cadastrada no banco de dados.")
            cursor.execute("INSERT INTO filtros (grupo_filtro_id, descricao) VALUES (%s, %s)", (id_grupo, col))
    # Cria um dicionário com as colunas e seus respectivos ids
    dict_colunas = {}
    for col in df.columns.difference(['Uf', 'Municipio', 'Mes', 'Ibge', 'Data']):
        for c in colunas:
            if col == c[1]:
                dict_colunas[col] = c[0]
                break
    conn.commit()
    cursor.close()
    conn.close()
    return dict_colunas

valida_colunas_bd(df, 1)

{'Agendamento p/ NASF': 1,
 'Agendamento para grupos': 2,
 'Alta do episódio': 3,
 'Encaminhamento interno no dia': 4,
 'Encaminhamento intersetorial': 5,
 'Encaminhamento p/ CAPS': 6,
 'Encaminhamento p/ internação h': 7,
 'Encaminhamento p/ serviço de a': 8,
 'Encaminhamento p/ serviço espe': 9,
 'Encaminhamento p/ urgência': 10,
 'Retorno p/ cuidado continuado/': 11,
 'Retorno para consulta agendada': 12}

In [37]:
df.columns.difference(['Uf', 'Municipio', 'Mes', 'Ibge', 'Data'])

Index(['Agendamento p/ NASF', 'Agendamento para grupos', 'Alta do episódio',
       'Encaminhamento interno no dia', 'Encaminhamento intersetorial',
       'Encaminhamento p/ CAPS', 'Encaminhamento p/ internação h',
       'Encaminhamento p/ serviço de a', 'Encaminhamento p/ serviço espe',
       'Encaminhamento p/ urgência', 'Retorno p/ cuidado continuado/',
       'Retorno para consulta agendada'],
      dtype='object')

In [23]:
atendimento = 'Individual'
tipos = [(1, 'Individual'), (2, 'Coletivo')]
if not any(atendimento == tipo[1] for tipo in tipos):
        print("Atendimento não cadastrado no banco de dados.")
        print(tipos)
else:
    # Pegar o id do tipo de atendimento
    id_tipo = [tipo[0] for tipo in tipos if tipo[1] == atendimento][0]
    print("Atendimento já cadastrado.")
    print(id_tipo)


Atendimento já cadastrado.
1


In [None]:
def carrega_banco(df, colunas):
    """Carrega os dados de produção no banco de dados."""
    conn = conectar_db()
    cursor = conn.cursor()

    for i, row in df.iterrows():
        for col in colunas:
            cursor.execute("INSERT INTO filtro_producao (filtro_id, ibge, data, valor) VALUES (%s, %s, %s, %s)",
                           (colunas[col], row['Ibge'], row['Data'], row[col]))

    conn.commit()
    conn.close()

In [60]:
def main():
    """Função principal."""

    xpaths = carregar_xpaths()

    arquivo = 'producao_conduta'
    nome_arq = arquivo + '.csv'
    xpath = xpaths[arquivo]
    tipo_atendimento = xpath['tipo_atendimento']
    grupo = xpath['grupo']

    df = ler_producao("data/consolidado/producao_conduta.csv")
    df = ajusta_producao(df)
    print("DataFrame ajustado")
    valida_producao(df)
    print("DataFrame validado")
    df = transform_data(df)
    id_atendimento = valida_tipo_atendimento_bd(tipo_atendimento)
    id_grupo = valida_grupos_bd(id_atendimento, grupo)
    colunas = valida_colunas_bd(df, id_grupo)
    print("Hierarquia no BD validada")
    carrega_banco(df, colunas)
    


if __name__ == "__main__":
    main()

  return pd.read_csv(nome_arq, sep=",", encoding='utf-8')


DataFrame ajustado
DataFrame validado
Hierarquia no BD validada
{'Agendamento p/ NASF': 2, 'Agendamento para grupos': 3, 'Alta do episódio': 4, 'Encaminhamento interno no dia': 5, 'Encaminhamento intersetorial': 6, 'Encaminhamento p/ CAPS': 7, 'Encaminhamento p/ internação h': 8, 'Encaminhamento p/ serviço de a': 9, 'Encaminhamento p/ serviço espe': 10, 'Encaminhamento p/ urgência': 11, 'Retorno p/ cuidado continuado/': 12, 'Retorno para consulta agendada': 13}
   Uf    Ibge             Municipio  Agendamento p/ NASF  \
0  PB  250077             APARECIDA                    0   
1  MG  315720         SANTA BÁRBARA                   54   
2  PR  412215  RIO BONITO DO IGUAÇU                    3   
3  AP  160070       TARTARUGALZINHO                    0   
4  SC  420160         ARROIO TRINTA                    1   

   Agendamento para grupos  Alta do episódio  Encaminhamento interno no dia  \
0                        1               794                              0   
1              