In [12]:
# IMPORTS
import pandas as pd
from datetime import datetime
import urllib3
import requests
from io import StringIO
import glob
import os

In [13]:
# DESATIVA AVISO DE REQUISIÇÃO
urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)

In [None]:
# INPUT
def input(dataset: str) -> pd.DataFrame:
    url = f"https://dados.anvisa.gov.br/dados/VigiMed_{dataset}.csv"
    resp = requests.get(url, verify=False)  # ignora SSL
    data = StringIO(resp.text)
    
    df = pd.read_csv(
        data,
        sep=';',              # separador de campos no CSV
        encoding='latin-1',   # encoding utilizado no arquivo original
        dtype=str,            # força todas as colunas como string para evitar problemas de tipo
        quoting=3,            # csv.QUOTE_NONE: não trata aspas como delimitador
        on_bad_lines='error', # gera erro explícito se houver linhas fora do layout esperado
        low_memory=False      # evita inferência de tipo em chunks, melhora consistência de tipos
    )
    
    return df

In [None]:
# OUTPUT
def output(df: pd.DataFrame, dataset: str) -> str:
    layer = '01_bronze'
    folder = rf"..\data\{layer}\{dataset}"
    
    for file in glob.glob(os.path.join(folder, "*.csv")):
        os.remove(file)
    
    timestamp = datetime.now().strftime("%Y_%m_%d_%H_%M_%S")  # YYYY_MM_DD_HH_MM_SS
    output_path = os.path.join(folder, f"{dataset}_{timestamp}.csv")
    df.to_csv(output_path, sep=";", index=False, encoding="utf-8")
    
    return output_path

In [19]:
# MEDICAMENTOS
dataset = 'Medicamentos'
df = input(dataset)
output(df, dataset)

'..\\data\\01_bronze\\Medicamentos\\Medicamentos_2025_08_29_09_11_30.csv'

In [20]:
# NOTIFICAÇÕES
dataset = 'Notificacoes'
df = input(dataset)
output(df, dataset)

'..\\data\\01_bronze\\Notificacoes\\Notificacoes_2025_08_29_09_12_33.csv'

In [21]:
# REAÇÕES
dataset = 'Reacoes'
df = input(dataset)
output(df, dataset)

'..\\data\\01_bronze\\Reacoes\\Reacoes_2025_08_29_09_13_42.csv'