# Aquisição de dados no portal da ONS Dados Aberto

https://ons-aws-prod-opendata.s3.amazonaws.com/

https://registry.opendata.aws/ons-opendata-portal/

https://github.com/awslabs/open-data-registry/blob/main/datasets/ons-opendata-portal.yaml#L17

In [None]:
import requests
import xml.etree.ElementTree as ET
from datetime import datetime


def listar_arquivos():
    url = "https://ons-aws-prod-opendata.s3.amazonaws.com"
    params = {"list-type": "2", "prefix": "dataset/"}
    arquivos = []

    while True:
        resp = requests.get(url, params=params)
        root = ET.fromstring(resp.content)
        for item in root.findall(".//{*}Contents"):
            arquivos.append(item.find("{*}Key").text)

        next_token = root.find(".//{*}NextContinuationToken")
        if next_token is None:
            break
        params["continuation-token"] = next_token.text

    return arquivos


def listar_arquivos_do_dataset(nome_dataset=None, extensoes=[".csv", ".parquet", ".xlsx", ".pdf"]):
    """
    Lista os arquivos disponíveis de um dataset público do ONS a partir do bucket
    'ons-aws-prod-opendata.s3.amazonaws.com'.

    Parâmetros
    ----------
    nome_dataset : str, opcional
        Nome do dataset a ser consultado. Se None (padrão), exibe a lista
        de todos os datasets disponíveis atualmente.

    extensoes : list de str, opcional
        Lista de extensões de arquivos a serem exibidos (default: [".csv", ".parquet", ".xlsx", ".pdf"]).
        Arquivos .pdf sempre serão exibidos, mesmo se não estiverem nesta lista.

    Retorno
    -------
    None
        A função apenas imprime na tela os arquivos encontrados ou os datasets disponíveis.

    -------------------------------
    Datasets disponíveis (18/06/2025):
    -------------------------------
    bacia_contorno
    balanco_dessem_detalhe
    balanco_dessem_geral
    balanco_energia_dessem_tm
    balanco_energia_subsistema_ho
    capacidade-geracao
    capacidade-transformacao
    carga_energia_di
    carga_energia_me
    carga_programada_tm
    carga_verificada_tm
    cargaglobal_roraima
    cmo_se
    cmo_tm
    curva-carga-ho
    cvu_usitermica_se
    dados_hidrologicos_di
    dados_hidrologicos_ho
    disponibilidade_usina_ho
    ear_bacia_di
    ear_ree_di
    ear_reservatorio_di
    ear_subsistema_di
    ena_bacia_di
    ena_ree_di
    ena_reservatorio_di
    ena_subsistema_di
    energia_vertida_turbinavel_ho
    equipamento_controle_reativo
    fator_capacidade_2_di
    geracao_exportacao_internacional_ho
    geracao_termica_despacho_2_ho
    geracao_usina_2_ho
    grandezas_fluviometricas_di
    hist_despacho_energia
    importacaoenergia-comercial-2-ho
    ind-disponibilidade-geracao-sin
    ind_confiarb_atls
    ind_confiarb_ccal
    ind_confiarb_ccat
    ind_confiarb_ciper
    ind_confiarb_dreq_freq
    ind_confiarb_energianaosuprida
    ind_confiarb_robustez
    ind_confiarb_severidade
    ind_disponibilidade_fgeracao_uge_an
    ind_disponibilidade_fgeracao_uge_me
    ind_disponibilidade_ft_conversor_me
    ind_disponibilidade_ft_reativo_me
    ind_disponibilidade_ft_trlt_me
    ind_providencia_ecpa_pcpa
    ind_qualid_dfd_evento
    ind_qualid_dfd_meano
    ind_qualid_dfp_regime
    intercambio_internacional_ho
    intercambio_modalidade_ho
    intercambio_nacional_ho
    linha_transmissao
    modalidade_usina
    ofertapreco-importacao-se
    programacao_diaria
    programacao_fluxo_controlado
    programacao_x_previsao
    res_volumeespera
    reservatorio
    restricao_coff_eolica_detail_tm
    restricao_coff_eolica_tm
    restricao_coff_fotovoltaica_detail_tm
    restricao_coff_fotovoltaica_tm
    subestacao
    taxa_teif_teip
    usina_conjunto
    usina_pqu
    """
    if nome_dataset is None:
        # Apresenta na tela "Datasets dispoíveis com a data atual"
        print(f"Datasets disponíveis ({datetime.now().strftime('%d/%m/%y')}):")
        todos = listar_arquivos()
        datasets = set()

        for arq in todos:
            if arq.startswith("dataset/") and not arq.endswith("/"):
                dataset = arq.split("/")[1]
                datasets.add(dataset)

        for dataset in sorted(datasets):
            print("-", dataset)
        return
    todos = listar_arquivos()
    arquivos_do_dataset = []

    for arq in todos:
        if arq.startswith(f"dataset/{nome_dataset}/") and not arq.endswith("/"):
            if any(arq.endswith(ext) for ext in extensoes):
                arquivos_do_dataset.append(arq.split("/")[-1])

    if not arquivos_do_dataset:
        print(f"Nenhum arquivo encontrado para o dataset '{nome_dataset}'.")
    else:
        print(f"Arquivos do dataset '{nome_dataset}':")
        for nome in arquivos_do_dataset:
            print("-", nome)


# Exemplo de uso:
listar_arquivos_do_dataset(
    nome_dataset="curva-carga-ho", extensoes=[".csv", ".pdf"])

# Função para baixar um arquivo específico do dataset


def baixar_arquivo(nome_dataset, nome_arquivo):
    url = f"https://ons-aws-prod-opendata.s3.amazonaws.com/dataset/{nome_dataset}/{nome_arquivo}"
    response = requests.get(url)

    if response.status_code == 200:
        with open(nome_arquivo, 'wb') as file:
            file.write(response.content)
        print(f"Arquivo '{nome_arquivo}' baixado com sucesso.")
    else:
        print(
            f"Erro ao baixar o arquivo '{nome_arquivo}': {response.status_code}")


# Exemplo de uso para baixar um arquivo específico
baixar_arquivo("curva-carga-ho", "CURVA_CARGA_2000.csv")

Arquivos do dataset 'curva-carga-ho':
- CURVA_CARGA_2000.csv
- CURVA_CARGA_2001.csv
- CURVA_CARGA_2002.csv
- CURVA_CARGA_2003.csv
- CURVA_CARGA_2004.csv
- CURVA_CARGA_2005.csv
- CURVA_CARGA_2006.csv
- CURVA_CARGA_2007.csv
- CURVA_CARGA_2008.csv
- CURVA_CARGA_2009.csv
- CURVA_CARGA_2010.csv
- CURVA_CARGA_2011.csv
- CURVA_CARGA_2012.csv
- CURVA_CARGA_2013.csv
- CURVA_CARGA_2014.csv
- CURVA_CARGA_2015.csv
- CURVA_CARGA_2016.csv
- CURVA_CARGA_2017.csv
- CURVA_CARGA_2018.csv
- CURVA_CARGA_2019.csv
- CURVA_CARGA_2020.csv
- CURVA_CARGA_2021.csv
- CURVA_CARGA_2022.csv
- CURVA_CARGA_2023.csv
- CURVA_CARGA_2024.csv
- CURVA_CARGA_2025.csv
- DicionarioDados_CurvaCarga.pdf
Arquivo 'CURVA_CARGA_2000.csv' baixado com sucesso.
