In [None]:
import requests
from datetime import datetime
import os

In [19]:
def formatCurrentYear():
    """
    Formats the current year as a string.

    Returns:
        str: The current year.
    """
    return str(datetime.now().year)

In [20]:
def validateSemester(semester):
    """
    Validates the semester input.

    Args:
        semester (str): The semester to validate ('first-semester' or 'second-semester').

    Raises:
        ValueError: If the semester is not valid.
    """
    if semester not in ['primeiro-semestre', 'segundo-semestre']:
        raise ValueError("O semestre deve ser 'primeiro-semestre' or 'segundo-semestre'.")

In [21]:
def createDirectory(directory):
    """
    Creates a directory if it does not exist.

    Args:
        directory (str): The name of the directory to create.

    Returns:
        bool: True if the directory was created, False if it already existed.
    """
    if not os.path.exists(directory):
        os.makedirs(directory)
        print(f"O diretório '{directory}' foi criado com sucesso.")
        return True
    else:
        print(f"O diretório '{directory}' Já existe. Prosseguindo com o download.")
        return False

In [22]:
def downloadCsvFile(semester, year, directory):
    """
    Downloads the CSV file from the specified endpoint.

    Args:
        semester (str): The semester for which to download the file.
        year (str): The year of the file.
        directory (str): The directory to save the downloaded file.

    Returns:
        str: The path to the saved file if successful, None otherwise.
    """
    link = f'{semester}-{year}'
    endpoint = f"https://www.gov.br/mdh/pt-br/acesso-a-informacao/dados-abertos/ligue180/{link}"
    file_name = f'{directory}/ligue180-{semester}-{year}.csv'
    try:
        print(f"Conectando ao endpoint para fazer o download do arquivo...")
        response = requests.get(endpoint)
        if response.status_code == 200:
            print(f"Baixando do arquivo: {file_name}...")
            with open(file_name, 'wb') as file:
                file.write(response.content)
            print(f"O arquivo CSV {semester.replace('-', ' ')} foi baixado e salvo como '{file_name}' com sucesso!")
            return file_name
        else:
            print(f"Erro ao acessar o endpoint para {semester.replace('-', ' ')}: {response.status_code}. Check o URL.")
            return None
    except requests.exceptions.RequestException as e:
        print(f"Um erro ocorreu durante o request {semester.replace('-', ' ')}: {e}. Por favor tente novamente mais tarde.")
        return None

In [23]:
def downloadAndLoadCsv(semester='primeiro-semestre'):
    """
    Main function to download and load the CSV file for the specified semester.

    Args:
        semester (str): The semester to download ('first-semester' or 'second-semester').
    
    Returns:
        str: The path to the downloaded CSV file if successful, None otherwise.
    """
    current_year = formatCurrentYear()
    validateSemester(semester)
    
    print(f"Iniciando download do arquivo {semester.replace('-', ' ')} do ano {current_year}...")
    
    directory = 'csv_files'
    createDirectory(directory)
    
    return downloadCsvFile(semester, current_year, directory)


In [24]:
downloadAndLoadCsv('primeiro-semestre')  # ou 'segundo-semestre'

Iniciando download do arquivo primeiro semestre do ano 2024...
O diretório 'csv_files' Já existe. Prosseguindo com o download.
Conectando ao endpoint para fazer o download do arquivo...
Baixando do arquivo: csv_files/ligue180-primeiro-semestre-2024.csv...
O arquivo CSV primeiro semestre foi baixado e salvo como 'csv_files/ligue180-primeiro-semestre-2024.csv' com sucesso!


'csv_files/ligue180-primeiro-semestre-2024.csv'