In [4]:
# Importando as bibliotecas
import os
import io
import zipfile
import requests
import pandas as pd
from typing import Optional, Dict

In [5]:
class UrbanMobilityData:
    def __init__(self, url: str):
        """
        Inicializa a classe com a URL do arquivo zip.

        :param url: URL do arquivo zipado do Kaggle.
        """
        self.url = url
        self.file_paths = {
            "Household": "Household.csv",
            "Person": "Person.csv",
            "Stage": "Stage.csv",
            "Trip": "Trip.csv"
        }

    def download_zip(self) -> Optional[bytes]:
        """
        Faz o download do arquivo zipado da URL fornecida.

        :return: Conteúdo do arquivo zipado em bytes, ou None em caso de erro.
        """
        try:
            response = requests.get(self.url)
            if response.status_code == 200:
                return response.content
            else:
                print(f"Falha ao fazer o download dos arquivos. Status code: {response.status_code}")
                return None
        except Exception as e:
            print(f"Erro ao baixar o arquivo: {e}")
            return None

    def extract_zip_to_dataframes(self, zip_content: bytes) -> Dict[str, Optional[pd.DataFrame]]:
        """
        Extrai o conteúdo do arquivo zipado e carrega os arquivos CSV em DataFrames.

        :param zip_content: Conteúdo do arquivo zipado em bytes.
        :return: Dicionário onde as chaves são os nomes dos arquivos e os valores são os DataFrames ou None.
        """
        dataframes = {}
        try:
            with zipfile.ZipFile(io.BytesIO(zip_content), 'r') as zip_ref:
                for file_name in zip_ref.namelist():
                    if file_name in self.file_paths.values():
                        with zip_ref.open(file_name) as file:
                            df = pd.read_csv(file, sep=';', on_bad_lines='skip')
                            key = [k for k, v in self.file_paths.items() if v == file_name][0]
                            dataframes[key] = df
                            print(f"DataFrame {key} carregado com sucesso")
        except Exception as e:
            print(f"Erro ao processar o arquivo zipado: {e}")
        return dataframes

In [7]:
if __name__ == "__main__":
    url = "https://www.kaggle.com/api/v1/datasets/download/danielefm/urban-mobility-survey-federal-district-brazil?datasetVersionNumber=1"

    # Instanciando a classe
    data_handler = UrbanMobilityData(url)

    # Fazendo o download do arquivo zip
    zip_content = data_handler.download_zip()
    if zip_content:
        # Extraindo o conteúdo do arquivo zip e carregando os DataFrames
        dataframes = data_handler.extract_zip_to_dataframes(zip_content)

        # Exibindo os DataFrames carregados
        for name, df in dataframes.items():
            if df is not None:
                print(f"\n{name} DataFrame:")
                print(df.columns)


DataFrame Household carregado com sucesso
DataFrame Person carregado com sucesso
DataFrame Stage carregado com sucesso
DataFrame Trip carregado com sucesso

Household DataFrame:
Index(['household_id', 'people_in_household', 'bathrooms', 'bedrooms',
       'vehicles', 'bicycles', 'motorcycles', 'dwelling_type', 'income',
       'household_tenure', 'piped_water_supply', 'street_pavement',
       'private_parking_space', 'year_of_newest_vehicle', 'domestic_worker',
       'cable_tv', 'social_assistence', 'expf_household', 'macrozone',
       'administrative_region'],
      dtype='object')

Person DataFrame:
Index(['person_id', 'household_id', 'age', 'gender', 'education_level',
       'area_of_occupation', 'has_driver_license', 'is_disabled',
       'sector_if_private_worker', 'sector_if_civil_servant', 'expf_person'],
      dtype='object')

Stage DataFrame:
Index(['stage_id', 'household_id', 'person_id', 'trip_id', 'mode', 'payment',
       'parking_type', 'bus_route', 'boarding_station'

In [8]:
Person.head()

NameError: name 'Person' is not defined