In [1]:
%%writefile dataset_leitor.py
import pandas as pd

class DatasetLeitor:
    def __init__(self, arquivo_csv):
        self.__caminho = arquivo_csv              # privado
        self._dados = None                        # protegido (por convenção)
        self.__carregar_dados()                   # carregamento automático

    def __carregar_dados(self):                   # método privado
        try:
            self._dados = pd.read_csv(self.__caminho)
            print("Dados carregados com sucesso.")
        except FileNotFoundError:
            print("Arquivo não encontrado.")
        except Exception as e:
            print("Erro ao carregar dados:", e)

    @property
    def dados(self):                              # getter
        return self._dados.copy()                 # protege o original

    @property
    def colunas(self):                            # interface de acesso
        return list(self._dados.columns)

    def filtrar_coluna(self, nome_coluna, valor): # interface de negócio
        if nome_coluna not in self._dados.columns:
            print(f"Coluna '{nome_coluna}' não encontrada.")
            return None
        return self._dados[self._dados[nome_coluna] == valor]

    def resumo(self):                             # interface analítica
        return self._dados.describe()

    def linhas_nulas(self):                       # utilidade analítica
        return self._dados[self._dados.isnull().any(axis=1)]

Writing dataset_leitor.py


In [2]:
# Simula um CSV
import pandas as pd

df = pd.DataFrame({
    'Nome': ['Ana', 'Bruno', 'Carlos', 'Ana'],
    'Idade': [23, 31, 19, None],
    'Nota': [8.5, 7.2, 9.1, 6.8]
})
df.to_csv('dados.csv', index=False)

In [3]:
from dataset_leitor import DatasetLeitor

dh = DatasetLeitor('dados.csv')

print("Colunas:", dh.colunas)
print("Resumo:\n", dh.resumo())
print("Filtro por nome == Ana:\n", dh.filtrar_coluna('Nome', 'Ana'))
print("Linhas com nulos:\n", dh.linhas_nulas())

Dados carregados com sucesso.
Colunas: ['Nome', 'Idade', 'Nota']
Resumo:
            Idade      Nota
count   3.000000  4.000000
mean   24.333333  7.900000
std     6.110101  1.080123
min    19.000000  6.800000
25%    21.000000  7.100000
50%    23.000000  7.850000
75%    27.000000  8.650000
max    31.000000  9.100000
Filtro por nome == Ana:
   Nome  Idade  Nota
0  Ana   23.0   8.5
3  Ana    NaN   6.8
Linhas com nulos:
   Nome  Idade  Nota
3  Ana    NaN   6.8
