In [6]:
import pandas as pd

class DataFrameBuilder:
    def __init__(self):
        self.df_vacio = self.crear_dataframe_vacio()
    
    def crear_dataframe_vacio(self):
        # Definir las columnas del DataFrame
        columnas = [
            'Tipo de Dato',
            'Cardinalidad',
            '% Cardinalidad',
            'Valores Faltantes',
            '% Valores Faltantes',
            'Categoría'
        ]
        
        # Crear un DataFrame vacío con las columnas definidas
        return pd.DataFrame(columns=columnas)
    
    def rellenar_dataframe(self, df_original):
        # Lista para almacenar las filas que se agregarán al DataFrame
        filas = []
        
        # Iterar sobre las columnas del DataFrame original
        for col in df_original.columns:
            tipo_dato = str(df_original[col].dtype)  # Tipo de dato
            cardinalidad = df_original[col].nunique()  # Cardinalidad
            percent_cardinalidad = (cardinalidad / len(df_original)) * 100  # % Cardinalidad
            valores_faltantes = df_original[col].isnull().sum()  # Valores faltantes
            percent_valores_faltantes = (valores_faltantes / len(df_original)) * 100  # % Valores faltantes
            
            # Determinar la categoría
            if tipo_dato == 'object':
                categoria = 'Categorica Nominal' if cardinalidad > 2 else 'Binaria'
            elif 'int' in tipo_dato:
                categoria = 'Numerica Discreta'
            elif 'float' in tipo_dato:
                categoria = 'Numerica Continua'
            else:
                categoria = 'Desconocida'
            
            # Crear un diccionario con los datos
            datos = {
                'Tipo de Dato': tipo_dato,
                'Cardinalidad': cardinalidad,
                '% Cardinalidad': percent_cardinalidad,
                'Valores Faltantes': valores_faltantes,
                '% Valores Faltantes': percent_valores_faltantes,
                'Categoría': categoria
            }
            
            # Agregar la fila a la lista
            filas.append(datos)
        
        # Crear un DataFrame con las filas
        df_nuevo = pd.DataFrame(filas)
        
        # Concatenar con el DataFrame vacío
        self.df_vacio = pd.concat([self.df_vacio, df_nuevo], ignore_index=True)
    
    def mostrar_dataframe(self):
        # Mostrar el DataFrame resultante de manera bien estructurada
        with pd.option_context('display.max_rows', None, 'display.max_columns', None): 
            print(self.df_vacio)

# Uso de la clase
df_builder = DataFrameBuilder()

# Cargar el DataFrame original
df_original = pd.read_csv(r'C:\Users\nuria\Proyecto_EDA\data\raw\Student Depression Dataset.csv')

# Rellenar el DataFrame vacío con los datos del DataFrame original
df_builder.rellenar_dataframe(df_original)

# Mostrar el DataFrame resultante
df_builder.mostrar_dataframe()


   Tipo de Dato Cardinalidad  % Cardinalidad Valores Faltantes  \
0         int64        27901      100.000000                 0   
1        object            2        0.007168                 0   
2       float64           34        0.121859                 0   
3        object           52        0.186373                 0   
4        object           14        0.050177                 0   
5       float64            6        0.021505                 0   
6       float64            3        0.010752                 0   
7       float64          332        1.189922                 0   
8       float64            6        0.021505                 0   
9       float64            5        0.017921                 0   
10       object            5        0.017921                 0   
11       object            4        0.014336                 0   
12       object           28        0.100355                 0   
13       object            2        0.007168                 0   
14      fl

  self.df_vacio = pd.concat([self.df_vacio, df_nuevo], ignore_index=True)
