# ***Parcial BigData - Segundo Corte***
* # ***ETL***

* ***Config***

In [1]:
class config:

    input_path = "stock_senti_analysis.csv"
    output_path = "stock_analysis_clean.csv"


* ***Extract***

In [59]:
import pandas as pd

class Extractor:
    def __init__(self, file_path):
        self.file_path = file_path

    def extract(self):
        try:
            df = pd.read_csv(self.file_path, encoding='latin1')
            return df

        except Exception as e:
            print(f"Error al extraer los datos {e}")
            return None

* ***Load***

In [60]:
class Loader:

    def __init__(self, df):
        self.df = df

    def to_csv(self, output_path):
        try:
            self.df.to_csv(output_path, index = False)
            print(f" - Datos guardados en {output_path}")
        except Exception as e:
            print(f"Error al guardar los datos: {e}")

* ***Transform***

In [61]:
class Transformer:

    def __init__(self, df):
        self.df = df

    def clean(self):

        df = self.df.copy()
        df['Date'] = pd.to_datetime(df['Date'], errors='coerce')
        df = df.dropna(subset=['Date', 'Top1', 'Top2', 'Top3', 'Top4', 'Top5', 'Top6', 'Top7', 'Top8'])

        text_cols = ['Top1', 'Top2', 'Top3', 'Top4', 'Top5', 'Top6', 'Top7', 'Top8']
        for col in text_cols:
            if col in df.columns:
                df[col] = df[col].fillna('Unknown')

        self.df = df
        return self.df



* ***Main***

In [62]:
def main():
    print("=== Iniciando proceso ETL ===")

    #EXTRACCIÓN
    extractor = Extractor(config.input_path)
    df = extractor.extract()

    if df is None:
        print("No se pudieron extraer los datos. Proceso detenido.")
        return
    print("✅ Datos extraídos correctamente.")

    #TRANSFORMACIÓN
    transformer = Transformer(df)
    df_clean = transformer.clean()
    print("✅ Datos transformados correctamente.")

    #CARGA
    loader = Loader(df_clean)
    loader.to_csv(config.output_path)
    print("✅ Datos cargados correctamente.")

    print("=== Proceso ETL finalizado con éxito ===")

if __name__ == "__main__":
    main()

=== Iniciando proceso ETL ===
✅ Datos extraídos correctamente.
✅ Datos transformados correctamente.
 - Datos guardados en stock_analysis_clean.csv
✅ Datos cargados correctamente.
=== Proceso ETL finalizado con éxito ===
