In [2]:
import pandas as pd

# Lista de archivos de entrada (reemplaza estos nombres por los tuyos)
input_files = [
    'Nigerian_Fraud.csv',
    'Ling.csv',
    'CEAS_08.csv',
    'Enron.csv'
]

# Columnas que queremos conservar
required_cols = ['subject', 'body', 'label']

# Lista para ir acumulando DataFrames
dfs = []

for filepath in input_files:
    # Leemos solo las columnas que existan de las requeridas
    try:
        df = pd.read_csv(filepath, usecols=lambda c: c in required_cols)
    except FileNotFoundError:
        print(f"¡Atención! No se encontró el archivo: {filepath}")
        continue

    # Asegurarnos de que todas las columnas requeridas existan
    for col in required_cols:
        if col not in df.columns:
            df[col] = pd.NA

    # Reordenar para que queden en el orden deseado
    df = df[required_cols]

    # Añadimos columna indicando el origen
    df['source_file'] = filepath

    dfs.append(df)

# Concatenamos todo en uno solo
if dfs:
    merged_df = pd.concat(dfs, ignore_index=True)
    # Guardamos el resultado
    merged_df.to_csv('merged.csv', index=False)
    print("✅ Archivos unificados en merged.csv")
else:
    print("❌ No se procesó ningún archivo. Revisa los nombres en input_files.")


✅ Archivos unificados en merged.csv
