In [None]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

def generate_random_product_dataframe(base_df, num_samples=None):
    if num_samples is None:
        num_samples = len(base_df)
    
    # Crear nuevo DataFrame
    df = pd.DataFrame(columns=base_df.columns)
    
    # Determinar los nombres de columnas
    date_column = base_df.columns[0]
    time_column = base_df.columns[1]
    model_column = base_df.columns[2]
    color_column = base_df.columns[3]
    current_price_column = base_df.columns[4]
    normal_price_column = base_df.columns[5]
    link_column = base_df.columns[6]
    
    # Generar fechas aleatorias en 2023
    start_date = datetime(2023, 1, 1)
    end_date = datetime(2023, 12, 31)
    date_range = (end_date - start_date).days
    
    for i in range(num_samples):
        # Seleccionar una fecha aleatoria en 2023
        random_days = np.random.randint(0, date_range)
        random_date = start_date + timedelta(days=random_days)
        
        # Generar hora aleatoria
        random_time = f"{np.random.randint(0,24):02d}:{np.random.randint(0,60):02d}:{np.random.randint(0,60):02d}"
        
        # Modificar precios con cierta aleatoriedad
        current_price = base_df[current_price_column].iloc[i % len(base_df)]
        normal_price = base_df[normal_price_column].iloc[i % len(base_df)]
        
        # Convertir precios a numérico, manejando diferentes formatos
        def convert_price(price):
            if isinstance(price, (int, float)):
                return price
            # Eliminar el símbolo de euro y reemplazar coma por punto
            return float(str(price).replace('€', '').replace(',', '.').strip())
        
        current_price_numeric = convert_price(current_price)
        normal_price_numeric = convert_price(normal_price)
        
        # Si el precio actual es 0 o menor, usar el precio normal
        if current_price_numeric <= 0:
            current_price_numeric = normal_price_numeric
        
        # Añadir variación aleatoria a los precios
        current_price_var = current_price_numeric * np.random.uniform(0.9, 1.1)
        normal_price_var = normal_price_numeric * np.random.uniform(0.9, 1.1)
        
        # Formatear precios de vuelta
        current_price_formatted = f"{current_price_var:.2f}€"
        normal_price_formatted = f"{normal_price_var:.2f}€"
        
        # Seleccionar aleatoriamente otros detalles
        model = base_df[model_column].iloc[i % len(base_df)]
        color = base_df[color_column].iloc[i % len(base_df)]
        link = base_df[link_column].iloc[i % len(base_df)]
        
        # Añadir al nuevo DataFrame
        df.loc[i] = [
            random_date.strftime('%Y-%m-%d'), 
            random_time, 
            model, 
            color, 
            current_price_formatted, 
            normal_price_formatted, 
            link
        ]
    
    return df

# Cargar el archivo CSV
df_original = pd.read_csv(r'zalando\data\productos_zalando_2024-11-19_17-54-22.csv')

# Generar DataFrame aleatorio
df_aleatorio = generate_random_product_dataframe(df_original, num_samples=1000)
df_aleatorio = df_aleatorio.sort_values(by='date')

# Guardar el DataFrame aleatorio como CSV
df_aleatorio.to_csv('datos_aleatorios_2023.csv', index=False)

print("Datos aleatorios generados y guardados en 'datos_aleatorios_2023.csv'")

Datos aleatorios generados y guardados en 'datos_aleatorios_2024.csv'
