In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import LabelEncoder
from datetime import datetime, timedelta

# Cargar datos desde un archivo CSV (ajusta la ruta según sea necesario)
df = pd.read_csv('/kaggle/input/kdp3g24/KDP6.csv')

# Asegurar que 'Fecha de pedido' sea datetime
df['Fecha de pedido'] = pd.to_datetime(df['Fecha de pedido'], errors='coerce')

# Asegurar que 'Regalias' sea numérica (eliminar caracteres no numéricos)
df['Regalias'] = pd.to_numeric(df['Regalias'].str.replace(',', ''), errors='coerce')

# Guardar una correspondencia entre 'ID' y 'Titulo_del_Libro' antes de eliminar duplicados
titulo_correspondencia = df[['ID', 'Titulo_del Libro']].drop_duplicates()

# Asegurar que 'Titulo_del_Libro' esté presente antes de eliminar filas con valores faltantes
df = df.dropna(subset=['Titulo_del Libro', 'Regalias', 'Fecha de pedido'])

# Eliminar 'Titulo_del_Libro' del DataFrame antes de codificar 'ID'
df = df.drop('Titulo_del Libro', axis=1)

# Codificar 'ID' usando LabelEncoder después de guardar la correspondencia
le = LabelEncoder()
df['ID'] = le.fit_transform(df['ID'])

# Asegurar que 'ID' sea int
df['ID'] = df['ID'].astype(int)

# Convertir 'Fecha de pedido' a números enteros (UNIX timestamp)
df['Fecha de pedido'] = df['Fecha de pedido'].astype(int) // 10**9

# Dividir el conjunto de datos
X_train, X_test, y_train, y_test = train_test_split(df[['ID', 'Fecha de pedido']], df['Regalias'], test_size=0.2, random_state=42)

# Restablecer el índice después de la división
X_train.reset_index(drop=True, inplace=True)
X_test.reset_index(drop=True, inplace=True)
y_train.reset_index(drop=True, inplace=True)
y_test.reset_index(drop=True, inplace=True)

# Proporcionar nombres de características al modelo
X_train.columns = ['ID', 'Fecha de pedido']

# Inicializar el modelo
modelo = LinearRegression()

# Entrenar el modelo
modelo.fit(X_train, y_train)

# Crear un DataFrame para almacenar las predicciones futuras
predicciones_futuras = pd.DataFrame()

# Generar predicciones para cada libro
for ID in df['ID'].unique():
    # Filtrar datos para el libro específico
    datos_libro = df[df['ID'] == ID]

    # Obtener la fecha actual
    fecha_actual = datetime.now()

    # Calcular fecha futura
    fecha_futura = fecha_actual + timedelta(days=30)  # Ajusta el número de días según sea necesario

    # Convertir la fecha a un número
    fecha_futura_numerica = fecha_futura.timestamp()

    # Verificar si el 'ID' está presente en la correspondencia de títulos
    if ID in titulo_correspondencia['ID'].values:
        # Realizar la predicción
        prediccion = modelo.predict([[ID, fecha_futura_numerica]])  # Se pasa tanto 'ID' como 'Fecha de pedido'

        # Obtener el título correspondiente al 'ID'
        titulo_correspondiente = titulo_correspondencia[titulo_correspondencia['ID'] == ID]['Titulo_del Libro'].iloc[0]

        # Agregar la predicción al DataFrame
        predicciones_futuras = pd.concat([predicciones_futuras, pd.DataFrame({
            'ID': [ID],
            'Titulo_del Libro': [titulo_correspondiente],
            'Fecha de pedido': [fecha_futura],
            'Prediccion Regalias': [round(prediccion[0], 2)]  # Redondear a dos decimales
        })], ignore_index=True)
    else:
        print(f"No se encontró ninguna correspondencia para el ID {ID}.")

# Mostrar el DataFrame con las predicciones en euros
predicciones_futuras['Regalias en euros'] = predicciones_futuras['Prediccion Regalias'] * 0.85  # Assuming 1 USD = 0.85 EUR
predicciones_futuras['Regalias en euros'] = predicciones_futuras['Regalias en euros'].map('${:,.2f}€'.format)
print(predicciones_futuras)



No se encontró ninguna correspondencia para el ID 0.
      ID                                   Titulo_del Libro  \
0    210  3.3. WIFI + RED 802.11: Cifrados WEP, WPA, WPA2..   
1    209  3.2. PASSWDS Cracking: Fuerza Bruta & Dicciona...   
2    208  3.2. PASSWDS Cracking: Fuerza Bruta & Dicciona...   
3    207  3.1. EXPLOTACIÓN + SPOOFING: Activos a la vista..   
4    206  3.5. PIVOTING: METASPLOIT frameworks: Laborato...   
..   ...                                                ...   
205    5  0.1. LEGAL & DATA, Agreement: Legislación y ac...   
206    4  4.2. GUIA TERMUX: ANDROID PHISHING:  Hacking d...   
207    3  1.2. OSINT, Doxing (& Dorking): Inteligencia d...   
208    2  3.1. EXPLOTACIÓN + SPOOFING: Activos a la vista..   
209    1  1.2. OSINT, Doxing (& Dorking): Inteligencia d...   

               Fecha de pedido  Prediccion Regalias Regalias en euros  
0   2024-02-12 21:56:58.839523               407.79          $346.62€  
1   2024-02-12 21:56:58.844623               4

