## **Machine Learning Model**

En este notebook se planea crear un modelo de machine learning que nos permita desarrollar "Recomendacion item_item". Esto es,  permite sugerir elementos items similares a aquellos usuarios que han interactuado con un juego en especifico.

Es de tener en cuenta que se usaran la menor cantidad de celdas de accion con el fin de hacer nuestro codigo lo mas corto y simple posible. De ser necesario, las interacciones tendran su respectivo comentario que nos ayudara a entender el codigo.

Nuestro codigo se repartira en distintas secciones teniendo una similitud con el patron Modelo - Vista - Controlador (MVC):

* Celda de librerias.
* Celda de acciones.
* Celda de vistas.

## 1. Librerias
    
    Esta Celda nos ayudara a traer todas las librerias necesarias con el fin de completar el ejercicio

In [19]:
import pandas as pd
import numpy as np

import scipy as sp
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.feature_extraction.text import TfidfVectorizer



## 2. Acciones
    Esta celda nos ayudara a crear todas las funciones necesarias.

## 3. Vistas

## 3.1 Sistema de Recomendacion Item - Item

In [25]:



# Creamos la funcion de recomendacion item-item

def recomendacion_juego(id_producto):

    # Obtencion del Dataset (asumiremos que esto ya está definido)

    item_data = pd.read_parquet("data\steam_game_data")
    col_drop = ["release_date", "tags", "specs", "price", "early_access", "developer", "release_year"]
    item_data.drop(columns= col_drop, inplace=True )

    #Reducimos el tamanio de la data a un 20% del total debido a la incapacidad de procesar tanta informacion

    item_data = item_data.sample(frac=1/5, random_state=42).reset_index()

    # Usamos procesamiento de texto para generar una matriz TF-IDF
    tfidf = TfidfVectorizer(stop_words="english")
    item_data["genres"] = item_data["genres"].fillna("")
    tfidf_matrix = tfidf.fit_transform(item_data["genres"])  # Vector TF-IDF

    # Entrenamiento similitud del coseno

    cosine_sim = cosine_similarity(tfidf_matrix, tfidf_matrix) 

    idx = item_data[item_data["id"] == id_producto].index[0]  # Encuentra el indice del juego
    sim_scores = list(enumerate(cosine_sim [idx]))  # Lista de puntuacion similitud en relacion al indice
    sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)  # Organizo los indices de mayor a menor
    sim_scores = sim_scores[1:6]  # Top 5 juegos recomendados (sin tomar el idx 0 ya que es el mismo juego)
    game_indices = [i[0] for i in sim_scores]  # Tomo la primera posicion de las duplas formadas por sim_scores

    print(f"Juego Seleccionado:  {item_data[item_data['id'] == id_producto].iloc[0]}")

    return item_data[["genres","title","id"]].iloc[game_indices]


## 4. Seccion De Pruebas

In [26]:
recomendacion_juego("271100")

Juego Seleccionado:  index                                      3181
genres                                    Indie
title     Master Reboot Art Book and Soundtrack
id                                       271100
Name: 0, dtype: object


Unnamed: 0,genres,title,id
2,Indie,Flat Path,512740
3,Indie,Choice of the Ninja,752850
11,Indie,Supersonic Tank Cats,701080
15,Indie,Oblivious Garden ~White Day,345040
18,Indie,Sentinels of the Multiverse - Digital Foil Her...,532620
