In [None]:
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.feature_extraction.text import CountVectorizer

In [None]:
df = pd.read_csv('datasets_norm/registros_peliculas.csv', encoding = 'utf-8')

In [None]:
def get_recommendation(titulo_pelicula, tipo_contenido):
    # Filtrar el DataFrame por el tipo de contenido
    df_tipo = df[df['type'] == tipo_contenido]
    
    # Obtener el índice de la película de entrada
    indice_pelicula = df_tipo[df_tipo['title'] == titulo_pelicula].index[0]
    
    # Combinar las columnas "rating" y "listed_in" en una sola columna de texto
    df_tipo['combined'] = df_tipo['rating'] + ', ' + df_tipo['listed_in']
    
    # Inicializar y ajustar el vectorizador de conteo de palabras
    vectorizer = CountVectorizer(tokenizer=lambda x: x.split(', '))
    combined_matrix = vectorizer.fit_transform(df_tipo['combined'])
    
    # Calcular la similitud de coseno entre el rating y las categorías de la película de entrada y todas las demás películas del mismo tipo
    similarities = cosine_similarity(combined_matrix)
    
    # Obtener las similitudes de la película de entrada con las demás películas del mismo tipo
    pelicula_similarities = similarities[indice_pelicula]
    
    # Obtener los índices de las 5 películas más similares (excluyendo la película de entrada)
    indices_similares = pelicula_similarities.argsort()[:-6:-1]
    
    # Obtener los nombres de las 5 películas más similares del mismo tipo
    peliculas_similares = df_tipo.iloc[indices_similares]['title'].values.tolist()
    
    return peliculas_similares

In [None]:
# Ejemplo de uso
pelicula = "the chronicles of narnia: the lion, the witch and the wardrobe" # Reemplaza con el título de la película de interés
tipo = 'movie'  # Reemplaza con el tipo de contenido ('movie' o 'tv-show')
recomendaciones = get_recommendation(pelicula, tipo)
print(recomendaciones)