In [None]:
import pandas as pd
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

In [None]:
# Collecte des données d'utilisateurs et de films
ratings_data = pd.read_csv("ratings.csv")
movie_data = pd.read_csv("movies.csv")

In [None]:
# Nettoyage et prétraitement des données
ratings_data.dropna(inplace=True)
movie_data.dropna(inplace=True)

In [None]:
# Jointure des données d'utilisateurs et de films
merged_data = pd.merge(ratings_data, movie_data, on="movieId")

In [None]:
# Pivotage des données pour créer une matrice utilisateur-film
user_movie_matrix = merged_data.pivot_table(index="userId", columns="title", values="rating")

In [None]:
# Remplacement des valeurs manquantes par 0
user_movie_matrix.fillna(0, inplace=True)

# Calcul de la similarité cosinus entre les utilisateurs
user_similarity = cosine_similarity(user_movie_matrix)


In [None]:
# Définition de la fonction de recommandation
def recommend_movies(user):
    # Récupération de l'index de l'utilisateur
    user_index = user_movie_matrix.index.get_loc(user)
    # Calcul de la similarité cosinus entre l'utilisateur et les autres utilisateurs
    similarities = user_similarity[user_index]
    # Récupération des indices des utilisateurs les plus similaires
    similar_indices = similarities.argsort()[::-1][1:]
    # Initialisation d'un dictionnaire pour stocker les recommandations et leur score
    recommendations = {}
    # Pour chaque utilisateur similaire, récupération des films qu'il a notés positivement
    for i in similar_indices:
        rated_movies = user_movie_matrix.iloc[i].where(lambda x: x > 3).dropna()
        # Pour chaque film noté positivement, ajout à la liste de recommandations avec le score de similarité correspondant
        for movie, rating in rated_movies.iteritems():
            if movie not in user_movie_matrix.iloc[user_index]:
                if movie not in recommendations:
                    recommendations[movie] = rating * similarities[i]
                else:
                    recommendations[movie] += rating * similarities[i]
    # Tri des recommandations par score décroissant
    sorted_recommendations = sorted(recommendations.items(), key=lambda x: x[1], reverse=True)
    return sorted_recommendations[:10]

In [None]:
user_id = 2
recommendations = recommend_movies(user_id)
print("Les 10 films les plus recommandés pour l'utilisateur {} sont :".format(user_id))
for i, recommendation in enumerate(recommendations):
    print("{}) {} (score : {})".format(i+1, recommendation[0], round(recommendation[1], 2)))


Les 10 films les plus recommandés pour l'utilisateur 2 sont :
