SISTEMA DE RECOMENDACIONES DE NETFLIX :

Este proyecto es particularmente interesante. Se trata de un sistema de recomendación de 
Netflix, ideal para aspirantes a científicos de datos o entusiastas del aprendizaje automático.
Para crear este proyecto, deberás importar una variedad de módulos, incluyendo tkinter, re, 
nltk, pandas y numpy (consulta las instrucciones de instalación de pip para los nuevos 
módulos). También necesitarás descargar un conjunto de datos que contenga películas y 
programas de TV de Netflix (puedes encontrar datos aquí:
 
 https://www.kaggle.com/datasets/satpreetmakhija/netflix-movies-and-tv-shows-2021?resource=download). 
Puedes utilizar tkinter para crear nuestra interfaz gráfica de usuario (GUI), que utilizará 
etiquetas, botones y campos de entrada. El usuario podrá ingresar una serie o película que 
haya disfrutado en Netflix para obtener recomendaciones basadas en sus gustos. El motor de 
recomendación podría utilizar reparto, director, calificaciones, país y géneros como 
‘características' de similitud. 

modulos :  tkinter, re, nltk, pandas, numpy

descargar DataSet de Peliculas y Programas de TV de Netfliux

Direccion ---- https://www.kaggle.com/datasets/satpreetmakhija/netflix-movies-and-tv-shows-2021?resource=download)

Motor de Recomendacion : Reparto, Director, Calificaciones, Pais, Genero,,,         ### Como Caracteristicas de Similitud..

In [5]:
import pandas as pd
import numpy as np
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import tkinter as tk
from tkinter import messagebox
import os

# ------------------------------------
# 1. Carga y Preprocesamiento de Datos
# ------------------------------------
def cargar_datos(ruta):
    """Carga los datos desde un archivo CSV."""
    if not os.path.exists(ruta):
        raise FileNotFoundError("El archivo no existe en la ruta especificada.")
    print(f"Leyendo datos desde: {ruta}")
    data = pd.read_csv(ruta)
    print("Datos cargados. Columnas disponibles: ", data.columns.tolist())
    if not all(col in data.columns for col in ['Title', 'Cast', 'Director', 'Genres']):
        raise ValueError("El archivo CSV no contiene las columnas necesarias: ['Title', 'Cast', 'Director', 'Genres'].")
    data = data.dropna(subset=['Title', 'Cast', 'Director', 'Genres'])
    print("Filtrando filas con valores nulos en las columnas clave...")
    data['combined_features'] = (
        data['Cast'] + ' ' + data['Director'] + ' ' + data['Genres']
    )
    print("Columna 'combined_features' creada.")
    return data

# ------------------------------------
# 2. Vectorización y Similitud
# ------------------------------------
def vectorizar_datos(data):
    """Crea la matriz de características vectorizadas."""
    print("Iniciando vectorización de datos...")
    vectorizer = TfidfVectorizer(stop_words='english')
    features = vectorizer.fit_transform(data['combined_features'])
    print("Vectorización completa. Dimensiones de la matriz: ", features.shape)
    return features

def calcular_similitud(features):
    """Calcula la matriz de similitud de coseno."""
    print("Calculando matriz de similitud de coseno...")
    similitud = cosine_similarity(features)
    print("Cálculo de similitud completado.")
    return similitud

# ------------------------------------
# 3. Motor de Recomendación
# ------------------------------------
def obtener_recomendaciones(titulo, data, similitud):
    """Devuelve una lista de recomendaciones basadas en un título."""
    print(f"Buscando recomendaciones para el título: {titulo}")
    if titulo not in data['Title'].values:
        print("Título no encontrado en los datos.")
        return ["Título no encontrado. Intenta con otro."]
    
    indice = data[data['Title'] == titulo].index[0]
    puntuaciones = list(enumerate(similitud[indice]))
    puntuaciones = sorted(puntuaciones, key=lambda x: x[1], reverse=True)[1:6]
    recomendaciones = [data['Title'].iloc[i[0]] for i in puntuaciones]
    print(f"Recomendaciones encontradas: {recomendaciones}")
    return recomendaciones

# ------------------------------------
# 4. Interfaz Gráfica (GUI)
# ------------------------------------
def crear_interfaz(data, similitud):
    """Crea la interfaz gráfica de usuario."""
    def recomendar():
        titulo = entrada.get()
        if not titulo:
            messagebox.showwarning("Advertencia", "Por favor, ingresa un título.")
            return
        recomendaciones = obtener_recomendaciones(titulo, data, similitud)
        resultado.config(text="\n".join(recomendaciones))

    print("Iniciando interfaz gráfica...")
    ventana = tk.Tk()
    ventana.title("Sistema de Recomendación de Netflix")
    
    tk.Label(ventana, text="Ingresa el título de una película o serie:").pack()
    entrada = tk.Entry(ventana, width=50)
    entrada.pack()
    
    tk.Button(ventana, text="Recomendar", command=recomendar).pack()
    resultado = tk.Label(ventana, text="", wraplength=400)
    resultado.pack()
    
    ventana.mainloop()

# ------------------------------------
# 5. Ejecución Principal
# ------------------------------------
def main():
    ruta_datos = "/home/carlos/programacion_Orientada_Objeto/**Proyectos de Portafolio - Python Avanzado**/netflixData.csv"  # Cambiar según sea necesario
    try:
        print("Cargando datos...")
        data = cargar_datos(ruta_datos)
        print("Vectorizando datos...")
        features = vectorizar_datos(data)
        print("Calculando similitudes...")
        similitud = calcular_similitud(features)
        print("Iniciando interfaz gráfica...")
        crear_interfaz(data, similitud)
    except Exception as e:
        print(f"Error: {e}")

if __name__ == "__main__":
    main()






Cargando datos...
Leyendo datos desde: /home/carlos/programacion_Orientada_Objeto/**Proyectos de Portafolio - Python Avanzado**/netflixData.csv
Datos cargados. Columnas disponibles:  ['Show Id', 'Title', 'Description', 'Director', 'Genres', 'Cast', 'Production Country', 'Release Date', 'Rating', 'Duration', 'Imdb Score', 'Content Type', 'Date Added']
Filtrando filas con valores nulos en las columnas clave...
Columna 'combined_features' creada.
Vectorizando datos...
Iniciando vectorización de datos...
Vectorización completa. Dimensiones de la matriz:  (3641, 21968)
Calculando similitudes...
Calculando matriz de similitud de coseno...
Cálculo de similitud completado.
Iniciando interfaz gráfica...
Iniciando interfaz gráfica...
Buscando recomendaciones para el título: TV show
Título no encontrado en los datos.
Buscando recomendaciones para el título: 10 Days in Sun City
Recomendaciones encontradas: ['Mauli', 'Love Per Square Foot', 'Skater Girl', 'Killa', 'X: Past Is Present']
Buscando rec