In [2]:
# Importando as bibliotecas necessárias
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics.pairwise import linear_kernel
import joblib

# Carregando os dados do arquivo CSV
df = pd.read_csv('dados.csv')

# Pré-processamento dos dados
# Para simplificar, vou considerar apenas 'titulo', 'genero' e 'sinopse'
features = ['Titulo', 'Genero', 'Sinopse']
df['Sinopse'] = df['Sinopse'].fillna('')  # Lidando com valores nulos na sinopse

# Construindo um vetorizador TF-IDF para converter texto em vetores numéricos
tfidf_vectorizer = TfidfVectorizer(stop_words='english')
tfidf_matrix = tfidf_vectorizer.fit_transform(df['Sinopse'])

# Treinando o modelo Random Forest
random_forest = RandomForestClassifier(n_estimators=100, random_state=42)
random_forest.fit(tfidf_matrix, df['Titulo'])

# Salvando o modelo e o vetorizador para uso futuro
joblib.dump(random_forest, 'modelo_random_forest.pkl')
joblib.dump(tfidf_vectorizer, 'vetorizador_tfidf.pkl')

# Função para recomendar filmes com base na sinopse fornecida pelo usuário
def recomendar_filmes(sinopse_usuario, df, tfidf_vectorizer, modelo):
    # Vetorizando a sinopse do usuário usando o mesmo vetorizador usado no treinamento
    sinopse_usuario_vec = tfidf_vectorizer.transform([sinopse_usuario])

    # Fazendo previsões de classificação usando o modelo Random Forest
    predicoes = modelo.predict(sinopse_usuario_vec)

    # Recuperando os filmes recomendados com base nas previsões
    indices_recomendados = df[df['Titulo'] == predicoes[0]].index

    return df.iloc[indices_recomendados]

# Exemplo de uso da função para recomendar filmes
sinopse_usuario = "war"
filmes_recomendados = recomendar_filmes(sinopse_usuario, df, tfidf_vectorizer, random_forest)
print(filmes_recomendados[['Titulo', 'Genero', 'Sinopse']])


KeyboardInterrupt

