In [4]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
import time

# Início da contagem de tempo
start_time = time.time()

# 1. Carregar os Dados
df = pd.read_csv("dados.csv")

# 2. Pré-processamento dos Dados (se necessário)

# 4. Vetorização das Sinopses
tfidf_vectorizer = TfidfVectorizer(stop_words='english')
tfidf_matrix = tfidf_vectorizer.fit_transform(df['Sinopse'])

# 5. Construção do Modelo de Recomendação
def recommend_movies(input_text, top_n=5):
    input_vector = tfidf_vectorizer.transform([input_text])
    cosine_similarities = cosine_similarity(input_vector, tfidf_matrix).flatten()
    top_indices = cosine_similarities.argsort()[:-top_n-1:-1]  # top N similar movies
    return df.iloc[top_indices]

# 6. Recomendação de Filmes
user_input = "Romantic"
recommended_movies = recommend_movies(user_input)
print(recommended_movies[['Titulo', 'Sinopse', 'Genero']])

# Fim da contagem de tempo
end_time = time.time()
# Tempo total de execução
execution_time = end_time - start_time
print("Tempo de execução:", execution_time, "segundos")

                     Titulo  \
815         Must Be... Love   
4579      Manhattan Romance   
4576       Mandobasar Galpo   
4636  Mission: Destroy Love   
1162            Almost Love   

                                                Sinopse  \
815   when a teenage girl develops romantic feelings...   
4579  a filmmaker working on a documentary about lov...   
4576  with the assistance of a psychiatrist  an accl...   
4636  two strangers meet by chance on a trip to thai...   
1162  a close crew of striving new yorkers experienc...   

                                               Genero  
815            Comedies, Dramas, International Movies  
4579    Comedies, Independent Movies, Romantic Movies  
4576    Dramas, International Movies, Romantic Movies  
4636  Comedies, International Movies, Romantic Movies  
1162             Comedies, Dramas, Independent Movies  
Tempo de execução: 0.1788182258605957 segundos
