In [1]:
import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.neighbors import NearestNeighbors
import psutil
import time

# Início da contagem de tempo
start_time = time.time()

# Função para medir o uso de memória
def memory_usage():
    # Obtém o uso de memória atual em MB
    mem_usage_mb = psutil.Process().memory_info().rss / 1024 / 1024
    return mem_usage_mb

# Imprime o uso de memória inicial
print("Uso de memória inicial:", memory_usage(), "MB")

# Carregar o DataFrame com os dados dos filmes
df = pd.read_csv('dados.csv')

# 3. Combinar título, sinopse e gênero em uma única coluna
df['Features'] = df['Titulo'] + ' ' + df['Sinopse'] + ' ' + df['Genero'] + ' ' + df['Pais'] + ' ' + df['Ano'].astype(str) + ' ' + df['Minutagem'].astype(str)

# Imprime o uso de memória após carregar o DataFrame
print("Uso de memória após carregar DataFrame:", memory_usage(), "MB")

# Criar um vetorizador TF-IDF para converter o texto em recursos numéricos
vectorizer = TfidfVectorizer(stop_words='english')  
X = vectorizer.fit_transform(df['Features'])

# Imprime o uso de memória após criar o vetorizador TF-IDF
print("Uso de memória após criar o vetorizador TF-IDF:", memory_usage(), "MB")

# Criar e treinar o modelo KNN
knn = NearestNeighbors(n_neighbors=5, metric='cosine')
knn.fit(X)

# Imprime o uso de memória após criar e treinar o modelo KNN
print("Uso de memória após criar e treinar o modelo KNN:", memory_usage(), "MB")

# Função para recomendar filmes com base na entrada do usuário
def recommend_movies(user_input):
    # Vetorizar a entrada do usuário
    entrada_usuario_vector = vectorizer.transform([user_input])

    # Encontrar os filmes mais próximos da entrada do usuário
    distances, indices = knn.kneighbors(entrada_usuario_vector)
    
    # Criar um DataFrame com os filmes recomendados
    recommended_movies_df = df.iloc[indices[0]][['Titulo', 'Sinopse', 'Genero']]

    return recommended_movies_df

# Solicitar entrada do usuário
user_input = "War"

# Recomendar filmes com base na entrada do usuário
recommended_movies = recommend_movies(user_input)

# Exibir os títulos e sinopses dos filmes recomendados
print(recommended_movies)

# Fim da contagem de tempo
end_time = time.time()

# Tempo total de execução
execution_time = end_time - start_time
print("Tempo de execução:", execution_time, "segundos")

# Uso de memória final
print("Uso de memória final:", memory_usage(), "MB")



Uso de memória inicial: 140.40234375 MB
Uso de memória após carregar DataFrame: 147.453125 MB
Uso de memória após criar o vetorizador TF-IDF: 153.390625 MB
Uso de memória após criar e treinar o modelo KNN: 153.390625 MB
                 Titulo                                            Sinopse  \
341   Company of Heroes  during the last major german offensive of worl...   
2051  War Against Women  filmed over three years in 10 countries  this ...   
321       A Private War  in this biopic  war correspondent marie colvin...   
3147        War Machine  when a proud general is tasked with winning an...   
5600  War Chhod Na Yaar  set in an india pakistan border post  this sat...   

                                      Genero  
341               Action & Adventure, Dramas  
2051     Documentaries, International Movies  
321               Dramas, Independent Movies  
3147                        Comedies, Dramas  
5600  Comedies, Dramas, International Movies  
Tempo de execução: 0.19037795