In [4]:
import pandas as pd

# Carregar dados do arquivo CSV (u.item contém informações dos filmes)
df = pd.read_csv('u.item', sep='|', encoding='latin-1', names=['MovieID', 'Title'], usecols=range(2))

# Ler os dados de avaliações do arquivo CSV (u.data contém as avaliações dos usuários)
ratings_df = pd.read_csv('u.data', sep='\t', names=['UserID', 'MovieID', 'Rating'], usecols=range(3))

# Filtrar as avaliações positivas (notas >= 4)
positive_ratings = ratings_df[ratings_df['Rating'] >= 4]

# Contar o número total de avaliações por filme
total_ratings_count = ratings_df.groupby('MovieID')['Rating'].count().reset_index()
total_ratings_count.columns = ['MovieID', 'TotalCount']

# Contar o número de avaliações positivas por filme
positive_ratings_count = positive_ratings.groupby('MovieID')['Rating'].count().reset_index()
positive_ratings_count.columns = ['MovieID', 'PositiveCount']

# Mesclar os dados dos filmes com o número total de avaliações e avaliações positivas
merged_df = pd.merge(total_ratings_count, positive_ratings_count, on='MovieID')

# Calcular o percentual positivo de notas por filme
merged_df['PositivePercentage'] = (merged_df['PositiveCount'] / merged_df['TotalCount']) * 100

# Mesclar com os títulos dos filmes
merged_df = pd.merge(merged_df, df, on='MovieID')

# Ordenar os filmes pelo maior percentual positivo de notas
top_positive_movies = merged_df.sort_values(by='PositivePercentage', ascending=False).head(10)

# Exibir a lista dos filmes com o maior percentual positivo de notas
print("Top 10 filmes com maior percentual positivo de notas:")
print(top_positive_movies[['MovieID', 'Title', 'PositivePercentage', 'PositiveCount', 'TotalCount']])


Top 10 filmes com maior percentual positivo de notas:
      MovieID                                 Title  PositivePercentage  \
796       814         Great Day in Harlem, A (1994)               100.0   
1331     1449                Pather Panchali (1955)               100.0   
1446     1674                     Mamma Roma (1962)               100.0   
1334     1452              Lady of Burlesque (1943)               100.0   
1337     1458          Damsel in Distress, A (1937)               100.0   
1343     1467  Saint of Fort Washington, The (1993)               100.0   
1034     1064                      Crossfire (1947)               100.0   
1356     1482    Gate of Heavenly Peace, The (1995)               100.0   
697       711         Substance of Fire, The (1996)               100.0   
1367     1498                 Farmer & Chase (1995)               100.0   

      PositiveCount  TotalCount  
796               1           1  
1331              8           8  
1446              