In [1]:
# Primeira parte
import pandas as pd
import pymongo
import urllib.parse

# Definir o caminho do arquivo CSV
csv_path = r"C:\Users\eopab\OneDrive\Área de Trabalho\atlas\IMDB top 1000.csv"

# Ler o CSV usando Pandas
df = pd.read_csv(csv_path)

In [2]:
import pymongo
import urllib.parse
from pymongo import MongoClient
from pymongo.server_api import ServerApi

# 1. Definir usuário e senha
username = "eopabro_db_user"
password = "hH4Jt5IwFAHurKb2"

# 2. Codificar a senha (boa prática para garantir segurança com caracteres especiais)
password_encoded = urllib.parse.quote_plus(password)

# 3. Criar a URI corretamente formatada
# ATENÇÃO: O host do cluster foi ajustado para 'eopabro.b1uqqmi.mongodb.net' 
# para corresponder ao seu cluster real, em vez de 'cluster0.i4a2i8b.mongodb.net'.
MONGO_URI = f"mongodb+srv://{username}:{password_encoded}@eopabro.b1uqqmi.mongodb.net/?appName=eopabro" 

# 4. Conectar ao MongoDB Atlas usando o ServerApi
# Isso garante compatibilidade futura e é o método recomendado.
client = MongoClient(MONGO_URI, server_api=ServerApi('1'))

# 5. Testar a conexão enviando um ping
try:
    client.admin.command('ping')
    print("✅ Pinged your deployment. You successfully connected to MongoDB!")
    
    # 6. Acessar o banco e a coleção
    # Lembre-se de confirmar se 'filmes' e 'filmes-series' são os nomes EXATOS.
    db = client["filmes"]
    collection = db["imdb"]
    
    print(f"✅ Conexão com MongoDB Atlas estabelecida! (Banco: {db.name}, Coleção: {collection.name})")

except Exception as e:
    print(f"❌ Erro na conexão com o MongoDB Atlas: {e}")

# 7. Você pode fechar a conexão no final do seu script
# client.close()

✅ Pinged your deployment. You successfully connected to MongoDB!
✅ Conexão com MongoDB Atlas estabelecida! (Banco: filmes, Coleção: imdb)


In [3]:
# Terceira parte

# Converte o DataFrame (df) em uma lista de dicionários, onde cada linha vira um "registro" (record) separado.
# df.to_dict() → transforma o DataFrame em um dicionário.
# orient="records" → define o formato da conversão: cada linha = 1 dicionário (ideal para inserir no MongoDB).
dados_json = df.to_dict(orient="records")

# Ou seja: orient="records" instrui o pandas a gerar uma lista de documentos JSON, 
# cada um representando uma linha da tabela, que o MongoDB entende perfeitamente.

# Insere todos os documentos (dicionários) da lista 'dados_json' dentro da coleção MongoDB de uma só vez.
# 'collection' → é o objeto que representa a coleção (tabela) no banco MongoDB.
# 'insert_many()' → comando do PyMongo que insere múltiplos documentos de uma vez (em lote).
# 'dados_json' → é a lista de dicionários criada antes (cada item = um documento/linha).
collection.insert_many(dados_json)

print(" Dados enviados para o MongoDB Atlas com sucesso!")

 Dados enviados para o MongoDB Atlas com sucesso!


In [4]:
for doc in collection.find({"Genre": "Drama"}):
    print(doc["Title"], "-", doc["Rate"])

# Retorna todos os filmes onde o campo "Genre" é "Drama".
# Você pode alterar para "Action", "Comedy", etc.

1. The Shawshank Redemption (1994) - 9.3
10. Fight Club (1999) - 8.8
19. One Flew Over the Cuckoo's Nest (1975) - 8.7
40. American History X (1998) - 8.5
45. Cinema Paradiso (1988) - 8.5
54. Capernaum (2018) - 8.4
88. The Hunt (2012) - 8.3
91. 7 Kogustaki Mucize (2019) - 8.3
98. Requiem for a Dream (2000) - 8.3
99. American Beauty (1999) - 8.3
122. Ikiru (1952) - 8.3
123. Bicycle Thieves (1948) - 8.3
141. Udaan (2010) - 8.2
149. There Will Be Blood (2007) - 8.2
153. Black (2005) - 8.2
155. Swades (2004) - 8.2
185. Tokyo Story (1953) - 8.2
187. All About Eve (1950) - 8.2
197. Mommy (I) (2014) - 8.1
202. Winter Sleep (2014) - 8.1
223. Gran Torino (2008) - 8.1
252. Trainspotting (1996) - 8.1
267. Paris, Texas (1984) - 8.1
272. Fanny and Alexander (1982) - 8.1
278. Network (1976) - 8.1
283. Cries & Whispers (1972) - 8.1
295. The Virgin Spring (1960) - 8.1
301. Nights of Cabiria (1957) - 8.1
335. Short Term 12 (2013) - 8.0
346. The Help (2011) - 8.0
351. My Name Is Khan (2010) - 8.0
368. Th

In [5]:
for doc in collection.find({"Rate": {"$gt": 8.5}}):
    print(doc["Title"], "-", doc["Rate"])

# O operador $gt significa greater than (maior que).
# Mostra filmes com nota superior a 8.5 no IMDB.

1. The Shawshank Redemption (1994) - 9.3
2. The Godfather (1972) - 9.2
3. The Dark Knight (2008) - 9.0
4. The Godfather: Part II (1974) - 9.0
5. The Lord of the Rings: The Return of the King (2003) - 8.9
6. Pulp Fiction (1994) - 8.9
7. Schindler's List (1993) - 8.9
8. 12 Angry Men (1957) - 8.9
9. Inception (2010) - 8.8
10. Fight Club (1999) - 8.8
11. The Lord of the Rings: The Fellowship of the Ring (2001) - 8.8
12. Forrest Gump (1994) - 8.8
13. The Good, the Bad and the Ugly (1966) - 8.8
14. Hamilton (2020) - 8.7
15. The Lord of the Rings: The Two Towers (2002) - 8.7
16. The Matrix (1999) - 8.7
17. Goodfellas (1990) - 8.7
18. Star Wars: Episode V - The Empire Strikes Back (1980) - 8.7
19. One Flew Over the Cuckoo's Nest (1975) - 8.7
20. Parasite (2019) - 8.6
21. Interstellar (2014) - 8.6
22. City of God (2002) - 8.6
23. Spirited Away (2001) - 8.6
24. Saving Private Ryan (1998) - 8.6
25. The Green Mile (1999) - 8.6
26. Life Is Beautiful (1997) - 8.6
27. Se7en (1995) - 8.6
28. The Silen

In [6]:
query = {"Genre": "Drama", "Metascore": {"$gt": 90}}
for doc in collection.find(query, {"Title": 1, "Metascore": 1, "_id": 0}):
    print(doc)

# Filtra por dois critérios: gênero e metascore alto.
# O segundo parâmetro {} define quais campos mostrar (1 = incluir, 0 = excluir).

{'Title': '149. There Will Be Blood (2007)', 'Metascore': 93.0}
{'Title': '187. All About Eve (1950)', 'Metascore': 98.0}
{'Title': '272. Fanny and Alexander (1982)', 'Metascore': 100.0}


In [7]:
count = collection.count_documents({"Certificate": "R"})
print("Total de filmes com classificação R:", count)

## Conta quantos documentos possuem o valor "R" no campo "Certificate".

Total de filmes com classificação R: 345
