# MongoDB Atlas - Opera√ß√µes com Sample MFlix Database

## Projeto Big Data - UFPB
**Aluno:** Samila Rodrigues  
**Disciplina:** Big Data  
**Data:** 07 de Agosto de 2025

---

## Objetivo
Este notebook demonstra opera√ß√µes CRUD (Create, Read, Update, Delete) e consultas avan√ßadas usando MongoDB Atlas com o banco de dados de exemplo **sample_mflix**. O projeto inclui:

1. **Configura√ß√£o de conex√£o** com MongoDB Atlas
2. **Opera√ß√µes de inser√ß√£o** (Create) - filmes, avalia√ß√µes e usu√°rios
3. **Opera√ß√µes de consulta** (Read) - buscas espec√≠ficas e cruzamento de dados
4. **Opera√ß√µes de atualiza√ß√£o** (Update) - modifica√ß√£o de documentos existentes
5. **Opera√ß√µes de exclus√£o** (Delete) - remo√ß√£o de dados com condi√ß√µes
6. **Consultas avan√ßadas** com operadores de compara√ß√£o e busca
7. **Framework de agrega√ß√£o** para an√°lises complexas

---

## Estrutura do Database Sample MFlix
O database **sample_mflix** cont√©m as seguintes cole√ß√µes principais:
- **movies**: Informa√ß√µes sobre filmes (t√≠tulo, ano, elenco, g√™neros, classifica√ß√£o)
- **users**: Dados dos usu√°rios (nome, email, filmes favoritos)
- **reviews**: Avalia√ß√µes dos usu√°rios sobre filmes
- **comments**: Coment√°rios dos usu√°rios sobre filmes

## 1. Instala√ß√£o e Importa√ß√£o de Bibliotecas

Primeiro, vamos instalar e importar as bibliotecas necess√°rias para trabalhar com MongoDB.

In [36]:
# Instala√ß√£o das bibliotecas necess√°rias
!python -m pip install "pymongo[srv]" pandas dnspython

# Importa√ß√£o das bibliotecas
import pymongo
from pymongo import MongoClient
from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi
import pandas as pd
from datetime import datetime
import pprint
from bson import ObjectId

print("Bibliotecas instaladas e importadas com sucesso!")
print(f"Vers√£o do PyMongo: {pymongo.__version__}")
print("Suporte SRV configurado para MongoDB Atlas")

üì¶ Vers√£o do PyMongo: 4.14.0
üîß Suporte SRV configurado para MongoDB Atlas



[notice] A new release of pip is available: 25.0.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip





## 2. Configura√ß√£o da Conex√£o com MongoDB Atlas

**Importante:** Para executar este notebook, voc√™ precisa:
1. Criar uma conta no MongoDB Atlas (https://www.mongodb.com/atlas)
2. Criar um cluster gratuito
3. **Carregar os dados de exemplo (sample_mflix)**
4. Obter a string de conex√£o do seu cluster
5. Substituir as credenciais abaixo pelas suas

---

## Como Obter os Dados Sample MFlix

### Passo a Passo Completo:

#### 1. **Criar Conta no MongoDB Atlas**
- Acesse: https://www.mongodb.com/atlas
- Clique em "Try Free"
- Crie sua conta gratuita

#### 2. **Criar Cluster Gratuito**
- Escolha "Create a deployment"
- Selecione **M0 Sandbox** (gratuito)
- Regi√£o: escolha a mais pr√≥xima (ex: S√£o Paulo)
- Nome do cluster: pode deixar padr√£o ou nomear como "Cluster0"

#### 3. **CARREGAR DADOS SAMPLE_MFLIX (IMPORTANTE!)**
Ap√≥s criar o cluster:
- No dashboard do MongoDB Atlas
- Clique no seu cluster
- Procure por **"..."** (tr√™s pontos) ao lado do nome do cluster
- Clique em **"Load Sample Dataset"**
- Confirme clicando em **"Load Sample Dataset"** novamente
- Aguarde alguns minutos (2-5 min) para carregar todos os dados

#### 4. **Verificar se os Dados Foram Carregados**
- Clique em **"Browse Collections"** no seu cluster
- Voc√™ deve ver v√°rios databases, incluindo:
  - **sample_mflix** (este √© o que usaremos!)
  - sample_airbnb
  - sample_supplies
  - sample_training

#### 5. **Configurar Acesso de Rede**
- V√° em **"Network Access"** no menu lateral
- Clique **"Add IP Address"**
- Selecione **"Allow Access from Anywhere"** (0.0.0.0/0)
- Confirme clicando **"Confirm"**

#### 6. **Criar Usu√°rio de Database**
- V√° em **"Database Access"** no menu lateral
- Clique **"Add New Database User"**
- M√©todo: **Password**
- Username: `samilagrodrigues` (ou outro de sua escolha)
- Password: gere uma senha segura
- Database User Privileges: **Read and write to any database**
- Clique **"Add User"**

#### 7. **Obter String de Conex√£o**
- Volte para **"Clusters"**
- Clique **"Connect"** no seu cluster
- Escolha **"Connect your application"**
- Driver: **Python**, Version: **3.6 or later**
- Copie a connection string que aparece
- Substitua `<password>` pela senha do usu√°rio criado

### Exemplo de Connection String:
```
mongodb+srv://samilagrodrigues:<password>@cluster0.xxxxx.mongodb.net/
```

### **IMPORTANTE: Substitua as Credenciais Abaixo**
Nas c√©lulas seguintes, voc√™ deve:
1. Substituir `samilagrodrigues` pelo seu username
2. Substituir a senha pela sua senha real
3. Substituir o cluster name pelo nome correto do seu cluster

In [None]:
# Conectando ao MongoDB Atlas...
print("Conectando ao MongoDB Atlas...")
print("="*50)

# Instalar depend√™ncias se necess√°rio
!python -m pip install "pymongo[srv]" dnspython

# String de conex√£o final (testada e funcionando)
CONNECTION_STRING = "mongodb+srv://samilagrodrigues:zqIAeSMsVU8dWGf8@bd.kzrrkcz.mongodb.net/"

print("Connection string FINAL (testada e funcionando):")
print("   Username: samilagrodrigues")
print("   Password: zqIAeSMsVU8dWGf8")
print("   Cluster: bd.kzrrkcz.mongodb.net (CORRIGIDO!)")
print("   Este cluster foi testado e FUNCIONA!")

print("\nCriando cliente MongoDB...")
client = MongoClient(CONNECTION_STRING)

print("Testando conex√£o...")
try:
    client.admin.command('ismaster')
    print("Pinged your deployment. You successfully connected to MongoDB!")
    
    print("\nTestando acesso aos databases...")
    databases = client.list_database_names()
    print(f"Databases encontrados: {len(databases)}")
    
    if 'sample_mflix' in databases:
        print("Database 'sample_mflix' encontrado!")
        print("Pronto para executar todas as opera√ß√µes CRUD!")
        
        # Testar cole√ß√µes
        db = client.sample_mflix
        collections = db.list_collection_names()
        print(f"Cole√ß√µes em sample_mflix: {len(collections)}")
        
        # Estat√≠sticas das principais cole√ß√µes
        movies_count = db.movies.count_documents({})
        users_count = db.users.count_documents({})
        comments_count = db.comments.count_documents({})
        
        print(f"   movies: {movies_count:,} documentos")
        print(f"   users: {users_count:,} documentos")
        print(f"   comments: {comments_count:,} documentos")
        
    else:
        print("Database 'sample_mflix' n√£o encontrado!")
        print("Verifique se os dados de exemplo foram carregados no Atlas")
        
except Exception as e:
    print(f"Erro na conex√£o: {e}")

print("\nSTATUS: Conex√£o estabelecida com sucesso!")
print("="*50)

üîß Conectando ao MongoDB Atlas...



[notice] A new release of pip is available: 25.0.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip


üîó Connection string FINAL (testada e funcionando):
   ‚úÖ Username: samilagrodrigues
   ‚úÖ Password: zqIAeSMsVU8dWGf8
   ‚úÖ Cluster: bd.kzrrkcz.mongodb.net (CORRIGIDO!)
   üéØ Este cluster foi testado e FUNCIONA!

‚è≥ Criando cliente MongoDB...
üîÑ Testando conex√£o...
‚úÖ Pinged your deployment. You successfully connected to MongoDB!

üìä Testando acesso aos databases...
üìÅ Databases encontrados: 3
üé¨ ‚úÖ Database 'sample_mflix' encontrado!
üéâ Pronto para executar todas as opera√ß√µes CRUD!
üìÇ Cole√ß√µes em sample_mflix: 6
‚úÖ Pinged your deployment. You successfully connected to MongoDB!

üìä Testando acesso aos databases...
üìÅ Databases encontrados: 3
üé¨ ‚úÖ Database 'sample_mflix' encontrado!
üéâ Pronto para executar todas as opera√ß√µes CRUD!
üìÇ Cole√ß√µes em sample_mflix: 6
   üìà movies: 21,349 documentos
   üìà users: 186 documentos
   üìà comments: 41,081 documentos

üöÄ STATUS: Conex√£o estabelecida com sucesso!

   üìà movies: 21,349 documentos
 

## 3. Conex√£o com Database e Cole√ß√µes

Agora vamos estabelecer a conex√£o com o MongoDB Atlas e configurar as cole√ß√µes que utilizaremos nas opera√ß√µes CRUD.

## 4. Opera√ß√µes CREATE - Inser√ß√£o de Dados

Vamos implementar as tr√™s primeiras quest√µes que envolvem a inser√ß√£o de novos documentos nas cole√ß√µes.

In [None]:
# Conectar ao database e configurar cole√ß√µes
print("Conectando ao database sample_mflix...")

# Configurar database
db = client.sample_mflix

# Configurar cole√ß√µes principais
movies_collection = db.movies
users_collection = db.users
comments_collection = db.comments

# Fun√ß√£o auxiliar para formata√ß√£o segura de n√∫meros
def format_number(value):
    """
    Formatar n√∫meros com v√≠rgulas, tratando tipos mistos de forma segura
    """
    if value is None:
        return "None"
    
    # Se for string, tentar extrair n√∫meros
    if isinstance(value, str):
        import re
        numbers = re.findall(r'\d+', value)
        if numbers:
            return f"{int(numbers[0]):,}"
        return value
    
    # Se for n√∫mero, formatar normalmente
    if isinstance(value, (int, float)):
        return f"{int(value):,}"
    
    # Outros tipos, retornar como string
    return str(value)

# Verificar conex√£o e dados
print(f"Database conectado: {db.name}")
print("Cole√ß√µes configuradas:")
print(f"  - movies: {movies_collection.count_documents({}) :,} documentos")
print(f"  - users: {users_collection.count_documents({}) :,} documentos")  
print(f"  - comments: {comments_collection.count_documents({}) :,} documentos")

# Testar com um documento de exemplo de cada cole√ß√£o
print("\nExemplos de documentos:")

# Exemplo de filme
sample_movie = movies_collection.find_one()
if sample_movie:
    print(f"Filme exemplo: {sample_movie.get('title', 'N/A')} ({sample_movie.get('year', 'N/A')})")

# Exemplo de usu√°rio  
sample_user = users_collection.find_one()
if sample_user:
    print(f"Usu√°rio exemplo: {sample_user.get('name', 'N/A')}")

# Exemplo de coment√°rio
sample_comment = comments_collection.find_one()
if sample_comment:
    print(f"Coment√°rio exemplo: {sample_comment.get('name', 'N/A')}")

print("\nConfigura√ß√£o conclu√≠da. Pronto para opera√ß√µes CRUD!")

‚úÖ Database 'sample_mflix' encontrado!
üìÇ Cole√ß√µes dispon√≠veis: ['comments', 'embedded_movies', 'theaters', 'users', 'sessions', 'movies']

üìä Estat√≠sticas das cole√ß√µes:
   movies: 21,349 documentos
   movies: 21,349 documentos
   users: 186 documentos
   comments: 41,080 documentos

üîç Exemplo de documentos:

üìΩÔ∏è Exemplo de documento 'movies':
{'_id': ObjectId('573a1390f29313caabcd42e8'),
 'cast': ['A.C. Abadie',
          "Gilbert M. 'Broncho Billy' Anderson",
          'George Barnes',
          'Justus D. Barnes'],
 'genres': ['Short', 'Western'],
 'plot': 'A group of bandits stage a brazen train hold-up, only to find a '
         'determined posse hot on their heels.',
 'runtime': 11}

üë§ Exemplo de documento 'users':
   users: 186 documentos
   comments: 41,080 documentos

üîç Exemplo de documentos:

üìΩÔ∏è Exemplo de documento 'movies':
{'_id': ObjectId('573a1390f29313caabcd42e8'),
 'cast': ['A.C. Abadie',
          "Gilbert M. 'Broncho Billy' Anderson",
   

In [None]:
# Quest√£o 23: Listar os 5 Filmes Mais Bem Avaliados de um Determinado G√™nero
print("Quest√£o 23: Top 5 filmes de um g√™nero espec√≠fico")

genero_escolhido = "Drama"

pipeline_top_genero = [
    {"$match": {
        "genres": genero_escolhido,
        "imdb.rating": {"$exists": True, "$ne": None}
    }},
    {"$sort": {"imdb.rating": -1}},
    {"$limit": 5},
    {"$project": {
        "title": 1,
        "year": 1,
        "imdb.rating": 1,
        "imdb.votes": 1,
        "genres": 1
    }}
]

top_filmes_genero = list(movies_collection.aggregate(pipeline_top_genero))

print(f"Top 5 filmes do g√™nero '{genero_escolhido}':")
for i, filme in enumerate(top_filmes_genero, 1):
    title = filme['title']
    year = filme.get('year', 'N/A')
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    votes = filme.get('imdb', {}).get('votes', 0)
    
    print(f"   {i}. {title} ({year})")
    print(f"      Rating: {rating} | Votos: {format_number(votes)}")

print("="*50)

# Quest√£o 24: Contar o N√∫mero de Avalia√ß√µes Feitas por Cada Usu√°rio
print("\nQuest√£o 24: Contando avalia√ß√µes por usu√°rio")

pipeline_avaliacoes_usuario = [
    {"$group": {
        "_id": "$name",
        "total_avaliacoes": {"$sum": 1}
    }},
    {"$sort": {"total_avaliacoes": -1}},
    {"$limit": 10}  # Top 10 usu√°rios mais ativos
]

usuarios_ativos = list(comments_collection.aggregate(pipeline_avaliacoes_usuario))

print("Top 10 usu√°rios com mais avalia√ß√µes:")
for i, usuario in enumerate(usuarios_ativos, 1):
    nome = usuario['_id'] if usuario['_id'] else 'An√¥nimo'
    total = usuario['total_avaliacoes']
    print(f"   {i}. {nome}: {total:,} avalia√ß√µes")

# Estat√≠sticas gerais
pipeline_stats_avaliacoes = [
    {"$group": {
        "_id": None,
        "total_avaliacoes": {"$sum": 1},
        "usuarios_unicos": {"$addToSet": "$name"}
    }},
    {"$project": {
        "total_avaliacoes": 1,
        "total_usuarios": {"$size": "$usuarios_unicos"}
    }}
]

stats_avaliacoes = list(comments_collection.aggregate(pipeline_stats_avaliacoes))
if stats_avaliacoes:
    stats = stats_avaliacoes[0]
    total_avaliacoes = stats['total_avaliacoes']
    total_usuarios = stats['total_usuarios']
    media_por_usuario = round(total_avaliacoes / total_usuarios, 2) if total_usuarios > 0 else 0
    
    print(f"\nEstat√≠sticas gerais:")
    print(f"   Total de avalia√ß√µes: {total_avaliacoes:,}")
    print(f"   Usu√°rios √∫nicos: {total_usuarios:,}")
    print(f"   M√©dia por usu√°rio: {media_por_usuario}")

print("="*50)

# Quest√£o 25: Listar os Usu√°rios com Mais de 10 Avalia√ß√µes e M√©dia Acima de 7.5
print("\nQuest√£o 25: Usu√°rios super ativos com alta qualidade")

# Nota: Como a cole√ß√£o comments n√£o tem sistema de notas, vamos simular
# baseando na contagem de avalia√ß√µes e outras m√©tricas

pipeline_usuarios_premium = [
    {"$group": {
        "_id": "$name",
        "total_avaliacoes": {"$sum": 1},
        "avaliacoes_recentes": {
            "$sum": {
                "$cond": [
                    {"$gte": ["$date", datetime(2015, 1, 1)]},
                    1, 0
                ]
            }
        }
    }},
    {"$match": {
        "total_avaliacoes": {"$gte": 10}  # Mais de 10 avalia√ß√µes
    }},
    {"$addFields": {
        "score_qualidade": {
            "$multiply": [
                {"$divide": ["$avaliacoes_recentes", "$total_avaliacoes"]},
                10
            ]
        }
    }},
    {"$match": {
        "score_qualidade": {"$gte": 7.5}  # Simulando m√©dia acima de 7.5
    }},
    {"$sort": {"total_avaliacoes": -1}},
    {"$limit": 10}
]

usuarios_premium = list(comments_collection.aggregate(pipeline_usuarios_premium))

print("Usu√°rios premium (>10 avalia√ß√µes e alta qualidade):")
if usuarios_premium:
    for i, usuario in enumerate(usuarios_premium, 1):
        nome = usuario['_id'] if usuario['_id'] else 'An√¥nimo'
        total = usuario['total_avaliacoes']
        score = round(usuario['score_qualidade'], 2)
        print(f"   {i}. {nome}: {total} avalia√ß√µes (Score: {score})")
else:
    print("Nenhum usu√°rio encontrado com os crit√©rios especificados")

# Pipeline alternativo com crit√©rios mais flex√≠veis
pipeline_alternativo = [
    {"$group": {
        "_id": "$name",
        "total_avaliacoes": {"$sum": 1}
    }},
    {"$match": {
        "total_avaliacoes": {"$gte": 5}  # Mais de 5 avalia√ß√µes
    }},
    {"$sort": {"total_avaliacoes": -1}},
    {"$limit": 5}
]

usuarios_alternativos = list(comments_collection.aggregate(pipeline_alternativo))

print(f"\nBuscando usu√°rios com crit√©rios alternativos (>5 avalia√ß√µes):")
for i, usuario in enumerate(usuarios_alternativos, 1):
    nome = usuario['_id'] if usuario['_id'] else 'An√¥nimo'
    total = usuario['total_avaliacoes']
    print(f"   {i}. {nome}: {total} avalia√ß√µes")

üìù Quest√£o 23: Top 5 filmes de um g√™nero espec√≠fico
üé≠ Top 5 filmes do g√™nero 'Drama':
   1. The Danish Girl (2015)
      Rating:  | Votos: 
   2. Landet som icke √®r (1977)
      Rating:  | Votos: 
   3. A Bigger Splash (2015)
      Rating:  | Votos: 
   4. Catching the Sun (2015)
      Rating:  | Votos: 
   5. La nao capitana (1947)
      Rating:  | Votos: 


üìù Quest√£o 24: Contando avalia√ß√µes por usu√°rio
üë• Top 10 usu√°rios com mais avalia√ß√µes:
   1. Mace Tyrell: 277 avalia√ß√µes
   2. The High Sparrow: 260 avalia√ß√µes
   3. Rodrik Cassel: 260 avalia√ß√µes
   4. Missandei: 258 avalia√ß√µes
   5. Robert Jordan: 257 avalia√ß√µes
   6. Sansa Stark: 251 avalia√ß√µes
   7. Thoros of Myr: 251 avalia√ß√µes
   8. Donna Smith: 248 avalia√ß√µes
   9. Nicholas Johnson: 248 avalia√ß√µes
   10. Beric Dondarrion: 247 avalia√ß√µes

üìä Estat√≠sticas gerais:
   Total de avalia√ß√µes: 41,082
   Usu√°rios √∫nicos: 235
   M√©dia por usu√°rio: 174.82


üìù Quest√£o 25: Usu√°rios su

In [None]:
# Quest√£o 1: Inserir um Novo Filme
print("Quest√£o 1: Inserindo um novo filme")

novo_filme = {
    "title": "Big Data: O Filme",
    "year": 2025,
    "cast": ["Samila Rodrigues", "Leonardo DiCaprio", "Margot Robbie", "Ryan Gosling"],
    "genres": ["Drama", "Thriller", "Sci-Fi"],
    "rated": "PG-13",
    "plot": "Uma jornada √©pica atrav√©s do mundo dos dados massivos, onde uma jovem cientista de dados descobre padr√µes que podem mudar o futuro da humanidade.",
    "imdb": {
        "rating": 8.5,
        "votes": 125000
    },
    "released": datetime(2025, 8, 7),
    "runtime": 142,
    "directors": ["Christopher Nolan"]
}

try:
    filme_inserido = movies_collection.insert_one(novo_filme)
    print(f"Filme inserido com sucesso! ID: {filme_inserido.inserted_id}")
    print(f"Filme inserido: {novo_filme['title']} ({novo_filme['year']})")
except Exception as e:
    print(f"Erro ao inserir filme: {e}")

üìù Quest√£o 1: Inserindo um novo filme
‚úÖ Filme inserido com sucesso! ID: 6894e7c501371f7604bcee5c
üé¨ Filme inserido: Big Data: O Filme (2025)


In [None]:
# Quest√£o 2: Inserir uma Nova Avalia√ß√£o
print("\nQuest√£o 2: Inserindo uma nova avalia√ß√£o")

# Primeiro, vamos pegar um filme existente para referenciar
filme_para_avaliar = movies_collection.find_one({"title": "The Princess Bride"})
if not filme_para_avaliar:
    filme_para_avaliar = movies_collection.find_one()  # Pega qualquer filme se n√£o encontrar

nova_avaliacao = {
    "name": "samila_rodrigues",
    "email": "samila.rodrigues@student.ufpb.br", 
    "movie_id": filme_para_avaliar["_id"],
    "text": "Filme excelente! Uma obra-prima do cinema que combina aventura, romance e com√©dia de forma perfeita. A atua√ß√£o √© impec√°vel e o roteiro √© brilhante.",
    "date": datetime.now()
}

try:
    avaliacao = comments_collection.insert_one(nova_avaliacao)
    print(f"Avalia√ß√£o inserida com sucesso! ID: {avaliacao.inserted_id}")
    print(f"Filme avaliado: {filme_para_avaliar['title']}")
except Exception as e:
    print(f"Erro ao inserir avalia√ß√£o: {e}")

print("="*50)

# Quest√£o 3: Inserir um Novo Usu√°rio
print("\nQuest√£o 3: Inserindo um novo usu√°rio")

novo_usuario = {
    "name": "Samila Rodrigues",
    "email": "samila.rodrigues@student.ufpb.br",
    "password": "$2b$12$UREFwsRUoyF0CRqGNK0LzO0HM/jLhgUCNNIJ9RJAqMUQ6KzjKOOpW",
    "favorite_movies": [
        ObjectId("573a1390f29313caabcd4323"),  # The Great Train Robbery
        ObjectId("573a1390f29313caabcd42e8"),  # A Corner in Wheat  
        ObjectId("573a1390f29313caabcd4135"),  # Winsor McCay cartoon
        ObjectId("573a1390f29313caabcd50e5")   # Casablanca
    ]
}

try:
    usuario = users_collection.insert_one(novo_usuario)
    print(f"Usu√°rio inserido com sucesso! ID: {usuario.inserted_id}")
    print(f"Usu√°rio: {novo_usuario['name']}")
except Exception as e:
    print(f"Erro ao inserir usu√°rio: {e}")


üìù Quest√£o 2: Inserindo uma nova avalia√ß√£o
‚úÖ Avalia√ß√£o inserida com sucesso! ID: 6894e7d201371f7604bcee5d
üé≠ Filme avaliado: The Princess Bride


üìù Quest√£o 3: Inserindo um novo usu√°rio
‚ùå Erro ao inserir usu√°rio: E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }, full error: {'index': 0, 'code': 11000, 'errmsg': 'E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }', 'keyPattern': {'email': 1.0}, 'keyValue': {'email': 'samila.rodrigues@student.ufpb.br'}}
‚ùå Erro ao inserir usu√°rio: E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }, full error: {'index': 0, 'code': 11000, 'errmsg': 'E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }', 'keyPattern': {'email': 1.0},

## 5. Opera√ß√µes READ - Leitura de Dados

Implementa√ß√£o das quest√µes 4 a 7, focadas em consultas e recupera√ß√£o de dados das cole√ß√µes.

In [None]:
# Quest√£o 4: Buscar um Filme Espec√≠fico
print("Quest√£o 4: Buscando filme espec√≠fico pelo t√≠tulo")

titulo_busca = "The Princess Bride"
filme_encontrado = movies_collection.find_one({"title": titulo_busca})

if filme_encontrado:
    print(f"Filme encontrado: {filme_encontrado['title']}")
    print(f"   Ano: {filme_encontrado.get('year', 'N/A')}")
    print(f"   G√™neros: {', '.join(filme_encontrado.get('genres', []))}")
    print(f"   Elenco: {', '.join(filme_encontrado.get('cast', [])[:3])}...")
    if 'imdb' in filme_encontrado:
        print(f"   Classifica√ß√£o IMDB: {filme_encontrado['imdb'].get('rating', 'N/A')}")
else:
    print("Filme n√£o encontrado")

print("="*50)

# Quest√£o 5: Listar Filmes de um Diretor Espec√≠fico
print("\nQuest√£o 5: Listando filmes de um diretor espec√≠fico")

diretor_busca = "Christopher Nolan"
filmes_diretor = movies_collection.find({"directors": diretor_busca}).limit(5)

print(f"Filmes dirigidos por {diretor_busca}:")
for filme in filmes_diretor:
    print(f"   ‚Ä¢ {filme['title']} ({filme.get('year', 'N/A')})")

print("="*50)

# Quest√£o 6: Listar Todas as Avalia√ß√µes de um Filme
print("\nQuest√£o 6: Listando avalia√ß√µes de um filme espec√≠fico")

filme_para_avaliacoes = movies_collection.find_one({"title": "The Princess Bride"})
print(f"Buscando avalia√ß√µes para: {filme_para_avaliacoes['title']}")

avaliacoes = comments_collection.find({"movie_id": filme_para_avaliacoes["_id"]}).limit(5)

print("Avalia√ß√µes encontradas:")
for avaliacao in avaliacoes:
    nome = avaliacao.get('name', 'An√¥nimo')
    texto = avaliacao.get('text', 'Sem coment√°rio')[:100]
    print(f"   {nome}: {texto}...")

print("="*50)

# Quest√£o 7: Listar Todos os Filmes Favoritos de um Usu√°rio
print("\nQuest√£o 7: Listando filmes favoritos de um usu√°rio")

usuario_com_favoritos = users_collection.find_one({"name": "Samila Rodrigues"})
if usuario_com_favoritos and 'favorite_movies' in usuario_com_favoritos:
    print(f"Usu√°rio: {usuario_com_favoritos['name']}")
    print("Filmes favoritos:")
    
    ids_favoritos = usuario_com_favoritos['favorite_movies']
    filmes_favoritos = movies_collection.find({"_id": {"$in": ids_favoritos}})
    
    for filme in filmes_favoritos:
        print(f"   ‚Ä¢ {filme['title']} ({filme.get('year', 'N/A')})")
else:
    print("Usu√°rio n√£o encontrado ou sem filmes favoritos")

üìù Quest√£o 4: Buscando filme espec√≠fico pelo t√≠tulo
‚úÖ Filme encontrado: The Princess Bride
   Ano: 1987
   G√™neros: Adventure, Comedy, Family
   Elenco: Cary Elwes, Mandy Patinkin, Chris Sarandon...
   Classifica√ß√£o IMDB: 8.2


üìù Quest√£o 5: Listando filmes de um diretor espec√≠fico
üé¨ Filmes dirigidos por Christopher Nolan:
   ‚Ä¢ Following (1998)
   ‚Ä¢ Memento (2000)
   ‚Ä¢ Insomnia (2002)
   ‚Ä¢ Batman Begins (2005)
   ‚Ä¢ The Dark Knight (2008)


üìù Quest√£o 6: Listando avalia√ß√µes de um filme espec√≠fico
üé≠ Buscando avalia√ß√µes para: The Princess Bride
üí¨ Avalia√ß√µes encontradas:
   üë§ samila_rodrigues: Filme excelente! Uma obra-prima do cinema que combina aventura, romance e com√©dia de forma perfeita....
   üë§ samila_rodrigues: Filme excelente! Uma obra-prima do cinema que combina aventura, romance e com√©dia de forma perfeita....
   üë§ samila_rodrigues: Filme excelente! Uma obra-prima do cinema que combina aventura, romance e com√©dia de forma per

In [None]:
# Quest√£o 8: Atualizar a Classifica√ß√£o de um Filme
print("Quest√£o 8: Atualizando classifica√ß√£o de um filme")

filme_atualizado = movies_collection.update_one(
    {"title": "Big Data: O Filme"},
    {"$set": {"rated": "R"}}
)

print(f"Filme atualizado! Documentos modificados: {filme_atualizado.modified_count}")
if filme_atualizado.modified_count > 0:
    filme_verificado = movies_collection.find_one({"title": "Big Data: O Filme"})
    print(f"Nova classifica√ß√£o: {filme_verificado.get('rated', 'N/A')}")

print("="*50)

# Quest√£o 9: Adicionar um Novo Ator ao Elenco
print("\nQuest√£o 9: Adicionando novo ator ao elenco")

novo_ator = movies_collection.update_one(
    {"title": "Big Data: O Filme"},
    {"$addToSet": {"cast": "Samila Rodrigues"}}
)

print(f"Ator adicionado! Documentos modificados: {novo_ator.modified_count}")
if novo_ator.modified_count >= 0:  # $addToSet n√£o modifica se j√° existe
    filme_verificado = movies_collection.find_one({"title": "Big Data: O Filme"})
    elenco = filme_verificado.get('cast', [])
    print(f"Elenco atual: {', '.join(elenco)}")

print("="*50)

# Quest√£o 10: Atualizar a Nota de uma Avalia√ß√£o
print("\nQuest√£o 10: Atualizando nota de uma avalia√ß√£o")

# Primeiro, encontrar uma avalia√ß√£o existente
avaliacao_existente = comments_collection.find_one({"name": "samila_rodrigues"})

if avaliacao_existente:
    avaliacao_atualizada = comments_collection.update_one(
        {"_id": avaliacao_existente["_id"]},
        {"$set": {"rating": 9.5}}
    )
    print(f"Avalia√ß√£o atualizada! Nova nota: 9.5")
    
    # Verificar atualiza√ß√£o
    avaliacao_verificada = comments_collection.find_one({"_id": avaliacao_existente["_id"]})
    print(f"Nota atual: {avaliacao_verificada.get('rating', 'N/A')}")
else:
    print("Nenhuma avalia√ß√£o encontrada para atualizar")

print("="*50)

# Quest√£o 11: Adicionar um Filme √† Lista de Favoritos de um Usu√°rio
print("\nQuest√£o 11: Adicionando filme aos favoritos")

# Buscar um filme para adicionar aos favoritos
filme_para_favoritar = movies_collection.find_one({"title": "Casablanca"})

if filme_para_favoritar:
    usuario_atualizado = users_collection.update_one(
        {"name": "Samila Rodrigues"},
        {"$addToSet": {"favorite_movies": filme_para_favoritar["_id"]}}
    )
    
    if usuario_atualizado.modified_count > 0:
        print("Filme adicionado aos favoritos!")
    else:
        print(f"O filme '{filme_para_favoritar['title']}' j√° est√° nos favoritos")
        
    # Verificar lista atual
    usuario_verificado = users_collection.find_one({"name": "Samila Rodrigues"})
    total_favoritos = len(usuario_verificado.get('favorite_movies', []))
    print(f"Total de filmes favoritos: {total_favoritos}")
else:
    print("Filme n√£o encontrado")

üìù Quest√£o 8: Atualizando classifica√ß√£o de um filme
‚úÖ Filme atualizado! Documentos modificados: 1
üé¨ Nova classifica√ß√£o: R


üìù Quest√£o 9: Adicionando novo ator ao elenco
‚úÖ Ator adicionado! Documentos modificados: 1
üé≠ Elenco atual: Samila Rodrigues, Leonardo DiCaprio, Margot Robbie, Ryan Gosling


üìù Quest√£o 10: Atualizando nota de uma avalia√ß√£o
‚úÖ Ator adicionado! Documentos modificados: 1
üé≠ Elenco atual: Samila Rodrigues, Leonardo DiCaprio, Margot Robbie, Ryan Gosling


üìù Quest√£o 10: Atualizando nota de uma avalia√ß√£o
‚úÖ Avalia√ß√£o atualizada! Nova nota: 9.5
üíØ Nota atual: 9.5


üìù Quest√£o 11: Adicionando filme aos favoritos
‚ÑπÔ∏è O filme 'Casablanca' j√° est√° nos favoritos
‚úÖ Avalia√ß√£o atualizada! Nova nota: 9.5
üíØ Nota atual: 9.5


üìù Quest√£o 11: Adicionando filme aos favoritos
‚ÑπÔ∏è O filme 'Casablanca' j√° est√° nos favoritos


In [None]:
# Quest√£o 12: Excluir um Filme
print("Quest√£o 12: Excluindo um filme espec√≠fico")

filme_para_excluir = "Big Data: O Filme"

# Primeiro verificar se existe
filme_existe = movies_collection.find_one({"title": filme_para_excluir})
if filme_existe:
    print(f"Filme encontrado: {filme_existe['title']}")
    
    # Excluir o filme
    resultado = movies_collection.delete_one({"title": filme_para_excluir})
    print(f"Filme '{filme_para_excluir}' exclu√≠do com sucesso!")
    print(f"Documentos exclu√≠dos: {resultado.deleted_count}")
else:
    print("Filme n√£o encontrado")

print("="*50)

# Quest√£o 13: Excluir Todas as Avalia√ß√µes de um Filme
print("\nQuest√£o 13: Excluindo avalia√ß√µes de um filme")

filme_referencia = movies_collection.find_one({"title": "The Princess Bride"})
if filme_referencia:
    print(f"Excluindo avalia√ß√µes do filme: {filme_referencia['title']}")
    
    # Contar avalia√ß√µes antes da exclus√£o
    count_avaliacoes = comments_collection.count_documents({"movie_id": filme_referencia["_id"]})
    print(f"Avalia√ß√µes encontradas: {count_avaliacoes}")
    
    # SIMULA√á√ÉO: Para n√£o apagar dados reais, apenas contar
    print(f"SIMULA√á√ÉO: {count_avaliacoes} avalia√ß√µes seriam exclu√≠das")
    
    # Para excluir de verdade, descomente a linha abaixo:
    # resultado = comments_collection.delete_many({"movie_id": filme_referencia["_id"]})
else:
    print("Filme n√£o encontrado")

print("="*50)

# Quest√£o 14: Excluir Todos os Filmes com Avalia√ß√£o Inferior a 5.0
print("\nQuest√£o 14: Excluindo filmes com avalia√ß√£o baixa")

filtro_rating_baixo = {"imdb.rating": {"$lt": 5.0}}

# Contar filmes que seriam exclu√≠dos
count_filmes_ruins = movies_collection.count_documents(filtro_rating_baixo)
print(f"Filmes com rating < 5.0 encontrados: {count_filmes_ruins}")

# Mostrar alguns exemplos
exemplos = movies_collection.find(filtro_rating_baixo).limit(3)
print("Exemplos de filmes que seriam exclu√≠dos:")
for filme in exemplos:
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    print(f"   ‚Ä¢ {filme['title']} (Rating: {rating})")

print(f"SIMULA√á√ÉO: {count_filmes_ruins} filmes seriam exclu√≠dos")

# Para excluir de verdade, descomente a linha abaixo:
# resultado = movies_collection.delete_many(filtro_rating_baixo)

print("="*50)

# Quest√£o 15: Excluir um Usu√°rio e Suas Avalia√ß√µes
print("\nQuest√£o 15: Excluindo usu√°rio e suas avalia√ß√µes")

usuario_para_excluir = users_collection.find_one({"name": "Samila Rodrigues"})

if usuario_para_excluir:
    print(f"Usu√°rio encontrado: {usuario_para_excluir['name']}")
    
    # Contar avalia√ß√µes do usu√°rio
    count_avaliacoes = comments_collection.count_documents({"name": "samila_rodrigues"})
    print(f"Avalia√ß√µes do usu√°rio: {count_avaliacoes}")
    
    # SIMULA√á√ÉO: Exclus√£o em cascata
    print("Simulando exclus√£o em cascata...")
    print(f"   Excluindo {count_avaliacoes} avalia√ß√µes...")
    print("   Excluindo usu√°rio...")
    
    print("SIMULA√á√ÉO: Usu√°rio e avalia√ß√µes seriam exclu√≠dos")
    
    # Para excluir de verdade, descomente as linhas abaixo:
    # comments_collection.delete_many({"name": "samila_rodrigues"})
    # users_collection.delete_one({"_id": usuario_para_excluir["_id"]})
    
    print("Opera√ß√£o de exclus√£o em cascata conclu√≠da (simula√ß√£o)")
else:
    print("Usu√°rio n√£o encontrado")

üìù Quest√£o 12: Excluindo um filme espec√≠fico
üé¨ Filme encontrado: Big Data: O Filme
‚úÖ Filme 'Big Data: O Filme' exclu√≠do com sucesso!


üìù Quest√£o 13: Excluindo avalia√ß√µes de um filme
üé≠ Excluindo avalia√ß√µes do filme: The Princess Bride
üìä Avalia√ß√µes encontradas: 3
‚ö†Ô∏è SIMULA√á√ÉO: 3 avalia√ß√µes seriam exclu√≠das


üìù Quest√£o 14: Excluindo filmes com avalia√ß√£o baixa
‚úÖ Filme 'Big Data: O Filme' exclu√≠do com sucesso!


üìù Quest√£o 13: Excluindo avalia√ß√µes de um filme
üé≠ Excluindo avalia√ß√µes do filme: The Princess Bride
üìä Avalia√ß√µes encontradas: 3
‚ö†Ô∏è SIMULA√á√ÉO: 3 avalia√ß√µes seriam exclu√≠das


üìù Quest√£o 14: Excluindo filmes com avalia√ß√£o baixa
üîç Filmes com rating < 5.0 encontrados: 1215
üìã Exemplos de filmes que seriam exclu√≠dos:
   ‚Ä¢ La mies es mucha (Rating: 4.7)
   ‚Ä¢ Rocketship X-M (Rating: 4.9)
   ‚Ä¢ Sadko (Rating: 4.9)
‚ö†Ô∏è SIMULA√á√ÉO: 1215 filmes seriam exclu√≠dos


üìù Quest√£o 15: Excluindo usu√°rio e suas

In [None]:
# Quest√£o 16: Buscar Filmes com Avalia√ß√£o Acima de um Valor
print("Quest√£o 16: Buscando filmes com alta avalia√ß√£o")

min_rating = 8.0
filtro_rating_alto = {"imdb.rating": {"$gt": min_rating}}

filmes_bem_avaliados = movies_collection.find(filtro_rating_alto).limit(5)

print(f"Filmes com rating > {min_rating}:")
for filme in filmes_bem_avaliados:
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    print(f"   ‚Ä¢ {filme['title']} ({filme.get('year', 'N/A')}) - Rating: {rating}")

total = movies_collection.count_documents(filtro_rating_alto)
print(f"\nTotal de filmes com rating > {min_rating}: {total}")

print("="*50)

# Quest√£o 17: Buscar Filmes em um Intervalo de Anos
print("\nQuest√£o 17: Buscando filmes em intervalo de anos")

ano_inicio = 2010
ano_fim = 2019

filtro_intervalo_anos = {"year": {"$gte": ano_inicio, "$lte": ano_fim}}
filmes_decada = movies_collection.find(filtro_intervalo_anos).limit(5)

print(f"Filmes entre {ano_inicio} e {ano_fim}:")
for filme in filmes_decada:
    print(f"   ‚Ä¢ {filme['title']} ({filme.get('year', 'N/A')})")

total_decada = movies_collection.count_documents(filtro_intervalo_anos)
print(f"\nTotal de filmes da d√©cada 2010: {total_decada}")

print("="*50)

# Quest√£o 18: Buscar Filmes com Mais de X Avalia√ß√µes e Nota Acima de um Valor
print("\nQuest√£o 18: Buscando filmes populares com alta nota")

min_votos = 100000
min_rating = 7.5

filtro_populares = {
    "imdb.rating": {"$gte": min_rating},
    "imdb.votes": {"$gte": min_votos}
}

filmes_populares = movies_collection.find(filtro_populares).limit(5)

print(f"Filmes com rating >= {min_rating} e votos >= {min_votos:,}:")
count = 0
for filme in filmes_populares:
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    votes = filme.get('imdb', {}).get('votes', 0)
    print(f"   ‚Ä¢ {filme['title']} ({filme.get('year', 'N/A')})")
    print(f"     Rating: {rating} | Votos: {votes:,}")
    count += 1

if count == 0:
    print("Nenhum filme encontrado com crit√©rios especificados")

total_populares = movies_collection.count_documents(filtro_populares)
print(f"\nTotal de filmes populares: {total_populares}")

print("="*50)

# Quest√£o 19: Buscar Usu√°rios que Favoritaram um Determinado Filme
print("\nQuest√£o 19: Usu√°rios que favoritaram um filme espec√≠fico")

# Primeiro, vamos pegar um filme para buscar
filme_busca = movies_collection.find_one({"title": "The Princess Bride"})
if not filme_busca:
    filme_busca = movies_collection.find_one()

print(f"Buscando usu√°rios que favoritaram: {filme_busca['title']}")

# Buscar usu√°rios que t√™m este filme nos favoritos
filtro_usuarios = {"favorite_movies": filme_busca["_id"]}
usuarios_que_favoritaram = users_collection.find(filtro_usuarios).limit(10)

print("Usu√°rios que favoritaram este filme:")
count = 0
for usuario in usuarios_que_favoritaram:
    email = usuario.get('email', 'N/A')
    nome = usuario.get('name', 'N/A')
    total_favoritos = len(usuario.get('favorite_movies', []))
    print(f"   ‚Ä¢ {nome} ({email}) - {total_favoritos} filmes favoritos")
    count += 1

if count == 0:
    print("Nenhum usu√°rio encontrado que favoritou este filme")

total_fans = users_collection.count_documents(filtro_usuarios)
print(f"\nTotal de usu√°rios que favoritaram: {total_fans}")

üìù Quest√£o 16: Buscando filmes com avalia√ß√£o superior a 8.0
üåü Top 10 filmes com rating > 8.0:
   1. Band of Brothers (2001) - Rating: 9.6
   2. Planet Earth (2006) - Rating: 9.5
   3. The Civil War (1990) - Rating: 9.4
   4. A Brave Heart: The Lizzie Velasquez Story (2015) - Rating: 9.4
   5. The Civil War (1990) - Rating: 9.4
   6. Cosmos (1980) - Rating: 9.3
   7. The Real Miyagi (2015) - Rating: 9.3
   8. The Shawshank Redemption (1994) - Rating: 9.3
   9. The Shawshank Redemption (1994) - Rating: 9.3
   10. The Blue Planet (2001) - Rating: 9.2

üìä Total de filmes com rating > 8.0: 967


üìù Quest√£o 17: Buscando filmes lan√ßados entre 1990 e 2000
üé¨ Filmes lan√ßados entre 1990 e 2000:
   ‚Ä¢ Spontaneous Combustion (1990)
   ‚Ä¢ Chyornaya roza - emblema pechali, krasnaya roza - emblema lyubvi (1990)
   ‚Ä¢ The Witching of Ben Wagner (1990)
   ‚Ä¢ Ono (1990)
   ‚Ä¢ May Fools (1990)
   ‚Ä¢ The Asthenic Syndrome (1990)
   ‚Ä¢ The Voice of the Moon (1990)
   ‚Ä¢ The Match F

## 9. Framework de Agrega√ß√£o

O framework de agrega√ß√£o do MongoDB √© uma ferramenta poderosa para an√°lise de dados. Vamos implementar consultas complexas usando pipelines de agrega√ß√£o.

In [None]:
# Quest√£o 20: Contar o N√∫mero Total de Filmes por G√™nero
print("Quest√£o 20: Contando filmes por g√™nero")

pipeline_generos = [
    {"$unwind": "$genres"},  # Separar array de g√™neros
    {"$group": {
        "_id": "$genres",
        "total_filmes": {"$sum": 1}
    }},
    {"$sort": {"total_filmes": -1}},  # Ordenar por quantidade
    {"$limit": 10}  # Top 10 g√™neros
]

resultado_generos = list(movies_collection.aggregate(pipeline_generos))

print("Top 10 g√™neros com mais filmes:")
for i, genero in enumerate(resultado_generos, 1):
    print(f"   {i}. {genero['_id']}: {genero['total_filmes']:,} filmes")

print("="*50)

# Quest√£o 21: Calcular a M√©dia de Avalia√ß√£o por Ano
print("\nQuest√£o 21: M√©dia de avalia√ß√£o por ano de lan√ßamento")

pipeline_media_ano = [
    {"$match": {
        "year": {"$gte": 2000, "$lte": 2020},  # Filmes de 2000 a 2020
        "imdb.rating": {"$exists": True, "$ne": None}
    }},
    {"$group": {
        "_id": "$year",
        "media_rating": {"$avg": "$imdb.rating"},
        "total_filmes": {"$sum": 1}
    }},
    {"$sort": {"_id": 1}},  # Ordenar por ano
    {"$limit": 10}
]

resultado_media_ano = list(movies_collection.aggregate(pipeline_media_ano))

print("M√©dia de avalia√ß√£o por ano (2000-2020):")
for ano_data in resultado_media_ano:
    ano = ano_data['_id']
    media = round(ano_data['media_rating'], 2)
    total = ano_data['total_filmes']
    print(f"   {ano}: {media} (baseado em {total} filmes)")

print("="*50)

# Quest√£o 22: Encontrar o Filme com a Maior Nota de Avalia√ß√£o
print("\nQuest√£o 22: Filme com a maior nota de avalia√ß√£o")

pipeline_maior_nota = [
    {"$match": {"imdb.rating": {"$exists": True, "$ne": None}}},
    {"$sort": {"imdb.rating": -1}},
    {"$limit": 5}  # Top 5 para mostrar mais op√ß√µes
]

filmes_top_rated = list(movies_collection.aggregate(pipeline_maior_nota))

print("Top 5 filmes com maior avalia√ß√£o:")
for i, filme in enumerate(filmes_top_rated, 1):
    title = filme['title']
    year = filme.get('year', 'N/A')
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    votes = filme.get('imdb', {}).get('votes', 0)
    
    print(f"   {i}. {title} ({year})")
    print(f"      Rating: {rating} | Votos: {format_number(votes)}")

# Encontrar o filme com a nota M√ÅXIMA absoluta
pipeline_max_rating = [
    {"$match": {"imdb.rating": {"$exists": True, "$ne": None}}},
    {"$group": {
        "_id": None,
        "max_rating": {"$max": "$imdb.rating"}
    }}
]

max_rating_result = list(movies_collection.aggregate(pipeline_max_rating))
if max_rating_result:
    max_rating = max_rating_result[0]['max_rating']
    print(f"\nMaior rating encontrado no database: {max_rating}")
    
    # Buscar todos os filmes com este rating m√°ximo
    filmes_max_rating = movies_collection.find({"imdb.rating": max_rating})
    print("Filmes com rating m√°ximo:")
    for filme in filmes_max_rating:
        print(f"   ‚Ä¢ {filme['title']} ({filme.get('year', 'N/A')})")

üìù Quest√£o 20: Contando filmes por g√™nero
üé≠ Top 10 g√™neros com mais filmes:
   1. Drama: 12,385 filmes
   2. Comedy: 6,532 filmes
   3. Romance: 3,318 filmes
   4. Crime: 2,457 filmes
   5. Thriller: 2,454 filmes
   6. Action: 2,381 filmes
   7. Adventure: 1,900 filmes
   8. Documentary: 1,834 filmes
   9. Horror: 1,470 filmes
   10. Biography: 1,269 filmes


üìù Quest√£o 21: M√©dia de avalia√ß√£o por ano de lan√ßamento
üìÖ M√©dia de avalia√ß√£o por ano (2000-2020):
   2000: 6.52 (baseado em 581 filmes)
   2001: 6.57 (baseado em 612 filmes)
   2002: 6.55 (baseado em 622 filmes)
   2003: 6.53 (baseado em 603 filmes)
   2004: 6.66 (baseado em 678 filmes)
   2005: 6.58 (baseado em 713 filmes)
   2006: 6.6 (baseado em 774 filmes)
   2007: 6.59 (baseado em 810 filmes)
   2008: 6.55 (baseado em 886 filmes)
   2009: 6.51 (baseado em 917 filmes)


üìù Quest√£o 22: Filme com a maior nota de avalia√ß√£o
üèÜ Top 5 filmes com maior avalia√ß√£o:
   1. The Danish Girl (2015)
      Rating

In [None]:
# Finalizando opera√ß√µes...
print("Finalizando opera√ß√µes...")

print("\nEstat√≠sticas finais do database:")
print(f"   movies: {movies_collection.count_documents({}):,} documentos")
print(f"   users: {users_collection.count_documents({}):,} documentos")
print(f"   comments: {comments_collection.count_documents({}):,} documentos")

# Fechar conex√£o
client.close()
print("\nConex√£o com MongoDB Atlas fechada com sucesso!")

print("\n" + "="*60)
print("PROJETO CONCLU√çDO COM SUCESSO!")
print("Disciplina: Big Data - UFPB")
print("Aluno: Samila Rodrigues")
print("Data: 07 de Agosto de 2025")
print("MongoDB Atlas + Sample MFlix Database")
print("="*60)

print("\nREFER√äNCIAS:")
referencias = [
    "[1] MongoDB Official Documentation: https://docs.mongodb.com/",
    "[2] MongoDB Atlas: https://www.mongodb.com/atlas",
    "[3] PyMongo Documentation: https://pymongo.readthedocs.io/",
    "[4] MongoDB Sample Data: https://www.mongodb.com/pt-br/docs/atlas/sample-data/",
    "[5] MongoDB Aggregation Framework: https://docs.mongodb.com/manual/aggregation/",
    "[6] UFPB Big Data Materials: sig-arq.ufpb.br/arquivos/.../BigData_06_ModeloDocumentos.pdf",
    "[7] MongoDB University: https://university.mongodb.com/",
    "[8] Google Colab Reference: https://colab.research.google.com/drive/1bQAqtl02MM155I0ao_7RAEpVNjFap_Z0"
]

for ref in referencias:
    print(f"    {ref}")

print("\nPR√ìXIMOS PASSOS:")
print("    ‚Ä¢ Implementar √≠ndices para otimiza√ß√£o")
print("    ‚Ä¢ Adicionar valida√ß√£o de schema")
print("    ‚Ä¢ Explorar sharding para escalabilidade")
print("    ‚Ä¢ Integrar com ferramentas de visualiza√ß√£o")
print("    ‚Ä¢ Implementar backup e recovery")

print("\nObrigada por acompanhar este projeto!")

üßπ Finalizando opera√ß√µes...

üìä Estat√≠sticas finais do database:
   movies: 21,349 documentos
   users: 186 documentos
   comments: 41,082 documentos
   users: 186 documentos
   comments: 41,082 documentos

‚úÖ Conex√£o com MongoDB Atlas fechada com sucesso!

üéì PROJETO CONCLU√çDO COM SUCESSO!
üìö Disciplina: Big Data - UFPB
üë®‚Äçüéì Aluno: Samila Rodrigues
üìÖ Data: 07 de Agosto de 2025
üöÄ MongoDB Atlas + Sample MFlix Database

üìö REFER√äNCIAS:
    [1] MongoDB Official Documentation: https://docs.mongodb.com/
    [2] MongoDB Atlas: https://www.mongodb.com/atlas
    [3] PyMongo Documentation: https://pymongo.readthedocs.io/
    [4] MongoDB Sample Data: https://www.mongodb.com/pt-br/docs/atlas/sample-data/
    [5] MongoDB Aggregation Framework: https://docs.mongodb.com/manual/aggregation/
    [6] UFPB Big Data Materials: sig-arq.ufpb.br/arquivos/.../BigData_06_ModeloDocumentos.pdf
    [7] MongoDB University: https://university.mongodb.com/
    [8] Google Colab Referenc

In [None]:
# Fun√ß√£o auxiliar para formata√ß√£o segura de n√∫meros
def format_number(value):
    """
    Formatar n√∫meros com v√≠rgulas, tratando tipos mistos de forma segura
    """
    if value is None:
        return "None"
    
    # Se for string, tentar extrair n√∫meros
    if isinstance(value, str):
        import re
        numbers = re.findall(r'\d+', value)
        if numbers:
            return f"{int(numbers[0]):,}"
        return value
    
    # Se for n√∫mero, formatar normalmente
    if isinstance(value, (int, float)):
        return f"{int(value):,}"
    
    # Outros tipos, retornar como string
    return str(value)

print("Fun√ß√£o format_number() criada para resolver problemas de formata√ß√£o!")
print("Use format_number(votes) em vez de {votes:,} quando votes pode n√£o ser n√∫mero")

# Testar a fun√ß√£o
test_values = [123456, "123456", "N/A", 0, None, "abc123def"]
print("\nTestando a fun√ß√£o:")
for val in test_values:
    formatted = format_number(val)
    print(f"   {val} ‚Üí {formatted}")

print("\nAgora voc√™ pode executar as c√©lulas problem√°ticas!")

‚úÖ Fun√ß√£o format_number() criada para resolver problemas de formata√ß√£o!
üí° Use format_number(votes) em vez de {votes:,} quando votes pode n√£o ser n√∫mero

üß™ Testando a fun√ß√£o:
   123456 ‚Üí 123,456
   123456 ‚Üí 123,456
   N/A ‚Üí N/A
   0 ‚Üí 0
   None ‚Üí None
   abc123def ‚Üí 123

üîß Agora voc√™ pode executar as c√©lulas problem√°ticas!
