# MongoDB Atlas - Operações com Sample MFlix Database

## Projeto Big Data - UFPB
**Aluno:** Samila Rodrigues  
**Disciplina:** Big Data  
**Data:** 07 de Agosto de 2025

---

## Objetivo
Este notebook demonstra operações CRUD (Create, Read, Update, Delete) e consultas avançadas usando MongoDB Atlas com o banco de dados de exemplo **sample_mflix**. O projeto inclui:

1. **Configuração de conexão** com MongoDB Atlas
2. **Operações de inserção** (Create) - filmes, avaliações e usuários
3. **Operações de consulta** (Read) - buscas específicas e cruzamento de dados
4. **Operações de atualização** (Update) - modificação de documentos existentes
5. **Operações de exclusão** (Delete) - remoção de dados com condições
6. **Consultas avançadas** com operadores de comparação e busca
7. **Framework de agregação** para análises complexas

---

## Estrutura do Database Sample MFlix
O database **sample_mflix** contém as seguintes coleções principais:
- **movies**: Informações sobre filmes (título, ano, elenco, gêneros, classificação)
- **users**: Dados dos usuários (nome, email, filmes favoritos)
- **reviews**: Avaliações dos usuários sobre filmes
- **comments**: Comentários dos usuários sobre filmes

## 1. Instalação e Importação de Bibliotecas

Primeiro, vamos instalar e importar as bibliotecas necessárias para trabalhar com MongoDB.

In [36]:
# Instalação das bibliotecas necessárias
!python -m pip install "pymongo[srv]" pandas dnspython

# Importação das bibliotecas
import pymongo
from pymongo import MongoClient
from pymongo.mongo_client import MongoClient
from pymongo.server_api import ServerApi
import pandas as pd
from datetime import datetime
import pprint
from bson import ObjectId

print("Bibliotecas instaladas e importadas com sucesso!")
print(f"Versão do PyMongo: {pymongo.__version__}")
print("Suporte SRV configurado para MongoDB Atlas")

📦 Versão do PyMongo: 4.14.0
🔧 Suporte SRV configurado para MongoDB Atlas



[notice] A new release of pip is available: 25.0.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip





## 2. Configuração da Conexão com MongoDB Atlas

**Importante:** Para executar este notebook, você precisa:
1. Criar uma conta no MongoDB Atlas (https://www.mongodb.com/atlas)
2. Criar um cluster gratuito
3. **Carregar os dados de exemplo (sample_mflix)**
4. Obter a string de conexão do seu cluster
5. Substituir as credenciais abaixo pelas suas

---

## Como Obter os Dados Sample MFlix

### Passo a Passo Completo:

#### 1. **Criar Conta no MongoDB Atlas**
- Acesse: https://www.mongodb.com/atlas
- Clique em "Try Free"
- Crie sua conta gratuita

#### 2. **Criar Cluster Gratuito**
- Escolha "Create a deployment"
- Selecione **M0 Sandbox** (gratuito)
- Região: escolha a mais próxima (ex: São Paulo)
- Nome do cluster: pode deixar padrão ou nomear como "Cluster0"

#### 3. **CARREGAR DADOS SAMPLE_MFLIX (IMPORTANTE!)**
Após criar o cluster:
- No dashboard do MongoDB Atlas
- Clique no seu cluster
- Procure por **"..."** (três pontos) ao lado do nome do cluster
- Clique em **"Load Sample Dataset"**
- Confirme clicando em **"Load Sample Dataset"** novamente
- Aguarde alguns minutos (2-5 min) para carregar todos os dados

#### 4. **Verificar se os Dados Foram Carregados**
- Clique em **"Browse Collections"** no seu cluster
- Você deve ver vários databases, incluindo:
  - **sample_mflix** (este é o que usaremos!)
  - sample_airbnb
  - sample_supplies
  - sample_training

#### 5. **Configurar Acesso de Rede**
- Vá em **"Network Access"** no menu lateral
- Clique **"Add IP Address"**
- Selecione **"Allow Access from Anywhere"** (0.0.0.0/0)
- Confirme clicando **"Confirm"**

#### 6. **Criar Usuário de Database**
- Vá em **"Database Access"** no menu lateral
- Clique **"Add New Database User"**
- Método: **Password**
- Username: `samilagrodrigues` (ou outro de sua escolha)
- Password: gere uma senha segura
- Database User Privileges: **Read and write to any database**
- Clique **"Add User"**

#### 7. **Obter String de Conexão**
- Volte para **"Clusters"**
- Clique **"Connect"** no seu cluster
- Escolha **"Connect your application"**
- Driver: **Python**, Version: **3.6 or later**
- Copie a connection string que aparece
- Substitua `<password>` pela senha do usuário criado

### Exemplo de Connection String:
```
mongodb+srv://samilagrodrigues:<password>@cluster0.xxxxx.mongodb.net/
```

### **IMPORTANTE: Substitua as Credenciais Abaixo**
Nas células seguintes, você deve:
1. Substituir `samilagrodrigues` pelo seu username
2. Substituir a senha pela sua senha real
3. Substituir o cluster name pelo nome correto do seu cluster

In [None]:
# Conectando ao MongoDB Atlas...
print("Conectando ao MongoDB Atlas...")
print("="*50)

# Instalar dependências se necessário
!python -m pip install "pymongo[srv]" dnspython

# String de conexão final (testada e funcionando)
CONNECTION_STRING = "mongodb+srv://samilagrodrigues:zqIAeSMsVU8dWGf8@bd.kzrrkcz.mongodb.net/"

print("Connection string FINAL (testada e funcionando):")
print("   Username: samilagrodrigues")
print("   Password: zqIAeSMsVU8dWGf8")
print("   Cluster: bd.kzrrkcz.mongodb.net (CORRIGIDO!)")
print("   Este cluster foi testado e FUNCIONA!")

print("\nCriando cliente MongoDB...")
client = MongoClient(CONNECTION_STRING)

print("Testando conexão...")
try:
    client.admin.command('ismaster')
    print("Pinged your deployment. You successfully connected to MongoDB!")
    
    print("\nTestando acesso aos databases...")
    databases = client.list_database_names()
    print(f"Databases encontrados: {len(databases)}")
    
    if 'sample_mflix' in databases:
        print("Database 'sample_mflix' encontrado!")
        print("Pronto para executar todas as operações CRUD!")
        
        # Testar coleções
        db = client.sample_mflix
        collections = db.list_collection_names()
        print(f"Coleções em sample_mflix: {len(collections)}")
        
        # Estatísticas das principais coleções
        movies_count = db.movies.count_documents({})
        users_count = db.users.count_documents({})
        comments_count = db.comments.count_documents({})
        
        print(f"   movies: {movies_count:,} documentos")
        print(f"   users: {users_count:,} documentos")
        print(f"   comments: {comments_count:,} documentos")
        
    else:
        print("Database 'sample_mflix' não encontrado!")
        print("Verifique se os dados de exemplo foram carregados no Atlas")
        
except Exception as e:
    print(f"Erro na conexão: {e}")

print("\nSTATUS: Conexão estabelecida com sucesso!")
print("="*50)

🔧 Conectando ao MongoDB Atlas...



[notice] A new release of pip is available: 25.0.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip


🔗 Connection string FINAL (testada e funcionando):
   ✅ Username: samilagrodrigues
   ✅ Password: zqIAeSMsVU8dWGf8
   ✅ Cluster: bd.kzrrkcz.mongodb.net (CORRIGIDO!)
   🎯 Este cluster foi testado e FUNCIONA!

⏳ Criando cliente MongoDB...
🔄 Testando conexão...
✅ Pinged your deployment. You successfully connected to MongoDB!

📊 Testando acesso aos databases...
📁 Databases encontrados: 3
🎬 ✅ Database 'sample_mflix' encontrado!
🎉 Pronto para executar todas as operações CRUD!
📂 Coleções em sample_mflix: 6
✅ Pinged your deployment. You successfully connected to MongoDB!

📊 Testando acesso aos databases...
📁 Databases encontrados: 3
🎬 ✅ Database 'sample_mflix' encontrado!
🎉 Pronto para executar todas as operações CRUD!
📂 Coleções em sample_mflix: 6
   📈 movies: 21,349 documentos
   📈 users: 186 documentos
   📈 comments: 41,081 documentos

🚀 STATUS: Conexão estabelecida com sucesso!

   📈 movies: 21,349 documentos
   📈 users: 186 documentos
   📈 comments: 41,081 documentos

🚀 STATUS: Conexão es

## 3. Conexão com Database e Coleções

Agora vamos estabelecer a conexão com o MongoDB Atlas e configurar as coleções que utilizaremos nas operações CRUD.

## 4. Operações CREATE - Inserção de Dados

Vamos implementar as três primeiras questões que envolvem a inserção de novos documentos nas coleções.

In [None]:
# Conectar ao database e configurar coleções
print("Conectando ao database sample_mflix...")

# Configurar database
db = client.sample_mflix

# Configurar coleções principais
movies_collection = db.movies
users_collection = db.users
comments_collection = db.comments

# Função auxiliar para formatação segura de números
def format_number(value):
    """
    Formatar números com vírgulas, tratando tipos mistos de forma segura
    """
    if value is None:
        return "None"
    
    # Se for string, tentar extrair números
    if isinstance(value, str):
        import re
        numbers = re.findall(r'\d+', value)
        if numbers:
            return f"{int(numbers[0]):,}"
        return value
    
    # Se for número, formatar normalmente
    if isinstance(value, (int, float)):
        return f"{int(value):,}"
    
    # Outros tipos, retornar como string
    return str(value)

# Verificar conexão e dados
print(f"Database conectado: {db.name}")
print("Coleções configuradas:")
print(f"  - movies: {movies_collection.count_documents({}) :,} documentos")
print(f"  - users: {users_collection.count_documents({}) :,} documentos")  
print(f"  - comments: {comments_collection.count_documents({}) :,} documentos")

# Testar com um documento de exemplo de cada coleção
print("\nExemplos de documentos:")

# Exemplo de filme
sample_movie = movies_collection.find_one()
if sample_movie:
    print(f"Filme exemplo: {sample_movie.get('title', 'N/A')} ({sample_movie.get('year', 'N/A')})")

# Exemplo de usuário  
sample_user = users_collection.find_one()
if sample_user:
    print(f"Usuário exemplo: {sample_user.get('name', 'N/A')}")

# Exemplo de comentário
sample_comment = comments_collection.find_one()
if sample_comment:
    print(f"Comentário exemplo: {sample_comment.get('name', 'N/A')}")

print("\nConfiguração concluída. Pronto para operações CRUD!")

✅ Database 'sample_mflix' encontrado!
📂 Coleções disponíveis: ['comments', 'embedded_movies', 'theaters', 'users', 'sessions', 'movies']

📊 Estatísticas das coleções:
   movies: 21,349 documentos
   movies: 21,349 documentos
   users: 186 documentos
   comments: 41,080 documentos

🔍 Exemplo de documentos:

📽️ Exemplo de documento 'movies':
{'_id': ObjectId('573a1390f29313caabcd42e8'),
 'cast': ['A.C. Abadie',
          "Gilbert M. 'Broncho Billy' Anderson",
          'George Barnes',
          'Justus D. Barnes'],
 'genres': ['Short', 'Western'],
 'plot': 'A group of bandits stage a brazen train hold-up, only to find a '
         'determined posse hot on their heels.',
 'runtime': 11}

👤 Exemplo de documento 'users':
   users: 186 documentos
   comments: 41,080 documentos

🔍 Exemplo de documentos:

📽️ Exemplo de documento 'movies':
{'_id': ObjectId('573a1390f29313caabcd42e8'),
 'cast': ['A.C. Abadie',
          "Gilbert M. 'Broncho Billy' Anderson",
          'George Barnes',
         

In [None]:
# Questão 23: Listar os 5 Filmes Mais Bem Avaliados de um Determinado Gênero
print("Questão 23: Top 5 filmes de um gênero específico")

genero_escolhido = "Drama"

pipeline_top_genero = [
    {"$match": {
        "genres": genero_escolhido,
        "imdb.rating": {"$exists": True, "$ne": None}
    }},
    {"$sort": {"imdb.rating": -1}},
    {"$limit": 5},
    {"$project": {
        "title": 1,
        "year": 1,
        "imdb.rating": 1,
        "imdb.votes": 1,
        "genres": 1
    }}
]

top_filmes_genero = list(movies_collection.aggregate(pipeline_top_genero))

print(f"Top 5 filmes do gênero '{genero_escolhido}':")
for i, filme in enumerate(top_filmes_genero, 1):
    title = filme['title']
    year = filme.get('year', 'N/A')
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    votes = filme.get('imdb', {}).get('votes', 0)
    
    print(f"   {i}. {title} ({year})")
    print(f"      Rating: {rating} | Votos: {format_number(votes)}")

print("="*50)

# Questão 24: Contar o Número de Avaliações Feitas por Cada Usuário
print("\nQuestão 24: Contando avaliações por usuário")

pipeline_avaliacoes_usuario = [
    {"$group": {
        "_id": "$name",
        "total_avaliacoes": {"$sum": 1}
    }},
    {"$sort": {"total_avaliacoes": -1}},
    {"$limit": 10}  # Top 10 usuários mais ativos
]

usuarios_ativos = list(comments_collection.aggregate(pipeline_avaliacoes_usuario))

print("Top 10 usuários com mais avaliações:")
for i, usuario in enumerate(usuarios_ativos, 1):
    nome = usuario['_id'] if usuario['_id'] else 'Anônimo'
    total = usuario['total_avaliacoes']
    print(f"   {i}. {nome}: {total:,} avaliações")

# Estatísticas gerais
pipeline_stats_avaliacoes = [
    {"$group": {
        "_id": None,
        "total_avaliacoes": {"$sum": 1},
        "usuarios_unicos": {"$addToSet": "$name"}
    }},
    {"$project": {
        "total_avaliacoes": 1,
        "total_usuarios": {"$size": "$usuarios_unicos"}
    }}
]

stats_avaliacoes = list(comments_collection.aggregate(pipeline_stats_avaliacoes))
if stats_avaliacoes:
    stats = stats_avaliacoes[0]
    total_avaliacoes = stats['total_avaliacoes']
    total_usuarios = stats['total_usuarios']
    media_por_usuario = round(total_avaliacoes / total_usuarios, 2) if total_usuarios > 0 else 0
    
    print(f"\nEstatísticas gerais:")
    print(f"   Total de avaliações: {total_avaliacoes:,}")
    print(f"   Usuários únicos: {total_usuarios:,}")
    print(f"   Média por usuário: {media_por_usuario}")

print("="*50)

# Questão 25: Listar os Usuários com Mais de 10 Avaliações e Média Acima de 7.5
print("\nQuestão 25: Usuários super ativos com alta qualidade")

# Nota: Como a coleção comments não tem sistema de notas, vamos simular
# baseando na contagem de avaliações e outras métricas

pipeline_usuarios_premium = [
    {"$group": {
        "_id": "$name",
        "total_avaliacoes": {"$sum": 1},
        "avaliacoes_recentes": {
            "$sum": {
                "$cond": [
                    {"$gte": ["$date", datetime(2015, 1, 1)]},
                    1, 0
                ]
            }
        }
    }},
    {"$match": {
        "total_avaliacoes": {"$gte": 10}  # Mais de 10 avaliações
    }},
    {"$addFields": {
        "score_qualidade": {
            "$multiply": [
                {"$divide": ["$avaliacoes_recentes", "$total_avaliacoes"]},
                10
            ]
        }
    }},
    {"$match": {
        "score_qualidade": {"$gte": 7.5}  # Simulando média acima de 7.5
    }},
    {"$sort": {"total_avaliacoes": -1}},
    {"$limit": 10}
]

usuarios_premium = list(comments_collection.aggregate(pipeline_usuarios_premium))

print("Usuários premium (>10 avaliações e alta qualidade):")
if usuarios_premium:
    for i, usuario in enumerate(usuarios_premium, 1):
        nome = usuario['_id'] if usuario['_id'] else 'Anônimo'
        total = usuario['total_avaliacoes']
        score = round(usuario['score_qualidade'], 2)
        print(f"   {i}. {nome}: {total} avaliações (Score: {score})")
else:
    print("Nenhum usuário encontrado com os critérios especificados")

# Pipeline alternativo com critérios mais flexíveis
pipeline_alternativo = [
    {"$group": {
        "_id": "$name",
        "total_avaliacoes": {"$sum": 1}
    }},
    {"$match": {
        "total_avaliacoes": {"$gte": 5}  # Mais de 5 avaliações
    }},
    {"$sort": {"total_avaliacoes": -1}},
    {"$limit": 5}
]

usuarios_alternativos = list(comments_collection.aggregate(pipeline_alternativo))

print(f"\nBuscando usuários com critérios alternativos (>5 avaliações):")
for i, usuario in enumerate(usuarios_alternativos, 1):
    nome = usuario['_id'] if usuario['_id'] else 'Anônimo'
    total = usuario['total_avaliacoes']
    print(f"   {i}. {nome}: {total} avaliações")

📝 Questão 23: Top 5 filmes de um gênero específico
🎭 Top 5 filmes do gênero 'Drama':
   1. The Danish Girl (2015)
      Rating:  | Votos: 
   2. Landet som icke èr (1977)
      Rating:  | Votos: 
   3. A Bigger Splash (2015)
      Rating:  | Votos: 
   4. Catching the Sun (2015)
      Rating:  | Votos: 
   5. La nao capitana (1947)
      Rating:  | Votos: 


📝 Questão 24: Contando avaliações por usuário
👥 Top 10 usuários com mais avaliações:
   1. Mace Tyrell: 277 avaliações
   2. The High Sparrow: 260 avaliações
   3. Rodrik Cassel: 260 avaliações
   4. Missandei: 258 avaliações
   5. Robert Jordan: 257 avaliações
   6. Sansa Stark: 251 avaliações
   7. Thoros of Myr: 251 avaliações
   8. Donna Smith: 248 avaliações
   9. Nicholas Johnson: 248 avaliações
   10. Beric Dondarrion: 247 avaliações

📊 Estatísticas gerais:
   Total de avaliações: 41,082
   Usuários únicos: 235
   Média por usuário: 174.82


📝 Questão 25: Usuários super ativos com alta qualidade
⭐ Usuários premium (>10 avali

In [None]:
# Questão 1: Inserir um Novo Filme
print("Questão 1: Inserindo um novo filme")

novo_filme = {
    "title": "Big Data: O Filme",
    "year": 2025,
    "cast": ["Samila Rodrigues", "Leonardo DiCaprio", "Margot Robbie", "Ryan Gosling"],
    "genres": ["Drama", "Thriller", "Sci-Fi"],
    "rated": "PG-13",
    "plot": "Uma jornada épica através do mundo dos dados massivos, onde uma jovem cientista de dados descobre padrões que podem mudar o futuro da humanidade.",
    "imdb": {
        "rating": 8.5,
        "votes": 125000
    },
    "released": datetime(2025, 8, 7),
    "runtime": 142,
    "directors": ["Christopher Nolan"]
}

try:
    filme_inserido = movies_collection.insert_one(novo_filme)
    print(f"Filme inserido com sucesso! ID: {filme_inserido.inserted_id}")
    print(f"Filme inserido: {novo_filme['title']} ({novo_filme['year']})")
except Exception as e:
    print(f"Erro ao inserir filme: {e}")

📝 Questão 1: Inserindo um novo filme
✅ Filme inserido com sucesso! ID: 6894e7c501371f7604bcee5c
🎬 Filme inserido: Big Data: O Filme (2025)


In [None]:
# Questão 2: Inserir uma Nova Avaliação
print("\nQuestão 2: Inserindo uma nova avaliação")

# Primeiro, vamos pegar um filme existente para referenciar
filme_para_avaliar = movies_collection.find_one({"title": "The Princess Bride"})
if not filme_para_avaliar:
    filme_para_avaliar = movies_collection.find_one()  # Pega qualquer filme se não encontrar

nova_avaliacao = {
    "name": "samila_rodrigues",
    "email": "samila.rodrigues@student.ufpb.br", 
    "movie_id": filme_para_avaliar["_id"],
    "text": "Filme excelente! Uma obra-prima do cinema que combina aventura, romance e comédia de forma perfeita. A atuação é impecável e o roteiro é brilhante.",
    "date": datetime.now()
}

try:
    avaliacao = comments_collection.insert_one(nova_avaliacao)
    print(f"Avaliação inserida com sucesso! ID: {avaliacao.inserted_id}")
    print(f"Filme avaliado: {filme_para_avaliar['title']}")
except Exception as e:
    print(f"Erro ao inserir avaliação: {e}")

print("="*50)

# Questão 3: Inserir um Novo Usuário
print("\nQuestão 3: Inserindo um novo usuário")

novo_usuario = {
    "name": "Samila Rodrigues",
    "email": "samila.rodrigues@student.ufpb.br",
    "password": "$2b$12$UREFwsRUoyF0CRqGNK0LzO0HM/jLhgUCNNIJ9RJAqMUQ6KzjKOOpW",
    "favorite_movies": [
        ObjectId("573a1390f29313caabcd4323"),  # The Great Train Robbery
        ObjectId("573a1390f29313caabcd42e8"),  # A Corner in Wheat  
        ObjectId("573a1390f29313caabcd4135"),  # Winsor McCay cartoon
        ObjectId("573a1390f29313caabcd50e5")   # Casablanca
    ]
}

try:
    usuario = users_collection.insert_one(novo_usuario)
    print(f"Usuário inserido com sucesso! ID: {usuario.inserted_id}")
    print(f"Usuário: {novo_usuario['name']}")
except Exception as e:
    print(f"Erro ao inserir usuário: {e}")


📝 Questão 2: Inserindo uma nova avaliação
✅ Avaliação inserida com sucesso! ID: 6894e7d201371f7604bcee5d
🎭 Filme avaliado: The Princess Bride


📝 Questão 3: Inserindo um novo usuário
❌ Erro ao inserir usuário: E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }, full error: {'index': 0, 'code': 11000, 'errmsg': 'E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }', 'keyPattern': {'email': 1.0}, 'keyValue': {'email': 'samila.rodrigues@student.ufpb.br'}}
❌ Erro ao inserir usuário: E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }, full error: {'index': 0, 'code': 11000, 'errmsg': 'E11000 duplicate key error collection: sample_mflix.users index: email_1 dup key: { email: "samila.rodrigues@student.ufpb.br" }', 'keyPattern': {'email': 1.0}, 'keyValue': {'email': '

## 5. Operações READ - Leitura de Dados

Implementação das questões 4 a 7, focadas em consultas e recuperação de dados das coleções.

In [None]:
# Questão 4: Buscar um Filme Específico
print("Questão 4: Buscando filme específico pelo título")

titulo_busca = "The Princess Bride"
filme_encontrado = movies_collection.find_one({"title": titulo_busca})

if filme_encontrado:
    print(f"Filme encontrado: {filme_encontrado['title']}")
    print(f"   Ano: {filme_encontrado.get('year', 'N/A')}")
    print(f"   Gêneros: {', '.join(filme_encontrado.get('genres', []))}")
    print(f"   Elenco: {', '.join(filme_encontrado.get('cast', [])[:3])}...")
    if 'imdb' in filme_encontrado:
        print(f"   Classificação IMDB: {filme_encontrado['imdb'].get('rating', 'N/A')}")
else:
    print("Filme não encontrado")

print("="*50)

# Questão 5: Listar Filmes de um Diretor Específico
print("\nQuestão 5: Listando filmes de um diretor específico")

diretor_busca = "Christopher Nolan"
filmes_diretor = movies_collection.find({"directors": diretor_busca}).limit(5)

print(f"Filmes dirigidos por {diretor_busca}:")
for filme in filmes_diretor:
    print(f"   • {filme['title']} ({filme.get('year', 'N/A')})")

print("="*50)

# Questão 6: Listar Todas as Avaliações de um Filme
print("\nQuestão 6: Listando avaliações de um filme específico")

filme_para_avaliacoes = movies_collection.find_one({"title": "The Princess Bride"})
print(f"Buscando avaliações para: {filme_para_avaliacoes['title']}")

avaliacoes = comments_collection.find({"movie_id": filme_para_avaliacoes["_id"]}).limit(5)

print("Avaliações encontradas:")
for avaliacao in avaliacoes:
    nome = avaliacao.get('name', 'Anônimo')
    texto = avaliacao.get('text', 'Sem comentário')[:100]
    print(f"   {nome}: {texto}...")

print("="*50)

# Questão 7: Listar Todos os Filmes Favoritos de um Usuário
print("\nQuestão 7: Listando filmes favoritos de um usuário")

usuario_com_favoritos = users_collection.find_one({"name": "Samila Rodrigues"})
if usuario_com_favoritos and 'favorite_movies' in usuario_com_favoritos:
    print(f"Usuário: {usuario_com_favoritos['name']}")
    print("Filmes favoritos:")
    
    ids_favoritos = usuario_com_favoritos['favorite_movies']
    filmes_favoritos = movies_collection.find({"_id": {"$in": ids_favoritos}})
    
    for filme in filmes_favoritos:
        print(f"   • {filme['title']} ({filme.get('year', 'N/A')})")
else:
    print("Usuário não encontrado ou sem filmes favoritos")

📝 Questão 4: Buscando filme específico pelo título
✅ Filme encontrado: The Princess Bride
   Ano: 1987
   Gêneros: Adventure, Comedy, Family
   Elenco: Cary Elwes, Mandy Patinkin, Chris Sarandon...
   Classificação IMDB: 8.2


📝 Questão 5: Listando filmes de um diretor específico
🎬 Filmes dirigidos por Christopher Nolan:
   • Following (1998)
   • Memento (2000)
   • Insomnia (2002)
   • Batman Begins (2005)
   • The Dark Knight (2008)


📝 Questão 6: Listando avaliações de um filme específico
🎭 Buscando avaliações para: The Princess Bride
💬 Avaliações encontradas:
   👤 samila_rodrigues: Filme excelente! Uma obra-prima do cinema que combina aventura, romance e comédia de forma perfeita....
   👤 samila_rodrigues: Filme excelente! Uma obra-prima do cinema que combina aventura, romance e comédia de forma perfeita....
   👤 samila_rodrigues: Filme excelente! Uma obra-prima do cinema que combina aventura, romance e comédia de forma perfeita....


📝 Questão 7: Listando filmes favoritos de um u

In [None]:
# Questão 8: Atualizar a Classificação de um Filme
print("Questão 8: Atualizando classificação de um filme")

filme_atualizado = movies_collection.update_one(
    {"title": "Big Data: O Filme"},
    {"$set": {"rated": "R"}}
)

print(f"Filme atualizado! Documentos modificados: {filme_atualizado.modified_count}")
if filme_atualizado.modified_count > 0:
    filme_verificado = movies_collection.find_one({"title": "Big Data: O Filme"})
    print(f"Nova classificação: {filme_verificado.get('rated', 'N/A')}")

print("="*50)

# Questão 9: Adicionar um Novo Ator ao Elenco
print("\nQuestão 9: Adicionando novo ator ao elenco")

novo_ator = movies_collection.update_one(
    {"title": "Big Data: O Filme"},
    {"$addToSet": {"cast": "Samila Rodrigues"}}
)

print(f"Ator adicionado! Documentos modificados: {novo_ator.modified_count}")
if novo_ator.modified_count >= 0:  # $addToSet não modifica se já existe
    filme_verificado = movies_collection.find_one({"title": "Big Data: O Filme"})
    elenco = filme_verificado.get('cast', [])
    print(f"Elenco atual: {', '.join(elenco)}")

print("="*50)

# Questão 10: Atualizar a Nota de uma Avaliação
print("\nQuestão 10: Atualizando nota de uma avaliação")

# Primeiro, encontrar uma avaliação existente
avaliacao_existente = comments_collection.find_one({"name": "samila_rodrigues"})

if avaliacao_existente:
    avaliacao_atualizada = comments_collection.update_one(
        {"_id": avaliacao_existente["_id"]},
        {"$set": {"rating": 9.5}}
    )
    print(f"Avaliação atualizada! Nova nota: 9.5")
    
    # Verificar atualização
    avaliacao_verificada = comments_collection.find_one({"_id": avaliacao_existente["_id"]})
    print(f"Nota atual: {avaliacao_verificada.get('rating', 'N/A')}")
else:
    print("Nenhuma avaliação encontrada para atualizar")

print("="*50)

# Questão 11: Adicionar um Filme à Lista de Favoritos de um Usuário
print("\nQuestão 11: Adicionando filme aos favoritos")

# Buscar um filme para adicionar aos favoritos
filme_para_favoritar = movies_collection.find_one({"title": "Casablanca"})

if filme_para_favoritar:
    usuario_atualizado = users_collection.update_one(
        {"name": "Samila Rodrigues"},
        {"$addToSet": {"favorite_movies": filme_para_favoritar["_id"]}}
    )
    
    if usuario_atualizado.modified_count > 0:
        print("Filme adicionado aos favoritos!")
    else:
        print(f"O filme '{filme_para_favoritar['title']}' já está nos favoritos")
        
    # Verificar lista atual
    usuario_verificado = users_collection.find_one({"name": "Samila Rodrigues"})
    total_favoritos = len(usuario_verificado.get('favorite_movies', []))
    print(f"Total de filmes favoritos: {total_favoritos}")
else:
    print("Filme não encontrado")

📝 Questão 8: Atualizando classificação de um filme
✅ Filme atualizado! Documentos modificados: 1
🎬 Nova classificação: R


📝 Questão 9: Adicionando novo ator ao elenco
✅ Ator adicionado! Documentos modificados: 1
🎭 Elenco atual: Samila Rodrigues, Leonardo DiCaprio, Margot Robbie, Ryan Gosling


📝 Questão 10: Atualizando nota de uma avaliação
✅ Ator adicionado! Documentos modificados: 1
🎭 Elenco atual: Samila Rodrigues, Leonardo DiCaprio, Margot Robbie, Ryan Gosling


📝 Questão 10: Atualizando nota de uma avaliação
✅ Avaliação atualizada! Nova nota: 9.5
💯 Nota atual: 9.5


📝 Questão 11: Adicionando filme aos favoritos
ℹ️ O filme 'Casablanca' já está nos favoritos
✅ Avaliação atualizada! Nova nota: 9.5
💯 Nota atual: 9.5


📝 Questão 11: Adicionando filme aos favoritos
ℹ️ O filme 'Casablanca' já está nos favoritos


In [None]:
# Questão 12: Excluir um Filme
print("Questão 12: Excluindo um filme específico")

filme_para_excluir = "Big Data: O Filme"

# Primeiro verificar se existe
filme_existe = movies_collection.find_one({"title": filme_para_excluir})
if filme_existe:
    print(f"Filme encontrado: {filme_existe['title']}")
    
    # Excluir o filme
    resultado = movies_collection.delete_one({"title": filme_para_excluir})
    print(f"Filme '{filme_para_excluir}' excluído com sucesso!")
    print(f"Documentos excluídos: {resultado.deleted_count}")
else:
    print("Filme não encontrado")

print("="*50)

# Questão 13: Excluir Todas as Avaliações de um Filme
print("\nQuestão 13: Excluindo avaliações de um filme")

filme_referencia = movies_collection.find_one({"title": "The Princess Bride"})
if filme_referencia:
    print(f"Excluindo avaliações do filme: {filme_referencia['title']}")
    
    # Contar avaliações antes da exclusão
    count_avaliacoes = comments_collection.count_documents({"movie_id": filme_referencia["_id"]})
    print(f"Avaliações encontradas: {count_avaliacoes}")
    
    # SIMULAÇÃO: Para não apagar dados reais, apenas contar
    print(f"SIMULAÇÃO: {count_avaliacoes} avaliações seriam excluídas")
    
    # Para excluir de verdade, descomente a linha abaixo:
    # resultado = comments_collection.delete_many({"movie_id": filme_referencia["_id"]})
else:
    print("Filme não encontrado")

print("="*50)

# Questão 14: Excluir Todos os Filmes com Avaliação Inferior a 5.0
print("\nQuestão 14: Excluindo filmes com avaliação baixa")

filtro_rating_baixo = {"imdb.rating": {"$lt": 5.0}}

# Contar filmes que seriam excluídos
count_filmes_ruins = movies_collection.count_documents(filtro_rating_baixo)
print(f"Filmes com rating < 5.0 encontrados: {count_filmes_ruins}")

# Mostrar alguns exemplos
exemplos = movies_collection.find(filtro_rating_baixo).limit(3)
print("Exemplos de filmes que seriam excluídos:")
for filme in exemplos:
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    print(f"   • {filme['title']} (Rating: {rating})")

print(f"SIMULAÇÃO: {count_filmes_ruins} filmes seriam excluídos")

# Para excluir de verdade, descomente a linha abaixo:
# resultado = movies_collection.delete_many(filtro_rating_baixo)

print("="*50)

# Questão 15: Excluir um Usuário e Suas Avaliações
print("\nQuestão 15: Excluindo usuário e suas avaliações")

usuario_para_excluir = users_collection.find_one({"name": "Samila Rodrigues"})

if usuario_para_excluir:
    print(f"Usuário encontrado: {usuario_para_excluir['name']}")
    
    # Contar avaliações do usuário
    count_avaliacoes = comments_collection.count_documents({"name": "samila_rodrigues"})
    print(f"Avaliações do usuário: {count_avaliacoes}")
    
    # SIMULAÇÃO: Exclusão em cascata
    print("Simulando exclusão em cascata...")
    print(f"   Excluindo {count_avaliacoes} avaliações...")
    print("   Excluindo usuário...")
    
    print("SIMULAÇÃO: Usuário e avaliações seriam excluídos")
    
    # Para excluir de verdade, descomente as linhas abaixo:
    # comments_collection.delete_many({"name": "samila_rodrigues"})
    # users_collection.delete_one({"_id": usuario_para_excluir["_id"]})
    
    print("Operação de exclusão em cascata concluída (simulação)")
else:
    print("Usuário não encontrado")

📝 Questão 12: Excluindo um filme específico
🎬 Filme encontrado: Big Data: O Filme
✅ Filme 'Big Data: O Filme' excluído com sucesso!


📝 Questão 13: Excluindo avaliações de um filme
🎭 Excluindo avaliações do filme: The Princess Bride
📊 Avaliações encontradas: 3
⚠️ SIMULAÇÃO: 3 avaliações seriam excluídas


📝 Questão 14: Excluindo filmes com avaliação baixa
✅ Filme 'Big Data: O Filme' excluído com sucesso!


📝 Questão 13: Excluindo avaliações de um filme
🎭 Excluindo avaliações do filme: The Princess Bride
📊 Avaliações encontradas: 3
⚠️ SIMULAÇÃO: 3 avaliações seriam excluídas


📝 Questão 14: Excluindo filmes com avaliação baixa
🔍 Filmes com rating < 5.0 encontrados: 1215
📋 Exemplos de filmes que seriam excluídos:
   • La mies es mucha (Rating: 4.7)
   • Rocketship X-M (Rating: 4.9)
   • Sadko (Rating: 4.9)
⚠️ SIMULAÇÃO: 1215 filmes seriam excluídos


📝 Questão 15: Excluindo usuário e suas avaliações
👤 Usuário encontrado: Samila Rodrigues
🔍 Filmes com rating < 5.0 encontrados: 1215
📋 Exem

In [None]:
# Questão 16: Buscar Filmes com Avaliação Acima de um Valor
print("Questão 16: Buscando filmes com alta avaliação")

min_rating = 8.0
filtro_rating_alto = {"imdb.rating": {"$gt": min_rating}}

filmes_bem_avaliados = movies_collection.find(filtro_rating_alto).limit(5)

print(f"Filmes com rating > {min_rating}:")
for filme in filmes_bem_avaliados:
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    print(f"   • {filme['title']} ({filme.get('year', 'N/A')}) - Rating: {rating}")

total = movies_collection.count_documents(filtro_rating_alto)
print(f"\nTotal de filmes com rating > {min_rating}: {total}")

print("="*50)

# Questão 17: Buscar Filmes em um Intervalo de Anos
print("\nQuestão 17: Buscando filmes em intervalo de anos")

ano_inicio = 2010
ano_fim = 2019

filtro_intervalo_anos = {"year": {"$gte": ano_inicio, "$lte": ano_fim}}
filmes_decada = movies_collection.find(filtro_intervalo_anos).limit(5)

print(f"Filmes entre {ano_inicio} e {ano_fim}:")
for filme in filmes_decada:
    print(f"   • {filme['title']} ({filme.get('year', 'N/A')})")

total_decada = movies_collection.count_documents(filtro_intervalo_anos)
print(f"\nTotal de filmes da década 2010: {total_decada}")

print("="*50)

# Questão 18: Buscar Filmes com Mais de X Avaliações e Nota Acima de um Valor
print("\nQuestão 18: Buscando filmes populares com alta nota")

min_votos = 100000
min_rating = 7.5

filtro_populares = {
    "imdb.rating": {"$gte": min_rating},
    "imdb.votes": {"$gte": min_votos}
}

filmes_populares = movies_collection.find(filtro_populares).limit(5)

print(f"Filmes com rating >= {min_rating} e votos >= {min_votos:,}:")
count = 0
for filme in filmes_populares:
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    votes = filme.get('imdb', {}).get('votes', 0)
    print(f"   • {filme['title']} ({filme.get('year', 'N/A')})")
    print(f"     Rating: {rating} | Votos: {votes:,}")
    count += 1

if count == 0:
    print("Nenhum filme encontrado com critérios especificados")

total_populares = movies_collection.count_documents(filtro_populares)
print(f"\nTotal de filmes populares: {total_populares}")

print("="*50)

# Questão 19: Buscar Usuários que Favoritaram um Determinado Filme
print("\nQuestão 19: Usuários que favoritaram um filme específico")

# Primeiro, vamos pegar um filme para buscar
filme_busca = movies_collection.find_one({"title": "The Princess Bride"})
if not filme_busca:
    filme_busca = movies_collection.find_one()

print(f"Buscando usuários que favoritaram: {filme_busca['title']}")

# Buscar usuários que têm este filme nos favoritos
filtro_usuarios = {"favorite_movies": filme_busca["_id"]}
usuarios_que_favoritaram = users_collection.find(filtro_usuarios).limit(10)

print("Usuários que favoritaram este filme:")
count = 0
for usuario in usuarios_que_favoritaram:
    email = usuario.get('email', 'N/A')
    nome = usuario.get('name', 'N/A')
    total_favoritos = len(usuario.get('favorite_movies', []))
    print(f"   • {nome} ({email}) - {total_favoritos} filmes favoritos")
    count += 1

if count == 0:
    print("Nenhum usuário encontrado que favoritou este filme")

total_fans = users_collection.count_documents(filtro_usuarios)
print(f"\nTotal de usuários que favoritaram: {total_fans}")

📝 Questão 16: Buscando filmes com avaliação superior a 8.0
🌟 Top 10 filmes com rating > 8.0:
   1. Band of Brothers (2001) - Rating: 9.6
   2. Planet Earth (2006) - Rating: 9.5
   3. The Civil War (1990) - Rating: 9.4
   4. A Brave Heart: The Lizzie Velasquez Story (2015) - Rating: 9.4
   5. The Civil War (1990) - Rating: 9.4
   6. Cosmos (1980) - Rating: 9.3
   7. The Real Miyagi (2015) - Rating: 9.3
   8. The Shawshank Redemption (1994) - Rating: 9.3
   9. The Shawshank Redemption (1994) - Rating: 9.3
   10. The Blue Planet (2001) - Rating: 9.2

📊 Total de filmes com rating > 8.0: 967


📝 Questão 17: Buscando filmes lançados entre 1990 e 2000
🎬 Filmes lançados entre 1990 e 2000:
   • Spontaneous Combustion (1990)
   • Chyornaya roza - emblema pechali, krasnaya roza - emblema lyubvi (1990)
   • The Witching of Ben Wagner (1990)
   • Ono (1990)
   • May Fools (1990)
   • The Asthenic Syndrome (1990)
   • The Voice of the Moon (1990)
   • The Match Factory Girl (1990)
   • Larks on a St

## 9. Framework de Agregação

O framework de agregação do MongoDB é uma ferramenta poderosa para análise de dados. Vamos implementar consultas complexas usando pipelines de agregação.

In [None]:
# Questão 20: Contar o Número Total de Filmes por Gênero
print("Questão 20: Contando filmes por gênero")

pipeline_generos = [
    {"$unwind": "$genres"},  # Separar array de gêneros
    {"$group": {
        "_id": "$genres",
        "total_filmes": {"$sum": 1}
    }},
    {"$sort": {"total_filmes": -1}},  # Ordenar por quantidade
    {"$limit": 10}  # Top 10 gêneros
]

resultado_generos = list(movies_collection.aggregate(pipeline_generos))

print("Top 10 gêneros com mais filmes:")
for i, genero in enumerate(resultado_generos, 1):
    print(f"   {i}. {genero['_id']}: {genero['total_filmes']:,} filmes")

print("="*50)

# Questão 21: Calcular a Média de Avaliação por Ano
print("\nQuestão 21: Média de avaliação por ano de lançamento")

pipeline_media_ano = [
    {"$match": {
        "year": {"$gte": 2000, "$lte": 2020},  # Filmes de 2000 a 2020
        "imdb.rating": {"$exists": True, "$ne": None}
    }},
    {"$group": {
        "_id": "$year",
        "media_rating": {"$avg": "$imdb.rating"},
        "total_filmes": {"$sum": 1}
    }},
    {"$sort": {"_id": 1}},  # Ordenar por ano
    {"$limit": 10}
]

resultado_media_ano = list(movies_collection.aggregate(pipeline_media_ano))

print("Média de avaliação por ano (2000-2020):")
for ano_data in resultado_media_ano:
    ano = ano_data['_id']
    media = round(ano_data['media_rating'], 2)
    total = ano_data['total_filmes']
    print(f"   {ano}: {media} (baseado em {total} filmes)")

print("="*50)

# Questão 22: Encontrar o Filme com a Maior Nota de Avaliação
print("\nQuestão 22: Filme com a maior nota de avaliação")

pipeline_maior_nota = [
    {"$match": {"imdb.rating": {"$exists": True, "$ne": None}}},
    {"$sort": {"imdb.rating": -1}},
    {"$limit": 5}  # Top 5 para mostrar mais opções
]

filmes_top_rated = list(movies_collection.aggregate(pipeline_maior_nota))

print("Top 5 filmes com maior avaliação:")
for i, filme in enumerate(filmes_top_rated, 1):
    title = filme['title']
    year = filme.get('year', 'N/A')
    rating = filme.get('imdb', {}).get('rating', 'N/A')
    votes = filme.get('imdb', {}).get('votes', 0)
    
    print(f"   {i}. {title} ({year})")
    print(f"      Rating: {rating} | Votos: {format_number(votes)}")

# Encontrar o filme com a nota MÁXIMA absoluta
pipeline_max_rating = [
    {"$match": {"imdb.rating": {"$exists": True, "$ne": None}}},
    {"$group": {
        "_id": None,
        "max_rating": {"$max": "$imdb.rating"}
    }}
]

max_rating_result = list(movies_collection.aggregate(pipeline_max_rating))
if max_rating_result:
    max_rating = max_rating_result[0]['max_rating']
    print(f"\nMaior rating encontrado no database: {max_rating}")
    
    # Buscar todos os filmes com este rating máximo
    filmes_max_rating = movies_collection.find({"imdb.rating": max_rating})
    print("Filmes com rating máximo:")
    for filme in filmes_max_rating:
        print(f"   • {filme['title']} ({filme.get('year', 'N/A')})")

📝 Questão 20: Contando filmes por gênero
🎭 Top 10 gêneros com mais filmes:
   1. Drama: 12,385 filmes
   2. Comedy: 6,532 filmes
   3. Romance: 3,318 filmes
   4. Crime: 2,457 filmes
   5. Thriller: 2,454 filmes
   6. Action: 2,381 filmes
   7. Adventure: 1,900 filmes
   8. Documentary: 1,834 filmes
   9. Horror: 1,470 filmes
   10. Biography: 1,269 filmes


📝 Questão 21: Média de avaliação por ano de lançamento
📅 Média de avaliação por ano (2000-2020):
   2000: 6.52 (baseado em 581 filmes)
   2001: 6.57 (baseado em 612 filmes)
   2002: 6.55 (baseado em 622 filmes)
   2003: 6.53 (baseado em 603 filmes)
   2004: 6.66 (baseado em 678 filmes)
   2005: 6.58 (baseado em 713 filmes)
   2006: 6.6 (baseado em 774 filmes)
   2007: 6.59 (baseado em 810 filmes)
   2008: 6.55 (baseado em 886 filmes)
   2009: 6.51 (baseado em 917 filmes)


📝 Questão 22: Filme com a maior nota de avaliação
🏆 Top 5 filmes com maior avaliação:
   1. The Danish Girl (2015)
      Rating:  | Votos: 
   2. Landet som icke

In [None]:
# Finalizando operações...
print("Finalizando operações...")

print("\nEstatísticas finais do database:")
print(f"   movies: {movies_collection.count_documents({}):,} documentos")
print(f"   users: {users_collection.count_documents({}):,} documentos")
print(f"   comments: {comments_collection.count_documents({}):,} documentos")

# Fechar conexão
client.close()
print("\nConexão com MongoDB Atlas fechada com sucesso!")

print("\n" + "="*60)
print("PROJETO CONCLUÍDO COM SUCESSO!")
print("Disciplina: Big Data - UFPB")
print("Aluno: Samila Rodrigues")
print("Data: 07 de Agosto de 2025")
print("MongoDB Atlas + Sample MFlix Database")
print("="*60)

print("\nREFERÊNCIAS:")
referencias = [
    "[1] MongoDB Official Documentation: https://docs.mongodb.com/",
    "[2] MongoDB Atlas: https://www.mongodb.com/atlas",
    "[3] PyMongo Documentation: https://pymongo.readthedocs.io/",
    "[4] MongoDB Sample Data: https://www.mongodb.com/pt-br/docs/atlas/sample-data/",
    "[5] MongoDB Aggregation Framework: https://docs.mongodb.com/manual/aggregation/",
    "[6] UFPB Big Data Materials: sig-arq.ufpb.br/arquivos/.../BigData_06_ModeloDocumentos.pdf",
    "[7] MongoDB University: https://university.mongodb.com/",
    "[8] Google Colab Reference: https://colab.research.google.com/drive/1bQAqtl02MM155I0ao_7RAEpVNjFap_Z0"
]

for ref in referencias:
    print(f"    {ref}")

print("\nPRÓXIMOS PASSOS:")
print("    • Implementar índices para otimização")
print("    • Adicionar validação de schema")
print("    • Explorar sharding para escalabilidade")
print("    • Integrar com ferramentas de visualização")
print("    • Implementar backup e recovery")

print("\nObrigada por acompanhar este projeto!")

🧹 Finalizando operações...

📊 Estatísticas finais do database:
   movies: 21,349 documentos
   users: 186 documentos
   comments: 41,082 documentos
   users: 186 documentos
   comments: 41,082 documentos

✅ Conexão com MongoDB Atlas fechada com sucesso!

🎓 PROJETO CONCLUÍDO COM SUCESSO!
📚 Disciplina: Big Data - UFPB
👨‍🎓 Aluno: Samila Rodrigues
📅 Data: 07 de Agosto de 2025
🚀 MongoDB Atlas + Sample MFlix Database

📚 REFERÊNCIAS:
    [1] MongoDB Official Documentation: https://docs.mongodb.com/
    [2] MongoDB Atlas: https://www.mongodb.com/atlas
    [3] PyMongo Documentation: https://pymongo.readthedocs.io/
    [4] MongoDB Sample Data: https://www.mongodb.com/pt-br/docs/atlas/sample-data/
    [5] MongoDB Aggregation Framework: https://docs.mongodb.com/manual/aggregation/
    [6] UFPB Big Data Materials: sig-arq.ufpb.br/arquivos/.../BigData_06_ModeloDocumentos.pdf
    [7] MongoDB University: https://university.mongodb.com/
    [8] Google Colab Reference: https://colab.research.google.com/

In [None]:
# Função auxiliar para formatação segura de números
def format_number(value):
    """
    Formatar números com vírgulas, tratando tipos mistos de forma segura
    """
    if value is None:
        return "None"
    
    # Se for string, tentar extrair números
    if isinstance(value, str):
        import re
        numbers = re.findall(r'\d+', value)
        if numbers:
            return f"{int(numbers[0]):,}"
        return value
    
    # Se for número, formatar normalmente
    if isinstance(value, (int, float)):
        return f"{int(value):,}"
    
    # Outros tipos, retornar como string
    return str(value)

print("Função format_number() criada para resolver problemas de formatação!")
print("Use format_number(votes) em vez de {votes:,} quando votes pode não ser número")

# Testar a função
test_values = [123456, "123456", "N/A", 0, None, "abc123def"]
print("\nTestando a função:")
for val in test_values:
    formatted = format_number(val)
    print(f"   {val} → {formatted}")

print("\nAgora você pode executar as células problemáticas!")

✅ Função format_number() criada para resolver problemas de formatação!
💡 Use format_number(votes) em vez de {votes:,} quando votes pode não ser número

🧪 Testando a função:
   123456 → 123,456
   123456 → 123,456
   N/A → N/A
   0 → 0
   None → None
   abc123def → 123

🔧 Agora você pode executar as células problemáticas!
