In [8]:
!pip install pymongo
!pip install pandas
!pip install matplotlib
!pip install seaborn
import pymongo
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

from pymongo import MongoClient
client = MongoClient("mongodb://root:mongo@mongo:27017/")


# Criação/acesso ao banco de dados
db = client["EstudantesDB"]

# Criação/acesso à coleção Estudantes
collection = db["Estudantes"]

# Limpar coleção se já existir dados
collection.delete_many({})

# Inserir pelo menos 5 documentos
estudantes = [
    {"nome": "Geovanna Silva", "idade": 22, "curso": "Engenharia de Dados", "email": "geovanna@email.com"},
    {"nome": "Tinez Santos", "idade": 25, "curso": "Ciência da Computação", "email": "tinez@email.com"},
    {"nome": "Dardo Oliveira", "idade": 21, "curso": "Engenharia de Dados", "email": "dardo@email.com"},
    {"nome": "Ganem Pereira", "idade": 23, "curso": "Sistemas de Informação", "email": "Ganem@email.com"},
    {"nome": "Marcos Costa", "idade": 24, "curso": "Ciência da Computação", "email": "marcos@email.com"}
]

result = collection.insert_many(estudantes)
print(f"Documentos inseridos com IDs: {result.inserted_ids}")

# Contar número de estudantes por curso usando aggregate()
print("\nNúmero de estudantes por curso (usando aggregate()):")
pipeline = [
    {"$group": {"_id": "$curso", "quantidade": {"$sum": 1}}},
    {"$sort": {"quantidade": -1}}
]
resultado_agregacao = list(collection.aggregate(pipeline))
for grupo in resultado_agregacao:
    print(f"{grupo['_id']}: {grupo['quantidade']}")

# Contar número de estudantes por curso usando countDocuments()
print("\nNúmero de estudantes por curso (usando countDocuments()):")
cursos = collection.distinct("curso")
for curso in cursos:
    contador = collection.count_documents({"curso": curso})
    print(f"{curso}: {contador}")

# Atualizar o curso de um estudante específico
filtro = {"nome": "Maria Silva"}
atualizacao = {"$set": {"curso": "Ciência de Dados"}}
resultado_atualizacao = collection.update_one(filtro, atualizacao)
print(f"\nEstudante atualizado: {resultado_atualizacao.matched_count} encontrado, {resultado_atualizacao.modified_count} modificado")

# Verificar atualização
print("\nDocumento atualizado:")
print(collection.find_one({"nome": "Maria Silva"}))

# Excluir um documento com base no nome
filtro = {"nome": "Carlos Pereira"}
resultado_exclusao = collection.delete_one(filtro)
print(f"\nEstudante excluído: {resultado_exclusao.deleted_count}")

# Verificar documentos restantes
print("\nDocumentos restantes:")
for doc in collection.find():
    print(doc)

Documentos inseridos com IDs: [ObjectId('681795fc0269f4a4ad5ab91e'), ObjectId('681795fc0269f4a4ad5ab91f'), ObjectId('681795fc0269f4a4ad5ab920'), ObjectId('681795fc0269f4a4ad5ab921'), ObjectId('681795fc0269f4a4ad5ab922')]

Número de estudantes por curso (usando aggregate()):
Ciência da Computação: 2
Engenharia de Dados: 2
Sistemas de Informação: 1

Número de estudantes por curso (usando countDocuments()):
Ciência da Computação: 2
Engenharia de Dados: 2
Sistemas de Informação: 1

Estudante atualizado: 0 encontrado, 0 modificado

Documento atualizado:
None

Estudante excluído: 0

Documentos restantes:
{'_id': ObjectId('681795fc0269f4a4ad5ab91e'), 'nome': 'Geovanna Silva', 'idade': 22, 'curso': 'Engenharia de Dados', 'email': 'geovanna@email.com'}
{'_id': ObjectId('681795fc0269f4a4ad5ab91f'), 'nome': 'Tinez Santos', 'idade': 25, 'curso': 'Ciência da Computação', 'email': 'tinez@email.com'}
{'_id': ObjectId('681795fc0269f4a4ad5ab920'), 'nome': 'Dardo Oliveira', 'idade': 21, 'curso': 'Engenh

In [9]:
# Avaliação 01 - Big Data e NoSQL
# Manipulação de Dados com Cassandra

# Instalação da biblioteca do driver Cassandra
!pip install cassandra-driver

# Importando as bibliotecas necessárias
from cassandra.cluster import Cluster
from uuid import uuid4
import time

# Função para criar o keyspace e tabela
def setup_database():
    try:
        # Conectar ao cluster sem especificar um keyspace
        print("Conectando ao cluster Cassandra...")
        meu_cluster = Cluster(['cassandra'], port=9042)
        minha_sessao = meu_cluster.connect()
        
        # Criar o keyspace (se não existir)
        print("Tentando criar o keyspace AulaDemo...")
        minha_sessao.execute("""
            CREATE KEYSPACE IF NOT EXISTS AulaDemo
            WITH replication = {'class': 'SimpleStrategy', 'replication_factor': 1}
        """)
        
        # Aguardar um tempo e verificar se o keyspace foi criado
        time.sleep(5)  # Espera significativa para o Cassandra processar
        print("Verificando se o keyspace foi criado...")
        
        # Listar todos os keyspaces existentes
        db_keyspaces = minha_sessao.execute("SELECT keyspace_name FROM system_schema.keyspaces")
        lista_keyspaces = [k.keyspace_name for k in db_keyspaces]
        print(f"Keyspaces disponíveis: {lista_keyspaces}")
        
        if "aulademo" not in [k.lower() for k in lista_keyspaces]:
            print("⚠️ O keyspace AulaDemo não foi encontrado após a criação!")
            return None
            
        print("✅ Keyspace AulaDemo encontrado!")
        
        # Conectar explicitamente ao keyspace
        print("Conectando ao keyspace AulaDemo...")
        # Criamos uma nova sessão explicitamente conectada ao keyspace
        novo_cluster = Cluster(['cassandra'], port=9042)
        nova_sessao = novo_cluster.connect("aulademo")
        
        # Criar tabela
        print("Criando tabela Estudantes...")
        nova_sessao.execute("""
            CREATE TABLE IF NOT EXISTS Estudantes (
                id UUID PRIMARY KEY,
                nome TEXT,
                idade INT,
                curso TEXT,
                email TEXT
            )
        """)
        
        # Fechar sessão original
        meu_cluster.shutdown()
        return novo_cluster, nova_sessao
        
    except Exception as e:
        print(f"❌ Erro ao configurar o banco de dados: {e}")
        if 'meu_cluster' in locals():
            meu_cluster.shutdown()
        return None

# Função para inserir dados de estudantes
def inserir_estudantes(sessao_db):
    try:
        # Limpar dados existentes
        print("Limpando dados existentes...")
        sessao_db.execute("TRUNCATE Estudantes")
        
        # Preparar dados
        print("Inserindo estudantes...")
        meus_estudantes = [
            (uuid4(), "Miguel Santos", 22, "Engenharia de Software", "miguel@email.com"),
            (uuid4(), "Larissa Lima", 24, "Inteligência Artificial", "larissa@email.com"),
            (uuid4(), "Pedro Rocha", 21, "Engenharia de Software", "pedro@email.com"),
            (uuid4(), "Camila Martins", 23, "Ciência de Dados", "camila@email.com"),
            (uuid4(), "Lucca Ferreira", 25, "Inteligência Artificial", "lucas@email.com")
        ]
        
        # Inserir cada estudante
        comando_insert = sessao_db.prepare("""
            INSERT INTO Estudantes (id, nome, idade, curso, email)
            VALUES (?, ?, ?, ?, ?)
        """)
        
        for aluno in meus_estudantes:
            sessao_db.execute(comando_insert, aluno)
            
        print("✅ Estudantes inseridos com sucesso!")
        return True
        
    except Exception as e:
        print(f"❌ Erro ao inserir estudantes: {e}")
        return False

# Funções de manipulação de dados

def buscar_por_nome(sessao_db, nome_aluno):
    """Busca estudantes pelo nome"""
    try:
        minha_query = "SELECT * FROM Estudantes WHERE nome = %s ALLOW FILTERING"
        resultados_busca = list(sessao_db.execute(minha_query, [nome_aluno]))
        return resultados_busca
    except Exception as e:
        print(f"❌ Erro ao buscar estudante: {e}")
        return []

def atualizar_curso(sessao_db, id_aluno, curso_novo):
    """Atualiza o curso de um estudante"""
    try:
        sessao_db.execute(
            "UPDATE Estudantes SET curso = %s WHERE id = %s",
            [curso_novo, id_aluno]
        )
        print(f"✅ Curso atualizado para o estudante com ID {id_aluno}")
        return True
    except Exception as e:
        print(f"❌ Erro ao atualizar curso: {e}")
        return False

def remover_estudante(sessao_db, id_aluno):
    """Remove um estudante do banco de dados"""
    try:
        sessao_db.execute(
            "DELETE FROM Estudantes WHERE id = %s",
            [id_aluno]
        )
        print(f"✅ Estudante com ID {id_aluno} removido com sucesso")
        return True
    except Exception as e:
        print(f"❌ Erro ao remover estudante: {e}")
        return False

def listar_estudantes(sessao_db):
    """Lista todos os estudantes cadastrados"""
    try:
        print("\n📋 Lista de estudantes:")
        lista_alunos = list(sessao_db.execute("SELECT * FROM Estudantes"))
        
        if not lista_alunos:
            print("Nenhum estudante encontrado.")
            return
            
        for aluno in lista_alunos:
            print(f"ID: {aluno.id}, Nome: {aluno.nome}, Curso: {aluno.curso}, Idade: {aluno.idade}")
        return lista_alunos
    except Exception as e:
        print(f"❌ Erro ao listar estudantes: {e}")
        return []

# Função principal para executar a demonstração
def main():
    print("\n🚀 Iniciando demonstração de manipulação de dados com Cassandra\n")
    
    # Configurar banco de dados
    resultado_setup = setup_database()
    if not resultado_setup:
        print("❌ Falha ao configurar o banco de dados. Encerrando...")
        return
        
    meu_cluster, minha_sessao = resultado_setup
    
    try:
        # Inserir dados de exemplo
        if not inserir_estudantes(minha_sessao):
            print("❌ Falha ao inserir dados de exemplo. Encerrando...")
            return
            
        # Demonstrar operações CRUD
        print("\n📊 Demonstrando operações CRUD (Create, Read, Update, Delete):")
        
        # 1. Buscar Larissa e atualizar seu curso
        print("\n🔍 Buscando estudante 'Larissa Lima'...")
        aluna_larissa = buscar_por_nome(minha_sessao, "Larissa Lima")
        
        if aluna_larissa:
            aluna = aluna_larissa[0]
            print(f"Encontrada: {aluna.nome}, ID: {aluna.id}, Curso atual: {aluna.curso}")
            
            # Atualizar o curso da Larissa
            print(f"Alterando curso para 'Machine Learning'...")
            atualizar_curso(minha_sessao, aluna.id, "Machine Learning")
            
            # Verificar atualização
            dados_atualizados = list(minha_sessao.execute("SELECT * FROM Estudantes WHERE id = %s", [aluna.id]))
            if dados_atualizados:
                print(f"Após atualização: {dados_atualizados[0].nome}, Curso: {dados_atualizados[0].curso}")
        else:
            print("❌ Estudante 'Larissa Lima' não encontrado.")
            
        # 2. Remover Pedro Rocha
        print("\n🔍 Buscando estudante 'Pedro Rocha' para remoção...")
        aluno_pedro = buscar_por_nome(minha_sessao, "Pedro Rocha")
        
        if aluno_pedro:
            print(f"Encontrado: {aluno_pedro[0].nome}, ID: {aluno_pedro[0].id}")
            remover_estudante(minha_sessao, aluno_pedro[0].id)
        else:
            print("❌ Estudante 'Pedro Rocha' não encontrado.")
            
        # 3. Listar todos os estudantes restantes
        listar_estudantes(minha_sessao)
        
        print("\n✅ Demonstração concluída com sucesso!")
        
    except Exception as e:
        print(f"\n❌ Erro durante a execução: {e}")
    finally:
        # Fechar conexão
        if 'meu_cluster' in locals():
            print("\nFechando conexão com o cluster...")
            meu_cluster.shutdown()

# Executar o programa
if __name__ == "__main__":
    main()

Collecting cassandra-driver
  Downloading cassandra_driver-3.29.2-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.2 kB)
Collecting geomet<0.3,>=0.1 (from cassandra-driver)
  Downloading geomet-0.2.1.post1-py3-none-any.whl.metadata (1.0 kB)
Collecting click (from geomet<0.3,>=0.1->cassandra-driver)
  Downloading click-8.1.8-py3-none-any.whl.metadata (2.3 kB)
Downloading cassandra_driver-3.29.2-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (3.9 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m3.9/3.9 MB[0m [31m6.2 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25hDownloading geomet-0.2.1.post1-py3-none-any.whl (18 kB)
Downloading click-8.1.8-py3-none-any.whl (98 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m98.2/98.2 kB[0m [31m15.6 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: click, geomet, cassandra-driver
Successfully installed cassandra-driver-3.29.2 click-8.1.8 geomet-0.2.1.post1

🚀