# Banco de Dados - CinemaFlix

## Cenário

Usuários do Cinemaflix necessitam consultar onde assistir filmes/séries, além de visualizar informações básicas do conteúdo como sinopse, categoria, tempo de duração, ano de lançamento, nota de avaliação por alguns portais, etc. Com as informações cadastradas pelos usuários em relação às suas preferências de filmes/séries estruturar um sistema de recomendação.


## MariaDB

### Banco de dados de usuários/plataformas/gêneros: cinemaflix_db

O banco de dados para armazenar informações sobre usuários, plataformas de streamings/vendas e gêneros será relacional e usaremos o MariaDB.

#### Schema

![image.png](attachment:e930db44-19cb-4bb6-9ff9-2f10cb1c5cb9.png)

#### Criação das tabelas do banco de dados MariaDB - Códigos

##### Funções

In [63]:
from sqlalchemy import create_engine, text
from pandas import read_sql

# Função para fazer as queries
def read_sql_mariadb(engine, query):
    return read_sql(query, engine)

# Função para fazer as criar tabela
def create_table(engine, command):
    try:
        with engine.connect() as conn:
                conn.execute(text(command))
        print("Tabela criada com sucesso.")
    except Exception as e:
        print(f"Erro durante a recriação da tabela: {e}")

# Função para fazer inserir dados em determinada tabela
def insert_data_into_table(engine, command):
    try:
        with engine.connect() as conn:
            with conn.begin() as trans:
                conn.execute(text(command))
        print("Dados inseridos com sucesso.")
    except Exception as e:
        print(f"Erro durante a recriação da tabela: {e}")

# Função para 'dropar' dados de uma tabela
def drop_table(engine, command):
    try:
        with engine.connect() as conn:
            with conn.begin() as trans:
                conn.execute(text(command))
        print("Tabela dropada com sucesso")
    except Exception as e:
        print(f"Não foi possível dropar a tabela: {e}")

def drop_tables():
    db_uri = "mysql+mysqlconnector://cinemaflix_user:user_password@mariadb:3306/cinemaflix_db"
    engine = create_engine(db_uri)
    query = "SHOW TABLES;"
    
    if len(read_sql_mariadb(engine, query)) != 0:
        command_drop_table = "DROP TABLE IF EXISTS usuario_plataforma;"
        drop_table(engine, command_drop_table)
        command_drop_table = "DROP TABLE IF EXISTS usuario_genero;"
        drop_table(engine, command_drop_table)
        command_drop_table = "DROP TABLE IF EXISTS conteudo_genero;"
        drop_table(engine, command_drop_table) 
        command_drop_table = "DROP TABLE IF EXISTS conteudo_plataforma;"
        drop_table(engine, command_drop_table)
        command_drop_table = "DROP TABLE IF EXISTS usuarios;"
        drop_table(engine, command_drop_table)
        command_drop_table = "DROP TABLE IF EXISTS plataformas;"
        drop_table(engine, command_drop_table)
        command_drop_table = "DROP TABLE IF EXISTS generos;"
        drop_table(engine, command_drop_table)
        

def consult_favorite_user_genre(engine, nome_usuario):
    
    query_generos = """
    SELECT
        u.nome_completo,
        g.titulo AS genero_preferido
    FROM
        usuarios u
    JOIN
        usuario_genero ug ON u.id_usuario = ug.id_usuario
    JOIN
        generos g ON ug.id_genero = g.id_genero
    WHERE
        u.nome_completo = :nome_param;
    """
    
    try:
        print(f"--- Gêneros preferidos do usuário {nome_usuario} ---")
        df_generos = read_sql(text(query_generos), engine, params={'nome_param': nome_usuario})
        display(df_generos)
    except Exception as e:
        print(f"Ocorreu um erro ao executar a consulta: {e}")


def consult_user_platform(engine, nome_plataforma):

    query_plataformas = """
    SELECT
        u.nome_completo,
        p.titulo AS plataforma_assinada
    FROM
        usuarios u
    JOIN
        usuario_plataforma up ON u.id_usuario = up.id_usuario
    JOIN
        plataformas p ON up.id_plataforma = p.id_plataforma
    WHERE
        p.titulo = :plataforma_param;
    """
    
    try:
        print(f"--- Usuários que assinam a plataforma '{nome_plataforma}' ---")
        df_plataformas = read_sql(text(query_plataformas), engine, params={'plataforma_param': nome_plataforma})
        display(df_plataformas)
    except Exception as e:
        print(f"Ocorreu um erro ao executar a consulta: {e}")


def consult_user_preferences(engine, nome_usuario):

    query_perfil = """
    SELECT
        u.nome_completo,
        GROUP_CONCAT(DISTINCT g.titulo SEPARATOR ', ') AS generos_preferidos,
        GROUP_CONCAT(DISTINCT p.titulo SEPARATOR ', ') AS plataformas_assinadas
    FROM
        usuarios u
    LEFT JOIN
        usuario_genero ug ON u.id_usuario = ug.id_usuario
    LEFT JOIN
        generos g ON ug.id_genero = g.id_genero
    LEFT JOIN
        usuario_plataforma up ON u.id_usuario = up.id_usuario
    LEFT JOIN
        plataformas p ON up.id_plataforma = p.id_plataforma
    WHERE
        u.nome_completo = :nome_param
    GROUP BY
        u.id_usuario;
    """
    
    try:
        print(f"--- Resumo de preferências do usuário '{nome_usuario}' ---")
        df_perfil = read_sql(text(query_perfil), engine, params={'nome_param': nome_usuario})
        display(df_perfil) 
    except Exception as e:
        print(f"Ocorreu um erro ao executar a consulta: {e}")

##### Exibindo banco de dados criados no momento da criação do ambiente de desenvolvimento - docker

In [64]:
# Criando o Engine do SQLAlchemy - "raiz"
db_uri = "mysql+mysqlconnector://cinemaflix_user:user_password@mariadb:3306/"
engine = create_engine(db_uri)

# Com a consulta abaixo conseguimos identicar os databases criados no momento em que criamos o container docker rodando o mariadb
query = "SHOW DATABASES;"
read_sql_mariadb(engine, query)

Unnamed: 0,Database
0,cinemaflix_db
1,information_schema


##### Exibindo que o banco de dados cinemaflix_db está vazio, e caso não esteja deletar as tabelas existentes

In [65]:
# Criando o Engine do SQLAlchemy para o database cinemaflix_db para acessar as suas tabelas
db_uri = "mysql+mysqlconnector://cinemaflix_user:user_password@mariadb:3306/cinemaflix_db"
engine = create_engine(db_uri)

query = "SHOW TABLES;"

# Caso existam tabelas no banco, os códigos abaixo é para "dropar" as tabelas, permitindo assim que as criemos.
drop_tables()

read_sql_mariadb(engine, query)
# O banco de dados está vazio. Vamos criar tabelas de acordo com o schema proposto com os dados de usuarios (chamada 'usuarios') e popular com 15 dados de usuários fictícios.

Tabela dropada com sucesso
Tabela dropada com sucesso
Tabela dropada com sucesso
Tabela dropada com sucesso
Tabela dropada com sucesso
Tabela dropada com sucesso
Tabela dropada com sucesso


Unnamed: 0,Tables_in_cinemaflix_db


##### Criando e inserindo dados nas tabelas "usuarios", "plataformas", "gêneros", "usuario_plataforma", "usuario_generos"

In [66]:
drop_tables()

# Criando a tabela 'usuarios'
command_create_table = """
CREATE TABLE usuarios (
    id_usuario INT PRIMARY KEY AUTO_INCREMENT,
    nome_completo VARCHAR(255) NOT NULL,
    email VARCHAR(255) NOT NULL UNIQUE,
    senha_hash VARCHAR(255) NOT NULL,
    data_nascimento DATE,
    data_cadastro DATE
);
"""

create_table(engine, command_create_table)

# Inserindo os dados dos usuários na tabela
command_insert_users = """
INSERT INTO usuarios (nome_completo, email, senha_hash, data_nascimento, data_cadastro) VALUES
('Ana Silva', 'ana.silva@example.com', 'hash_exemplo_abc123', '1995-08-20', '2024-01-10'),
('Bruno Costa', 'bruno.costa@example.com', 'hash_exemplo_def456', '1990-03-15', '2024-01-12'),
('Carla Dias', 'carla.dias@example.com', 'hash_exemplo_ghi789', '1988-11-30', '2024-02-05'),
('Daniel Faria', 'daniel.faria@example.com', 'hash_exemplo_jkl101', '2001-07-22', '2024-02-20'),
('Eduarda Lima', 'eduarda.lima@example.com', 'hash_exemplo_mno112', '1999-05-18', '2024-03-01'),
('Felipe Gomes', 'felipe.gomes@example.com', 'hash_exemplo_pqr131', '1992-09-03', '2024-03-15'),
('Gabriela Moura', 'gabriela.moura@example.com', 'hash_exemplo_stu141', '1998-01-25', '2024-04-02'),
('Heitor Rocha', 'heitor.rocha@example.com', 'hash_exemplo_vwx151', '1985-12-12', '2024-04-19'),
('Isabela Pinto', 'isabela.pinto@example.com', 'hash_exemplo_yza161', '2003-02-28', '2024-05-07'),
('João Martins', 'joao.martins@example.com', 'hash_exemplo_bcd171', '1996-06-10', '2024-05-21'),
('Larissa Vieira', 'larissa.vieira@example.com', 'hash_exemplo_efg181', '1994-10-08', '2024-06-03'),
('Marcos Nunes', 'marcos.nunes@example.com', 'hash_exemplo_hij191', '1991-04-14', '2024-06-18'),
('Natália Azevedo', 'natalia.azevedo@example.com', 'hash_exemplo_klm202', '1997-08-16', '2024-07-01'),
('Otávio Barros', 'otavio.barros@example.com', 'hash_exemplo_nop212', '1989-03-29', '2024-07-15'),
('Patrícia Ramos', 'patricia.ramos@example.com', 'hash_exemplo_qrs222', '2000-11-05', '2024-07-22');
"""
insert_data_into_table(engine, command_insert_users)

# Criando a tabela 'plataformas'
command_create_table = """
CREATE TABLE plataformas (
    id_plataforma INT PRIMARY KEY AUTO_INCREMENT,
    titulo VARCHAR(255) NOT NULL,
    data_cadastro TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
"""

create_table(engine, command_create_table)

# Inserindo os dados das plataformas na tabela
command_insert = """
INSERT INTO plataformas (titulo) VALUES 
('Netflix'),
('Amazon Prime Video'),
('Max'),
('Apple TV'),
('Disney+'),
('GloboPlay'),
('Telecine'),
('Hulu'),
('Crunchyroll');
"""

insert_data_into_table(engine, command_insert)

# Criando a tabela 'Generos'
command_create_table = """
CREATE TABLE generos (
    id_genero INT PRIMARY KEY AUTO_INCREMENT,
    titulo VARCHAR(255) NOT NULL,
    data_cadastro TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
"""

create_table(engine, command_create_table)

# Inserindo os dados dos gêneros na tabela
command_insert = """
INSERT INTO generos (titulo) VALUES ('Terror'),('Aventura'),('Drama'),('Comedia'),('Acao'),('Romance'),('Ficcao Cientifica'),('Fantasia'),\
('Documentario'),('Suspense'),('Misterio'),('Animacao'),('Musical'),('Crime'),('Historico'),('Biografia'),('Guerra'),('Esporte'),\
('Faroeste'),('Reality Show');
"""
insert_data_into_table(engine, command_insert)

# Criando a tabela 'usuario_plataforma'
command_create_table = """
CREATE TABLE usuario_plataforma (
   id_usuario INT, id_plataforma INT, PRIMARY KEY (id_usuario, id_plataforma),
   data_cadastro TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
   FOREIGN KEY (id_usuario) REFERENCES usuarios(id_usuario) ON DELETE CASCADE,
   FOREIGN KEY (id_plataforma) REFERENCES plataformas(id_plataforma) ON DELETE CASCADE
);
"""
create_table(engine, command_create_table)

# Inserindo os dados dos usuáios e suas plataformas favoritas na tabela
command_insert = """INSERT INTO usuario_plataforma (id_usuario, id_plataforma) VALUES (1, 1),(1, 2),(2, 3),(3, 1),(4, 2),(5, 5),\
(6, 3),(7, 4),(8, 1),(9, 6),(10, 2),(11, 7),(12, 3),(13, 8),(14, 4),(15, 9),(1, 5),(2, 6),(3, 7),(4, 8),(5, 9),(6, 1),(7, 2),\
(8, 3),(9, 4),(10, 5),(11, 6),(12, 7),(13, 1),(14, 2),(15, 3);"""

insert_data_into_table(engine, command_insert)

# Criando a tabela 'usuario_genero'
command_create_table = """
CREATE TABLE usuario_genero (
   id_usuario INT, id_genero INT, PRIMARY KEY (id_usuario, id_genero),
   data_cadastro TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
   FOREIGN KEY (id_usuario) REFERENCES usuarios(id_usuario) ON DELETE CASCADE,
   FOREIGN KEY (id_genero) REFERENCES generos(id_genero) ON DELETE CASCADE
);
"""
create_table(engine, command_create_table)

# Inserindo os dados dos usuáios e suas plataformas favoritas na tabela
command_insert = """INSERT INTO usuario_genero (id_usuario, id_genero) VALUES (1, 1),(1, 2),(2, 3),(3, 1),(4, 5),(5, 7),(6, 4),\
(7, 6),(8, 8),(9, 9),(10, 10),(11, 11),(12, 12),(13, 13),(14, 14),(15, 15),(1, 16),(2, 17),(3, 18),(4, 19),(5, 20),(6, 1),(7, 2),\
(8, 3),(9, 4),(10, 5),(11, 6),(12, 7),(13, 8),(14, 9),(15, 10);"""

insert_data_into_table(engine, command_insert)


query = "SHOW TABLES;"
read_sql_mariadb(engine, query)


Tabela criada com sucesso.
Dados inseridos com sucesso.
Tabela criada com sucesso.
Dados inseridos com sucesso.
Tabela criada com sucesso.
Dados inseridos com sucesso.
Tabela criada com sucesso.
Dados inseridos com sucesso.
Tabela criada com sucesso.
Dados inseridos com sucesso.


Unnamed: 0,Tables_in_cinemaflix_db
0,generos
1,plataformas
2,usuario_genero
3,usuario_plataforma
4,usuarios


##### Exibindo os schemas e os dados das tabelas criadas

In [67]:
# Tabela: usuarios
query = "DESCRIBE usuarios;"
print("\nSCHEMA - USUARIOS")
display(read_sql_mariadb(engine, query))

query = "SELECT * FROM usuarios;"
print("\n\nTABELA DE USUÁRIOS CADASTRADOS")
display(read_sql_mariadb(engine, query))
print(60*"#")

# Tabela: generos
query = "DESCRIBE generos;"
print("\nSCHEMA - GÊNEROS")
display(read_sql_mariadb(engine, query))

query = "SELECT * FROM generos;"
print("\n\nTABELA DE GÊNEROS CADASTRADOS")
display(read_sql_mariadb(engine, query))
print(60*"#")

# Tabela: plataformas
query = "DESCRIBE plataformas;"
print("\n\nSCHEMA - PLATAFORMAS")
display(read_sql_mariadb(engine, query))

query = "SELECT * FROM plataformas;"
print("\n\nTABELA DE PLATAFORMAS CADASTRADAS")
display(read_sql_mariadb(engine, query))
print(60*"#")

# Tabela: usuario_genero
query = "DESCRIBE usuario_genero;"
print("\n\nSCHEMA - USUÁRIO x GÊNERO")
display(read_sql_mariadb(engine, query))

query = "SELECT * FROM usuario_genero;"
print("\n\nTABELA DE RELAÇÃO USUÁRIO x GÊNERO")
display(read_sql_mariadb(engine, query))
print(60*"#")

# Tabela: usuario_plataforma
query = "DESCRIBE usuario_plataforma;"
print("\n\nSCHEMA - USUÁRIO x PLATAFORMA")
display(read_sql_mariadb(engine, query))

query = "SELECT * FROM usuario_plataforma;"
print("\n\nTABELA DE RELAÇÃO USUÁRIO x PLATAFORMA")
display(read_sql_mariadb(engine, query))



SCHEMA - USUARIOS


Unnamed: 0,Field,Type,Null,Key,Default,Extra
0,id_usuario,int(11),NO,PRI,,auto_increment
1,nome_completo,varchar(255),NO,,,
2,email,varchar(255),NO,UNI,,
3,senha_hash,varchar(255),NO,,,
4,data_nascimento,date,YES,,,
5,data_cadastro,date,YES,,,




TABELA DE USUÁRIOS CADASTRADOS


Unnamed: 0,id_usuario,nome_completo,email,senha_hash,data_nascimento,data_cadastro
0,1,Ana Silva,ana.silva@example.com,hash_exemplo_abc123,1995-08-20,2024-01-10
1,2,Bruno Costa,bruno.costa@example.com,hash_exemplo_def456,1990-03-15,2024-01-12
2,3,Carla Dias,carla.dias@example.com,hash_exemplo_ghi789,1988-11-30,2024-02-05
3,4,Daniel Faria,daniel.faria@example.com,hash_exemplo_jkl101,2001-07-22,2024-02-20
4,5,Eduarda Lima,eduarda.lima@example.com,hash_exemplo_mno112,1999-05-18,2024-03-01
5,6,Felipe Gomes,felipe.gomes@example.com,hash_exemplo_pqr131,1992-09-03,2024-03-15
6,7,Gabriela Moura,gabriela.moura@example.com,hash_exemplo_stu141,1998-01-25,2024-04-02
7,8,Heitor Rocha,heitor.rocha@example.com,hash_exemplo_vwx151,1985-12-12,2024-04-19
8,9,Isabela Pinto,isabela.pinto@example.com,hash_exemplo_yza161,2003-02-28,2024-05-07
9,10,João Martins,joao.martins@example.com,hash_exemplo_bcd171,1996-06-10,2024-05-21


############################################################

SCHEMA - GÊNEROS


Unnamed: 0,Field,Type,Null,Key,Default,Extra
0,id_genero,int(11),NO,PRI,,auto_increment
1,titulo,varchar(255),NO,,,
2,data_cadastro,timestamp,NO,,current_timestamp(),




TABELA DE GÊNEROS CADASTRADOS


Unnamed: 0,id_genero,titulo,data_cadastro
0,1,Terror,2025-07-26 21:52:46
1,2,Aventura,2025-07-26 21:52:46
2,3,Drama,2025-07-26 21:52:46
3,4,Comedia,2025-07-26 21:52:46
4,5,Acao,2025-07-26 21:52:46
5,6,Romance,2025-07-26 21:52:46
6,7,Ficcao Cientifica,2025-07-26 21:52:46
7,8,Fantasia,2025-07-26 21:52:46
8,9,Documentario,2025-07-26 21:52:46
9,10,Suspense,2025-07-26 21:52:46


############################################################


SCHEMA - PLATAFORMAS


Unnamed: 0,Field,Type,Null,Key,Default,Extra
0,id_plataforma,int(11),NO,PRI,,auto_increment
1,titulo,varchar(255),NO,,,
2,data_cadastro,timestamp,NO,,current_timestamp(),




TABELA DE PLATAFORMAS CADASTRADAS


Unnamed: 0,id_plataforma,titulo,data_cadastro
0,1,Netflix,2025-07-26 21:52:46
1,2,Amazon Prime Video,2025-07-26 21:52:46
2,3,Max,2025-07-26 21:52:46
3,4,Apple TV,2025-07-26 21:52:46
4,5,Disney+,2025-07-26 21:52:46
5,6,GloboPlay,2025-07-26 21:52:46
6,7,Telecine,2025-07-26 21:52:46
7,8,Hulu,2025-07-26 21:52:46
8,9,Crunchyroll,2025-07-26 21:52:46


############################################################


SCHEMA - USUÁRIO x GÊNERO


Unnamed: 0,Field,Type,Null,Key,Default,Extra
0,id_usuario,int(11),NO,PRI,,
1,id_genero,int(11),NO,PRI,,
2,data_cadastro,timestamp,NO,,current_timestamp(),




TABELA DE RELAÇÃO USUÁRIO x GÊNERO


Unnamed: 0,id_usuario,id_genero,data_cadastro
0,1,1,2025-07-26 21:52:46
1,1,2,2025-07-26 21:52:46
2,1,16,2025-07-26 21:52:46
3,2,3,2025-07-26 21:52:46
4,2,17,2025-07-26 21:52:46
5,3,1,2025-07-26 21:52:46
6,3,18,2025-07-26 21:52:46
7,4,5,2025-07-26 21:52:46
8,4,19,2025-07-26 21:52:46
9,5,7,2025-07-26 21:52:46


############################################################


SCHEMA - USUÁRIO x PLATAFORMA


Unnamed: 0,Field,Type,Null,Key,Default,Extra
0,id_usuario,int(11),NO,PRI,,
1,id_plataforma,int(11),NO,PRI,,
2,data_cadastro,timestamp,NO,,current_timestamp(),




TABELA DE RELAÇÃO USUÁRIO x PLATAFORMA


Unnamed: 0,id_usuario,id_plataforma,data_cadastro
0,1,1,2025-07-26 21:52:46
1,1,2,2025-07-26 21:52:46
2,1,5,2025-07-26 21:52:46
3,2,3,2025-07-26 21:52:46
4,2,6,2025-07-26 21:52:46
5,3,1,2025-07-26 21:52:46
6,3,7,2025-07-26 21:52:46
7,4,2,2025-07-26 21:52:46
8,4,8,2025-07-26 21:52:46
9,5,5,2025-07-26 21:52:46


### Consultas ao banco de dados cinemaflix no MariaDB

#### Consulta 1: Quais são os gêneros preferidos de determinado usuário?

In [68]:
## INPUT: nome do usuário como consta no banco de dados 'usuarios'
#nome_usuario = "Carla Dias"
nome_usuario = "João Martins"

db_uri = "mysql+mysqlconnector://cinemaflix_user:user_password@mariadb:3306/cinemaflix_db"
engine = create_engine(db_uri)
consult_favorite_user_genre(engine, nome_usuario)

--- Gêneros preferidos do usuário João Martins ---


Unnamed: 0,nome_completo,genero_preferido
0,João Martins,Acao
1,João Martins,Suspense


#### Consulta 2: Quais são os usuários assinam determinada plataforma de streaming?

In [69]:
## INPUT: nome da plataforma de streaming contida na tabela 'usuario_plataforma'
#nome_plataforma = "Netflix"
nome_plataforma = "Amazon Prime Video"

db_uri = "mysql+mysqlconnector://cinemaflix_user:user_password@mariadb:3306/cinemaflix_db"
engine = create_engine(db_uri)
consult_user_platform(engine, nome_plataforma)

--- Usuários que assinam a plataforma 'Amazon Prime Video' ---


Unnamed: 0,nome_completo,plataforma_assinada
0,Ana Silva,Amazon Prime Video
1,Daniel Faria,Amazon Prime Video
2,Gabriela Moura,Amazon Prime Video
3,João Martins,Amazon Prime Video
4,Otávio Barros,Amazon Prime Video


#### Consulta 3: Quais as prefências de determinado usuário?

In [73]:
## INPUT: nome do usuário como consta no banco de dados 'usuarios'
nome_usuario = "Carla Dias"
#nome_usuario = "João Martins"

db_uri = "mysql+mysqlconnector://cinemaflix_user:user_password@mariadb:3306/cinemaflix_db"
engine = create_engine(db_uri)
consult_user_preferences(engine, nome_usuario)

--- Resumo de preferências do usuário 'Carla Dias' ---


Unnamed: 0,nome_completo,generos_preferidos,plataformas_assinadas
0,Carla Dias,"Esporte, Terror","Netflix, Telecine"


## MongoDB

### 🔨 Conexão e setup - container de mongodb


In [18]:
from pymongo import MongoClient, errors
from pprint import pprint

mongo_uri = "mongodb://root:root_password@mongodb:27017/"
try:
    client = MongoClient(mongo_uri, serverSelectionTimeoutMS=5000)
    client.server_info()  # força a conexão
    print("✅ Conexão bem-sucedida!")
    print("Bancos existentes:", client.list_database_names())
except errors.ConnectionFailure as e:
    print("❌ Erro ao conectar:", e)
    raise

db = client["cinemaflix_db"]
movies = db["movies"]

✅ Conexão bem-sucedida!
Bancos existentes: ['admin', 'cinemaflix_db', 'config', 'local']


#### (Re)cria coleção e insere + 15 filmes

In [4]:
if "movies" in db.list_collection_names():
    db.drop_collection("movies")
print("→ coleção ‘movies’ pronta para popular.")

# dois exemplos clássicos
sample = [
    {
        "titulo": "The Shawshank Redemption",
        "sinopse": "Two imprisoned men bond over a number of years…",
        "tipo": "Filme",
        "ano_lancamento": 1994,
        "url_img_capa": "https://…",
        "generos": ["Drama"],
        "nota_imdb": 9.3,
        "diretores": [{"nome": "Frank Darabont"}],
        "elenco": [
            {"nome": "Tim Robbins", "personagem": "Andy Dufresne"},
            {"nome": "Morgan Freeman", "personagem": "Red"}
        ],
        "plataformas": [
            {"nome_plataforma": "Netflix", "url_conteudo": "https://…"}
        ]
    },
    {
        "titulo": "The Godfather",
        "sinopse": "The aging patriarch of an organized crime dynasty…",
        "tipo": "Filme",
        "ano_lancamento": 1972,
        "url_img_capa": "https://…",
        "generos": ["Crime", "Drama"],
        "nota_imdb": 9.2,
        "diretores": [{"nome": "Francis Ford Coppola"}],
        "elenco": [
            {"nome": "Marlon Brando", "personagem": "Don Vito Corleone"},
            {"nome": "Al Pacino", "personagem": "Michael Corleone"}
        ],
        "plataformas": [
            {"nome_plataforma": "Amazon Prime Video", "url_conteudo": "https://…"}
        ]
    }
]

# gera mais 13 exemplos simples
for i in range(3, 16):
    sample.append({
        "titulo": f"Sample Movie {i}",
        "sinopse": f"Sinopse para Sample Movie {i}.",
        "tipo": "Filme" if i % 3 else "Série",
        "ano_lancamento": 2000 + i,
        "url_img_capa": "https://example.com/cover.jpg",
        "generos": ["Drama", "Action"] if i % 2 else ["Comedy"],
        "nota_imdb": round(5 + i * 0.3, 1),
        "diretores": [{"nome": f"Director {i}"}],
        "elenco": [{"nome": f"Actor {i}A", "personagem": "Protagonist"}],
        "plataformas": [
            {"nome_plataforma": "Netflix", "url_conteudo": "https://…"},
            {"nome_plataforma": "Hulu",    "url_conteudo": "https://…"}
        ]
    })

result = movies.insert_many(sample)
print(f"Inserido {len(result.inserted_ids)} documentos.")

→ coleção ‘movies’ pronta para popular.
Inserido 15 documentos.


#### ➕ Create (inserir documentos)
1. Inserir um único filme  
2. Inserir vários filmes de uma vez


#### ✏️ Update
1. Atualizar **um** campo  
2. Atualizar **vários** documentos  
3. Substituir **todo** o documento


### 🗑 Delete
1. Deletar **um**  
2. Deletar **vários** documentos


### 🔍 Fazendo algumas consultas

#### Busca por título parcial (apenas uma parte do nome completo)

In [20]:
# RegEx case-insensitive para corresponder parte do título
substring = "godfather"
filme = movies.find_one({
    "titulo": { "$regex": substring, "$options": "i" }
})
if filme:
    pprint(filme)
else:
    print(f"Nenhum título contendo '{substring}' encontrado.")


{'_id': ObjectId('68861d642b399326903e7eec'),
 'ano_lancamento': 1972,
 'diretores': [{'nome': 'Francis Ford Coppola'}],
 'elenco': [{'nome': 'Marlon Brando', 'personagem': 'Don Vito Corleone'},
            {'nome': 'Al Pacino', 'personagem': 'Michael Corleone'}],
 'generos': ['Crime', 'Drama'],
 'nota_imdb': 9.2,
 'plataformas': [{'nome_plataforma': 'Amazon Prime Video',
                  'url_conteudo': 'https://…'}],
 'sinopse': 'The aging patriarch of an organized crime dynasty…',
 'tipo': 'Filme',
 'titulo': 'The Godfather',
 'url_img_capa': 'https://…'}


#### Todos os filmes de drama

In [6]:
print("\n🎬 Filmes de drama:")
for m in movies.find({"generos": "Drama"}):
    print(" •", m["titulo"])


🎬 Filmes de drama:
 • The Shawshank Redemption
 • The Godfather
 • Sample Movie 3
 • Sample Movie 5
 • Sample Movie 7
 • Sample Movie 9
 • Sample Movie 11
 • Sample Movie 13
 • Sample Movie 15


#### Filtrar os top 5 por nota IMDB

In [8]:
print("\n🏆 Top 5 IMBD:")
for m in movies.find().sort("nota_imdb", -1).limit(5):
    print(" •", m["titulo"], f"({m['nota_imdb']})")


🏆 Top 5 IMBD:
 • Sample Movie 15 (9.5)
 • The Shawshank Redemption (9.3)
 • Sample Movie 14 (9.2)
 • The Godfather (9.2)
 • Sample Movie 13 (8.9)


#### Filmes com o texto "The" no titulo

In [10]:
print('\n🔍 Titles with "The":')
for m in movies.find({"titulo": {"$regex": "The", "$options": "i"}}):
    print(" •", m["titulo"])


🔍 Titles with "The":
 • The Shawshank Redemption
 • The Godfather


#### Títulos dirigidos por diretor

In [21]:
print('\n🔍 Todos dirigidos por ‘Frank Darabont’')
for m in movies.find({ "diretores.nome": "Frank Darabont" }):
    print(" •", m["titulo"])


🔍 Todos dirigidos por ‘Frank Darabont’
 • The Shawshank Redemption


#### Filtro combinado de plataforma + nota IMDB

In [22]:
print('\n🔍 Filmes no netflix com nota IMDb ≥ 8.0')
for m in movies.find({
    "plataformas": {
        "$elemMatch": {
            "nome_plataforma": "Netflix",
        }
    },
    "nota_imdb": { "$gte": 8.0 }
}):
    print(" •", m["titulo"],"::", m["nota_imdb"])


🔍 Filmes no netflix com nota IMDb ≥ 8.0
 • The Shawshank Redemption :: 9.3
 • Sample Movie 10 :: 8.0
 • Sample Movie 11 :: 8.3
 • Sample Movie 12 :: 8.6
 • Sample Movie 13 :: 8.9
 • Sample Movie 14 :: 9.2
 • Sample Movie 15 :: 9.5


## Neo4j

### Banco de dados de relacionamentos/recomendações

#### Criação do banco de dados - Códigos

##### Função setup_neo4j() para criação de todo o setup necessário para elaborar as funcções do sistema de recomendação.

In [84]:
%reload_ext neo4j_cypher_query
from neo4j import GraphDatabase

def setup_neo4j():
    """
    Connects to the Neo4j database, clears existing data,
    and creates a new graph structure with sample nodes and relationships.
    """
    uri = "neo4j://neo4j:7687"
    user = "neo4j"
    password = "strong_password"
    driver = None

    try:
        # --- 1. ESTABLISH CONNECTION ---
        driver = GraphDatabase.driver(uri, auth=(user, password))
        session = driver.session()
        print("Connection to Neo4j successful.")

        # --- 2. CLEAR EXISTING DATABASE (for a clean setup) ---
        print("Clearing existing database...")
        session.run("MATCH (n) DETACH DELETE n")
        print("Database cleared.")

        # --- 3. CREATE GRAPH SCHEMA AND DATA ---
        print("Creating graph nodes and relationships...")
        graph_query = """
// ===============================
// Apagar tudo 
// ===============================

MATCH (n)
DETACH DELETE n
        """
        session.run(graph_query)
        graph_query = """
// ===============================
// GÊNEROS
// ===============================
MERGE (:Genre {nome: "Ação"})
MERGE (:Genre {nome: "Drama"})
MERGE (:Genre {nome: "Comédia"})
MERGE (:Genre {nome: "Ficção"})
MERGE (:Genre {nome: "Suspense"})
        """
        session.run(graph_query)
        print("Graph data GÊNEROS created successfully.")
        graph_query = """
// ===============================
//  VÍDEOS
// ===============================
CREATE
  (v1:Video {id: "v1", titulo: "Matrix", tipo: "filme"}),
  (v2:Video {id: "v2", titulo: "Inception", tipo: "filme"}),
  (v3:Video {id: "v3", titulo: "Breaking Bad", tipo: "serie"}),
  (v4:Video {id: "v4", titulo: "Stranger Things", tipo: "serie"}),
  (v5:Video {id: "v5", titulo: "O Poderoso Chefão", tipo: "filme"}),
  (v6:Video {id: "v6", titulo: "Friends", tipo: "serie"}),
  (v7:Video {id: "v7", titulo: "The Office", tipo: "serie"}),
  (v8:Video {id: "v8", titulo: "John Wick", tipo: "filme"}),
  (v9:Video {id: "v9", titulo: "Dark", tipo: "serie"}),
  (v10:Video {id: "v10", titulo: "La Casa de Papel", tipo: "serie"}),
  (v11:Video {id: "v11", titulo: "Black Mirror", tipo: "serie"}),
  (v12:Video {id: "v12", titulo: "Sherlock", tipo: "serie"}),
  (v13:Video {id: "v13", titulo: "Vikings", tipo: "serie"}),
  (v14:Video {id: "v14", titulo: "Peaky Blinders", tipo: "serie"}),
  (v15:Video {id: "v15", titulo: "The Mandalorian", tipo: "serie"})

        """
        session.run(graph_query)
        print("Graph data VÍDEOS created successfully.")
        graph_query = """
        
// ===============================
//  ASSOCIAR VÍDEOS A GÊNEROS
// ===============================
MATCH (a:Genre {nome: "Ação"}), (d:Genre {nome: "Drama"}), (c:Genre {nome: "Comédia"}), 
      (f:Genre {nome: "Ficção"}), (s:Genre {nome: "Suspense"})
MATCH 
  (v1:Video {id: "v1"}), (v2:Video {id: "v2"}), (v3:Video {id: "v3"}), (v4:Video {id: "v4"}),
  (v5:Video {id: "v5"}), (v6:Video {id: "v6"}), (v7:Video {id: "v7"}), (v8:Video {id: "v8"}),
  (v9:Video {id: "v9"}), (v10:Video {id: "v10"}), (v11:Video {id: "v11"}), (v12:Video {id: "v12"}),
  (v13:Video {id: "v13"}), (v14:Video {id: "v14"}), (v15:Video {id: "v15"})
MERGE (v1)-[:HAS_GENRE]->(a)
MERGE (v2)-[:HAS_GENRE]->(f)
MERGE (v3)-[:HAS_GENRE]->(d)
MERGE (v4)-[:HAS_GENRE]->(f)
MERGE (v5)-[:HAS_GENRE]->(d)
MERGE (v6)-[:HAS_GENRE]->(c)
MERGE (v7)-[:HAS_GENRE]->(c)
MERGE (v8)-[:HAS_GENRE]->(a)
MERGE (v9)-[:HAS_GENRE]->(s)
MERGE (v10)-[:HAS_GENRE]->(a)
MERGE (v11)-[:HAS_GENRE]->(s)
MERGE (v12)-[:HAS_GENRE]->(s)
MERGE (v13)-[:HAS_GENRE]->(a)
MERGE (v14)-[:HAS_GENRE]->(d)
MERGE (v15)-[:HAS_GENRE]->(f);

        """
        session.run(graph_query)
        print("Graph data ASSOCIAR VÍDEOS A GÊNEROS created successfully.")
        graph_query = """
        
// ===============================
// USUÁRIOS
// ===============================
UNWIND range(1, 10) AS i
CREATE (:User {id: 'u' + i, nome: 'Usuario ' + i});

        """
        session.run(graph_query)
        print("Graph data USUÁRIOS created successfully.")
        graph_query = """
        
// ===============================
// VISUALIZAÇÕES ALEATÓRIAS
// ===============================
UNWIND range(1, 10) AS i
MATCH (u:User {id: 'u' + i})
WITH u
MATCH (v:Video)
WITH u, v, rand() AS r
WHERE r < 0.6
MERGE (u)-[:WATCHED {timestamp: timestamp()}]->(v);

        """
        session.run(graph_query)
        print("Graph data VISUALIZAÇÕES ALEATÓRIAS created successfully.")
        graph_query = """
        
// ===============================
//  CURTIDAS
// ===============================
MATCH (u:User)-[w:WATCHED]->(v:Video)
WITH u, v, rand() AS r
WHERE r < 0.3
MERGE (u)-[:LIKED]->(v);

        """
        session.run(graph_query)
        print("Graph data CURTIDAS created successfully.")
        graph_query = """
        
// ===============================
// AVALIAÇÕES (RATING)
// ===============================
MATCH (u:User)-[w:WATCHED]->(v:Video)
WITH u, v, rand() AS r
WHERE r < 0.5
WITH u, v, toInteger(1 + rand() * 5) AS nota
MERGE (u)-[:RATED {nota: nota}]->(v);

        """
        session.run(graph_query)
        print("Graph data AVALIAÇÕES (RATING) created successfully.")
        graph_query = """
        

// ===============================
// GÊNERO FAVORITO
// ===============================
MATCH (:User)-[r:FAVORITE_GENRE]->(:Genre)
DELETE r;

        """
        session.run(graph_query)
        graph_query = """
        
MATCH (u:User)-[:WATCHED]->(v:Video)-[:HAS_GENRE]->(g:Genre)
WITH u, g, count(*) AS qtd
ORDER BY qtd DESC
WITH u, collect({g: g, qtd: qtd}) AS generos

UNWIND generos AS item
WITH u, item.g AS g, item.qtd AS qtd, generos[0].qtd AS max_qtd
WHERE qtd = max_qtd
MERGE (u)-[:FAVORITE_GENRE]->(g);

        """
        session.run(graph_query)
        print("Graph data GÊNERO FAVORITO created successfully.")
        
        print("Graph data created successfully.")
        print("\nNeo4j setup is complete!")

    except Exception as e:
        print(f" Error during Neo4j setup: {e}")
    finally:
        if driver:
            driver.close()
            print("Connection to Neo4j is closed.")

##### Executando a função para criar toda a estrutura de base de dados

In [89]:
setup_neo4j()

Connection to Neo4j successful.
Clearing existing database...
Database cleared.
Creating graph nodes and relationships...
Graph data GÊNEROS created successfully.
Graph data VÍDEOS created successfully.
Graph data ASSOCIAR VÍDEOS A GÊNEROS created successfully.
Graph data USUÁRIOS created successfully.
Graph data VISUALIZAÇÕES ALEATÓRIAS created successfully.
Graph data CURTIDAS created successfully.
Graph data AVALIAÇÕES (RATING) created successfully.
Graph data GÊNERO FAVORITO created successfully.
Graph data created successfully.

Neo4j setup is complete!
Connection to Neo4j is closed.


#### Visualizando a base de dados/nós e seus relacionamentos

In [90]:
%%cypher

match (a)-[r]->(b)
match (c)

return *




GraphWidget(layout=Layout(height='800px', width='100%'))

#### Recomendacao outros filmes e séries do tipo Quem viu, viu também para o usuário u1
##### OBS: Pode ser necessário trocar o u1 por u2 ... u10

In [91]:
%%cypher

MATCH (u1:User {id: "u1"})-[:WATCHED]->(v:Video)<-[:WATCHED]-(u2:User)-[:WATCHED]->(rec:Video)
WHERE u1 <> u2 AND NOT (u1)-[:WATCHED]->(rec)
RETURN DISTINCT rec AS recomendacao
LIMIT 5;




GraphWidget(layout=Layout(height='500px', width='100%'))

#### Recomendação filmes e séries mais bem avaliados por todos os usuários (média da nota). 
##### Útil para a seção EM ALTA no protótipo.


In [92]:
%%cypher

MATCH (v:Video)<-[r:RATED]-()
RETURN v, avg(r.nota) AS media, count(*) AS votos
ORDER BY media DESC, votos DESC
LIMIT 5;





GraphWidget(layout=Layout(height='500px', width='100%'))

#### Recomendação filmes e séries para o usuario u1 com base nos seus gêneros favoritos. 
##### Útil para a seção PARA VOCÊ  no protótipo.
##### OBS: Pode ser necessário trocar o u1 por u2 ... u10

In [93]:
%%cypher

MATCH (u:User {id: "u1"})-[:FAVORITE_GENRE]->(g:Genre)
MATCH (rec:Video)-[:HAS_GENRE]->(g)
WHERE NOT (u)-[:WATCHED]->(rec)
RETURN DISTINCT rec 
LIMIT 5;




GraphWidget(layout=Layout(height='500px', width='100%'))

#### Recomendação de filmes e séries mais bem avaliados por todos os usuários (média da nota). 
##### Útil para a seção EM ALTA no protótipo.
##### OBS: Pode ser necessário trocar o u1 por u2 ... u10


In [94]:
%%cypher

MATCH (v:Video)<-[r:RATED]-()
RETURN v, avg(r.nota) AS media, count(*) AS votos
ORDER BY media DESC, votos DESC
LIMIT 5;





GraphWidget(layout=Layout(height='500px', width='100%'))

#### Recomendação dos filmes mais assistidos nos últimos 30 dias por gênero. 
##### Útil para a seção EM ALTA no protótipo.
##### OBS: Pode ser necessário trocar o Ação por outro gênero


In [95]:
%%cypher

WITH timestamp() AS agora
MATCH (u:User)-[w:WATCHED]->(v:Video)-[:HAS_GENRE]->(g:Genre {nome: "Ação"})
WHERE w.timestamp >= agora - 1000 * 60 * 60 * 24 * 30
RETURN v, count(*) AS visualizacoes
ORDER BY visualizacoes DESC
LIMIT 10;





GraphWidget(layout=Layout(height='500px', width='100%'))