# Preparation

## Imports

In [None]:
import os
import time
import random
import json
import dotenv
from pymongo import MongoClient
from pymongo.server_api import ServerApi
from pymongo.errors import CollectionInvalid, DuplicateKeyError
from neo4j import GraphDatabase
from neo4j.exceptions import ClientError
import spotipy
from spotipy.oauth2 import SpotifyClientCredentials
from faker import Faker
from google import genai
from google.genai.errors import ClientError

## Connect to MongoDB

In [None]:
dotenv.load_dotenv()

mongo_user = os.getenv("MONGODB_USERNAME")
mongo_pass = os.getenv("MONGODB_PASSWORD")

mongo_client = MongoClient(
    (f"mongodb+srv://{os.getenv("MONGODB_USERNAME")}:{os.getenv("MONGODB_PASSWORD")}"
     "@projeto-bd.9scqvyv.mongodb.net/"
     "?retryWrites=true&w=majority&appName=projeto-bd"),
    server_api = ServerApi(
        version = "1",
        strict = True,
        deprecation_errors = True
    )
)

mongo_db = mongo_client["music_catalog"]

## Connect to Neo4j

In [None]:
dotenv.load_dotenv()

neo4j = GraphDatabase.driver(
    "neo4j+s://10ab7e50.databases.neo4j.io",
    auth = (
        os.getenv("NEO4J_USERNAME"),
        os.getenv("NEO4J_PASSWORD"),
    ),
)

neo4j.verify_connectivity()

## Connect to Spotify API

In [None]:
dotenv.load_dotenv()

spotify = spotipy.Spotify(auth_manager=SpotifyClientCredentials())

## Init Faker

In [None]:
fake = Faker()

## Connect to Gemini API

In [None]:
dotenv.load_dotenv()

gemini = genai.Client(api_key=os.getenv("GEMINI_API_KEY")).chats.create(model="gemini-2.5-flash")

# Artists

## Create Entities

### MongoDB

In [None]:
try:
    mongo_db.create_collection("artists")
    mongo_db.artists.create_index("releases.id")
except CollectionInvalid as e:
    print(e)

### Neo4j

In [None]:
try:
    neo4j.execute_query("CREATE CONSTRAINT FOR (a:Artist) REQUIRE a.id IS UNIQUE")
    neo4j.execute_query("CREATE CONSTRAINT FOR (g:Genre) REQUIRE g.name IS UNIQUE")
    neo4j.execute_query("CREATE CONSTRAINT FOR (r:Release) REQUIRE r.id IS UNIQUE")
except ClientError as e:
    print(e.message)

## Retrieve Artists by Genre

### From Spotify

In [None]:
response = spotify.search(
    q = "genre:djent",
    type = "artist",
)
artist_ids = [artist["id"] for artist in response["artists"]["items"]]

while response["artists"]["next"]:
    response = spotify.next(response["artists"])
    artist_ids.extend([artist["id"] for artist in response["artists"]["items"]])

artist_ids

### From JSON

In [None]:
with open("../resources/my_guys.json", "r") as f:
    artist_ids = json.load(f)

artist_ids

## Insert into DBs

In [None]:
def release_tracks(release_id: str) -> list:
    response = spotify.album_tracks(release_id)

    tracks = []
    for track in response["items"]:
        tracks.append({
            "track_number": track["track_number"],
            "name": track["name"],
            "duration": track["duration_ms"]
        })

    while response["next"]:
        response = spotify.next(response)
        for track in response["items"]:
            tracks.append({
                "track_number": track["track_number"],
                "name": track["name"],
                "duration": track["duration_ms"]
            })

    return tracks

def artist_releases(artist_id: str) -> list:
    response = spotify.artist_albums(artist_id, album_type="album")

    releases = []
    for release in response["items"]:
        releases.append({
            "id": release["id"],
            "name": release["name"],
            "release_date": release["release_date"],
            "tracks": release_tracks(release["id"]),
            "ratings": [],
        })

    while response["next"]:
        response = spotify.next(response)
        for release in response["items"]:
            releases.append({
                "id": release["id"],
                "name": release["name"],
                "release_date": release["release_date"],
                "tracks": release_tracks(release["id"]),
                "ratings": [],
            })

    return releases

for artist_id in artist_ids:
    response = spotify.artist(artist_id)

    artist = dict()
    artist["_id"] = artist_id
    artist["name"] = response["name"]
    artist["genres"] = response["genres"]
    artist_popularity = response["popularity"]
    artist["bio"] = fake.paragraph(nb_sentences=25)
    artist["qt_followers"] = 0
    artist["releases"] = artist_releases(artist_id)

    if len(artist["releases"]) > 0:
        mongo_db.artists.insert_one(artist)

        neo4j.execute_query(
            """
            MERGE (a:Artist {id: $id})
            ON CREATE SET a.popularity = $popularity
            """,
            id = artist["_id"],
            popularity = artist_popularity,
        )

        for genre in artist["genres"]:
            neo4j.execute_query(
                """
                MATCH (a:Artist {id: $artistId})
                MERGE (g:Genre {name: $name})
                MERGE (a)-[:BELONGS_TO]->(g)
                """,
                artistId = artist["_id"],
                name = genre,
            )

        for release in artist["releases"]:
            neo4j.execute_query(
                """
                MATCH (a:Artist {id: $artistId})
                MERGE (r:Release {id: $id})
                MERGE (a)-[:RELEASED]->(r)
                """,
                artistId = artist["_id"],
                id = release["id"],
            )

## Change Bios

### Do it

In [None]:
artists_cursor = mongo_db.artists.find(
    {
        "updated": {
            "$exists": False,
        },
    },
)
updated_count = 0

for artist in artists_cursor:
    try:
        bio = gemini.send_message(
            f"Give me a bio for the music artist {artist["name"]}. Respond with only a paragraph-long the bio.",
        ).text.strip()
        
        update_result = mongo_db.artists.update_one(
            {
                "_id": artist["_id"],
            },
            {
                "$set": {
                    "bio": bio,
                    "updated": True,
                }
            }
        )

        updated_count += 1
        time.sleep(5)
    except ClientError as e:
        if not e.code == 429:
            print(e)
        break

result = tuple(
    mongo_db.artists.aggregate([
        {
            "$group": {
                "_id": None,
                "total": {
                    "$sum": 1,
                },
                "updated": {
                    "$sum": {
                        "$cond": [
                            {
                                "$ifNull": [
                                    "$updated",
                                    False,
                                ],
                            }, 
                            1, 
                            0,
                        ],
                    },
                },
            },
        },
    ])
)[0]

print(f"Progress: {result["updated"]}/{result["total"]}")
print(f"Bios updated: {updated_count}")

### Remove "updated" property

In [None]:
result = mongo_db.artists.update_many(
    {
        "updated": {
            "$exists": True,
        },
    },
    {
        "$unset": {
            "updated": None,
        },
    },
)

print(f"Removed from {result.modified_count} artists")

# Users

## Create Entities

### MongoDB

In [None]:
try:
    mongo_db.create_collection("users")
    mongo_db.users.create_index("username", unique=True)
except CollectionInvalid as e:
    print(e)

### Neo4j

In [None]:
try:
    neo4j.execute_query("CREATE CONSTRAINT FOR (u:User) REQUIRE u.username IS UNIQUE")
except ClientError as e:
    print(e.message)

## Insert into DBs

### Randoms

In [None]:
QT_TRIES = 1_000
qt_fails = 0

for _ in range(QT_TRIES):
    try:
        first_name = fake.first_name()
        last_name = fake.last_name()
        number = random.randint(0, 99)

        user = dict()
        user["username"] = f"{first_name.lower()}_{last_name.lower()}{number:02}"
        user["password"] = fake.sha256()
        if random.random() < 0.75:
            user["name"] = f"{first_name} {last_name}"
        if "name" in user and random.random() < 0.5:
            user["bio"] = fake.paragraph(nb_sentences=10)
        user["friends"] = []
        user["artists_followed"] = []
        user["ratings"] = []

        mongo_db.users.insert_one(user)

        neo4j.execute_query(
            """
            MERGE (u:User {username: $username})
            """,
            username = user["username"],
        )
    except DuplicateKeyError:
        qt_fails += 1

print(f"Finished with {QT_TRIES - qt_fails} users inserted.")        

### Personalized

In [None]:
user = dict()
user["username"] = f"sahudy"
user["password"] = fake.sha256()
user["name"] = f"Sahudy Montenegro González"
user["bio"] = (
"""Criançada,

me desculpem desde já, vou ter que cancelar a aula de amanhã. 

Sei que serão muito infelizes com essa notícia ;)

A aula prevista para amanhã é sobre o Redis, um in-memory KV store, bem simples de se iniciar. A aula está liberada no AVA, mas eu vou repor ela no último dia de aula, como previsto no calendário, já que não interfere na elaboração dos projetos.

Boa semana!

G5: apresentação na semana que vem :) acredito que esta decisão minha possa nterferir no andamento do projeto de vocês, me escrevam por email sobre suas preocupações, se houver alguma. 

Abs,"""
)
user["friends"] = []
user["artists_followed"] = []
user["ratings"] = []

mongo_db.users.insert_one(user)

neo4j.execute_query(
    """
    MERGE (u:User {username: $username})
    """,
    username = user["username"],
)

In [None]:
user = dict()
user["username"] = f"ryansakurai"
user["password"] = fake.sha256()
user["name"] = f"Ryan Sakurai"
user["bio"] = "Sou Ryan, pessoa não binária, mestiço de raízes misturadas e pulsantes que carrego com orgulho no sangue, medindo 1,64m de pura teimosia e inquietude, apaixonado por metal, esse gênero musical que traduz em riffs e guturais toda a intensidade que sinto dentro do peito. Fã incondicional de One Piece, me identifico profundamente com as jornadas de superação, liberdade e amizade que a obra ensina, e confesso que choro mais do que gostaria em alguns arcos épicos — sim, meu lado nerd não falha em se emocionar com boas histórias. Entre um headbang e outro, vivo imerso em universos de fantasia, tecnologia e cultura pop, buscando sempre me expressar com autenticidade e sem medo de abraçar o que sou, por mais contraditório ou peculiar que isso possa parecer aos olhos dos outros."
user["friends"] = []
user["artists_followed"] = []
user["ratings"] = []

mongo_db.users.insert_one(user)

neo4j.execute_query(
    """
    MERGE (u:User {username: $username})
    """,
    username = user["username"],
)

In [None]:
user = dict()
user["username"] = f"viniciuscastro"
user["password"] = fake.sha256()
user["name"] = f"Vini"
user["bio"] = "Sou o Vini, um cara que domina o mundo das construções, mecânica e eletricidade, combinando força de pedreiro, precisão de mecânico e a paciência de eletricista — mesmo com minhas pernas finas, nada me segura quando o serviço chama. Sou funkeiro de alma, aquele que sente o batidão no corpo e na mente, mas não perco tempo com Instagram porque minha vida é muito real pra ficar postando tudo por aí. Faculdade? Ah, essa fica meio de lado, porque prefiro mil vezes acelerar na direção da minha rotina, dirigindo igual maluco pelas ruas e ainda surpreendendo com umas manobras de Python que aprendi na marra, misturando o mundo do código com a vida de obra e estrada. Minha vibe é fazer acontecer, mesmo que no ritmo acelerado e fora do convencional, porque ser do jeito que sou é o que me mantém firme e único."
user["friends"] = []
user["artists_followed"] = []
user["ratings"] = []

mongo_db.users.insert_one(user)

neo4j.execute_query(
    """
    MERGE (u:User {username: $username})
    """,
    username = user["username"],
)

In [None]:
user = dict()
user["username"] = f"caike_sant0s"
user["password"] = fake.sha256()
user["name"] = f"Caique (Hugo)"
user["bio"] = "Eu sou Caike, mas pode me chamar de Hugo ou Cacá, apelidos que me acompanham nas minhas aventuras de rolezeiro nato, sempre buscando o próximo encontro, a próxima história pra contar. Tenho uma irmã que, apesar das brigas e zoações, é parceira de vida e cúmplice das melhores confusões. Andar de moto é mais que um hobby, é um estilo de vida, a sensação de liberdade que só quem já sentiu o vento no rosto entende. Sempre sigo meu lema: existem dois tipos de problemas — o meu e o dos outros — e prefiro focar no que posso resolver, sem me perder nas dores alheias. Ah, e não é pouca coisa não, sou o aluno preferido da professora Sahudy, aquela que sabe reconhecer quando alguém leva as coisas a sério, mesmo que eu esteja sempre no meio do rolê."
user["friends"] = []
user["artists_followed"] = []
user["ratings"] = []

mongo_db.users.insert_one(user)

neo4j.execute_query(
    """
    MERGE (u:User {username: $username})
    """,
    username = user["username"],
)

## Change Bios

### Do it

In [None]:
users_cursor = mongo_db.users.find(
    {
        "bio": {
            "$exists": True,
        },
        "updated": {
            "$exists": False,
        },
        "username": {
            "$nin": ["sahudy", "ryansakurai", "viniciuscastro", "caike_sant0s"]
        },
    },
)

updated_count = 0

for user in users_cursor:
    try:
        bio = gemini.send_message(
            f"Create a random informal bio in first person for a person called {user["name"]}. Respond with only the bio",
        ).text.strip()
        
        update_result = mongo_db.users.update_one(
            {
                "username": user["username"],
            },
            {
                "$set": {
                    "bio": bio,
                    "updated": True,
                }
            },
        )

        updated_count += 1
        time.sleep(5)
    except ClientError as e:
        if not e.code == 429:
            print(e)
        break

result = tuple(
    mongo_db.users.aggregate([
        {
            "$match": {
                "bio": {
                    "$exists": True,
                },
            },
        },
        {
            "$group": {
                "_id": None,
                "total": {
                    "$sum": 1,
                },
                "updated": {
                    "$sum": {
                        "$cond": [
                            {
                                "$ifNull": [
                                    "$updated",
                                    False,
                                ],
                            }, 
                            1, 
                            0,
                        ],
                    },
                },
            },
        },
    ])
)[0]

print(f"Progress: {result["updated"]}/{result["total"]}")
print(f"Bios updated: {updated_count}")

### Remove "updated" property

In [None]:
result = mongo_db.users.update_many(
    {
        "updated": {
            "$exists": True,
        },
    },
    {
        "$unset": {
            "updated": None,
        },
    },
)

print(f"Removed from {result.modified_count} users")

# Close Connections

In [None]:
mongo_client.close()
neo4j.close()