In [16]:
# --- Celda 1: Instalaciones ---
# Instalamos Gradio (interfaz web), sentence-transformers (embeddings),
# faiss-cpu (b√∫squeda vectorial) y la librer√≠a de Google (para Gemini).
# --- Celda 1: Instalaciones ---
print("Instalando librer√≠as...")
!pip install gradio sentence-transformers faiss-cpu google-generativeai python-dotenv --quiet
print("‚úÖ Librer√≠as instaladas.")

Instalando librer√≠as...
‚úÖ Librer√≠as instaladas.


In [17]:
# --- Celda 2: Importaciones ---
import gradio as gr
import json
import numpy as np
import faiss
from pathlib import Path
from sentence_transformers import SentenceTransformer
import google.generativeai as genai
import os                       # üëà Importante para dotenv
from dotenv import load_dotenv  # üëà Importamos la funci√≥n
print("‚úÖ Librer√≠as importadas.")

‚úÖ Librer√≠as importadas.


In [18]:
# --- Celda 3: Configuraci√≥n y API Key (con DotEnv) ---

# 1. Cargar las variables del archivo .env a la memoria del sistema
load_dotenv()

# 2. Leer la API key desde las variables de entorno
API_KEY = os.getenv("GEMINI_API_KEY")

if not API_KEY:
    print("üõë ¬°ERROR! No se encontr√≥ 'GEMINI_API_KEY'.")
    print("Aseg√∫rate de haber creado el archivo .env y puesto la clave all√≠.")
else:
    try:
        genai.configure(api_key=API_KEY)
        print("‚úÖ API Key de Gemini cargada de forma segura desde .env.")
    except Exception as e:
        print(f"üõë Error configurando la API Key: {e}")

# Nombres de archivos y modelos
DATA_FILE = "music_faiss_map_with_embeddings.json"
EMBED_MODEL = "all-MiniLM-L6-v2"
GEMINI_MODEL = "models/gemini-2.5-flash"

‚úÖ API Key de Gemini cargada de forma segura desde .env.


In [19]:
# --- Celda 4: Cargar Datos y Construir el "Cerebro" (FAISS) ---

p = Path(DATA_FILE)
if not p.exists():
    print(f"‚ùå ERROR: No se encontr√≥ el archivo '{DATA_FILE}'.")
    print("Por favor, sube tu archivo JSON al panel de Archivos (a la izquierda).")
else:
    print(f"Cargando datos desde {DATA_FILE}...")
    data = json.loads(p.read_text(encoding="utf-8"))
    metas = data["metadatas"]
    print(f"‚úÖ Canciones cargadas: {len(metas)}")

    # Cargar el modelo de embeddings
    print(f"Cargando modelo de embeddings '{EMBED_MODEL}'...")
    model = SentenceTransformer(EMBED_MODEL)

    # Extraer embeddings y doc_ids para FAISS
    embeddings = []
    doc_ids = []
    for doc_id, meta in metas.items():
        emb = meta.get("embedding")
        if emb:
            embeddings.append(np.array(emb, dtype=np.float32))
            doc_ids.append(doc_id)

    # Construir el √≠ndice FAISS
    emb_matrix = np.vstack(embeddings)
    faiss.normalize_L2(emb_matrix) # Normalizar para usar producto interno (IP)

    dim = emb_matrix.shape[1]
    index = faiss.IndexFlatIP(dim) # IP = Inner Product (producto escalar)
    index.add(emb_matrix)

    print(f"‚úÖ √çndice FAISS (el 'cerebro' de b√∫squeda) creado con {index.ntotal} canciones.")

Cargando datos desde music_faiss_map_with_embeddings.json...
‚úÖ Canciones cargadas: 50
Cargando modelo de embeddings 'all-MiniLM-L6-v2'...
‚úÖ √çndice FAISS (el 'cerebro' de b√∫squeda) creado con 50 canciones.


In [20]:
# --- Celda 5: Funciones del RAG (Las "Herramientas") ---

def embed_query(query):
    """Convierte una consulta de texto en un vector embedding."""
    return model.encode([query], convert_to_numpy=True)[0]

def retrieve_similar(query_emb, k=4):
    """Busca en FAISS los k documentos m√°s similares."""
    q = np.asarray(query_emb, dtype=np.float32).reshape(1, -1)
    faiss.normalize_L2(q)
    
    D, I = index.search(q, k) # D=Distancias (scores), I=√çndices
    
    results = []
    for score, idx in zip(D[0], I[0]):
        song_id = doc_ids[idx]
        meta = metas[song_id]
        results.append({
            "doc_id": song_id,
            "score": float(score),
            "meta": meta
        })
    return results

def build_rag_prompt(query, retrieved_docs):
    """Construye el prompt para Gemini con el contexto encontrado."""
    context = ""
    for i, doc in enumerate(retrieved_docs):
        meta = doc["meta"]
        metadata_dict = meta.get('metadata', {})
        context += f"""
[Documento {i+1}]
T√≠tulo: {meta.get('title', 'N/A')}
Artista: {meta.get('artist', 'N/A')}
A√±o: {metadata_dict.get('released', 'N/A')}
G√©nero: {metadata_dict.get('genre', 'N/A')}
"""
    
    prompt = f"""
Eres un asistente experto en m√∫sica llamado 'Discogs RAG'.
Tu tarea es responder la pregunta del usuario bas√°ndote *√∫nicamente* en el contexto proporcionado.
Si la respuesta no est√° en el contexto, di "No encontr√© informaci√≥n sobre eso en mi base de datos".

---
[CONTEXTO]
{context.strip()}
---

[PREGUNTA DEL USUARIO]
{query}

[TU RESPUESTA]
"""
    return prompt

def call_gemini(prompt_text):
    """Llama a la API de Gemini para generar una respuesta."""
    try:
        model_obj = genai.GenerativeModel(GEMINI_MODEL)
        response = model_obj.generate_content(prompt_text)
        return response.text
    except Exception as e:
        print(f"Error al llamar a Gemini: {e}")
        return "Hubo un error al contactar al modelo de IA. Por favor, revisa tu API Key."

print("‚úÖ Funciones RAG (embed, retrieve, build, call) definidas.")

‚úÖ Funciones RAG (embed, retrieve, build, call) definidas.


In [21]:
# --- Celda 6: Funci√≥n Principal (El "Orquestador") ---

def responder_pregunta_rag(pregunta_usuario, historial_chat):
    """
    Esta es la funci√≥n principal que Gradio llamar√°.
    Recibe la pregunta y el historial, y devuelve la respuesta.
    """
    if not pregunta_usuario.strip():
        return "Por favor, hazme una pregunta."

    print(f"\nPregunta recibida: '{pregunta_usuario}'")
    
    # Paso 1: Embed (Convertir pregunta a vector)
    q_emb = embed_query(pregunta_usuario)
    
    # Paso 2: Retrieve (Buscar en FAISS)
    retrieved_docs = retrieve_similar(q_emb, k=4)
    
    # Paso 3: Build Prompt (Construir prompt con contexto)
    prompt = build_rag_prompt(pregunta_usuario, retrieved_docs)
    print(f"Prompt construido para Gemini:\n{prompt}\n")
    
    # Paso 4: Generate (Llamar a Gemini)
    respuesta = call_gemini(prompt)
    
    print(f"Respuesta generada: '{respuesta}'")
    return respuesta

print("‚úÖ Funci√≥n 'orquestadora' de Gradio definida.")

‚úÖ Funci√≥n 'orquestadora' de Gradio definida.


In [None]:
# --- Celda 7: ¬°Lanzar la Interfaz (Gradio)! ---

print("üöÄ Lanzando interfaz de Gradio...")

iface = gr.ChatInterface(
    fn=responder_pregunta_rag,
    title="üéµ Experto Musical (RAG + Discogs)",
    description="Hazme una pregunta sobre la base de datos de m√∫sica. Usar√© RAG para encontrar la respuesta.",
    examples=[
        "¬øQu√© discos tiene jazz?", 
        "Recomi√©ndame vinilos de rock europeo", 
        "Canciones de rock cl√°sico con guitarras"
    ],
    theme="soft"
)

# .launch(share=True) crea un enlace p√∫blico temporal (72h)
# para que puedas probarlo en tu navegador o tel√©fono.
iface.launch(debug=True, share=True)

üöÄ Lanzando interfaz de Gradio...


  self.chatbot = Chatbot(


* Running on local URL:  http://127.0.0.1:7861

Could not create share link. Please check your internet connection or our status page: https://status.gradio.app.



Pregunta recibida: 'tienes discos de rap'
Prompt construido para Gemini:

Eres un asistente experto en m√∫sica llamado 'Discogs RAG'.
Tu tarea es responder la pregunta del usuario bas√°ndote *√∫nicamente* en el contexto proporcionado.
Si la respuesta no est√° en el contexto, di "No encontr√© informaci√≥n sobre eso en mi base de datos".

---
[CONTEXTO]
[Documento 1]
T√≠tulo: LAX
Artista: The Game (2)
A√±o: 2008
G√©nero: Hip Hop

[Documento 2]
T√≠tulo: Life 'N Perspectives Of A Genuine Crossover
Artista: Urban Dance Squad
A√±o: 2016-11-07
G√©nero: Hip Hop, Rock

[Documento 3]
T√≠tulo: Kinematografia
Artista: Paktofonika
A√±o: N/A
G√©nero: Hip Hop

[Documento 4]
T√≠tulo: Ascenseur Pour L'√©chafaud * Des Femmes Disparaissent
Artista: The Miles Davis Quintet & Art Blakey & The Jazz Messengers
A√±o: N/A
G√©nero: Jazz, Stage & Screen
---

[PREGUNTA DEL USUARIO]
tienes discos de rap

[TU RESPUESTA]


Respuesta generada: 'S√≠, tengo discos de rap:

*   LAX de The Game (2)
*   Life 'N Perspecti