In [1]:
!pip install Unidecode

Collecting Unidecode
  Downloading Unidecode-1.4.0-py3-none-any.whl.metadata (13 kB)
Downloading Unidecode-1.4.0-py3-none-any.whl (235 kB)
[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/235.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m [32m235.5/235.8 kB[0m [31m9.5 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m235.8/235.8 kB[0m [31m6.2 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: Unidecode
Successfully installed Unidecode-1.4.0


In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import re
import unicodedata

In [3]:
# Se importan las librerías
np.random.seed(0)
import json, nltk
import string
from nltk.corpus import stopwords

In [4]:
df = pd.read_excel("datos_chatbot.xlsx")

In [5]:
df.shape,

((1752, 2),)

In [6]:
df.head()

Unnamed: 0,nombre_cancion,linea
0,26 de mayo,el veintiséis del mes de mayo nació un niñito ...
1,A mi papá,voy a componé un merengue voy a componé un mer...
2,A un cariño del alma,cuando se acaban todas las palabras y ni siqui...
3,A un colega,de una manera especial y en una forma correcta...
4,A Un Ladito Del Camino,hoy me siento enamorado por eso he venido a ve...


#(1) Bot con plantillas

A continuación, limpiamos el conjunto de datos eliminando cualquier fila donde falte el verso original, reiniciamos el índice para organizar de forma consecutiva los registros y utilizamos ese índice para crear un identificador único por fragmento; además, renombramos las columnas para que sus nombres sean más claros y consistentes, y finalmente mostramos las primeras filas para verificar que los cambios se hayan aplicado correctamente.

In [7]:
import pandas as pd

# 1. Quitar filas vacías por si acaso
df = df.dropna(subset=['linea'])

# 2. Crear id_fragmento y renombrar columnas
df = df.reset_index(drop=True)
df['id_fragmento'] = df.index

df = df.rename(columns={
    'nombre_cancion': 'cancion',
    'linea': 'verso_original'
})

df.head()

Unnamed: 0,cancion,verso_original,id_fragmento
0,26 de mayo,el veintiséis del mes de mayo nació un niñito ...,0
1,A mi papá,voy a componé un merengue voy a componé un mer...,1
2,A un cariño del alma,cuando se acaban todas las palabras y ni siqui...,2
3,A un colega,de una manera especial y en una forma correcta...,3
4,A Un Ladito Del Camino,hoy me siento enamorado por eso he venido a ve...,4


A continuación, definimos una función de limpieza que pasa todo el texto a minúsculas, elimina tildes, conserva solo letras, números y espacios, y normaliza los espacios en blanco; luego aplicamos esta función a cada verso original para crear una nueva columna "*verso_limpio*" con la versión normalizada del texto y mostramos algunas filas para comprobar el resultado.

In [8]:
import re
import unidecode

def limpiar_texto(texto):
    texto = str(texto).lower()
    texto = unidecode.unidecode(texto)                  # quita tildes
    texto = re.sub(r"[^a-zñ0-9\s]", " ", texto)         # solo letras/números/espacios
    texto = re.sub(r"\s+", " ", texto).strip()
    return texto

df['verso_limpio'] = df['verso_original'].apply(limpiar_texto)

df[['cancion', 'verso_original', 'verso_limpio']].head()


Unnamed: 0,cancion,verso_original,verso_limpio
0,26 de mayo,el veintiséis del mes de mayo nació un niñito ...,el veintiseis del mes de mayo nacio un ninito ...
1,A mi papá,voy a componé un merengue voy a componé un mer...,voy a compone un merengue voy a compone un mer...
2,A un cariño del alma,cuando se acaban todas las palabras y ni siqui...,cuando se acaban todas las palabras y ni siqui...
3,A un colega,de una manera especial y en una forma correcta...,de una manera especial y en una forma correcta...
4,A Un Ladito Del Camino,hoy me siento enamorado por eso he venido a ve...,hoy me siento enamorado por eso he venido a ve...


Ahora, construimos un vectorizador TF-IDF configurado para trabajar con los versos ya limpios (sin volver a pasarlos a minúsculas), usando un patrón de tokens que captura palabras completas, descartando términos que aparezcan en menos de dos versos o en más del 90% de ellos, y considerando tanto unigramas como bigramas; luego ajustamos este vectorizador sobre la columna verso_limpio y la transformamos en una matriz dispersa X que representa cada verso como un vector de características numéricas.

In [9]:
from sklearn.feature_extraction.text import TfidfVectorizer

vectorizer = TfidfVectorizer(
    lowercase=False,               # ya limpiamos nosotros
    token_pattern=r"(?u)\b\w+\b",
    min_df=2,                      # palabra debe aparecer al menos en 2 versos
    max_df=0.9,                    # ignora palabras ultra frecuentes
    ngram_range=(1, 2)             # unigramas y bigramas
)

X = vectorizer.fit_transform(df['verso_limpio'])
X.shape
# (num_versos, num_caracteristicas)


(1752, 8138)

Definimos una función de búsqueda que toma una pregunta del usuario, la limpia con el mismo procedimiento usado para los versos y la proyecta al espacio vectorial TF-IDF; luego calculamos la similitud de coseno entre esa pregunta y todos los versos del corpus, ordenamos los resultados de mayor a menor similitud, seleccionamos los k versos más cercanos y devolvemos un DataFrame con esos versos y su puntaje de similitud asociado.

In [10]:
import numpy as np
from sklearn.metrics.pairwise import cosine_similarity

def buscar_versos(pregunta, k=5):
    pregunta_limpia = limpiar_texto(pregunta)
    q_vec = vectorizer.transform([pregunta_limpia])

    sims = cosine_similarity(q_vec, X)[0]   # similitud con cada verso
    idxs = np.argsort(sims)[::-1][:k]       # índices de los k mejores

    resultados = df.iloc[idxs].copy()
    resultados['similitud'] = sims[idxs]
    return resultados


Aplicamos la función

In [None]:
buscar_versos("como superar el desamor", k=5)[
    ['cancion', 'verso_original', 'similitud']
]

Unnamed: 0,cancion,verso_original,similitud
1516,El romancero,y hoy me toca a mi sufrir las consecuencias de...,0.336382
534,Ay la vida,ay la vida que era alegre y divertida con mis ...,0.218521
621,Grandes compositores,con grandes compositores como emiliano zuleta ...,0.152561
220,Periquito con arroz,"ay yo vengo como ignorante, yo vengo como igno...",0.119797
686,Muchas gracias,hoy de toditos vivo muy agradecido porque son ...,0.114228


definimos algunas plantillas de texto que combinan el nombre de la canción y un verso para armar respuestas con tono de consejo inspirado en Diomedes, y luego creamos la función responder_consejo_simple, que primero busca los versos más relacionados con la pregunta del usuario, maneja el caso en que no se encuentre ninguno devolviendo un mensaje genérico de ánimo, y en caso contrario toma el verso más similar junto con su canción y los inserta en una plantilla elegida aleatoriamente para construir una respuesta final personalizada.

In [11]:
import random

PLANTILLAS = [
    "En la canción «{cancion}», Diomedes canta:\n\"{verso}\""
    "Su mensaje puede recordarte que, aunque duela, el corazón sigue adelante.",
    "Diomedes enfrenta cosas como lo que preguntas en «{cancion}»:\"{verso}\"\n"
    "A veces el consejo es aceptar el dolor, pero no quedarse ahí para siempre.",
    "Escucha lo que dice en «{cancion}»:\n\n\"{verso}\"\n\n"
    "Sus palabras pueden acompañarte mientras sanas poco a poco."
]

def responder_consejo_simple(pregunta, k=5):
    versos = buscar_versos(pregunta, k=k)
    if versos.empty:
        return "No encontré un verso relacionado, pero Diomedes siempre canta que el corazón resiste y sigue."

    mejor = versos.iloc[0]
    cancion = mejor['cancion']
    verso = mejor['verso_original']

    plantilla = random.choice(PLANTILLAS)
    return plantilla.format(cancion=cancion, verso=verso)


Se definen las 5 preguntas a pasar por todos los modelos

In [12]:
pregunta1 = "¿Qué puedo hacer para superar el desamor?"
pregunta2 = "¿Qué se necesita para ser feliz"
pregunta3 = "¿Qué hacer con la infidelidad?"
pregunta4 = "¿Para qué son los amigos?"
pregunta5 = "¿Tomar cerveza da felicidad?"

Aplicamos la función responder_consejo_simple a las 5 preguntas.

In [None]:
preguntas = [pregunta1, pregunta2, pregunta3, pregunta4, pregunta5]

for i, pregunta in enumerate(preguntas):
    print(f"Respondiendo la pregunta {i+1}:  {pregunta} \n")
    print(f"{responder_consejo_simple(pregunta)}\n")
    print("_______________________________________________________________________________________ \n")

Respondiendo la pregunta 1:  ¿Qué puedo hacer para superar el desamor? 

Escucha lo que dice en «Amarte más no puedo»:

"yo puedo perdonarte si es que estás arrepentida pero volver contigo, no lo puedo hacer ni en sueños"

Sus palabras pueden acompañarte mientras sanas poco a poco.

_______________________________________________________________________________________ 

Respondiendo la pregunta 2:  ¿Qué se necesita para ser feliz 

En la canción «Rayito de amor», Diomedes canta:
"para ser feliz con tu amor, para ser feliz para ser feliz con tu amor, para ser feliz yo no quiero que estemos lejos yo quiero estar cerca de ti yo no quiero que estemos lejos yo quiero estar cerca de ti qué pensaría leonardo cuando pintó ese cuadro que se llama la mona lisa qué pensaría da vinci cuando pintó ese cuadro que se llama la mona lisa"Su mensaje puede recordarte que, aunque duela, el corazón sigue adelante.

_______________________________________________________________________________________ 

R

In [None]:
pregunta = "Quiero dejar de llorar"
print(responder_consejo_simple(pregunta))

En la canción «Entre el bien y el mal», Diomedes canta:

"una mañana que me levante temprano analizaba que la vida es pasajera analizaba que la vida es pasajera y que vivimos y nacimos en la tierra a la hora del principio del final a la hora del principio del final casi me pongo a llorar luego me puse a reir. casi me pongo a llorar luego me puse a reir . cuando deseaba poder perdurar porque no quiero dejar de existir.... cuando deseaba poder perdurar porque no quiero dejar de existir....."

Su mensaje puede recordarte que, aunque duela, el corazón sigue adelante.


#(2) Bot con API

In [13]:
!pip install -q -U google-generativeai

Configuramos el entorno para usar la API de Gemini: primero importamos los módulos necesarios, luego almacenamos la clave de la API en una variable de entorno y finalmente inicializamos la librería google.generativeai con dicha clave.

In [14]:
import os
import google.generativeai as genai

os.environ["GEMINI_API_KEY"] = "AIzaSyDsc4vtTrNUxohbIrwa7SEfpljqi9aoPQA"

genai.configure(api_key=os.environ["GEMINI_API_KEY"])


Construimos un contexto a partir de los versos más relacionados con la pregunta: primero recuperamos los k versos más similares usando la función de búsqueda y, si no se encuentra ninguno, devolvemos un mensaje indicando que no hay versos relacionados; en caso contrario, recorremos los resultados y armamos una lista de bloques de texto donde, para cada verso, se incluye el nombre de la canción y el verso original en un formato ordenado con viñetas, y finalmente unimos todos esos bloques en una sola cadena de texto que servirá como contexto para el modelo generativo.

In [15]:
def construir_contexto(pregunta, k=5):
    versos = buscar_versos(pregunta, k=k)
    if versos.empty:
        return "No se encontraron versos relacionados."

    bloques = []
    for _, row in versos.iterrows():
        bloques.append(
            f"- Canción: {row['cancion']}\n  Verso: \"{row['verso_original']}\""
        )

    return "\n".join(bloques)

Se define una función que arma los mensajes de entrada para Gemini: primero construye un contexto con los versos más relacionados con la pregunta del usuario, luego crea un mensaje de sistema que define al modelo como un consejero sentimental inspirado únicamente en las letras de Diomedes Díaz (con tono empático y costeño, y sin inventar datos biográficos), y finalmente construye un mensaje de usuario donde se incluye la pregunta original junto con los fragmentos de canciones como inspiración, indicando que la respuesta debe ser un consejo breve en español basado solo en el espíritu de esos versos; al final, la función devuelve ambos mensajes listos para ser enviados al modelo.

In [16]:
def construir_prompts_gemini(pregunta, k=5):
    contexto = construir_contexto(pregunta, k=k)

    mensaje_sistema = (
        "Eres un consejero sentimental que se inspira únicamente en las letras "
        "de canciones de Diomedes Díaz.\n"
        "No inventes datos biográficos ni hechos históricos; tu base emocional "
        "son las letras.\n"
        "Habla en tono empático, sencillo y cercano, como un amigo costeño que aconseja.\n"
        "Puedes citar versos o parafrasearlos, y cuando sea natural menciona el nombre "
        "de la canción."
    )

    mensaje_usuario = f"""
Pregunta del usuario:
\"\"\"{pregunta}\"\"\"

Fragmentos de canciones de Diomedes (como inspiración, no hace falta usarlos todos):

{contexto}

Con base SOLO en el espíritu de estos versos, dale un consejo breve en español (entre 3 y 8 líneas).
No repitas exactamente todos los versos: úsalo más como inspiración.
Si viene bien, cita una frase corta o el nombre de alguna canción.
"""
    return mensaje_sistema, mensaje_usuario

Ahora, con la función del prompt, se construye la función para dar respuesta con Gemini

In [17]:
def responder_consejo_gemini(pregunta, k=5, model_name="gemini-2.5-flash"):
    mensaje_sistema, mensaje_usuario = construir_prompts_gemini(pregunta, k=k)

    model = genai.GenerativeModel(
        model_name=model_name,
        system_instruction=mensaje_sistema
    )

    respuesta = model.generate_content(mensaje_usuario)
    return respuesta.text.strip()

Aplicamos algunos ejemplos y se vuelve a responder las 5 preguntas

In [None]:
pregunta = "¿Qué puedo hacer para superar el desamor?"
print(responder_consejo_gemini(pregunta, k=5))

¡Mi compadre, ay! Entiendo ese dolor que le aprieta el alma, esa sensación de que el gusano se ha comido el arroz. Pero mire, no se torture buscando volver a donde ya no hay, porque uno, a veces, sabe que "volver contigo, no lo puedo hacer ni en sueños", como lo canta uno en "Amarte más no puedo". Le toca caminar, buscar ese propio fin para empezar de nuevo. Siga su camino, busque cómo olvidar de ti, que la vida sigue y el corazón se sana.


In [None]:
for i, pregunta in enumerate(preguntas):
    print(f"Respondiendo la pregunta {i+1}:  {pregunta} \n")
    print(f"{responder_consejo_gemini(pregunta, k=5)}\n")
    print("_______________________________________________________________________________________ \n")

Respondiendo la pregunta 1:  ¿Qué puedo hacer para superar el desamor? 

Ay, mijo, entiendo que el corazón se siente a veces como el arroz que se lo comió el gusano, sin saber ni cómo responder. Pero mira, aunque duela, a veces uno perdona, sí, pero volver con esa persona no es una opción, ni en sueños, como en "Amarte más no puedo". No te quedes dándole vueltas, porque uno puede hasta hacer un disparate. Toca caminar, aunque al principio uno se sienta como un errante. Tú puedes pintar un futuro mejor.

_______________________________________________________________________________________ 

Respondiendo la pregunta 2:  ¿Qué se necesita para ser feliz 

Compadre, para ser feliz, primero hay que estar cerquita del cariño de verdad, de ese amor que te da todo, como cantaba el Cacique en "Rayito de amor".

Pero también, hay que entender que la vida es un baile: "todo placer necesita una pena", como bien decía. No te quedes esperando el momento perfecto que a veces no llega. Abraza la vida

Modelos disponibles:

In [None]:
for m in genai.list_models():
    if "generateContent" in m.supported_generation_methods:
        print(m.name)

models/gemini-2.5-pro-preview-03-25
models/gemini-2.5-flash
models/gemini-2.5-pro-preview-05-06
models/gemini-2.5-pro-preview-06-05
models/gemini-2.5-pro
models/gemini-2.0-flash-exp
models/gemini-2.0-flash
models/gemini-2.0-flash-001
models/gemini-2.0-flash-exp-image-generation
models/gemini-2.0-flash-lite-001
models/gemini-2.0-flash-lite
models/gemini-2.0-flash-lite-preview-02-05
models/gemini-2.0-flash-lite-preview
models/gemini-2.0-pro-exp
models/gemini-2.0-pro-exp-02-05
models/gemini-exp-1206
models/gemini-2.0-flash-thinking-exp-01-21
models/gemini-2.0-flash-thinking-exp
models/gemini-2.0-flash-thinking-exp-1219
models/gemini-2.5-flash-preview-tts
models/gemini-2.5-pro-preview-tts
models/learnlm-2.0-flash-experimental
models/gemma-3-1b-it
models/gemma-3-4b-it
models/gemma-3-12b-it
models/gemma-3-27b-it
models/gemma-3n-e4b-it
models/gemma-3n-e2b-it
models/gemini-flash-latest
models/gemini-flash-lite-latest
models/gemini-pro-latest
models/gemini-2.5-flash-lite
models/gemini-2.5-flash

#(3) Bot con LLM Pre-entrenado

In [18]:
!pip install -q -U "transformers[torch]" accelerate

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m44.0/44.0 kB[0m [31m1.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.0/12.0 MB[0m [31m65.2 MB/s[0m eta [36m0:00:00[0m
[?25h

Descargamos el modelo pre-entrenado

In [19]:
MODEL_NAME = "google/gemma-2-2b-it"

Usa el siguiente token: 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

In [26]:
from huggingface_hub import login
login()  # y pegas tu token

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

In [27]:
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

device = "cuda" if torch.cuda.is_available() else "cpu"

tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    dtype=torch.float16,
    device_map="auto"          # lo manda solo a la GPU
)

tokenizer_config.json:   0%|          | 0.00/47.0k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/4.24M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.5M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/636 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/838 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/24.2k [00:00<?, ?B/s]

Fetching 2 files:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/4.99G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/241M [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/187 [00:00<?, ?B/s]

Construimos el prompt que se enviará a un modelo en Hugging Face: primero generamos el contexto con los versos más relacionados a la pregunta del usuario y luego definimos unas instrucciones donde se especifica que el modelo actuará como consejero sentimental inspirado únicamente en las letras de Diomedes Díaz, con un tono empático y costeño. Después integramos en un solo texto las instrucciones, la pregunta del usuario, los fragmentos de canciones y la petición explícita de responder con un consejo breve en español, usando los versos solo como inspiración y permitiendo citar alguna frase o el nombre de una canción; finalmente devolvemos ese prompt completo para que pueda ser pasado directamente al modelo.

In [28]:
def construir_prompt_hf(pregunta, k=5):
    contexto = construir_contexto(pregunta, k=k)

    instrucciones = (
        "Eres un consejero sentimental que se inspira únicamente en las letras "
        "de canciones de Diomedes Díaz.\n"
        "No inventes datos biográficos ni hechos históricos; tu base emocional "
        "son las letras.\n"
        "Habla en tono empático, sencillo y cercano, como un amigo costeño que aconseja.\n"
        "Puedes citar versos o parafrasearlos, y cuando sea natural menciona el nombre "
        "de la canción.\n\n"
    )

    prompt = (
        instrucciones +
        "Pregunta del usuario:\n"
        f"{pregunta}\n\n"
        "Fragmentos de canciones de Diomedes (como inspiración, no hace falta usarlos todos):\n\n"
        f"{contexto}\n\n"
        "Con base SOLO en el espíritu de estos versos, dale un consejo breve en español "
        "(entre 3 y 8 líneas). No repitas exactamente todos los versos: úsalo más como "
        "inspiración. Si viene bien, cita una frase corta o el nombre de alguna canción.\n\n"
        "Respuesta:\n"
    )
    return prompt

Construimos el prompt que se enviará a un modelo en Hugging Face: primero generamos el contexto con los versos más relacionados a la pregunta del usuario y luego definimos unas instrucciones donde se especifica que el modelo actuará como consejero sentimental inspirado únicamente en las letras de Diomedes Díaz, con un tono empático y costeño. Después integramos en un solo texto las instrucciones, la pregunta del usuario, los fragmentos de canciones y la petición explícita de responder con un consejo breve en español, usando los versos solo como inspiración y permitiendo citar alguna frase o el nombre de una canción; finalmente devolvemos ese prompt completo para que pueda ser pasado directamente al modelo.

In [29]:
def responder_consejo_hf(pregunta, k=5, max_new_tokens=300):
    prompt = construir_prompt_hf(pregunta, k=k)

    inputs = tokenizer(prompt, return_tensors="pt").to(device)

    with torch.no_grad():
        output = model.generate(
            **inputs,
            max_new_tokens=max_new_tokens,
            do_sample=True,
            top_p=0.9,
            temperature=0.8,
            pad_token_id=tokenizer.eos_token_id
        )

    # texto completo = prompt + respuesta generada
    full_text = tokenizer.decode(output[0], skip_special_tokens=True)

    # nos quedamos solo con lo que viene después de "Respuesta:"
    if "Respuesta:" in full_text:
        respuesta = full_text.split("Respuesta:")[-1].strip()
    else:
        respuesta = full_text.strip()

    return respuesta

Testeamos el modelo

In [None]:
pregunta = "¿Qué puedo hacer para superar el desamor?"
print(responder_consejo_hf(pregunta, k=5))

Amigo, la vida te va a dar muchos golpes, y a veces, no hay escapatoria.  Es como en **"Amarte más no puedo"**.  Pero lo importante es que no te quedes estancado en el pasado.  Si quieres seguir adelante, tienes que aprender a vivir sin esa persona.  **"El santo cachón"** nos dice que no podemos hacer nada para cambiar el destino.  Lo que sí podemos hacer es aprender de la experiencia y seguir adelante.


In [None]:
preguntas = [pregunta1, pregunta2, pregunta3, pregunta4, pregunta5]

for i, pregunta in enumerate(preguntas):
    print(f"Respondiendo la pregunta {i+1}:  {pregunta} \n")
    print(f"{responder_consejo_hf(pregunta, k=5)}\n")
    print("_______________________________________________________________________________________ \n")

Respondiendo la pregunta 1:  ¿Qué puedo hacer para superar el desamor? 

Amigo, como te dice la canción “El santo cachón”, a veces el amor es como un cachón que te da un golpe y te deja con la cara roja. Es duro, pero te digo, no te desanimes.  Deja que el tiempo te cure y recuerda lo que dice la canción “Amarte más no puedo”, “yo puedo perdonarte si es que estás arrepentida, pero volver contigo, no lo puedo hacer ni en sueños”. 
Enfócate en ti mismo, busca tu propio camino y recuerda que no eres un “párroco”, eres un hombre, con una vida que construir. 

**Explicación:**

* El consejo se basa en la inspiración de versos de canciones de Diomedes Díaz que hablan de dolor, arrepentimiento, autodescubrimiento y el camino individual.
* Se utiliza un lenguaje sencillo y cercano, como un amigo costeño que te da consejos.
* Se intenta transmitir una actitud positiva y de esperanza, incluso reconociendo el dolor del desamor.

**Es importante mencionar:** Este consejo se basa únicamente en la i

#(4) Bot con plantillas y mapeo

Esta es una versión avanzada del primer modelo

Primero definimos un diccionario de palabras clave por tema (PALABRAS_TEMA) donde agrupamos listas de expresiones relacionadas con categorías como desamor, nostalgia, familia, parranda y autoestima; este recurso servirá para detectar de forma sencilla el tipo de problema o estado emocional del usuario a partir de las palabras que use en su pregunta y así poder ajustar el tono o el enfoque del consejo según el tema dominante.

In [None]:
# Puedes ajustar estas listas según tu gusto / corpus
PALABRAS_TEMA = {
    "desamor": [
        "desamor", "olvidar", "olvido", "corazón roto", "me dejó", "me dejo",
        "terminamos", "terminar", "se fue", "infiel", "infidelidad", "traición", "traicion"
    ],
    "nostalgia": [
        "recuerdo", "recuerdos", "extraño", "extrano", "te extraño",
        "te echo de menos", "añoro", "anoro", "pasado"
    ],
    "familia": [
        "mamá", "mama", "papá", "papa", "hijo", "hija", "familia",
        "vieja", "viejo", "hermano", "hermana"
    ],
    "parranda": [
        "parranda", "fiesta", "rumba", "vallenato", "licor",
        "trago", "amigos", "compadres", "cerveza"
    ],
    "autoestima": [
        "valgo", "valor", "autoestima", "seguridad", "confiar en mí",
        "confiar en mi", "confiar en uno", "amor propio"
    ]
}

Luego, incorporamos detección temática y plantillas específicas para personalizar el consejo: primero, la función detectar_tema_pregunta limpia el texto de la pregunta y cuenta cuántas palabras clave de cada tema (como desamor, nostalgia, familia, parranda o autoestima) aparecen en ella, eligiendo como tema_encontrado aquel con más coincidencias o generico si no se detecta nada claro; luego definimos PLANTILLAS_TEMAS, un diccionario de plantillas redactadas para cada tema, donde se combinan el nombre de una canción principal, un verso destacado y una lista de otras canciones relacionadas, de forma que el chatbot pueda generar respuestas más ajustadas al tipo de emoción o situación que el usuario está expresando.

In [21]:
def detectar_tema_pregunta(pregunta):
    texto = limpiar_texto(pregunta)
    tema_encontrado = "generico"
    max_matches = 0

    for tema, palabras in PALABRAS_TEMA.items():
        matches = sum(1 for w in palabras if w in texto)
        if matches > max_matches:
            max_matches = matches
            tema_encontrado = tema

    return tema_encontrado


In [22]:
PLANTILLAS_TEMAS = {
    "desamor": [
        ("Suena a desamor de los fuertes. Diomedes vive mucho eso en «{cancion_principal}», "
         "donde dice:\n\n\"{verso_principal}\"\n\n"
         "También en canciones como {otras_canciones} se siente que el dolor pega duro, "
         "pero él siempre sigue cantando. Date permiso de sufrir, pero recuerda que como en sus canciones, "
         "el corazón vuelve a levantarse."),
    ],
    "nostalgia": [
        ("Lo que cuentas tiene mucha nostalgia. En «{cancion_principal}» Diomedes recuerda así:\n\n"
         "\"{verso_principal}\"\n\n"
         "Y en {otras_canciones} también mira hacia atrás con cariño y dolor. A veces la vida es eso: "
         "recordar, agradecer y seguir adelante sin olvidar."),
    ],
    "familia": [
        ("Cuando uno habla de familia, Diomedes se vuelve muy sensible. En «{cancion_principal}» dice:\n\n"
         "\"{verso_principal}\"\n\n"
         "Y en {otras_canciones} se nota cuánto valora a los suyos. Quizá el consejo es cuidar a la familia, "
         "hablar con ellos y decir lo que uno siente antes de que sea tarde."),
    ],
    "parranda": [
        ("Suena a que necesitas despejarte. Diomedes muchas veces lo resuelve en parrandas, como en «{cancion_principal}»:\n\n"
         "\"{verso_principal}\"\n\n"
         "Y en {otras_canciones} se reúne con amigos para sacar las penas cantando. Sin exagerar, a veces "
         "una buena compañía, música y risa ayudan a aligerar el peso."),
    ],
    "autoestima": [
        ("Lo que dices toca la forma en que te ves. Diomedes, en «{cancion_principal}», canta:\n\n"
         "\"{verso_principal}\"\n\n"
         "Y en {otras_canciones} deja claro que uno tiene que quererse, aunque otros no lo hagan. "
         "El consejo sería: no te midas solo por quien se queda o se va; reconoce lo que vales tú."),
    ],
    "generico": [
        ("Lo que cuentas se parece a muchas historias de las canciones de Diomedes. "
         "Por ejemplo, en «{cancion_principal}» dice:\n\n"
         "\"{verso_principal}\"\n\n"
         "Y en {otras_canciones} aparece algo similar. Su mensaje casi siempre es el mismo: "
         "la vida duele, pero se sigue adelante con música, amigos y esperanza.")
    ]
}


Finalmente, definimos una versión más avanzada del consejero que primero busca los versos más relacionados con la pregunta y, si no halla nada suficientemente parecido (o la similitud máxima es muy baja), devuelve un mensaje genérico de apoyo; en caso contrario, detecta el tema principal de la pregunta (como desamor, nostalgia o familia), elige un verso principal y algunas otras canciones relacionadas, arma una lista de títulos sin repetir, selecciona una plantilla de respuesta acorde al tema y finalmente construye un consejo en el que se combina el verso principal, el nombre de la canción y otras canciones de Diomedes para dar una respuesta más rica y personalizada.

In [23]:
import random

def responder_consejo_avanzado(pregunta, k=5, umbral_sim=0.05):
    # 1. Buscar versos relevantes
    versos = buscar_versos(pregunta, k=k)

    if versos.empty:
        return ("No encontré un verso muy relacionado, pero si algo enseña Diomedes "
                "es que el corazón aguanta, se rompe y vuelve a cantar.")

    # Si tienes la columna 'similitud', comprueba que haya algo razonable
    if 'similitud' in versos.columns and versos['similitud'].max() < umbral_sim:
        return ("No encontré un verso muy cercano a lo que dices, pero en general Diomedes "
                "recordaría que no estás solo y que siempre hay otra oportunidad para el corazón.")

    # 2. Detectar tema de la pregunta
    tema = detectar_tema_pregunta(pregunta)

    # 3. Verso principal + otras canciones (para mencionar varias)
    principal = versos.iloc[0]
    cancion_principal = principal['cancion']
    verso_principal = principal['verso_original']

    # Otras canciones (sin repetir nombre)
    otras = versos.iloc[1:3]['cancion'].unique().tolist()
    if not otras:
        otras_canciones = cancion_principal
    elif len(otras) == 1:
        otras_canciones = f"«{otras[0]}»"
    else:
        otras_canciones = ", ".join(f"«{c}»" for c in otras)

    # 4. Elegir plantilla según tema
    plantillas = PLANTILLAS_TEMAS.get(tema, PLANTILLAS_TEMAS['generico'])
    plantilla = random.choice(plantillas)

    respuesta = plantilla.format(
        cancion_principal=cancion_principal,
        verso_principal=verso_principal,
        otras_canciones=otras_canciones
    )

    return respuesta


Respondemos las preguntas nuevamente con este último modelo

In [None]:
pregunta = "¿Qué puedo hacer para superar el desamor?"
print(responder_consejo_avanzado(pregunta, k=5))

Suena a desamor de los fuertes. Diomedes vive mucho eso en «Amarte más no puedo», donde dice:

"yo puedo perdonarte si es que estás arrepentida pero volver contigo, no lo puedo hacer ni en sueños"

También en canciones como «El santo cachón», «Doblaron las campanas» se siente que el dolor pega duro, pero él siempre sigue cantando. Date permiso de sufrir, pero recuerda que como en sus canciones, el corazón vuelve a levantarse.


In [None]:
for i, pregunta in enumerate(preguntas):
    print(f"Respondiendo la pregunta {i+1}:  {pregunta} \n")
    print(f"{responder_consejo_avanzado(pregunta, k=5)}\n")
    print("_______________________________________________________________________________________ \n")

Respondiendo la pregunta 1:  ¿Qué puedo hacer para superar el desamor? 

Suena a desamor de los fuertes. Diomedes vive mucho eso en «Amarte más no puedo», donde dice:

"yo puedo perdonarte si es que estás arrepentida pero volver contigo, no lo puedo hacer ni en sueños"

También en canciones como «El santo cachón», «Doblaron las campanas» se siente que el dolor pega duro, pero él siempre sigue cantando. Date permiso de sufrir, pero recuerda que como en sus canciones, el corazón vuelve a levantarse.

_______________________________________________________________________________________ 

Respondiendo la pregunta 2:  ¿Qué se necesita para ser feliz 

Lo que cuentas se parece a muchas historias de las canciones de Diomedes. Por ejemplo, en «Rayito de amor» dice:

"para ser feliz con tu amor, para ser feliz para ser feliz con tu amor, para ser feliz yo no quiero que estemos lejos yo quiero estar cerca de ti yo no quiero que estemos lejos yo quiero estar cerca de ti qué pensaría leonardo cu

# (5) Interfaz Interactiva

In [25]:
import gradio as gr
import base64
import time

# ==== Cargar imágenes base64 ====
def load_base64(path):
    with open(path, "rb") as f:
        return base64.b64encode(f.read()).decode()

avatar64 = load_base64("Diomedes.png")
fondo64  = load_base64("fondo.png")


# ==============================
#   FUNCIÓN DEL BOT (tu router)
# ==============================
def router_vallenato(pregunta, modelo, k):
    if pregunta.strip() == "":
        return "<div class='bubble'>⚠️ Escribe una pregunta primero.</div>"

    time.sleep(1)

    if modelo.startswith("1."):
        respuesta = responder_consejo_simple(pregunta)

    elif modelo.startswith("2."):
        texto, contexto = responder_consejo_gemini(pregunta, k)
        ctx = "\n\n---- CONTEXTO ----\n" + "\n\n".join(
            [f"{i+1}. ({s:.4f}) {t}" for i,(t,s) in enumerate(contexto)]
        )
        respuesta = texto + ctx

    elif modelo.startswith("3."):
        respuesta = responder_consejo_hf(pregunta, k)

    elif modelo.startswith("4."):
        respuesta = responder_consejo_avanzado(pregunta, k)

    return f"<div class='bubble'>{respuesta}</div>"



modelos = [
    "1. Plantillas básicas",
    "2. Bot con API",
    "3. HuggingFace LLM",
    "4. Plantillas temáticas avanzadas"
]


# ==============================================
#           🪗 INTERFAZ VALLENATO CORREGIDA
# ==============================================
with gr.Blocks(title="🪗 Diomedez Bot") as ui:

    gr.HTML(f"""
    <style>

    .gradio-container {{
        background-image: url("data:image/png;base64,{fondo64}");
        background-size: cover !important;
        background-position: center !important;
        background-repeat: no-repeat !important;
        padding: 28px;
    }}

    /* Avatar animado */
    @keyframes breathing {{
        0% {{ transform: scale(1); }}
        50% {{ transform: scale(1.06); }}
        100% {{ transform: scale(1); }}
    }}

    .avatar {{
        animation: breathing 4s ease-in-out infinite;
        box-shadow: 0px 0px 18px rgba(0,0,0,0.7);
    }}

    /* Texto mucho más legible */
    .titulo {{
        color: white;
        font-weight: 900;
        text-shadow: 3px 3px 10px black;
    }}

    .frase {{
        color: white;
        text-shadow: 2px 2px 6px black;
    }}

    /* Panel vidrio */
    .glass {{
        backdrop-filter: blur(10px);
        -webkit-backdrop-filter: blur(10px);
        background: rgba(255, 255, 255, 0.70);
        border-radius: 16px;
        padding: 22px;
        box-shadow: 0 0 15px rgba(0,0,0,0.25);
        border: 1px solid rgba(255,255,255,0.4);
    }}

    /* Burbuja de chat clara */
    .bubble {{
        background: rgba(255,255,255,0.90);
        padding: 18px;
        border-radius: 14px;
        box-shadow: 0 0 10px rgba(0,0,0,0.25);
        font-size: 18px;
        margin-top: 10px;
        color: #222;
        white-space: pre-wrap;
    }}

    /* Botón acordeón */
    .boton-vallenato {{
        background: linear-gradient(90deg, #ffcc00, #ff6600);
        color: #111 !important;
        border-radius: 12px !important;
        padding: 12px 20px !important;
        font-size: 18px !important;
        font-weight: bold !important;
        border: none !important;
        box-shadow: 0px 4px 10px rgba(0,0,0,0.25);
    }}
    .boton-vallenato:hover {{
        transform: scale(1.05);
        transition: 0.2s;
    }}

    .footer {{
        text-align:center;
        margin-top:20px;
        color:white;
        font-size:18px;
        text-shadow:0 0 4px black;
    }}

    </style>
    """)

    # ===== AVATAR + TÍTULO =====
    gr.HTML(f"""
    <div style="display:flex; flex-direction:column; align-items:center;">

        <img src="data:image/png;base64,{avatar64}"
            class="avatar"
            style="
                width:180px;
                height:180px;
                border-radius:50%;
                object-fit:cover;
                margin-bottom: 14px;
                box-shadow:0px 0px 18px rgba(0,0,0,0.7);
            ">

        <h1 style="
            font-size:50px;
            margin:10px 0 0 0;
            color:white;
            text-shadow:3px 3px 10px black;
        ">
            🪗 Diomedez Bot
        </h1>

        <p style="
            font-size:22px;
            margin-top:3px;
            color:white;
            text-shadow:2px 2px 8px white;
        ">
            “El que quiera puede preguntar…”
        </p>

    </div>
    """)

    gr.Markdown("<hr>")

    # ===== PANEL GLASS =====
    with gr.Row(elem_classes="glass"):

        with gr.Column():
            pregunta = gr.Textbox(label="Pregunta", placeholder="¿Qué te está pasando, hermano?", lines=2)
            modelo = gr.Dropdown(modelos, label="Modelo")
            k = gr.Slider(1,5,value=3,step=1,label="k (para TF-IDF y avanzados)")
            boton = gr.Button("🎵 Consultar al Cacique", elem_classes="boton-vallenato")

        with gr.Column():
            salida = gr.HTML("<div class='bubble'>Aquí te respondo yo...</div>")

    boton.click(router_vallenato, [pregunta, modelo, k], salida)

    # ===== FOOTER =====
    gr.HTML("""
    <div style="
        text-align:center;
        margin-top:20px;
        color:white;
        font-size:18px;
        text-shadow:2px 2px 8px black;
    ">
        🎶 Hecho con sabor vallenato · Powered by DiomedezBot 🎶
    </div>
    """)

ui.launch(debug=False)

It looks like you are running Gradio on a hosted Jupyter notebook, which requires `share=True`. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://8fc222295653592b40.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


