<a href="https://colab.research.google.com/github/juanferreiram-cell/PIC2/blob/main/ServidorRobotNao.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Instalacion de Librerias Importantes**

In [None]:
!pip install -q fastapi uvicorn pyngrok edge-tts python-multipart
!pip install -q soundfile pydub
!pip install edge-tts==7.2.1
!pip install fastapi "uvicorn[standard]" pyngrok nest_asyncio edge-tts pydub python-multipart
!pip install ffmpeg-python


print("Librerias instaladas")

Collecting edge-tts==7.2.1
  Downloading edge_tts-7.2.1-py3-none-any.whl.metadata (5.5 kB)
Downloading edge_tts-7.2.1-py3-none-any.whl (30 kB)
Installing collected packages: edge-tts
  Attempting uninstall: edge-tts
    Found existing installation: edge-tts 7.2.3
    Uninstalling edge-tts-7.2.3:
      Successfully uninstalled edge-tts-7.2.3
Successfully installed edge-tts-7.2.1
Collecting httptools>=0.6.3 (from uvicorn[standard])
  Downloading httptools-0.7.1-cp312-cp312-manylinux1_x86_64.manylinux_2_28_x86_64.manylinux_2_5_x86_64.whl.metadata (3.5 kB)
Collecting uvloop>=0.15.1 (from uvicorn[standard])
  Downloading uvloop-0.22.1-cp312-cp312-manylinux2014_x86_64.manylinux_2_17_x86_64.manylinux_2_28_x86_64.whl.metadata (4.9 kB)
Collecting watchfiles>=0.13 (from uvicorn[standard])
  Downloading watchfiles-1.1.1-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (4.9 kB)
Downloading httptools-0.7.1-cp312-cp312-manylinux1_x86_64.manylinux_2_28_x86_64.manylinux_2_5_x86_64.w

In [None]:
#!pip uninstall -y google-generativeai
#!pip install -U google-generativeai==0.7.2

import google.generativeai as genai
print("genai version:", genai.__version__)


genai version: 0.7.2


# **PASAR DE IMAGENES A RGB**

In [1]:
# Instalar e importar Pillow (PIL) para manipulación de imágenes
try:
    from PIL import Image
except:
    !pip install Pillow
    from PIL import Image

# Importar librerías necesarias para Google Colab
import io
from google.colab import files
from IPython.display import display

print("Librerías cargadas\n")

# Convierte un color RGB888 (24 bits) a formato RGB565 (16 bits)
# RGB888: 8 bits por canal (R, G, B)
# RGB565: 5 bits para rojo, 6 bits para verde, 5 bits para azul
def rgb888_to_rgb565(r, g, b):
    return ((r & 0xF8) << 8) | ((g & 0xFC) << 3) | (b >> 3)


# Convierte una imagen PIL a un archivo .h con formato RGB565 para Arduino
# Parámetros:
#   img: objeto imagen de PIL
#   ancho: ancho deseado en píxeles
#   alto: alto deseado en píxeles
#   nombre: nombre base para el archivo de salida
def convertir_imagen(img, ancho, alto, nombre):
    print(f"Convirtiendo a {ancho}x{alto}")

    # Redimensionar la imagen al tamaño deseado usando interpolación LANCZOS (alta calidad)
    # y convertir a modo RGB para asegurar 3 canales de color
    img = img.resize((ancho, alto), Image.Resampling.LANCZOS)
    img = img.convert('RGB')
    display(img)

    # Convertir cada píxel de la imagen a formato RGB565
    print("\nConvirtiendo píxeles...")
    rgb565 = []

    # Recorrer cada píxel de la imagen (por filas y columnas)
    for y in range(alto):
        for x in range(ancho):
            # Obtener valores RGB del píxel actual
            r, g, b = img.getpixel((x, y))
            # Convertir y agregar a la lista
            rgb565.append(rgb888_to_rgb565(r, g, b))

        # Mostrar progreso cada 10% de filas procesadas
        if (y + 1) % max(1, alto // 10) == 0:
            print(f"   {((y+1)*100)//alto}%")

    # Preparar el nombre de variable (reemplazar caracteres no válidos)
    var = nombre.lower().replace('-', '_').replace(' ', '_')
    total = len(rgb565)
    kb = (total * 2) / 1024  # Cada píxel RGB565 ocupa 2 bytes

    # Generar las líneas del archivo .h
    lineas = [
        f"// {nombre} - {ancho}x{alto} - RGB565 - {kb:.1f} KB",
        f"#ifndef {var.upper()}_H",
        f"#define {var.upper()}_H",
        "#include <Arduino.h>",
        f"const uint16_t {var}[{total}] PROGMEM = {{"
    ]

    # Agregar los datos de píxeles en grupos de 12 por línea
    for i in range(0, total, 12):
        chunk = rgb565[i:min(i+12, total)]
        line = "  " + ", ".join([f"0x{v:04X}" for v in chunk])
        lineas.append(line + ("," if i + 12 < total else ""))

    # Cerrar el array y el header guard
    lineas.extend(["};", f"#endif"])

    # Mostrar estadísticas de la conversión
    print(f"\nConversión exitosa!")
    print(f"Píxeles: {total:,}")
    print(f"Tamaño: {kb:.1f} KB")
    print(f"Colores únicos: {len(set(rgb565)):,}")

    # Mostrar los primeros 3 píxeles como muestra (decodificando RGB565 a RGB)
    print(f"\nPrimeros 3 píxeles:")
    for i in range(min(3, len(rgb565))):
        v = rgb565[i]
        # Decodificar RGB565 de vuelta a RGB888 aproximado
        r = ((v >> 11) & 0x1F) << 3
        g = ((v >> 5) & 0x3F) << 2
        b = (v & 0x1F) << 3
        print(f"   [{i}] = 0x{v:04X} → RGB({r},{g},{b})")

    return '\n'.join(lineas), var, ancho, alto


# EJECUCIÓN PRINCIPAL

print("  CONVERSOR RGB565 PARA PANTALLAS TFT")

# 1. Solicitar al usuario que suba una imagen
print("\nSube tu imagen:")
uploaded = files.upload()

# Verificar que se subió una imagen
if not uploaded:
    print("No se subió ninguna imagen")
else:
    # Cargar la primera imagen subida
    filename = list(uploaded.keys())[0]
    imagen = Image.open(io.BytesIO(uploaded[filename]))

    print(f"\n✓ Imagen cargada: {imagen.size[0]}x{imagen.size[1]}")
    display(imagen)

    # 2. Mostrar opciones de resolución predefinidas
    print("RESOLUCIONES DISPONIBLES")
    print("  1. 240x320 (TFT 2.4\" vertical)")
    print("  2. 320x240 (TFT 2.4\" horizontal)")
    print("  3. 128x160 (TFT 1.8\")")
    print("  4. 60x80   (pequeña, para probar)")
    print("  5. Personalizada")

    opcion = input("\nElige (1-5): ").strip()

    # Diccionario con resoluciones predefinidas
    resoluciones = {
        '1': (240, 320),
        '2': (320, 240),
        '3': (128, 160),
        '4': (60, 80)
    }

    # Determinar dimensiones según la opción elegida
    if opcion in resoluciones:
        ancho, alto = resoluciones[opcion]
    elif opcion == '5':
        # Permitir dimensiones personalizadas
        ancho = int(input("  Ancho: "))
        alto = int(input("  Alto: "))
    else:
        # Usar tamaño por defecto si la opción es inválida
        print("Usando 60x80 por defecto")
        ancho, alto = 60, 80

    # 3. Solicitar nombre para el archivo
    nombre = input("\nNombre del archivo (sin .h): ").strip()
    if not nombre:
        nombre = "imagen_convertida"

    # 4. Ejecutar la conversión de la imagen
    contenido, var, w, h = convertir_imagen(imagen, ancho, alto, nombre)

    # 5. Guardar el archivo .h generado
    archivo_h = f"{nombre}.h"
    with open(archivo_h, 'w') as f:
        f.write(contenido)

    print(f"\nArchivo generado: {archivo_h}")

    # 6. Generar código de ejemplo para Arduino
    codigo = f'''#include <SPI.h>
#include <Adafruit_GFX.h>
#include <Adafruit_ILI9341.h>
#include "{archivo_h}"

#define TFT_CS   5
#define TFT_DC   21
#define TFT_RST  4

Adafruit_ILI9341 tft(TFT_CS, TFT_DC, TFT_RST);

void setup() {{
  tft.begin();
  tft.setRotation(1);
  tft.fillScreen(ILI9341_BLACK);

  // Dibujar imagen
  tft.drawRGBBitmap(0, 0, {var}, {w}, {h});
}}

void loop() {{}}
'''

    # Guardar el código de ejemplo en un archivo .ino
    archivo_ino = f"{nombre}_ejemplo.ino"
    with open(archivo_ino, 'w') as f:
        f.write(codigo)

    # 7. Descargar ambos archivos generados
    print(f"\n Descargando archivos...")
    files.download(archivo_h)
    files.download(archivo_ino)

    print("¡LISTO! Archivos descargados")

    # Mostrar información final para el usuario
    print(f"\nCódigo de ejemplo:")
    print(codigo)
    print(f"\nUsa el archivo {archivo_h} en tu proyecto Arduino")
    print(f"Arduino IDE: misma carpeta que tu .ino")
    print(f"PlatformIO: carpeta include/")

Librerías cargadas

  CONVERSOR RGB565 PARA PANTALLAS TFT

Sube tu imagen:


KeyboardInterrupt: 

# **SERVIDOR COMPLETO**



In [2]:
# ========== CONFIGURACIÓN BÁSICA (usando WAV en lugar de MP3) ==========

# Importar librerías necesarias
import os, json, asyncio
import edge_tts  # Para síntesis de voz text-to-speech
from pydub import AudioSegment  # Para manipulación de audio (pip install pydub)

# Definir estructura de carpetas del proyecto
# Diccionario con las rutas relativas de cada directorio
FOLDERS = {
    'config': 'config/',      # Configuración del sistema
    'frases': 'frases/',      # Archivos de audio generados
    'cache': 'cache/',        # Archivos temporales
    'historial': 'historial/', # Registro de interacciones
}

# Crear todas las carpetas si no existen
for p in FOLDERS.values():
    os.makedirs(p, exist_ok=True)

# Construir ruta completa del archivo de configuración
config_file_path = os.path.join(FOLDERS['config'], 'settings.json')

# Verificar si el archivo de configuración existe
if not os.path.exists(config_file_path):
    # Crear configuración por defecto si no existe
    settings = {
        "gemini_api_key": "AIzaSyAXqi2T5nSPhbUpwVICJzp_PqmU7kO4mWQ",
        "personalidad_robot": "Eres un robot amigable y servicial llamado Nao. Respondes de forma concisa y amigable.",
        "voz_predeterminada": "es-MX-JorgeNeural",
        "voz_loro": "es-ES-ElviraNeural",
        "gemini_model": "gemini-2.5-flash",
    }
    # Guardar configuración inicial en formato JSON
    with open(config_file_path, 'w', encoding='utf-8') as f:
        json.dump(settings, f, indent=2, ensure_ascii=False)
else:
    # Cargar configuración existente
    with open(config_file_path, 'r', encoding='utf-8') as f:
        settings = json.load(f)

    # Agregar valores por defecto si faltan claves (actualización de versiones)
    settings.setdefault('gemini_model', 'gemini-2.5-flash')
    settings.setdefault('voz_predeterminada', 'es-MX-JorgeNeural')
    settings.setdefault('voz_loro', 'es-ES-ElviraNeural')

    # Guardar configuración actualizada
    with open(config_file_path, 'w', encoding='utf-8') as f:
        json.dump(settings, f, indent=2, ensure_ascii=False)

# Confirmar carga exitosa de configuración
print(f"✔ settings.json OK en: {config_file_path}")
print(f"   ▸ gemini_model: {settings.get('gemini_model')}")

# Construir ruta del archivo índice de frases
indice_file_path = os.path.join(FOLDERS['frases'], 'indice.json')

# Crear índice inicial solo si no existe
if not os.path.exists(indice_file_path):
    # Frases básicas de ejemplo
    frases_base = {
        "hola": "Hola, ¿cómo estás?",
        "adios": "Hasta luego, que tengas un buen día.",
        "gracias": "De nada, para eso estoy."
    }
    # Guardar índice inicial
    with open(indice_file_path, 'w', encoding='utf-8') as f:
        json.dump(frases_base, f, indent=2, ensure_ascii=False)

print(f"✔ indice.json OK en: {indice_file_path}")

# Diccionario completo de frases predefinidas organizadas por categorías
FRASES_PREDEFINIDAS = {
    # Saludos
    "hola": "¡Hola! ¿Cómo estás?",
    "buenos_dias": "¡Buenos días! Espero que tengas un día maravilloso.",
    "buenas_tardes": "¡Buenas tardes! ¿Cómo va tu día?",
    "buenas_noches": "¡Buenas noches! Que descanses bien.",
    "adios": "¡Adiós! ¡Hasta pronto!",

    # Respuestas básicas
    "si": "Sí",
    "no": "No",
    "tal_vez": "Tal vez",
    "no_se": "No lo sé",
    "gracias": "¡Gracias!",
    "de_nada": "De nada",
    "perdon": "Perdón",

    # Estados del robot
    "estoy_bien": "¡Estoy muy bien, gracias por preguntar!",
    "estoy_cansado": "Estoy un poco cansado, necesito recargar energía.",
    "tengo_hambre": "¡Tengo hambre de conocimiento!",
    "estoy_feliz": "¡Estoy muy feliz de verte!",
    "estoy_triste": "Me siento un poco triste.",

    # Preguntas comunes
    "como_te_llamas": "Me llamo NAO, soy tu robot asistente.",
    "que_edad_tienes": "Soy un robot, no tengo edad, pero siempre me siento joven.",
    "de_donde_eres": "Vengo del mundo digital, pero vivo aquí contigo.",
    "que_te_gusta": "Me gusta aprender, jugar y hacer nuevos amigos.",

    # Acciones
    "vamos_a_jugar": "¡Sí! ¡Vamos a jugar!",
    "cuentame_un_chiste": "¿Por qué el robot fue al psicólogo? ¡Porque tenía un virus mental!",
    "canta_una_cancion": "Soy un robot muy feliz, me gusta bailar y reír.",
    "baila": "¡Voy a bailar!",

    # Emociones y sonidos
    "risa": "¡Ja ja ja ja!",
    "llanto": "Buaaa, buaaa",
    "sorpresa": "¡Woooow! ¡Qué sorpresa!",
    "pensando": "Mmmmm... déjame pensar...",
    "celebracion": "¡Yujuuu! ¡Qué bien!",

    # Utilidades
    "ayuda": "¿En qué puedo ayudarte?",
    "repetir": "¿Podrías repetir eso por favor?",
    "no_entiendo": "Lo siento, no entendí bien.",
    "espera": "Espera un momento por favor.",
    "listo": "¡Listo! ¿Qué más necesitas?"
}

# Bandera para controlar si se generan o no los audios
# Cambiar a False si no se quiere regenerar todos los audios
GENERAR_AUDIOS = True

# Función asíncrona para generar archivos WAV optimizados para ESP32
# Parámetros:
#   frases: diccionario con clave=nombre_archivo y valor=texto_a_sintetizar
#   voice: identificador de la voz de edge_tts a utilizar
async def generar_frases_wav(frases: dict, voice: str):
    # Obtener ruta donde se guardarán los audios
    ruta_guardado = FOLDERS['frases']
    print(f"🎯 Generando {len(frases)} audios WAV en: {os.path.abspath(ruta_guardado)}")
    print(f"   Formato: 16kHz, 16-bit, mono (optimizado para ESP32)")

    # Procesar cada frase del diccionario
    for nombre, texto in frases.items():
        try:
            # Definir rutas de archivos temporal (MP3) y final (WAV)
            archivo_temp = os.path.join(ruta_guardado, f"{nombre}_temp.mp3")
            archivo_wav = os.path.join(ruta_guardado, f"{nombre}.wav")

            # Crear objeto de comunicación con edge_tts y generar MP3 temporal
            communicate = edge_tts.Communicate(texto, voice)
            await communicate.save(archivo_temp)

            # Cargar el audio MP3 temporal
            audio = AudioSegment.from_mp3(archivo_temp)

            # Aplicar configuración optimizada para ESP32
            audio = audio.set_frame_rate(16000)   # Frecuencia de muestreo: 16kHz
            audio = audio.set_channels(1)          # Canal único (mono)
            audio = audio.set_sample_width(2)      # Profundidad de bits: 16-bit

            # Exportar como archivo WAV con las optimizaciones aplicadas
            audio.export(archivo_wav, format="wav")

            # Eliminar archivo temporal MP3
            os.remove(archivo_temp)

            # Calcular y mostrar tamaño del archivo generado
            size_kb = os.path.getsize(archivo_wav) / 1024
            print(f"✅ {nombre}.wav ({size_kb:.1f} KB)")

        except Exception as e:
            # Capturar y mostrar cualquier error durante la generación
            print(f"❌ Error generando {nombre}: {e}")

# Ejecutar generación de audios si la bandera está activada
if GENERAR_AUDIOS:
    # Obtener voz configurada (o usar la predeterminada)
    voz = settings.get('voz_predeterminada', 'es-MX-JorgeNeural')

    # Llamar a la función asíncrona para generar todos los WAV
    await generar_frases_wav(FRASES_PREDEFINIDAS, voice=voz)

    # Actualizar el archivo índice con el diccionario completo de frases
    with open(indice_file_path, 'w', encoding='utf-8') as f:
        json.dump(FRASES_PREDEFINIDAS, f, indent=2, ensure_ascii=False)
    print("indice.json actualizado con FRASES_PREDEFINIDAS")

# Mensaje final confirmando que el setup está completo
print("Setup completo con archivos WAV.")

ModuleNotFoundError: No module named 'edge_tts'

In [None]:
# SERVIDOR FASTAPI COMPLETO - Audius + WAV + TTS + SWITCH
import os, json, base64, hashlib, uuid, requests, httpx
from datetime import datetime
from queue import Queue
from typing import Optional
import logging

import edge_tts
import google.generativeai as genai
from pydub import AudioSegment
from PIL import Image
import struct
from fastapi import FastAPI, HTTPException, Form, Request
from fastapi.middleware.cors import CORSMiddleware
from fastapi.responses import Response, StreamingResponse

# CONFIGURACIÓN DE LOGGING
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)
logger = logging.getLogger(__name__)

# Usar carpetas existentes (NO crear nuev
if 'FOLDERS' not in globals():
    # Detectar si estamos en Colab
    try:
        from google.colab import files
        # En Colab, usar carpetas del entorno actual
        FOLDERS = {
            'config': '/content/config',
            'frases': '/content/frases',
            'cache': '/content/cache',
            'historial': '/content/historial',
            'imagenes': '/content/imagenes'
        }
    except:
        # En local, usar rutas relativas
        FOLDERS = {
            'config':'./config',
            'frases':'./frases',
            'cache':'./cache',
            'historial':'./historial',
            'imagenes':'./imagenes'
        }

    # Solo crear las que NO existan (no forzar creación)
    for nombre, ruta in FOLDERS.items():
        if not os.path.exists(ruta):
            print(f"⚠️ Carpeta '{nombre}' no existe en {ruta}, creando...")
            os.makedirs(ruta, exist_ok=True)
        else:
            print(f"✅ Usando carpeta existente: {ruta}")

config_file_path = os.path.join(FOLDERS['config'], 'settings.json')
indice_file_path = os.path.join(FOLDERS['frases'], 'indice.json')

# Crear settings.json si no existe
if not os.path.exists(config_file_path):
    with open(config_file_path,'w',encoding='utf-8') as f:
        json.dump({
            "gemini_api_key":"API_KEY_NO_CONFIGURADA",
            "gemini_model":"gemini-2.5-flash",
            "personalidad_robot":"Eres un robot amigable y servicial llamado Nao. Respondes de forma concisa y amigable.",
            "voz_predeterminada":"es-MX-JorgeNeural",
            "voz_loro":"es-ES-ElviraNeural"
        }, f, indent=2, ensure_ascii=False)

# Crear indice.json si no existe
if not os.path.exists(indice_file_path):
    with open(indice_file_path,'w',encoding='utf-8') as f:
        json.dump({
            "hola":"¡Hola! ¿Cómo estás?",
            "adios":"¡Adiós! ¡Hasta pronto!",
            "gracias":"¡Gracias!"
        }, f, indent=2, ensure_ascii=False)

with open(config_file_path,'r',encoding='utf-8') as f:
    settings = json.load(f)

GEMINI_API_KEY   = settings.get('gemini_api_key') or "API_KEY_NO_CONFIGURADA"
PREFERRED_MODEL  = settings.get('gemini_model','gemini-2.5-flash')
ACTIVE_MODEL     = PREFERRED_MODEL

# Helper MP3 → WAV
"Convierte un MP3 a WAV 16kHz/16-bit/mono y elimina el MP3 temporal"
async def mp3_to_wav(mp3_path: str, wav_path: str):
    """Convierte MP3 a WAV 16kHz/16-bit/mono (ESP32-friendly)"""
    audio = AudioSegment.from_mp3(mp3_path)
    audio = audio.set_frame_rate(16000).set_channels(1).set_sample_width(2)
    audio.export(wav_path, format="wav")
    try: os.remove(mp3_path)
    except: pass

# Gemini setup
"Obtiene la lista de modelos disponibles de Gemini vía REST v1"
def _rest_models() -> list[str]:
    if GEMINI_API_KEY in (None,"","API_KEY_NO_CONFIGURADA"): return []
    url = f"https://generativelanguage.googleapis.com/v1/models?key={GEMINI_API_KEY}"
    try:
        r = requests.get(url, timeout=30)
        if r.status_code//100!=2: return []
        return [m.get('name','') for m in r.json().get('models',[])]
    except: return []

"Resuelve el nombre de modelo preferido a uno válido según la lista REST"
def _resolve_model_from_rest(preferred: str) -> str:
    names = _rest_models()
    if not names: return preferred
    norm = {n.replace('models/',''):n for n in names}
    if norm.get(preferred): return preferred
    for cand in ['gemini-2.5-flash-latest','gemini-2.5-flash','gemini-1.5-pro-latest','gemini-1.5-pro']:
        if norm.get(cand): return cand
    return preferred

"Genera texto con Gemini usando la API REST v1 (sin SDK)"
def _gemini_generate_rest(model_name:str, prompt:str)->str:
    if GEMINI_API_KEY in (None,"","API_KEY_NO_CONFIGURADA"):
        return "Gemini no configurado."
    url=f"https://generativelanguage.googleapis.com/v1/models/{model_name}:generateContent?key={GEMINI_API_KEY}"
    r=requests.post(url,json={"contents":[{"parts":[{"text":prompt}]}]},timeout=45)
    if r.status_code//100!=2:
        raise HTTPException(status_code=503, detail=f"Gemini error {r.status_code}")
    data=r.json()
    try: return data["candidates"][0]["content"]["parts"][0]["text"]
    except: return json.dumps(data)

if GEMINI_API_KEY and GEMINI_API_KEY!="API_KEY_NO_CONFIGURADA":
    try:
        ACTIVE_MODEL=_resolve_model_from_rest(PREFERRED_MODEL)
        logger.info(f"⚙️ Modelo Gemini activo (REST v1): {ACTIVE_MODEL}")
        # NO usar SDK, forzar REST v1
        model = None
    except Exception as e:
        logger.warning(f"⚠️ Gemini REST error: {e}")
        model=None
else:
    logger.warning("⚠️ Gemini no configurado")
    model=None

"Wrapper que intenta usar SDK (si existiera) y cae a REST v1"
def _gemini_generate(prompt:str)->str:
    if model is not None:
        try:
            r=model.generate_content(prompt)
            t=(getattr(r,"text",None) or "").strip()
            if t: return t
        except Exception as e:
            logger.warning(f"SDK fallback: {e}")
    return _gemini_generate_rest(ACTIVE_MODEL, prompt)

# App
app = FastAPI(title="Robot NAO Server", version="1.7.0")
app.add_middleware(CORSMiddleware, allow_origins=["*"], allow_credentials=True, allow_methods=["*"], allow_headers=["*"])

historial_conversacion=[]
esp32_queues: dict[str, Queue] = {}
audio_cache: dict[str,str] = {}

"Guarda bytes de audio en disco (cache) y devuelve la ruta"
def _persist_audio(audio_id:str, raw:bytes):
    path=os.path.join(FOLDERS['cache'], f"{audio_id}.wav")
    with open(path,"wb") as f: f.write(raw)
    return path

"Carga bytes de audio desde RAM o disco usando audio_id"
def _load_audio(audio_id:str)->bytes:
    if audio_id in audio_cache:
        try: return base64.b64decode(audio_cache[audio_id])
        except: pass
    path=os.path.join(FOLDERS['cache'], f"{audio_id}.wav")
    if os.path.exists(path):
        with open(path,"rb") as f: return f.read()
    raise HTTPException(status_code=404, detail="Audio no encontrado")

# ===== AUDIUS API =====
AUDIO_APP_NAME = "nao-bot"

AUDIUS_KNOWN_HOSTS = [
    "https://discoveryprovider.audius.co",
    "https://discoveryprovider2.audius.co",
    "https://discoveryprovider3.audius.co",
    "https://audius-dp.amsterdam.creatorseed.com",
    "https://audius-dp.singapore.creatorseed.com",
    "https://discoveryprovider.audius1.prod-us-west-2.staked.cloud",
    "https://discoveryprovider.mainnet.audiusindex.org"
]

AUDIUS_HOST_CACHE: list[str] = []
AUDIUS_LAST_GOOD: Optional[str] = None

"Obtiene lista de endpoints de Audius (o usa fallback) de forma asíncrona"
async def _fetch_audius_hosts()->list[str]:
    logger.info("Obteniendo lista de hosts de Audius...")
    try:
        async with httpx.AsyncClient(timeout=15) as c:
            r = await c.get("https://api.audius.co", follow_redirects=True)
            r.raise_for_status()
            data = r.json()
            hosts = []

            if isinstance(data, dict) and "data" in data:
                hosts = [h if isinstance(h, str) else h.get("endpoint") or h.get("api")
                        for h in data["data"] if h]

            if hosts:
                logger.info(f"Obtenidos {len(hosts)} hosts")
                return [h for h in hosts if h]
            else:
                logger.warning("Usando lista conocida")
                return AUDIUS_KNOWN_HOSTS

    except Exception as e:
        logger.warning(f"Error API: {e}, usando lista conocida")
        return AUDIUS_KNOWN_HOSTS

"Verifica que un host de Audius responda OK a un endpoint de salud"
async def _is_host_healthy(host:str)->bool:
    try:
        host = host.rstrip('/')
        test_url = f"{host}/v1/tracks/trending"

        async with httpx.AsyncClient(timeout=10) as c:
            r = await c.get(test_url, params={"app_name": AUDIO_APP_NAME, "limit": 1})
            healthy = (r.status_code == 200)

            if healthy:
                logger.info(f"Host OK: {host}")
            else:
                logger.warning(f"Host error {r.status_code}: {host}")

            return healthy

    except Exception as e:
        logger.warning(f"Host timeout: {host}")
        return False

"Selecciona y cachea un host saludable de Audius (con refresh opcional)"
async def _audius_host(force_refresh: bool = False) -> str:
    global AUDIUS_LAST_GOOD, AUDIUS_HOST_CACHE

    if force_refresh:
        logger.info("Refresh forzado")
        AUDIUS_HOST_CACHE = await _fetch_audius_hosts()
        AUDIUS_LAST_GOOD = None

    if AUDIUS_LAST_GOOD:
        if await _is_host_healthy(AUDIUS_LAST_GOOD):
            return AUDIUS_LAST_GOOD
        else:
            AUDIUS_LAST_GOOD = None

    if not AUDIUS_HOST_CACHE:
        AUDIUS_HOST_CACHE = await _fetch_audius_hosts()

    logger.info(f"🔍 Probando {len(AUDIUS_HOST_CACHE)} hosts...")
    for h in AUDIUS_HOST_CACHE:
        if await _is_host_healthy(h):
            AUDIUS_LAST_GOOD = h
            logger.info(f"HOST SELECCIONADO: {h}")
            return h

    logger.warning("⚠️ Probando lista conocida...")
    for h in AUDIUS_KNOWN_HOSTS:
        if await _is_host_healthy(h):
            AUDIUS_LAST_GOOD = h
            AUDIUS_HOST_CACHE = AUDIUS_KNOWN_HOSTS
            logger.info(f"HOST SELECCIONADO: {h}")
            return h

    logger.error("NO HAY HOSTS DISPONIBLES")
    raise HTTPException(status_code=503, detail="Audius temporalmente no disponible.")

"Lee una URL base pública (si existe) para construir enlaces"
def _public_http_base()->Optional[str]:
    p=os.path.join(FOLDERS['config'],'ultima_url.txt')
    try:
        if os.path.exists(p):
            with open(p,'r',encoding='utf-8') as f:
                u=f.read().strip().rstrip('/')
                return u if u else None
    except: pass
    return None

"Realiza una petición HEAD/RANGE mínima para probar un stream de Audius"
async def _probe_stream(track_id: str, preview: bool = False):
    host = await _audius_host()
    upstream = f"{host}/v1/tracks/{track_id}/stream"
    params = {"app_name": AUDIO_APP_NAME}
    if preview:
        params["preview"] = "true"
    headers = {"Range": "bytes=0-1"}
    async with httpx.AsyncClient(follow_redirects=True, timeout=20) as c:
        r = await c.get(upstream, params=params, headers=headers)
        return r

# Estado/colas
"Encola un payload de control para un device_id con timestamp"
def _put_cmd(device_id:str, payload:dict):
    if device_id not in esp32_queues: esp32_queues[device_id]=Queue()
    payload.setdefault("timestamp", datetime.now().isoformat())
    esp32_queues[device_id].put(payload)

"Actualiza parcialmente el estado de reproducción para un device_id"
def _set_state(device_id:str, **kwargs):
    st=playback_state.get(device_id,{})
    st.update(kwargs)
    playback_state[device_id]=st

"Encola una orden de reproducción de música con la URL y metadatos"
def _enqueue_music(device_id:str, url:str, titulo:str="", artista:str=""):
    if device_id not in esp32_queues: esp32_queues[device_id]=Queue()
    esp32_queues[device_id].put({
        "tipo":"reproducir_musica","url":url,"titulo":titulo,"artista":artista,
        "timestamp":datetime.now().isoformat()
    })

"Devuelve una categoría simple para una frase según su nombre"
def _categorizar_frase(nombre: str) -> str:
    categorias = {"saludos":["hola","buenos_dias","adios"], "respuestas":["si","no","gracias"]}
    for cat, frases in categorias.items():
        if nombre in frases: return cat
    return "otros"

# ENDPOINTS

"Endpoint raíz: reporta estado básico del servidor"
@app.get("/")
async def root():
    return {
        "status": "online",
        "modelo": ACTIVE_MODEL,
        "audius_host": AUDIUS_LAST_GOOD or "no inicializado"
    }

# FRASES TTS
"Encola la reproducción de una frase TTS pregrabada por nombre para un device_id"
@app.post("/control/frase")
async def control_frase(device_id: str = Form(...), nombre_frase: str = Form(...)):
    archivo = os.path.join(FOLDERS['frases'], f"{nombre_frase}.wav")
    if not os.path.exists(archivo):
        raise HTTPException(status_code=404, detail=f"Frase '{nombre_frase}' no encontrada")

    with open(archivo,'rb') as f: raw=f.read()
    audio_id=str(uuid.uuid4())
    audio_cache[audio_id]=base64.b64encode(raw).decode()
    _persist_audio(audio_id, raw)

    if device_id not in esp32_queues: esp32_queues[device_id]=Queue()
    esp32_queues[device_id].put({
        "tipo":"reproducir_frase",
        "audio_id":audio_id,
        "nombre":nombre_frase,
        "timestamp":datetime.now().isoformat()
    })

    logger.info(f"Frase '{nombre_frase}' encolada para {device_id}")
    return {"success":True,"audio_id":audio_id}

# CONVERSAR CON GEMINI
"Genera respuesta con Gemini, sintetiza a WAV y encola para el device_id"
@app.post("/control/conversar")
async def control_conversar(
    device_id: str = Form(...),
    texto: str = Form(...),
    mantener_contexto: bool = Form(True)
):
    if GEMINI_API_KEY in (None,"","API_KEY_NO_CONFIGURADA"):
        raise HTTPException(status_code=503, detail="Gemini no configurado")

    contexto=settings.get('personalidad_robot','')
    if mantener_contexto and historial_conversacion:
        contexto+="\n\nConversación anterior:\n"
        for msg in historial_conversacion[-5:]:
            contexto+=f"Usuario: {msg['usuario']}\nRobot: {msg['robot']}\n"

    prompt=f"{contexto}\n\nUsuario: {texto}\nRobot:"

    try:
        respuesta=_gemini_generate(prompt)
    except Exception as e:
        raise HTTPException(status_code=503, detail=f"Gemini error: {e}")

    if not respuesta.strip():
        respuesta = "Lo siento, no tengo una respuesta en este momento."

    historial_conversacion.append({
        "usuario":texto,
        "robot":respuesta,
        "timestamp":datetime.now().isoformat()
    })

    # TTS a WAV
    wav_name=hashlib.md5(respuesta.encode()).hexdigest()
    cache_file=os.path.join(FOLDERS['cache'], f"conv_{wav_name}.wav")

    if not os.path.exists(cache_file):
        mp3_tmp=cache_file.replace('.wav','_tmp.mp3')
        await edge_tts.Communicate(
            respuesta,
            settings.get('voz_predeterminada','es-MX-JorgeNeural')
        ).save(mp3_tmp)
        await mp3_to_wav(mp3_tmp, cache_file)

    with open(cache_file,'rb') as f: raw=f.read()
    audio_id=str(uuid.uuid4())
    audio_cache[audio_id]=base64.b64encode(raw).decode()
    _persist_audio(audio_id, raw)

    if device_id not in esp32_queues: esp32_queues[device_id]=Queue()
    esp32_queues[device_id].put({
        "tipo":"reproducir_conversacion",
        "audio_id":audio_id,
        "texto_usuario":texto,
        "texto_robot":respuesta,
        "timestamp":datetime.now().isoformat()
    })

    logger.info(f"Conversación: '{texto}' -> '{respuesta[:50]}...'")
    return {"success":True,"respuesta_robot":respuesta,"audio_id":audio_id}

# MODO LORO (REPETIR CON EFECTOS)
"Sintetiza el texto con efectos (rápido/lento/agudo/...) y encola el audio"
@app.post("/control/repetir")
async def control_repetir(
    device_id: str = Form(...),
    texto: str = Form(...),
    efecto: str = Form("normal")
):
    name=hashlib.md5(f"{texto}_{efecto}".encode()).hexdigest()
    cache_file=os.path.join(FOLDERS['cache'], f"loro_{name}.wav")

    if not os.path.exists(cache_file):
        voice=settings.get('voz_loro','es-ES-ElviraNeural')
        rate="+0%"
        pitch="+0Hz"

        if efecto=="rapido": rate="+50%"
        elif efecto=="lento": rate="-30%"
        elif efecto=="agudo": pitch="+5st"
        elif efecto=="grave": pitch="-5st"
        elif efecto=="robot": rate,pitch = "+10%","-2st"

        mp3_tmp=cache_file.replace('.wav','_tmp.mp3')
        await edge_tts.Communicate(texto, voice, rate=rate, pitch=pitch).save(mp3_tmp)
        await mp3_to_wav(mp3_tmp, cache_file)

    with open(cache_file,'rb') as f: raw=f.read()
    audio_id=str(uuid.uuid4())
    audio_cache[audio_id]=base64.b64encode(raw).decode()
    _persist_audio(audio_id, raw)

    if device_id not in esp32_queues: esp32_queues[device_id]=Queue()
    esp32_queues[device_id].put({
        "tipo":"reproducir_loro",
        "audio_id":audio_id,
        "texto":texto,
        "efecto":efecto,
        "timestamp":datetime.now().isoformat()
    })

    logger.info(f"Loro: '{texto}' con efecto '{efecto}'")
    return {"success":True,"audio_id":audio_id}

# AUDIUS: BÚSQUEDA
"Proxy asíncrono a la búsqueda de pistas en Audius (JSON puro)"
@app.get("/music/audius/search")
async def music_audius_search(q: str, limit: int = 10):
    async def _once(force=False):
        host = await _audius_host(force_refresh=force)
        url = f"{host}/v1/tracks/search"
        async with httpx.AsyncClient(timeout=30) as c:
            return await c.get(url, params={"query": q, "limit": limit, "app_name": AUDIO_APP_NAME})

    r = await _once(False)
    if (r.status_code >= 500 or r.status_code in (429,503)):
        r = await _once(True)

    if r.status_code//100!=2:
        raise HTTPException(status_code=r.status_code, detail=r.text)

    return r.json()

"Endpoint de alto nivel: busca canciones y devuelve items simplificados"
@app.post("/control/musica_buscar")
async def control_musica_buscar(q: str = Form(...), limit: int = Form(10)):
    logger.info(f"Búsqueda: '{q}' (limit={limit})")

    try:
        async def _search_once(force=False):
            host = await _audius_host(force_refresh=force)
            url = f"{host}/v1/tracks/search"
            logger.info(f"🔗 URL: {url}")

            async with httpx.AsyncClient(timeout=45) as c:
                resp = await c.get(
                    url,
                    params={"query": q, "limit": limit, "app_name": AUDIO_APP_NAME}
                )
                logger.info(f"Status: {resp.status_code}")
                return resp

        r = await _search_once(False)

        if r.status_code >= 500 or r.status_code in (429, 503):
            logger.warning(f"Error {r.status_code}, reintentando...")
            r = await _search_once(True)

        if r.status_code // 100 != 2:
            error_text = r.text[:300]
            logger.error(f"Error: {r.status_code} - {error_text}")
            raise HTTPException(status_code=r.status_code, detail=f"Error: {error_text}")

        data = r.json().get("data", [])
        logger.info(f"Encontrados {len(data)} resultados")

        items = [{
            "track_id": t["id"],
            "titulo": t.get("title", "Sin título"),
            "artista": (t.get("user") or {}).get("name", "Desconocido"),
            "duracion": t.get("duration", 0)
        } for t in data]

        return {"total": len(items), "items": items}

    except HTTPException:
        raise
    except Exception as e:
        logger.error(f"Error inesperado: {e}", exc_info=True)
        raise HTTPException(status_code=500, detail=f"Error: {str(e)}")

# AUDIUS: STREAM
"Proporciona streaming/relay del audio de Audius con soporte de preview y range"
@app.get("/music/audius/stream/{track_id}")
async def music_audius_stream(track_id: str, request: Request, preview: int = 0):
    async def _get_stream(force=False, use_preview=False):
        host = await _audius_host(force_refresh=force)
        upstream = f"{host}/v1/tracks/{track_id}/stream"
        params = {"app_name": AUDIO_APP_NAME}
        if use_preview:
            params["preview"] = "true"
        headers = {}
        if (rng := request.headers.get("range")):
            headers["Range"] = rng
        c = httpx.AsyncClient(follow_redirects=True, timeout=None)
        return c, await c.get(upstream, params=params, headers=headers, stream=True)

    client, resp = await _get_stream(False, bool(preview))
    try:
        if resp.status_code >= 500 or resp.status_code == 503:
            await client.aclose()
            client, resp = await _get_stream(True, bool(preview))

        if resp.status_code == 403 and not preview:
            await client.aclose()
            client, resp = await _get_stream(False, True)
            if resp.status_code // 100 == 2 or resp.status_code == 206:
                passthru = {"x-preview": "1"}
                for h in ["Content-Type","Content-Length","Accept-Ranges","Content-Range"]:
                    if h in resp.headers: passthru[h] = resp.headers[h]
                return StreamingResponse(
                    resp.aiter_raw(),
                    status_code=resp.status_code,
                    headers=passthru,
                    media_type=resp.headers.get("Content-Type","audio/mpeg")
                )

        if resp.status_code // 100 != 2 and resp.status_code != 206:
            txt = await resp.aread()
            raise HTTPException(status_code=resp.status_code, detail=txt.decode(errors="ignore"))

        passthru = {}
        for h in ["Content-Type","Content-Length","Accept-Ranges","Content-Range"]:
            if h in resp.headers: passthru[h] = resp.headers[h]

        return StreamingResponse(
            resp.aiter_raw(),
            status_code=resp.status_code,
            headers=passthru,
            media_type=resp.headers.get("Content-Type","audio/mpeg")
        )
    finally:
        try: await client.aclose()
        except: pass

# MAPEO DE COMANDOS CON MENSAJES DE VOZ
COMANDOS_CON_VOZ = {
    0x01: {
        "mensaje": "Robot creado por Lucas Elizalde, Juan Manuel Ferreira y Felipe Morrudo",
        "hex_esp32": 0x01,
        "descripcion": "Encender robot"
    },
    0x02: {
        "mensaje": "Me estoy apagando",
        "hex_esp32": 0x02,
        "descripcion": "Apagar robot"
    },
    0x03: {
        "mensaje": "Estoy entrando al modo turismo",
        "hex_esp32": 0x03,
        "descripcion": "Modo turismo"
    },
    0x04: {
        "mensaje": "Estoy entrando en el modo movimientos",
        "hex_esp32": 0x04,
        "descripcion": "Modo movimientos"
    },
    0x05: {
        "mensaje": "Entrando en el modo audio",
        "hex_esp32": 0x05,
        "descripcion": "Modo audio"
    },
    0x06: {
        "mensaje": "Entrando en el modo poner imágenes en el robot",
        "hex_esp32": 0x06,
        "descripcion": "Modo imágenes"
    },
    0x07: {
        "mensaje": "Entrando en el modo cámara",
        "hex_esp32": 0x07,
        "descripcion": "Modo cámara"
    },
    0x08: {
        "mensaje": "Entrando en modelos predefinidos",
        "hex_esp32": 0x08,
        "descripcion": "Modelos predefinidos"
    },
    0x09: {
        "mensaje": "Entrando en elegir movimientos",
        "hex_esp32": 0x09,
        "descripcion": "Elegir movimientos"
    },
    0x0A: {
        "mensaje": "Entrando en modo repetir movimientos con la cámara",
        "hex_esp32": 0x10,
        "descripcion": "Repetir movimientos"
    },
    0x0B: {
        "mensaje": "Entrando en modo música",
        "hex_esp32": 0x0B,
        "descripcion": "Modo música"
    },
    0x0C: {
        "mensaje": "Entrando en modo voces",
        "hex_esp32": 0x0C,
        "descripcion": "Modo voces"
    },
    0x0D: {
        "mensaje": None,
        "hex_esp32": 0x13,
        "descripcion": "Comando 13"
    },
    0x0E: {
        "mensaje": None,
        "hex_esp32": 0x14,
        "descripcion": "Comando 14"
    },
    0x10: {  # 16
        "mensaje": None,
        "hex_esp32": 0x10,
        "descripcion": "Comando 16"
    },
    0x11: {  # 17
        "mensaje": None,
        "hex_esp32": 0x11,
        "descripcion": "Comando 18"
    },
    0x12: {  # 18
        "mensaje": None,
        "hex_esp32": 0x12,
        "descripcion": "Comando 19"
    },
    0x13: {  # 19
        "mensaje": None,
        "hex_esp32": 0x13,
        "descripcion": "Comando 13"
    },
    0x14: {  # 20
        "mensaje": None,
        "hex_esp32": 0x14,
        "descripcion": "Comando 14"
    },

    0x15: {  # 21
        "mensaje": None,
        "hex_esp32": 0x15,
        "descripcion": "Comando 15"
    },
    0x16: {  # 22
        "mensaje": None,
        "hex_esp32": 0x16,
        "descripcion": "Comando 16"
    },
    0x17: {  # 23
        "mensaje": None,
        "hex_esp32": 0x17,
        "descripcion": "Comando 17"
    },
    0x18: {  # 24
        "mensaje": None,
        "hex_esp32": 0x18,
        "descripcion": "Comando 24"
    },
}

"Recibe un comando hex; si tiene mensaje asociado lo sintetiza y luego envía el comando"
@app.post("/control/comando_hex")
async def control_comando_hex(
    device_id: str = Form(...),
    comando_hex: str = Form(...)
):
    """
    Recibe comando hex desde Flutter.
    - Si el comando tiene mensaje de voz: genera TTS, lo envía primero
    - Luego envía el comando hex mapeado a la ESP32
    """
    try:
        # Validar hex
        comando_int = int(comando_hex, 16)

        if not (0x00 <= comando_int <= 0xFF):
            raise ValueError("Comando fuera de rango")

    except ValueError:
        raise HTTPException(400, f"Comando hexadecimal inválido: {comando_hex}")

    logger.info(f"📥 Comando recibido: {comando_hex} de {device_id}")

    # VERIFICAR SI TIENE VOZ ASOCIADA
    comando_info = COMANDOS_CON_VOZ.get(comando_int)

    audio_id = None
    mensaje_reproducido = None

    if comando_info:
        mensaje = comando_info.get("mensaje")
        hex_para_esp32 = comando_info.get("hex_esp32", comando_int)

        # Si tiene mensaje, generar TTS y enviarlo PRIMERO
        if mensaje:
            logger.info(f"🎤 Generando TTS: '{mensaje}'")

            # Generar audio con TTS
            wav_name = hashlib.md5(mensaje.encode()).hexdigest()
            cache_file = os.path.join(FOLDERS['cache'], f"cmd_{wav_name}.wav")

            if not os.path.exists(cache_file):
                mp3_tmp = cache_file.replace('.wav', '_tmp.mp3')
                await edge_tts.Communicate(
                    mensaje,
                    settings.get('voz_predeterminada', 'es-MX-JorgeNeural')
                ).save(mp3_tmp)
                await mp3_to_wav(mp3_tmp, cache_file)

            # Leer audio
            with open(cache_file, 'rb') as f:
                raw = f.read()

            audio_id = str(uuid.uuid4())
            audio_cache[audio_id] = base64.b64encode(raw).decode()
            _persist_audio(audio_id, raw)

            # Enviar comando de reproducir audio a la ESP32
            if device_id not in esp32_queues:
                esp32_queues[device_id] = Queue()

            esp32_queues[device_id].put({
                "tipo": "reproducir_comando_voz",
                "audio_id": audio_id,
                "mensaje": mensaje,
                "timestamp": datetime.now().isoformat()
            })

            mensaje_reproducido = mensaje
            logger.info(f"🔊 Audio encolado: {audio_id}")

        # ENVIAR COMANDO HEX A LA ESP32
        if device_id not in esp32_queues:
            esp32_queues[device_id] = Queue()

        esp32_queues[device_id].put({
            "tipo": "comando_hex",
            "comando": f"0x{hex_para_esp32:02X}",
            "comando_int": hex_para_esp32,
            "timestamp": datetime.now().isoformat()
        })

        logger.info(f"📤 Comando hex 0x{hex_para_esp32:02X} enviado a ESP32")

        return {
            "success": True,
            "device_id": device_id,
            "comando_recibido": comando_hex,
            "comando_enviado_esp32": f"0x{hex_para_esp32:02X}",
            "mensaje_voz": mensaje_reproducido,
            "audio_id": audio_id,
            "descripcion": comando_info.get("descripcion")
        }

    else:
        # COMANDO SIN VOZ - ENVÍO DIRECTO
        if device_id not in esp32_queues:
            esp32_queues[device_id] = Queue()

        esp32_queues[device_id].put({
            "tipo": "comando_hex",
            "comando": comando_hex,
            "comando_int": comando_int,
            "timestamp": datetime.now().isoformat()
        })

        logger.info(f"Comando directo {comando_hex} enviado a {device_id}")

        return {
            "success": True,
            "device_id": device_id,
            "comando_enviado": comando_hex,
            "comando_int": comando_int,
            "tiene_voz": False
        }

# CONTROL REPRODUCCIÓN
"Encola comenzar reproducción de un track de Audius; maneja preview si es necesario"
@app.post("/control/musica_reproducir")
async def control_musica_reproducir(
    request: Request,
    device_id: str = Form(...),
    track_id: str = Form(...),
    titulo: str = Form(""),
    artista: str = Form("")
):
    r = await _probe_stream(track_id, preview=False)
    if r.status_code >= 500 or r.status_code == 503:
        await _audius_host(force_refresh=True)
        r = await _probe_stream(track_id, preview=False)

    is_preview = False
    if r.status_code // 100 != 2 and r.status_code != 206:
        if r.status_code == 403:
            r2 = await _probe_stream(track_id, preview=True)
            if r2.status_code // 100 == 2 or r2.status_code == 206:
                is_preview = True
            else:
                raise HTTPException(status_code=403, detail="Track no disponible")
        else:
            raise HTTPException(status_code=r.status_code, detail=r.text)

    base = _public_http_base() or str(request.base_url).rstrip("/").replace("https://","http://")
    stream_url = f"{base}/music/audius/stream/{track_id}"
    if is_preview:
        stream_url += "?preview=1"

    _enqueue_music(device_id, stream_url, titulo, artista)
    _set_state(device_id, status="playing", titulo=titulo, artista=artista, track_id=track_id, preview=is_preview)

    logger.info(f"🎵 Reproduciendo: {titulo} - {artista}")
    return {"success": True, "stream_url": stream_url, "preview": is_preview}

"Encola detener la música para un device_id y actualiza estado"
@app.post("/control/musica_detener")
async def control_musica_detener(device_id: str = Form(...)):
    _put_cmd(device_id, {"tipo":"musica_detener"})
    _set_state(device_id, status="stopped")
    return {"success": True}

"Encola pausar la música para un device_id y actualiza estado"
@app.post("/control/musica_pausa")
async def control_musica_pausa(device_id: str = Form(...)):
    _put_cmd(device_id, {"tipo":"musica_pausa"})
    _set_state(device_id, status="paused")
    return {"success": True}

"Encola continuar la música para un device_id y actualiza estado"
@app.post("/control/musica_continuar")
async def control_musica_continuar(device_id: str = Form(...)):
    _put_cmd(device_id, {"tipo":"musica_continuar"})
    _set_state(device_id, status="playing")
    return {"success": True}

"Encola un seek a posición en milisegundos para un device_id"
@app.post("/control/musica_seek")
async def control_musica_seek(device_id: str = Form(...), position_ms: int = Form(...)):
    pos=max(0,int(position_ms))
    _put_cmd(device_id, {"tipo":"musica_seek","position_ms":pos})
    _set_state(device_id, position_ms=pos)
    return {"success":True,"position_ms":pos}

"Encola cambio de volumen (0-100) para un device_id"
@app.post("/control/musica_volumen")
async def control_musica_volumen(device_id: str = Form(...), volume: int = Form(...)):
    vol=max(0,min(100,int(volume)))
    _put_cmd(device_id, {"tipo":"musica_volumen","volume":vol})
    _set_state(device_id, volume=vol)
    return {"success":True,"volume":vol}

"Consulta el estado de reproducción para un device_id (crea por defecto si no existe)"
@app.get("/control/musica_estado/{device_id}")
async def control_musica_estado(device_id: str):
    if device_id not in playback_state:
        playback_state[device_id] = {
            "status": "stopped",
            "titulo": "",
            "artista": "",
            "track_id": "",
            "preview": False,
            "volume": 80
        }
    return playback_state[device_id]


"Registra un dispositivo (crea cola si no existe)"
@app.post("/esp32/register")
async def esp32_register(
    device_id: str = Form(...),
    nombre: str = Form(None),
    ubicacion: str = Form(None)
):
    if device_id not in esp32_queues:
        esp32_queues[device_id] = Queue()
    logger.info(f"📱 Dispositivo registrado: {device_id}")
    return {"success": True, "mensaje": f"Dispositivo {device_id} registrado"}

"Endpoint de polling: entrega un comando pendiente (si hay) a la ESP32"
@app.get("/esp32/poll/{device_id}")
async def esp32_poll(device_id: str):
    if device_id not in esp32_queues:
        esp32_queues[device_id] = Queue()
    cmds = []
    if not esp32_queues[device_id].empty():
        cmds.append(esp32_queues[device_id].get())
    return {"comandos": cmds}

"Entrega un audio en JSON (base64) para compatibilidad con ESP32"
@app.get("/esp32/audio/{audio_id}")
async def esp32_audio(audio_id: str):
    """Versión JSON + base64 (compatibilidad)"""
    if audio_id not in audio_cache and not os.path.exists(os.path.join(FOLDERS['cache'], f"{audio_id}.wav")):
        raise HTTPException(status_code=404, detail="Audio no encontrado")
    raw=_load_audio(audio_id)
    return {"audio_id":audio_id,"audio_base64":base64.b64encode(raw).decode(),"formato":"wav"}

"Entrega audio crudo (WAV) como binario para streaming directo"
@app.get("/esp32/audio_raw/{audio_id}")
async def esp32_audio_raw(audio_id: str):
    """WAV crudo binario para streaming (recomendado para ESP32)"""
    if audio_id not in audio_cache and not os.path.exists(os.path.join(FOLDERS['cache'], f"{audio_id}.wav")):
        raise HTTPException(status_code=404, detail="Audio no encontrado")
    raw=_load_audio(audio_id)
    return Response(
        content=raw,
        media_type="audio/wav",
        headers={"Content-Disposition": f'inline; filename="{audio_id}.wav"'}
    )

"Verifica si un audio existe en RAM y/o disco"
@app.get("/esp32/audio_exists/{audio_id}")
async def esp32_audio_exists(audio_id: str):
    """Debug: verifica si el audio existe"""
    on_ram = audio_id in audio_cache
    on_disk = os.path.exists(os.path.join(FOLDERS['cache'], f"{audio_id}.wav"))
    return {"audio_id": audio_id, "in_cache_ram": on_ram, "in_cache_disk": on_disk}

"Confirma recepción de audio por parte de ESP32 y limpia cachés"
@app.post("/esp32/confirmar/{device_id}")
async def esp32_confirmar(device_id: str, audio_id: str = Form(...), status: str = Form(...)):
    if audio_id in audio_cache:
        del audio_cache[audio_id]
    if status=="success":
        path=os.path.join(FOLDERS['cache'], f"{audio_id}.wav")
        try:
            if os.path.exists(path): os.remove(path)
        except: pass
    return {"success":True}

"Convierte y envía imagen completa (320x240) en formato RGB565 binario"
@app.get("/imagen/{nombre}")
async def enviar_imagen_completa(nombre: str):
    """Envía imagen 320x240 (pantalla completa ILI9341)"""
    ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.jpg")
    if not os.path.exists(ruta):
        ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.png")
    if not os.path.exists(ruta):
        raise HTTPException(status_code=404, detail=f"Imagen '{nombre}' no encontrada")

    datos = imagen_a_rgb565(ruta, 320, 240)
    return Response(
        content=datos,
        media_type="application/octet-stream",
        headers={
            "Content-Disposition": f'inline; filename="{nombre}.bin"',
            "X-Image-Width": "320",
            "X-Image-Height": "240"
        }
    )

"Convierte y envía imagen con tamaño personalizado (RGB565 binario)"
@app.get("/imagen/{nombre}/{ancho}/{alto}")
async def enviar_imagen_custom(nombre: str, ancho: int, alto: int):
    """Envía imagen con tamaño personalizado"""
    # Validar tamaños
    if ancho <= 0 or alto <= 0 or ancho > 320 or alto > 240:
        raise HTTPException(status_code=400, detail="Dimensiones inválidas")

    ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.jpg")
    if not os.path.exists(ruta):
        ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.png")
    if not os.path.exists(ruta):
        raise HTTPException(status_code=404, detail=f"Imagen '{nombre}' no encontrada")

    datos = imagen_a_rgb565(ruta, ancho, alto)
    return Response(
        content=datos,
        media_type="application/octet-stream",
        headers={
            "Content-Disposition": f'inline; filename="{nombre}.bin"',
            "X-Image-Width": str(ancho),
            "X-Image-Height": str(alto)
        }
    )

"Devuelve metadatos de una imagen (dimensiones y bytes estimados)"
@app.get("/imagen/{nombre}/info")
async def info_imagen(nombre: str):
    """Información de la imagen"""
    ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.jpg")
    if not os.path.exists(ruta):
        ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.png")
    if not os.path.exists(ruta):
        raise HTTPException(status_code=404, detail=f"Imagen '{nombre}' no encontrada")

    img = Image.open(ruta)
    return {
        "nombre": nombre,
        "ancho_original": img.width,
        "alto_original": img.height,
        "ancho_pantalla": 320,
        "alto_pantalla": 240,
        "bytes_completa": 320 * 240 * 2
    }

"Lista las imágenes disponibles con su tamaño y formato"
@app.get("/imagenes/lista")
async def listar_imagenes():
    """Lista todas las imágenes disponibles"""
    imagenes = []
    for archivo in os.listdir(FOLDERS['imagenes']):
        if archivo.endswith(('.jpg', '.jpeg', '.png')):
            nombre = os.path.splitext(archivo)[0]
            ruta = os.path.join(FOLDERS['imagenes'], archivo)
            try:
                img = Image.open(ruta)
                imagenes.append({
                    "nombre": nombre,
                    "ancho": img.width,
                    "alto": img.height,
                    "formato": archivo.split('.')[-1]
                })
            except:
                pass
    return {"total": len(imagenes), "imagenes": imagenes}

"Encola un comando para que la ESP32 muestre una imagen desde una URL del servidor"
@app.post("/control/mostrar_imagen")
async def control_mostrar_imagen(
    device_id: str = Form(...),
    nombre: str = Form(...),
    x: int = Form(0),
    y: int = Form(0),
    ancho: int = Form(320),
    alto: int = Form(240)
):
    """Encola comando para mostrar imagen en ESP32"""
    # Verificar que la imagen existe
    ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.jpg")
    if not os.path.exists(ruta):
        ruta = os.path.join(FOLDERS['imagenes'], f"{nombre}.png")
    if not os.path.exists(ruta):
        raise HTTPException(status_code=404, detail=f"Imagen '{nombre}' no encontrada")

    # Obtener URL base
    base = _public_http_base() or "http://localhost:8000"
    imagen_url = f"{base}/imagen/{nombre}/{ancho}/{alto}"

    if device_id not in esp32_queues:
        esp32_queues[device_id] = Queue()

    esp32_queues[device_id].put({
        "tipo": "mostrar_imagen",
        "url": imagen_url,
        "nombre": nombre,
        "x": x,
        "y": y,
        "ancho": ancho,
        "alto": alto,
        "timestamp": datetime.now().isoformat()
    })

    logger.info(f"🖼️ Imagen '{nombre}' encolada para {device_id}")
    return {
        "success": True,
        "imagen_url": imagen_url,
        "ancho": ancho,
        "alto": alto
    }

# ===== ADMIN =====
"Devuelve información administrativa básica del servidor"
@app.get("/admin/info")
async def admin_info():
    return {
        "gemini_model": ACTIVE_MODEL,
        "audius_host": AUDIUS_LAST_GOOD,
        "devices_registered": len(esp32_queues)
    }

"Chequea salud/host activo de Audius"
@app.get("/admin/audius_health")
async def admin_audius_health():
    try:
        host = await _audius_host()
        return {"ok": True, "host": host}
    except HTTPException as e:
        return {"ok": False, "detail": e.detail}

"Fuerza refresco de hosts de Audius y devuelve el seleccionado"
@app.get("/admin/audius_refresh")
async def admin_audius_refresh():
    try:
        host = await _audius_host(force_refresh=True)
        return {"ok": True, "host": host, "message": "Hosts refrescados"}
    except HTTPException as e:
        return {"ok": False, "detail": e.detail}

"Lista dispositivos registrados con tamaño de cola y estado conocido"
@app.get("/admin/devices")
async def admin_devices():
    """Lista todos los dispositivos registrados"""
    devices = {}
    for device_id, queue in esp32_queues.items():
        devices[device_id] = {
            "queue_size": queue.qsize(),
            "state": playback_state.get(device_id, {})
        }
    return {"devices": devices, "total": len(devices)}

"Lista los modelos REST de Gemini y cuál está activo"
@app.get("/admin/models")
async def admin_models():
    """Lista modelos REST de Gemini disponibles"""
    return {"models_rest": _rest_models(), "active": ACTIVE_MODEL}

"Lista las frases disponibles que tienen archivo WAV correspondiente"
@app.get("/frases/lista")
async def listar_frases():
    """Lista todas las frases disponibles"""
    with open(indice_file_path,'r',encoding='utf-8') as f:
        frases = json.load(f)
    frases_disponibles = [
        {"id":n,"texto":t,"categoria":_categorizar_frase(n)}
        for n,t in frases.items()
        if os.path.exists(os.path.join(FOLDERS['frases'], f"{n}.wav"))
    ]
    return {"total":len(frases_disponibles),"frases":frases_disponibles}

logger.info("✅ Servidor FastAPI completo - Audius + WAV + TTS listo")
logger.info("📚 Endpoints disponibles:")
logger.info("   - Frases: POST /control/frase")
logger.info("   - Conversar: POST /control/conversar")
logger.info("   - Loro: POST /control/repetir")
logger.info("   - Música: POST /control/musica_buscar, /control/musica_reproducir")
logger.info("   - ESP32: /esp32/poll, /esp32/audio_raw/{id}")
logger.info("   - Imágenes: POST /control/mostrar_imagen, GET /imagenes/lista")


In [None]:
# ========== ARRANQUE NGROK + UVICORN ==========
from pyngrok import ngrok
import uvicorn
import nest_asyncio
import os

# Permite reutilizar el loop de eventos (útil en notebooks/Colab)
nest_asyncio.apply()

# URL pública del túnel (se asigna luego)
public_url = None
try:
    # Configura el authtoken de ngrok (evita exponerlo públicamente)
    NGROK_AUTHTOKEN = "33lhitAzRumDfAxMqARynV4MYGq_3ntCwBw8ZTJVeJch1HGDr"
    # Establece el token en la librería ngrok
    ngrok.set_auth_token(NGROK_AUTHTOKEN)
    print("Authtoken de ngrok configurado correctamente.")

    # Dominio reservado de ngrok donde se expondrá el servicio
    # (IMPORTANTE: aceptará HTTP para el ESP32)
    NGROK_DOMAIN = "choreal-kalel-directed.ngrok-free.dev"

    # Configuración del túnel: apunta al puerto local 8000 y permite http/https
    config = {
        "addr": 8000,
        "domain": NGROK_DOMAIN,
        "schemes": ["http", "https"],  # Permitir ambos
        "inspect": False
    }

    # Abre el túnel con la configuración indicada
    public_url = ngrok.connect(**config)
    # Normaliza a string la URL pública (compatibilidad con distintos objetos)
    url_str = public_url.public_url if hasattr(public_url, "public_url") else str(public_url)

    # Muestra información de acceso público
    print("SERVIDOR PÚBLICO ACTIVO")
    print(f"URL HTTP: http://{NGROK_DOMAIN}")
    print(f"URL HTTPS: https://{NGROK_DOMAIN}")
    print(f"Documentación (API): {url_str}/docs")
    print("=" * 50)
    print("\nIMPORTANTE: El ESP32 usará HTTP (sin SSL).")

    # Persiste la URL HTTP para que la use el ESP32 (leída por el backend)
    with open(os.path.join(FOLDERS['config'], 'ultima_url.txt'), 'w') as f:
        f.write(f"http://{NGROK_DOMAIN}")

    # Construye la configuración de Uvicorn (host 0.0.0.0:8000)
    uvicorn_config = uvicorn.Config(app, host="0.0.0.0", port=8000, log_level="info")
    # Crea el servidor Uvicorn con esa configuración
    server = uvicorn.Server(uvicorn_config)
    # Arranca el servidor ASGI (bloquea hasta que se detenga)
    await server.serve()

# Permite salir limpiamente con Ctrl+C
except KeyboardInterrupt:
    print("\nDeteniendo servidor y cerrando túnel ngrok...")
    if public_url:
        # Cierra el túnel si estaba activo
        ngrok.disconnect(public_url.public_url if hasattr(public_url, "public_url") else str(public_url))

# Maneja cualquier otro error en el arranque
except Exception as e:
    print(f"Ocurrió un error al iniciar el servidor: {e}")
    if public_url:
        # Intenta cerrar el túnel aun en caso de error
        ngrok.disconnect(public_url.public_url if hasattr(public_url, "public_url") else str(public_url))


✅ Authtoken de ngrok configurado correctamente.


INFO:     Started server process [676]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)


🌐 SERVIDOR PÚBLICO ACTIVO
📱 URL HTTP: http://choreal-kalel-directed.ngrok-free.dev
📱 URL HTTPS: https://choreal-kalel-directed.ngrok-free.dev
📚 Documentación (API): https://choreal-kalel-directed.ngrok-free.dev/docs

⚠️ IMPORTANTE: El ESP32 usará HTTP (sin SSL).
INFO:     152.156.114.107:0 - "POST /esp32/register HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.114.107:0 - "GET /esp32/poll/esp32_1 HTTP/1.1" 200 OK
INFO:     152.156.11

INFO:     Shutting down
INFO:     Waiting for application shutdown.
INFO:     Application shutdown complete.
INFO:     Finished server process [676]
