Skip to content

v0.2.0 — Cerebro configurable

Latest

Choose a tag to compare

@Zero0889 Zero0889 released this 24 Jun 16:47

✨ Cerebro configurable

El chat principal de Orion ahora puede correr en cualquier proveedor LLM además de Gemini. La voz "Hey Orion" sigue siendo Gemini Live por diseño (única API con audio bidireccional en tiempo real), pero el chat de texto, agentes y tools comparten el provider que elijas.

Proveedores soportados

  • Gemini (default) — voz incluida, free tier generoso
  • DeepSeek — V3 / R1, muy barato, fuerte en código
  • Ollama (local) — 100% offline, sin keys, sin internet
  • OpenRouter — gateway a Llama, Qwen, DeepSeek y más, free tier
  • Groq — Llama 3.3 70B ultra-rápido
  • OpenAI — GPT-4o / mini
  • Mistral — small/codestral

Cómo cambiarlo

  • Settings → Cerebro: selector de provider + model, input de API key, badge de status, botón Probar. Click en el chip arriba del ChatPanel salta directo a esta pestaña.
  • Onboarding para usuarios nuevos: wizard reescrito con paso "Elegí tu cerebro" + setup específico (Gemini key, DeepSeek key, o detector de Ollama con instrucciones de instalación).
  • Hot-reload sin reiniciar la app.

Notas

  • Si elegís DeepSeek u Ollama, la voz queda desactivada. Podés agregar key Gemini en cualquier momento y se reactiva.
  • Tu `config/brain.json` arranca con Gemini por default — usuarios existentes no notan ningún cambio.
  • Con 16 GB de RAM van bien modelos 7B-8B en Ollama (`llama3.1:8b`, `qwen2.5:7b`).

Bug fixes incluidos

  • Las conversaciones ahora se persisten correctamente a SQLite (antes `bus.new_conversation()` nunca se llamaba en runtime).

Cobertura

  • 394 tests Python passing (+34 nuevos)
  • 71 tests vitest passing (+10 nuevos)
  • Estables en 5 corridas seguidas sin flakiness
  • 29 tools del registry validadas (schema + import + handler)

Quality gates

ruff · ruff format · mypy · eslint · prettier · typecheck · vitest · vite build · gen:api:check — todos verdes.


🤖 Generated with Claude Code