# ASISTENTE INTELIGENTE CON LLM Y RAG PARA LA OPTIMIZACIÓN WEB: PROPUESTA Y PLANIFICACIÓN

## 1. PROBLEMA

El rendimiento, la accesibilidad y el posicionamiento en motores de búsqueda (SEO) son factores clave en el desarrollo de sitios web modernos. Estos elementos garantizan una mejor experiencia de usuario y una mayor visibilidad en línea. Herramientas como Google Lighthouse permiten generar reportes automáticos que evalúan estos factores, identificando métricas clave y áreas de mejora.
Sin embargo, estos reportes suelen ser extensos, técnicos y poco accesibles para desarrolladores con poca experiencia o para equipos de desarrollo que requieren recomendaciones prácticas y priorizadas. Aunque Google Lighthouse indica qué aspectos deben optimizarse, no siempre proporciona guías accionables adaptadas al contexto específico de cada proyecto, lo que dificulta la toma de decisiones efectivas y la implementación de mejoras.
La falta de un asistente que interprete los reportes, traduzca los hallazgos en acciones concretas y priorice las recomendaciones según su impacto y esfuerzo, provoca retrasos en los ciclos de desarrollo, posibles malas prácticas en la corrección y, en consecuencia, sitios web con bajo rendimiento, accesibilidad reducida y posicionamiento deficiente.
Por lo tanto, existe la necesidad de una aplicación que, apoyada en modelos de lenguaje grande (LLM) y técnicas de recuperación aumentada de información (RAG), actúe como asistente inteligente capaz de analizar los reportes de Google Lighthouse y ofrecer recomendaciones claras, prácticas y priorizadas, facilitando la optimización integral de sitios web de manera más eficiente.

## 2. OBJETIVOS
### 2.1. Objetivo general

Desarrollar un asistente inteligente basado en LLM y RAG capaz de interpretar reportes de Google Lighthouse y generar recomendaciones prácticas, priorizadas y accionables para mejorar el rendimiento, la accesibilidad y el SEO de sitios web.

### 2.2. Objetivos específicos

1. Diseñar un mecanismo de procesamiento que permita analizar y extraer información relevante de los reportes JSON generados por Google Lighthouse.
2.	Integrar un LLM con soporte RAG, que interprete los hallazgos y los traduzca en recomendaciones claras y adaptadas al contexto del sitio web evaluado.
3.	Desarrollar una interfaz de usuario sencilla e intuitiva que permita cargar reportes, visualizar los resultados priorizados y exportar un plan de optimización en formato accesible.

## 3. JUSTIFICACIÓN

La optimización del rendimiento, la accesibilidad y el SEO en aplicaciones web es un desafío constante para los desarrolladores y equipos de tecnología. Aunque Google Lighthouse provee un análisis detallado de estos aspectos, sus reportes pueden resultar extensos, técnicos y difíciles de interpretar, especialmente para quienes no cuentan con experiencia avanzada en métricas web o buenas prácticas de optimización.
Un modelo de lenguaje grande (LLM), combinado con técnicas de recuperación aumentada de información (RAG), representa una solución adecuada a este problema por varias razones:

-	Los LLMs pueden procesar y explicar información técnica de los reportes de Lighthouse en un lenguaje más claro y comprensible.
-	Mediante RAG, el asistente puede acceder a guías, buenas prácticas y ejemplos de implementación que complementen la información del reporte, ofreciendo sugerencias accionables y adaptadas al entorno del proyecto.
-	Un LLM puede no solo listar problemas, sino también organizarlos en función de impacto, esfuerzo y beneficio esperado, facilitando la toma de decisiones.
-	La solución permite que tanto desarrolladores expertos como principiantes puedan entender rápidamente las mejoras necesarias, reduciendo la curva de aprendizaje y acelerando el ciclo de optimización.

De esta manera, el uso de un LLM con RAG aporta un valor significativo al transformar un reporte técnico en un plan práctico de mejora, mejorando la eficiencia del desarrollo web y aumentando la calidad de los sitios en términos de rendimiento, accesibilidad y posicionamiento en buscadores.

## 4. MODELO LLM

El modelo seleccionado para el desarrollo de la aplicación es CodeLlama 7B de Meta, ejecutado de forma local a través de Ollama. CodeLlama es una variante de la familia Llama optimizado para tareas de programación y análisis técnico, lo que lo convierte en una opción adecuada para interpretar y explicar reportes de Google Lighthouse.

### 4.1. Justificación de la elección

-	CodeLlama ha sido entrenado específicamente en datos de programación, lo que le permite comprender métricas, estructuras de datos y recomendaciones técnicas con mayor precisión que un modelo general.
-	La posibilidad de correr el modelo en local mejora la privacidad de los datos analizados (reportes de Lighthouse) y evita depender de servicios externos en la nube.
-	La versión 7B ofrece una buena relación entre consumo de recursos y velocidad de inferencia, siendo adecuada para prototipos rápidos y equipos con hardware limitado.
-	CodeLlama puede integrarse con técnicas de recuperación aumentada de información para complementar sus respuestas con guías, ejemplos y mejores prácticas almacenadas en la base de conocimiento del proyecto.

## 5. DIAGRAMA DE ARQUITECTURA
![Diagrama de Arquitectura](./diagrams/architecture_diagram.png)
La arquitectura propuesta sigue un enfoque modular compuesta por los siguientes elementos:
1.	Interfaz de Usuario (UI): desarrollada en Next.js, permite al usuario cargar los reportes JSON de Google Lighthouse y visualizar los resultados generados por el asistente de manera clara.
2.	Backend: actúa como intermediario entre la interfaz y el modelo. Se encarga de procesar los reportes de Lighthouse, generar los prompts necesarios y organizar la respuesta recibida.
3.	Ollama Runtime: proporciona el entorno local para ejecutar el modelo de lenguaje CodeLlama, asegurando privacidad en el procesamiento y menor dependencia de servicios externos.
4.	Modelo LLM (CodeLlama 7B): núcleo de la solución, encargado de interpretar los hallazgos de los reportes y generar recomendaciones contextualizadas y priorizadas.
5.	Módulo RAG (Recuperación Aumentada de Información): consulta una base de conocimiento compuesta por guías, buenas prácticas y ejemplos técnicos, para enriquecer las respuestas del modelo con información práctica y confiable.
El flujo de interacción es el siguiente: el usuario carga un reporte → el backend lo procesa → se consulta la base de conocimiento mediante RAG → se construye un prompt enriquecido → Ollama ejecuta el modelo CodeLlama → el backend organiza la salida y la muestra en la interfaz.

## 6. PRESENTACIÓN
La presentación de la primera entrega se puede observar en la siguiente URL:
-	[Figma | Asistente Google Lighthouse](https://www.figma.com/deck/BSqKzByYz6St0e0Ztx9qSx/Asistente-Google-Lighthouse?node-id=1-108&t=HU5ZIqNsKvDw8NSS-1)
