## RAG (Retrieval-Augmented Generation)

**Members**:
- Juan Diego Pérez Navarro
- Maria Camila García Salazar


## Definition

---

Retrieval-augmented generation (RAG) is a significant development in conversational artificial intelligence (AI) that enhances the interaction between machines and humans. RAG synthesizes the strengths of both retrieval-based and generative models, providing a more adaptive and nuanced system for responding to user queries. This approach allows conversational AI to deliver more precise and contextually relevant responses by drawing upon a vast array of external information sources in addition to the model’s internal knowledge​​​​.

In [4]:
# Import of the anthropic library and definition of api_key and model to be used
import anthropic
from os import getenv
from dotenv import load_dotenv

load_dotenv()


API_KEY = getenv("CLAUDE_API_KEY")
MODEL_NAME = getenv("CLAUDE_MODEL_NAME")

In [5]:
# Implementation of the get_completion function,
# which is a helper function that sends a question
# to Claude and returns the answer generated by Claude.

client = anthropic.Anthropic(api_key=API_KEY)

def get_completion(prompt: str, system_prompt=""):
    message = client.messages.create(
        model=MODEL_NAME,
        max_tokens=2000,
        temperature=0.0,
        system=system_prompt,
        messages=[
          {"role": "user", "content": prompt}
        ]
    )
    return message.content[0].text

**Contexto**

---


In this case, we use a .txt document from a project that was done in the software architecture course and with the help of this technique we will ask Claude specific questions from the .txt file.

In [6]:
# file reading
with open("./info.txt", encoding="utf-8") as txt:
  context = txt.read()

In [7]:
# System prompt
system_prompt = f"""
Eres un asistente encargado para resolver dudas del proyecto "Nebula".

<context>
{context}
</context>
"""

In [8]:
# Prompt
prompt = "De qué se trata el proyecto de Nebula?"
print(get_completion(prompt, system_prompt))

Según la información proporcionada en el contexto, el proyecto Nebula se trata de una plataforma web que permite a los usuarios:

- Cargar archivos CSV
- Seleccionar características y etiquetas de los datos
- Generar automáticamente modelos de regresión y clasificación utilizando algoritmos de machine learning

Los principales objetivos de Nebula son:

1. Simplificar el proceso de creación y evaluación de modelos de machine learning, haciéndolo accesible a usuarios con diversos niveles de experiencia.

2. Proporcionar una interfaz de usuario intuitiva y eficaz que guíe a los usuarios a través del flujo de trabajo.

3. Automatizar la evaluación de los modelos generados, mostrando métricas clave como precisión, error cuadrático medio, puntuación F1, etc.

4. Garantizar la seguridad de los datos de los usuarios mediante un sistema de autenticación y gestión de sesiones.

5. Ofrecer escalabilidad y flexibilidad a la plataforma, permitiendo su crecimiento y adaptación a nuevos requisitos y 

In [9]:
# Prompt
prompt = "Qué tecnologías se tuvieron en cuenta para Nebula?"
print(get_completion(prompt, system_prompt))

Según la información proporcionada en el documento de arquitectura de software (SAD) de Nebula, las principales tecnologías utilizadas en el proyecto son:

Frontend:
- Next.js: Framework de React para la construcción de la interfaz de usuario.
- React: Biblioteca de JavaScript para la creación de interfaces de usuario.
- Material Design 3: Sistema de diseño de Google para la apariencia y comportamiento de la interfaz.
- Zustand: Librería de gestión de estado para aplicaciones React.

Backend:
- FastAPI: Framework web de Python para el desarrollo de APIs de alto rendimiento.
- Scikit-learn: Biblioteca de Python para la implementación de algoritmos de machine learning.
- PostgreSQL: Sistema de gestión de bases de datos relacional para el almacenamiento de datos.
- Redis: Sistema de almacenamiento en caché en memoria para mejorar el rendimiento, especialmente en la gestión de sesiones de usuario.

Infraestructura y Despliegue:
- Docker: Plataforma de contenedorización para garantizar la c

In [10]:
# Prompt
prompt = "Para qué sirvió el SAD en Nebula?"
print(get_completion(prompt, system_prompt))

El Documento de Arquitectura de Software (SAD) de Nebula sirvió para los siguientes propósitos:

1. Documentar la arquitectura del sistema: El SAD describe detalladamente la arquitectura de Nebula, incluyendo los componentes estructurales y sus interacciones. Esto permite tener una visión general y comprensión clara de cómo está diseñado el sistema.

2. Abordar los requisitos clave: El SAD identifica los objetivos, contexto y requisitos de comportamiento y calidad que impulsaron las decisiones arquitectónicas. Esto asegura que la arquitectura esté alineada con las necesidades del proyecto.

3. Presentar diferentes vistas arquitectónicas: El SAD incluye vistas de módulos, componentes y conectores, y asignación, que permiten analizar el sistema desde diferentes perspectivas y satisfacer las necesidades de los diversos stakeholders.

4. Explicar los enfoques arquitectónicos: El SAD documenta los enfoques arquitectónicos clave, como la arquitectura basada en servicios, la contenedorización