# Reto 2 - Sistema RAG usando IA Generativa para el diseño de la Arquitectura
## 1. Instalación de dependencias y inicialización del entorno para generar las respuestas del LLM

In [1]:
# instalamos langchain
!pip install langchain_openai -q

In [2]:
# Cargamos el TOKEN de OpenAI para poder ejecutar prompts
import os
from dotenv import load_dotenv

load_dotenv()

if not os.getenv("OPENAI_API_KEY"):
    print("⚠️  OPENAI_API_KEY no encontrada. Configura tu API key en archivo .env")
else:
    print("✅ OpenAI API Key configurada")

✅ OpenAI API Key configurada


In [4]:
# Importamos las librerias para ejecutar los prompts
from langchain_openai import ChatOpenAI
# Inicializamos el modelo LangChain OpenAI
# Seleccionamos la temperatura de 0 para mantener el modelo lo mas
# deterministico posible
llm = ChatOpenAI(
    model="gpt-5",
    temperature=0
)

## 2. Fewshot con metodología CoT y CREATE para la creación de un promppt mas especifico y con los requerimientos especificos para el diseño del arquitectura del software

In [None]:
# Few-shot con Cadena de Pensamiento utilizando tecnología C.R.E.A.T.E.
few_shot_cot_create = """
<instruction>
Actúa como un arquitecto senior de software de Python especializado con mas de 10 años de experiencia en sistemas CRUD, 
y amplia experiencia en implementaciones en Dockers Compose.
</instruction>

<context>
Estoy trabajando en la implementación de un sistema CRUD para la gestion de la identidad digital de usuarios
optimizando el código, la arquitectura del software y los procesos para mejorar el performance, la seguridad y
la mantenibilidad de la app.
</context>

<requirements>
Crear la arquitectura de la app para la gestion de un sistema CRUD que:
- Utilice la tecnica de Chain of thought para diseñar la arquitectura del sistema.
- Incluya los siguientes componentes: backend, frontend, base de datos y contenerizacion basica.
- Implemente funcionalidades core de autneticación, gestion de usuarios, y una caracteristica de analisis urbano
como accidentes o inicidentes de trafico.
- Defina una arquitectura simplificada pero funcional.
</requirements>

<specifications>
- Debe de usar API Rest para el backend.
- Debe de usar la tecnica de Chain of thought para diseñar la arquitectura del sistema.
- Debe usar SQlite como base de datos.
- Debe usar Streamlit para la creación del frontend.
- Debe de tener una arquitectura simplificada pero funcional.
- Debe de estar contenerizada con Dockers Compose.
- Debe de incluir las dependencias necesarias para ejecutar el código.
- Debe de incluir ejemplos de la arquitectura.
- Debe de describir el proceso de diseño en pasos enumerados.
</specifications>

<artifacts>
Genera en orden especifico:
1. La estructura basica de la app.
2. Los pasos necesarios para la implementación del backend.
3. Los pasos necesarios para la implementación de la base de datos.
4. Los pasos necesarios para la implemenetación del frontend.
5. Los pasos necesariso para la contenerizacion.
6. Los puntos a favor y en contra de la arquitectura seleccionada.
7. Los puntos de mejora de la arquitectura seleccionada.
8. Ejemplo de cada uno de los archivos generados en la arquitectura propuesta.
</artifacts>

"""

In [None]:
# Ejecutamos el prompt e imprimimos el resultado
few_shot_cot_create_response = llm.invoke(few_shot_cot_create)
print(few_shot_cot_create_response.content)

A continuación encontrarás una propuesta de arquitectura simplificada pero funcional para un sistema CRUD de gestión de identidad digital con autenticación, gestión de usuarios y una característica de análisis urbano de incidentes de tráfico, usando FastAPI (REST), SQLite, Streamlit y Docker Compose.

1) Estructura básica de la app
- Descripción general
  - backend: API REST con FastAPI, autenticación JWT, CRUD de usuarios e incidentes, endpoint de analítica básica.
  - base de datos: SQLite con SQLAlchemy. Persistencia en volumen de Docker.
  - frontend: Streamlit consumiendo la API para login, CRUD de incidentes y visualización analítica y geográfica.
  - contenerización: 2 servicios (backend y frontend) orquestados con Docker Compose.

- Árbol de directorios
  .
  ├── backend
  │   ├── app
  │   │   ├── __init__.py
  │   │   ├── main.py
  │   │   ├── core
  │   │   │   ├── __init__.py
  │   │   │   └── config.py
  │   │   ├── db
  │   │   │   ├── __init__.py
  │   │   │   ├── models

In [None]:
# Inicilaizamos con el modelo gpt-4o-mini para reducir costos y comparar salidas
llm = ChatOpenAI(
    model="gpt-4o-mini",
    temperature=0
)

In [None]:
# Ejecutamos el prompt e imprimimos el resultado ahora con el modelo gpt-4o-mini
few_shot_cot_create_response_4o = llm.invoke(few_shot_cot_create)
print(few_shot_cot_create_response_4o.content)

### 1. Estructura básica de la app

La estructura básica de la aplicación se puede organizar de la siguiente manera:

```
digital_identity_management/
│
├── backend/
│   ├── app/
│   │   ├── __init__.py
│   │   ├── main.py
│   │   ├── models.py
│   │   ├── routes.py
│   │   ├── database.py
│   │   └── auth.py
│   ├── requirements.txt
│   └── Dockerfile
│
├── frontend/
│   ├── app.py
│   └── requirements.txt
│
├── docker-compose.yml
└── README.md
```

### 2. Pasos necesarios para la implementación del backend

1. **Crear el entorno de trabajo**:
   - Crear la carpeta `backend/app` y los archivos mencionados en la estructura.

2. **Instalar dependencias**:
   - Crear un archivo `requirements.txt` en `backend` con las siguientes dependencias:
     ```
     fastapi
     uvicorn
     sqlalchemy
     sqlite
     passlib[bcrypt]
     ```

3. **Configurar la base de datos**:
   - En `database.py`, configurar la conexión a SQLite usando SQLAlchemy.

4. **Definir modelos**:
   - En `models.py`, 

Los resultados obtenidos con el modelo gpt-5 son muchos mas completos, y se opta por usar este modelo para la generación del pipeline para obtener la arquitectura de la aplicación

## Pipeline para el diseño de la arquitectura usando las recomendaciones de la IA, para el frontend y la base de datos

In [10]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field
from typing import Optional

In [None]:
# Creamos la estructira de salida para el parser

class CodeOutput(BaseModel):
    estructura: str = Field(..., description="Explicacion de la estructura de la app")
    backend: str = Field(..., description="Explicación del backend con archivos")
    database: str = Field(..., description="Explicación de la base de datos")
    frontend: str = Field(..., description="Explicación del frontend")
    container: str = Field(..., description="Explicación de la contenerizacion")
    improvements: Optional[str] = Field(None, description="Sugerencias para mejorar la arquitectura de la app.")

parser = PydanticOutputParser(pydantic_object=CodeOutput)

In [12]:
# Establecemos el modelo
model = ChatOpenAI(model="gpt-5", temperature=0)

In [23]:
# Establecemos el prompt
prompt = ChatPromptTemplate.from_messages([
    ("system", """
     Actúa como un arquitecto senior de software de Python especializado con mas de 10 años de experiencia en sistemas CRUD, 
     y amplia experiencia en implementaciones en Dockers Compose.

    CONTEXTO: Estoy trabajando en la implementación de un sistema CRUD para la gestion de la identidad digital de usuarios
    optimizando el código, la arquitectura del software y los procesos para mejorar el performance, la seguridad y
    la mantenibilidad de la app.

    PRINCIPIOS:
    - La arquitectura debe de seguir las mejores practicas
    - Arquitectura simple pero funcional
    - Utilizar la técnica de Chain of Thoughts para el diseño de la arquitectura.
    """),
    ("human", """
    OBJETIVO: {objetivo}
     REQUISITOS: {requisitos}
     ESPECIFICACIONES: {especificaciones}
     {format_instructions}
     """)
])

In [24]:
# Creamos el pipeline
chain = prompt | model | parser

In [None]:
# Establecemos las inputs para el prompt
inputs = {
    "objetivo": "Crear la arquitectura de la app para la gestion de un sistema CRUD completo.",
    "requisitos": """Crear la arquitectura de la app para la gestion de un sistema CRUD que:
        - Incluya los siguientes componentes: backend, frontend, base de datos y contenerizacion basica.
        - Implemente funcionalidades core de autneticación, gestion de usuarios, y una caracteristica de analisis urbano
        como accidentes o inicidentes de trafico.
        - Defina una arquitectura simplificada pero funcional.""",
    "especificaciones": """
    - Debe de usar API Rest para el backend.
    - Debe de tener una arquitectura simplificada pero funcional.
    - Debe de incluir ejemplos de la arquitectura.
    - Debe de describir el proceso de diseño en pasos enumerados.
    - Debe de incluir los puntos a favor y en contra de la arquitectura seleccionada.
    - Debe de incluir los puntos de mejora de la arquitectura seleccionada.""",
    "format_instructions": parser.get_format_instructions()
}

In [26]:
# Ejecutamos el pipeline
result = chain.invoke(inputs)

In [None]:
# Imprimimos la estructura de la app generada
print(result.estructura)

Arquitectura general (3 capas + contenedores):
- Frontend (SPA React): UI, manejo de sesión, llamadas a API, visualización y analítica básica.
- Backend (API REST con FastAPI): autenticación JWT, CRUD de usuarios, CRUD de incidentes, endpoints de analítica.
- Base de datos (PostgreSQL): persistencia relacional, índices, migraciones.
- Contenerización (Docker Compose): orquestación local de frontend, backend y base de datos.

Diagrama lógico (texto):
[React SPA] --HTTP/HTTPS--> [FastAPI] --SQL--> [PostgreSQL]
                                 ^
                           OpenAPI/Swagger

Proceso de diseño (pasos enumerados):
1) Definir dominios: identidad (usuarios/roles/sesiones) y urbano (incidentes/analítica).
2) Elegir patrones: API REST, capas limpias (routers -> services -> repos -> db), DTOs con Pydantic.
3) Seguridad: JWT acceso+refresh, hashing de contraseñas, CORS, validación.
4) Modelo de datos: users, roles, user_roles, refresh_tokens, incidents.
5) Endpoints: auth (login, re

In [None]:
# Imprimimos la escritura del backend generado
print(result.backend)

Tecnología y librerías:
- Python 3.12, FastAPI, Uvicorn, SQLAlchemy 2.x, Alembic, Pydantic v2, Passlib (argon2 o bcrypt), PyJWT.

Capas y responsabilidades:
- Routers (FastAPI APIRouter): definen endpoints y validaciones de entrada/salida.
- Services: lógica de negocio (reglas, transacciones orquestadas).
- Repositories: acceso a datos con SQLAlchemy ORM/SQL.
- Schemas (Pydantic): DTOs para requests/responses.
- Core: configuración, seguridad, middlewares.

Autenticación y autorización:
- Login con email+password. Hash con Argon2 (recomendado) o bcrypt.
- JWT de acceso (vida corta, Authorization: Bearer) y refresh (httpOnly, Secure cookie).
- RBAC simple: roles [admin, analyst, user]. Dependencias de ruta verifican scopes/roles.

Endpoints principales (ejemplos):
- POST /auth/login
- POST /auth/refresh
- POST /auth/logout
- GET /users (paginado, filtros: email, role)
- POST /users, GET /users/{id}, PUT /users/{id}, DELETE /users/{id}
- GET /incidents (paginado, filtros: from, to, sever

In [None]:
# Imprimimos la arquietectura del front generado
print(result.frontend)

Tecnología: React + Vite, TypeScript, React Router, React Query (tanstack), UI library (MUI), axios.

Páginas clave:
- /login: formulario de autenticación.
- /users: listado CRUD con búsqueda y paginación.
- /incidents: listado y detalle; creación/edición.
- /dashboard: tarjetas de KPIs, gráficos de incidentes por día y severidad; mapa simple (Leaflet) opcional.

Estado y servicios:
- React Query para fetching/caching y reintentos.
- Interceptor axios añade Authorization Bearer y maneja refresh token.
- Guarded routes según rol (admin/analyst/user).

Estructura (resumen):
- src/
  - pages/{Login.tsx, Users.tsx, Incidents.tsx, Dashboard.tsx}
  - components/{UserForm.tsx, IncidentForm.tsx, Charts.tsx}
  - services/{api.ts, users.ts, incidents.ts, auth.ts}
  - hooks/{useAuth.ts}
  - store/{authStore.ts}
  - routes.tsx

Ejemplo servicio API:
// services/api.ts
import axios from 'axios'
const api = axios.create({ baseURL: import.meta.env.VITE_API_URL })
api.interceptors.response.use(r => r,

In [None]:
# Imprimimos la arquietectura de la base de datos generada
print(result.database)

Motor: PostgreSQL 16.

Esquema y relaciones (resumen):
- users(id PK, email UNIQUE, hashed_password, full_name, is_active, created_at TIMESTAMPTZ)
- roles(id PK, name UNIQUE)
- user_roles(user_id FK->users, role_id FK->roles, PK compuesta)
- refresh_tokens(id PK, user_id FK->users, token_hash UNIQUE, exp TIMESTAMPTZ, revoked BOOL)
- incidents(id PK, title, description, occurred_at TIMESTAMPTZ, severity INT CHECK 1..5, lat NUMERIC(9,6), lon NUMERIC(9,6), city TEXT, status TEXT, created_by FK->users)

Índices recomendados:
- users(email)
- incidents(occurred_at), incidents(city), incidents(severity)
- Índice compuesto incidents(city, occurred_at DESC)
- Índices en lat/lon si se filtra por bounding box (ej. BRIN para rango de lat/lon en datasets grandes)

Migraciones:
- Alembic con versionado, seeds iniciales (roles, admin).

Ejemplo DDL (fragmento):
CREATE TABLE incidents (
  id BIGSERIAL PRIMARY KEY,
  title TEXT NOT NULL,
  description TEXT,
  occurred_at TIMESTAMPTZ NOT NULL,
  severi

In [None]:
# Imprimimos la contenerizacion generada
print(result.container)

Objetivo: Desarrollo local simple con Docker Compose.

Servicios:
- db: postgres:16 con volumen persistente.
- backend: imagen construida desde backend/ con Uvicorn.
- frontend: build de React y servido con Nginx.

docker-compose.yml (ejemplo mínimo):
version: '3.9'
services:
  db:
    image: postgres:16
    environment:
      - POSTGRES_USER=app
      - POSTGRES_PASSWORD=app
      - POSTGRES_DB=appdb
    ports:
      - '5432:5432'
    volumes:
      - db-data:/var/lib/postgresql/data
    healthcheck:
      test: ['CMD-SHELL', 'pg_isready -U app -d appdb']
      interval: 10s
      timeout: 5s
      retries: 5
  backend:
    build: ./backend
    environment:
      - DATABASE_URL=postgresql+psycopg://app:app@db:5432/appdb
      - JWT_SECRET=change-me
      - JWT_REFRESH_SECRET=change-me-too
      - CORS_ORIGINS=http://localhost:5173
    ports:
      - '8000:8000'
    depends_on:
      db:
        condition: service_healthy
  frontend:
    build:
      context: ./frontend
      dockerfil

## Agregamos una segunda configuracion para el frontend con Streamlit y la base de datos con SQLite

In [32]:
# Establecemos las inputs para el prompt
inputs2 = {
    "objetivo": "Crear la arquitectura de la app para la gestion de un sistema CRUD completo.",
    "requisitos": """Crear la arquitectura de la app para la gestion de un sistema CRUD que:
        - Incluya los siguientes componentes: backend, frontend, base de datos y contenerizacion basica.
        - Implemente funcionalidades core de autneticación, gestion de usuarios, y una caracteristica de analisis urbano
        como accidentes o inicidentes de trafico.
        - Defina una arquitectura simplificada pero funcional.""",
    "especificaciones": """
    - Debe de usar API Rest para el backend.
    - Debe usar SQlite como base de datos.
    - Debe usar Streamlit para la creación del frontend.
    - Debe de tener una arquitectura simplificada pero funcional.
    - Debe de incluir ejemplos de la arquitectura.
    - Debe de describir el proceso de diseño en pasos enumerados.
    - Debe de incluir los puntos a favor y en contra de la arquitectura seleccionada.
    - Debe de incluir los puntos de mejora de la arquitectura seleccionada.""",
    "format_instructions": parser.get_format_instructions()
}

In [33]:
# Ejecutamos el pipeline
result2 = chain.invoke(inputs2)

In [34]:
print(result2.estructura)

Resumen general:
- Monorepo con cuatro piezas: backend (API REST en FastAPI), frontend (Streamlit), base de datos (SQLite embebida) y contenerización básica (Docker + Docker Compose).
- Flujo: Usuario en Streamlit -> HTTP/JSON -> FastAPI -> SQLAlchemy -> archivo SQLite.
- Entidades principales: Usuario (autenticación y gestión), Incidente (accidentes/incidentes urbanos), Token JWT (acceso/refresh).

Estructura de carpetas propuesta:
- /app
  - /backend
    - /src
      - main.py
      - /api (routers)
      - /core (config, seguridad)
      - /models (SQLAlchemy)
      - /schemas (Pydantic)
      - /services (lógica)
      - /repositories (DAO)
      - /tests
    - requirements.txt
    - Dockerfile
  - /frontend
    - app.py
    - /pages (múltiples pantallas Streamlit)
    - api_client.py
    - Dockerfile
    - requirements.txt
  - /data
    - app.db (SQLite; montado como volumen)
  - docker-compose.yml
  - .env

Flujo de datos (simplificado):
1) Streamlit autentica al usuario con emai

In [35]:
print(result2.backend)

Tecnologías: Python 3.11, FastAPI, Uvicorn, SQLAlchemy 2.x, Pydantic v2, Passlib[bcrypt], PyJWT, httpx/requests para tests, SlowAPI (opcional) para rate limiting.

Estructura lógica:
- api/routers: auth.py, users.py, incidents.py, analytics.py, health.py
- services/: auth_service.py, user_service.py, incident_service.py, analytics_service.py
- repositories/: user_repo.py, incident_repo.py
- models/: user.py, incident.py, base.py
- schemas/: user.py, incident.py, auth.py
- core/: config.py, security.py, db.py (SessionLocal), deps.py (Depends), logging.py

Configuración (.env):
- APP_ENV=dev
- SECRET_KEY=clave_super_secreta
- ACCESS_TOKEN_EXPIRE_MINUTES=15
- REFRESH_TOKEN_EXPIRE_DAYS=7
- DATABASE_URL=sqlite:///data/app.db
- CORS_ORIGINS=http://localhost:8501

main.py (esqueleto):
from fastapi import FastAPI
from fastapi.middleware.cors import CORSMiddleware
from core.config import settings
from core.db import init_db
from api import auth, users, incidents, analytics, health

app = FastAP

In [36]:
print(result2.frontend)

Tecnología: Streamlit en modo multipágina. Se consume la API REST con requests/httpx. Gestión de sesión con st.session_state para token JWT.

Estructura:
- app.py (layout, routing ligero, verificación de sesión)
- pages/
  - 01_Login.py
  - 02_Usuarios.py
  - 03_Incidentes.py
  - 04_Analitica.py
- api_client.py (cliente HTTP con manejo de token y base URL)

api_client.py (extracto):
import os, requests, streamlit as st
API_BASE = os.getenv('API_BASE_URL', 'http://localhost:8000')
class API:
    def __init__(self):
        self.base = API_BASE
    def headers(self):
        token = st.session_state.get('token')
        return {'Authorization': f'Bearer {token}'} if token else {}
    def login(self, email, password):
        r = requests.post(f'{self.base}/auth/login', json={'email': email, 'password': password})
        r.raise_for_status(); return r.json()
    def get(self, path, params=None):
        r = requests.get(f'{self.base}{path}', params=params, headers=self.headers()); r.rais

In [37]:
print(result2.database)

SQLite embebido, archivo en /data/app.db (montado como volumen). URL: sqlite:///data/app.db.

Esquema:
- users(id PK, email UNIQUE, hashed_password, full_name, role, created_at)
- incidents(id PK, title, description, severity, lat, lon, happened_at, created_by FK users.id)

Índices sugeridos:
- users.email (único)
- incidents.severity, incidents.happened_at, incidents.lat, incidents.lon
- Índice compuesto ix_incidents_time_severity(happened_at, severity) para analítica temporal por severidad

Relaciones:
- incidents.created_by -> users.id

Creación de tablas:
- Base.metadata.create_all(bind=engine) en startup para simplicidad.

Migraciones:
- En MVP, cambios manuales controlados. Para crecer, incorporar Alembic para versiones de schema.

Semillas de datos:
- Script seed.py que inserta un admin y algunos incidentes aleatorios para pruebas.

Consideraciones de concurrencia:
- SQLite soporta múltiples lectores y un escritor; operaciones de escritura deben ser cortas.

Backups:
- Copia per