<img src="https://dialektico.com/wp-content/uploads/2023/03/MiniLogoW4.png" alt="Dialéktico Logo" />

Este pequeño tutorial pertenece al curso de RAG y agentes con LangChain al que puedes acceder mediante la siguiente URL: https://www.youtube.com/playlist?list=PLlWTv9_GeWd32stuEMWpYOnxiVxnXaU6q

Sigue los videos del curso para recibir instrucciones y contexto sobre la ejecución de este Notebook.

**Nota**: este notebook está pensado para ser ejecutado en local.

<br>

# Requisitos previos

Antes de comenzar, asegúrate de tener instalado:

- Python 3.9+

Requisitos de hardware:
- RAM: Al menos 8 GB de RAM, 16 RAM recomendados.
- CPU: Procesador Intel Core i5 o AMD Ryzen 5 (mínimo).
- GPU: NVIDIA GPU con al menos 6GB VRAM (no es necesaria).

# Instalación de Ollama

- Descarga el instalador correspondiente a tu sistema operativo en https://ollama.com/.
- Realiza la instalación correspondiente.
- Una vez instalado, abre una terminal (CMD o Terminal en VS Code) y ejecuta: ```ollama --version```.

# Descargar el modelo DeepSeek

Con Ollama instalado, descarga el modelo DeepSeek localmente: ```ollama pull deepseek-r1:1.5b```

Este proceso descargará varios cientos de MB o más, dependiendo del modelo. Solo se hace una vez.

# Configura un entorno virtual

- Utiliza: ```python -m venv venv```
- Activa el entorno en Windows: ```venv\Scripts\activate```
- En Linux: ```source venv/bin/activate```

# Instalación de librerías

Finalmente, instala las librerías:

```pip install langchain==0.3.25 langchain-ollama==0.3.2```

# Se importan las librerías

In [None]:
import re
from langchain_core.prompts import PromptTemplate
from langchain_ollama import ChatOllama

# Se utiliza el modelo

Se carga el modelo a utilizar:

In [None]:
# Cargar el modelo en LangChain
llm = ChatOllama(model="deepseek-r1:1.5b")

Se define un prompt:

In [None]:
# Se define un prompt.
prompt = "Hola"

Se genera la respuesta:

In [None]:
response = llm.invoke(prompt)

In [None]:
response.content

Se limpia la respuesta:

In [None]:
# Filtrar <think> usando expresiones regulares
clean_response = re.sub(r"<think>.*?</think>", "", response.content, flags=re.DOTALL).strip()

print(clean_response)

Se define un prompt de simulación RAG:

In [None]:
# Se crea un prompt.
prompt = PromptTemplate.from_template("""
Eres un asistente que responde de manera precisa y directa. No expliques tus razonamientos, solo responde con la información dada.

Información: La mochila roja cuesta 200 pesos. La mochila azul cuesta 300 pesos.
Pregunta: {question}
""")

Se genera la respuesta:

In [None]:
# Generar respuesta
question = "¿Cuánto cuesta la mochila azul?"
response = llm.invoke(prompt.format(question=question))

In [None]:
response.content

Se limpia:

In [None]:
# Filtrar <think> usando expresiones regulares
clean_response = re.sub(r"<think>.*?</think>", "", response.content, flags=re.DOTALL).strip()

print(clean_response)

In [None]:
# Dialektico Machine learning practices © 2025 by Daniel Antonio García Escobar
# is licensed under CC BY-NC 4.0. To view a copy of this license,
# visit https://creativecommons.org/licenses/by-nc/4.0/

# Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International
# Public License