# Preparación de entorno

In [None]:
#conda create -n langchain python=3.12 -y
#conda activate langchain
#conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia -y     |    pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126
#pip3 install langchain langchain-community pypdf openai chromadb tiktoken sentence-transformers transformers ipykernel langchain-google-genai langchain_ollama langchain_experimental duckduckgo-search ddgs wikipedia pinecone langchain-pinecone

# Variables de entorno

In [1]:
from dotenv import load_dotenv
import os
from IPython.display import display, Markdown

def print_lm(text: str):
        display(Markdown(text))

In [None]:
load_dotenv()
print(os.getenv("GOOGLE_API_KEY"))

# 1. PRIMER CAPÍTULO - PROMPT TEMPLATES

Plantillas de texto que se pueden ir adaptando según lo que se le quiera dar al usuario

In [3]:
from langchain_core.prompts import PromptTemplate
# Con esto se crea una plantilla donde siempre el prompt será el mismo
prompt = PromptTemplate.from_template("Describe un objeto que te resulte {adjetivo} y por qué tiene ese efecto en tí")

  from .autonotebook import tqdm as notebook_tqdm


In [4]:
prompt.format(adjetivo="fascinante")

'Describe un objeto que te resulte fascinante y por qué tiene ese efecto en tí'

In [5]:
prompt.format(adjetivo="feo")

'Describe un objeto que te resulte feo y por qué tiene ese efecto en tí'

## Chains con Prompt Templates

In [6]:
template = "Eres un asistente útil que sólo responde con la traducción del {idioma_entrada} al {idioma_salida} el texto: {texto}"

In [7]:
#texto = "Me encanta programar"
texto = "Quiero aprender a bailar salsa"


In [8]:
prompt_template = PromptTemplate(input_variables=["idioma_entrada", "idioma_salida", "texto"], template=template)

In [9]:
# Llamando al LLM
from langchain_google_genai import ChatGoogleGenerativeAI
llm = ChatGoogleGenerativeAI(temperature=0, model='gemini-2.5-flash-lite')

In [10]:
#Creación de la cadema
chain = prompt_template | llm

In [11]:
result = chain.invoke(input={"idioma_entrada": "español", "idioma_salida": "inglés", "texto": texto})
print(result)

content='I want to learn to dance salsa' additional_kwargs={} response_metadata={'finish_reason': 'STOP', 'model_name': 'gemini-2.5-flash-lite', 'safety_ratings': [], 'model_provider': 'google_genai'} id='lc_run--019c5cc8-38b0-70c2-90dd-afbe00a3aec1-0' tool_calls=[] invalid_tool_calls=[] usage_metadata={'input_tokens': 23, 'output_tokens': 7, 'total_tokens': 30, 'input_token_details': {'cache_read': 0}}


In [12]:
print(result.content)

I want to learn to dance salsa


In [13]:
print_lm(result.content)

I want to learn to dance salsa

## Ejemplo práctico usando API de películas

### Primero cómo sería sin usar LangChain

https://developer.themoviedb.org/reference/search-movie -> se debe crear cuenta y una API KEY
![image.png](attachment:image.png)

In [14]:
import os, requests
from langchain_google_genai import ChatGoogleGenerativeAI

In [15]:
# Se usa el código copiado como base para buscar otras películas
movie = "titanic"
url = f"https://api.themoviedb.org/3/search/movie?query={movie}&include_adult=false&language=en-US&page=1"

headers = {
    "accept": "application/json",
    "Authorization": "Bearer eyJhbGciOiJIUzI1NiJ9.eyJhdWQiOiIwMTRiZmYzYzg1MGUwOGQ2NmZlYTY1Y2ZjYjIwZDM4OCIsIm5iZiI6MTc3MTAxOTE2OC43MDUsInN1YiI6IjY5OGY5YmEwNTI5MmJmZDg5Y2NiYzIxNSIsInNjb3BlcyI6WyJhcGlfcmVhZCJdLCJ2ZXJzaW9uIjoxfQ.X6IhygMpLhWPdn6sfrest2IXaeHzX0WLjV-9BNpye0E"
}

response = requests.get(url, headers=headers)

print(response.text)

{"page":1,"results":[{"adult":false,"backdrop_path":"/xnHVX37XZEp33hhCbYlQFq7ux1J.jpg","genre_ids":[18,10749],"id":597,"original_language":"en","original_title":"Titanic","overview":"101-year-old Rose DeWitt Bukater tells the story of her life aboard the Titanic, 84 years later. A young Rose boards the ship with her mother and fiancé. Meanwhile, Jack Dawson and Fabrizio De Rossi win third-class tickets aboard the ship. Rose tells the whole story from Titanic's departure through to its death—on its first and last voyage—on April 15, 1912.","popularity":29.8839,"poster_path":"/9xjZS2rlVxm8SFx8kPC3aIGCOYQ.jpg","release_date":"1997-12-18","title":"Titanic","video":false,"vote_average":7.902,"vote_count":26771},{"adult":false,"backdrop_path":"/8FhAKRTrTLsJfXOkWL6odZeb0M1.jpg","genre_ids":[18,36],"id":11021,"original_language":"de","original_title":"Titanic","overview":"In 1912, the Titanic embarks on its inevitable collision course with history. In the wake of the over-spending required to 

In [16]:
response = response.json()
response

{'page': 1,
 'results': [{'adult': False,
   'backdrop_path': '/xnHVX37XZEp33hhCbYlQFq7ux1J.jpg',
   'genre_ids': [18, 10749],
   'id': 597,
   'original_language': 'en',
   'original_title': 'Titanic',
   'overview': "101-year-old Rose DeWitt Bukater tells the story of her life aboard the Titanic, 84 years later. A young Rose boards the ship with her mother and fiancé. Meanwhile, Jack Dawson and Fabrizio De Rossi win third-class tickets aboard the ship. Rose tells the whole story from Titanic's departure through to its death—on its first and last voyage—on April 15, 1912.",
   'popularity': 29.8839,
   'poster_path': '/9xjZS2rlVxm8SFx8kPC3aIGCOYQ.jpg',
   'release_date': '1997-12-18',
   'title': 'Titanic',
   'video': False,
   'vote_average': 7.902,
   'vote_count': 26771},
  {'adult': False,
   'backdrop_path': '/8FhAKRTrTLsJfXOkWL6odZeb0M1.jpg',
   'genre_ids': [18, 36],
   'id': 11021,
   'original_language': 'de',
   'original_title': 'Titanic',
   'overview': "In 1912, the Tita

In [17]:
#se delimita sólo la primera película de la búsqueda
response["results"][0]

{'adult': False,
 'backdrop_path': '/xnHVX37XZEp33hhCbYlQFq7ux1J.jpg',
 'genre_ids': [18, 10749],
 'id': 597,
 'original_language': 'en',
 'original_title': 'Titanic',
 'overview': "101-year-old Rose DeWitt Bukater tells the story of her life aboard the Titanic, 84 years later. A young Rose boards the ship with her mother and fiancé. Meanwhile, Jack Dawson and Fabrizio De Rossi win third-class tickets aboard the ship. Rose tells the whole story from Titanic's departure through to its death—on its first and last voyage—on April 15, 1912.",
 'popularity': 29.8839,
 'poster_path': '/9xjZS2rlVxm8SFx8kPC3aIGCOYQ.jpg',
 'release_date': '1997-12-18',
 'title': 'Titanic',
 'video': False,
 'vote_average': 7.902,
 'vote_count': 26771}

In [18]:
#se pueden obtener campos específicos
resume = response["results"][0]["overview"]
resume

"101-year-old Rose DeWitt Bukater tells the story of her life aboard the Titanic, 84 years later. A young Rose boards the ship with her mother and fiancé. Meanwhile, Jack Dawson and Fabrizio De Rossi win third-class tickets aboard the ship. Rose tells the whole story from Titanic's departure through to its death—on its first and last voyage—on April 15, 1912."

In [19]:
title = response["results"][0]["title"]
title

'Titanic'

In [20]:
date = response["results"][0]["release_date"]
date

'1997-12-18'

In [21]:
for i in range(min(len(response["results"]), 3)):
    title= response["results"][i]["original_title"]
    resume= response["results"][i]["overview"]
    date= response["results"][i]["release_date"]

    print(f"""Título: {title}\nResumen: {resume} \nFecha de lanzamiento: {date} \n""")


Título: Titanic
Resumen: 101-year-old Rose DeWitt Bukater tells the story of her life aboard the Titanic, 84 years later. A young Rose boards the ship with her mother and fiancé. Meanwhile, Jack Dawson and Fabrizio De Rossi win third-class tickets aboard the ship. Rose tells the whole story from Titanic's departure through to its death—on its first and last voyage—on April 15, 1912. 
Fecha de lanzamiento: 1997-12-18 

Título: Titanic
Resumen: In 1912, the Titanic embarks on its inevitable collision course with history. In the wake of the over-spending required to build the largest luxury ship in the world, White Star Line executive Sir Bruce Ismay schemes to reverse the direction of his company's plummeting stock value. Onboard the Titanic, brave German 1st Officer Petersen struggles to convince his self-important British superiors not to overexert the ship's engines. 
Fecha de lanzamiento: 1943-09-24 

Título: Titanic
Resumen: Unhappily married, Julia Sturges decides to go to America 

Es posible pero tocó explorar los datos para poder extraer lo que se quería

### Ahora usando LangChain

In [22]:
def get_movies(movie):
    url = f"https://api.themoviedb.org/3/search/movie?query={movie}&include_adult=false&language=en-US&page=1"

    headers = {
        "accept": "application/json",
        "Authorization": "Bearer eyJhbGciOiJIUzI1NiJ9.eyJhdWQiOiIwMTRiZmYzYzg1MGUwOGQ2NmZlYTY1Y2ZjYjIwZDM4OCIsIm5iZiI6MTc3MTAxOTE2OC43MDUsInN1YiI6IjY5OGY5YmEwNTI5MmJmZDg5Y2NiYzIxNSIsInNjb3BlcyI6WyJhcGlfcmVhZCJdLCJ2ZXJzaW9uIjoxfQ.X6IhygMpLhWPdn6sfrest2IXaeHzX0WLjV-9BNpye0E"
    }

    response = requests.get(url, headers=headers)
    return response.text

In [23]:
template= """Te voy a dar información sobre algunas películas, me tienes que dar la información (en español)
del título, fecha de estreno y resumen de las primeras 4 que aparezcan de forma estructurada (si aparecen 
menos de 4 me das las que aparezcan). {answer})"""

In [24]:
prompt_template = PromptTemplate(input_variables=["answer"], template=template)

In [25]:
# Llamando al LLM
llm = ChatGoogleGenerativeAI(temperature=0, model='gemini-2.5-flash-lite')

In [26]:
#Creación de la cadema
chain = prompt_template | llm

In [27]:
answer = get_movies("titanic")

In [28]:
result = chain.invoke(input={"answer": answer})
print_lm(result.content)

Aquí tienes la información de las primeras 4 películas que aparecen:

**1. Titanic**
*   **Fecha de estreno:** 1997-12-18
*   **Resumen:** Rose DeWitt Bukater, de 101 años, cuenta la historia de su vida a bordo del Titanic, 84 años después. Una joven Rose aborda el barco con su madre y su prometido. Mientras tanto, Jack Dawson y Fabrizio De Rossi ganan billetes de tercera clase a bordo del barco. Rose narra toda la historia desde la partida del Titanic hasta su hundimiento, en su primer y último viaje, el 15 de abril de 1912.

**2. Titanic**
*   **Fecha de estreno:** 1943-09-24
*   **Resumen:** En 1912, el Titanic emprende su inevitable rumbo de colisión con la historia. A raíz del excesivo gasto que supuso la construcción del mayor barco de lujo del mundo, el ejecutivo de White Star Line, Sir Bruce Ismay, trama un plan para revertir la caída de las acciones de su compañía. A bordo del Titanic, el valiente primer oficial alemán Petersen lucha por convencer a sus superiores británicos, que se creen muy importantes, de que no sobrecarguen los motores del barco.

**3. Titanic**
*   **Fecha de estreno:** 1953-04-11
*   **Resumen:** Julia Sturges, infelizmente casada, decide ir a América con sus dos hijos en el Titanic. Su marido, Richard, también organiza su pasaje en el lujoso transatlántico para poder tener la custodia de sus dos hijos. Todo esto se vuelve insignificante una vez que el barco choca contra un iceberg.

**4. Titanic**
*   **Fecha de estreno:** 2023-02-07
*   **Resumen:** Este documental explora la increíble historia del Titanic. Desde la tripulación hasta sus últimas horas, Titanic narra esta increíble historia como nunca antes. Prepárate para Titanic.

# 2. SEGUNDO CAPÍTULO - CHAINS

## SIMPLE CHAINS

In [None]:
import os
from dotenv import load_dotenv
load_dotenv()
os.getenv("GOOGLE_API_KEY")

In [None]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import PromptTemplate

In [46]:
from IPython.display import display, Markdown

def print_lm(text: str):
        display(Markdown(text))

In [33]:
llm = ChatGoogleGenerativeAI(temperature=0, model='gemini-2.5-flash-lite')

In [34]:
template = """Eres un detectiva experimentado. Describe las pistas clave que condujeron a resolver el caso de {case} en {city}."""

In [35]:
prompt_template = PromptTemplate.from_template(template=template)

In [43]:
from langchain_core.callbacks import StdOutCallbackHandler
chain = (prompt_template | llm).with_config(callbacks=[StdOutCallbackHandler()])

In [44]:
output = chain.invoke({'case': 'Desaparición de la madrastra', 'city': 'Londres'})



[1m> Entering new RunnableSequence chain...[0m


[1m> Entering new PromptTemplate chain...[0m

[1m> Finished chain.[0m

[1m> Finished chain.[0m


In [47]:
print_lm(output.content)

¡Ah, el caso de la madrastra desaparecida en Londres! Un rompecabezas intrincado, de esos que te hacen rascarte la cabeza hasta que las piezas encajan. Como detective experimentado, te diré que no fue una sola pista brillante, sino una **confluencia de pequeños detalles, aparentemente insignificantes al principio, que gradualmente tejieron la verdad.**

Aquí te presento las pistas clave que, en mi opinión, fueron cruciales para resolver la desaparición de la señora Eleanor Ainsworth:

**1. La "Desaparición" Inesperada y la Ausencia de Lucha:**

*   **La Ausencia de Rastro de Lucha:** Eleanor era una mujer de rutinas y de carácter fuerte. Si hubiera sido secuestrada o agredida, esperaríamos signos de forcejeo, objetos caídos, o alguna señal de resistencia. La ausencia total de esto fue la primera bandera roja. Sugería que o bien se fue voluntariamente, o fue llevada por alguien de confianza, o la escena fue meticulosamente limpiada.
*   **El "Desayuno a Medio Terminar":** La taza de té aún caliente, el periódico abierto en la página de crucigramas, la tostada a medio comer. Esto indicaba una interrupción abrupta, pero no violenta. No era una huida apresurada, sino una partida repentina, casi como si hubiera salido a buscar algo y no hubiera regresado.

**2. El Comportamiento Inusual de los Sospechosos Inmediatos:**

*   **El Marido, el Señor Ainsworth:** Su reacción inicial fue de una calma casi antinatural. Si bien el shock puede manifestarse de diversas maneras, su falta de pánico inmediato, su enfoque en los detalles logísticos en lugar de la angustia emocional, levantó sospechas. Además, su coartada, aunque aparentemente sólida, tenía pequeñas lagunas que se fueron desmoronando con la investigación.
*   **Los Hijos del Señor Ainsworth (del primer matrimonio):** Su hostilidad hacia Eleanor era bien conocida. Inicialmente, se les consideró sospechosos obvios, pero su falta de un plan coherente y su evidente resentimiento, aunque sospechoso, no encajaba con la sofisticación de una desaparición bien orquestada. Sin embargo, su conocimiento de las rutinas de Eleanor y su posible motivo (herencia, resentimiento) los mantenía en el radar.

**3. Las Pistas Digitales y Financieras:**

*   **Las Transacciones Bancarias Anómalas:** Esta fue una pista crucial. Descubrimos una serie de transferencias de dinero inusuales y de gran cuantía realizadas por Eleanor en las semanas previas a su desaparición. No eran compras de lujo ni gastos habituales. Esto sugería que estaba preparando algo, o que estaba siendo coaccionada.
*   **El Historial de Búsquedas en Internet:** Al acceder a sus dispositivos (con la debida autorización, por supuesto), encontramos búsquedas sobre "retiros bancarios anónimos", "viajes de larga distancia sin equipaje" y "cómo desaparecer sin dejar rastro". Esto confirmaba que Eleanor estaba planeando su partida, pero ¿por qué y con quién?
*   **La Comunicación Cifrada:** La investigación de sus comunicaciones reveló el uso de aplicaciones de mensajería cifrada y correos electrónicos con alias. Esto indicaba que estaba manteniendo contacto con alguien de forma secreta, alguien que no quería ser identificado.

**4. El Testimonio Inesperado y la Pista Física:**

*   **El Jardinero y el "Coche Desconocido":** Un jardinero que trabajaba en una propiedad cercana, y que inicialmente no se consideró relevante, recordó haber visto un coche oscuro y poco común aparcado cerca de la casa de los Ainsworth la mañana de la desaparición. No le dio importancia en ese momento, pero su descripción, aunque vaga, coincidía con un vehículo que luego identificamos.
*   **El Ticket de Tren Olvidado:** En un rincón polvoriento del garaje, encontramos un ticket de tren de un solo trayecto a una ciudad costera remota, con una fecha anterior a la desaparición. Parecía un olvido, pero al examinarlo de cerca, notamos una pequeña marca de bolígrafo que, al ser analizada, resultó ser una inicial.

**5. La Conexión Inesperada y el Motivo Oculto:**

*   **La "Amiga" Misteriosa:** A través de las comunicaciones cifradas y las transacciones bancarias, pudimos rastrear a una persona que Eleanor había estado contactando intensamente: una mujer con un pasado turbio y una deuda considerable. Esta mujer, que se hacía pasar por una amiga de confianza, resultó ser la clave.
*   **El Plan de Fuga y la Coerción:** La verdad era que Eleanor no había sido secuestrada en el sentido tradicional. Había sido coaccionada. La "amiga" la había amenazado con revelar un secreto oscuro de su pasado, un secreto que arruinaría su reputación y la pondría en peligro. Eleanor, desesperada, había planeado su propia "desaparición" para escapar de la extorsión y empezar una nueva vida, pero la "amiga" la había manipulado para que le entregara una gran suma de dinero a cambio de su "ayuda" para desaparecer.

**En resumen, las pistas clave fueron:**

*   La **ausencia de violencia** en la escena.
*   El **comportamiento sospechoso pero no concluyente** de los familiares directos.
*   Las **transacciones financieras y la actividad digital** que revelaron un plan.
*   El **testimonio aparentemente insignificante** del jardinero.
*   La **pista física del ticket de tren** que conectó los puntos.
*   La **identificación de la cómplice/extorsionadora** y su motivo.

Fue un caso de paciencia, de conectar puntos aparentemente dispares, y de no subestimar nunca el detalle más pequeño. La madrastra desaparecida no fue víctima de un crimen violento, sino de una compleja red de extorsión y manipulación, y la verdad se escondía en las sombras de las finanzas y las comunicaciones secretas.

## SEQUENTIAL CHAINS

In [46]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_ollama import ChatOllama 
from langchain_core.prompts import PromptTemplate
from IPython.display import display, Markdown
from langchain_core.callbacks import StdOutCallbackHandler
import os
from dotenv import load_dotenv
load_dotenv()
os.getenv("GOOGLE_API_KEY")

def print_lm(text: str):
        display(Markdown(text))

In [47]:
llm1 = ChatGoogleGenerativeAI(temperature=0, model='gemini-2.5-flash-lite')
prompt_template1 =  PromptTemplate.from_template(template="Eres un científico experimentado y programador Python que escribe código con comentarios (sin sección de explicación del código). Escribe una función que implemente el concepto de {concept}.")

In [48]:
llm2 = ChatOllama(model="llama3.2:1b",temperature=1.2)
prompt_template2 =  PromptTemplate.from_template(template="Dada una función de Python, descríbela lo más detalladamanet posible: {function}.")

In [49]:
# Esta es la nueva forma de hacer una Simple Sequential Chain
chain = (prompt_template1 | llm1 | prompt_template2 | llm2).with_config(callbacks=[StdOutCallbackHandler()])

In [50]:
output = chain.invoke('obtener los primeros "n" números primos')



[1m> Entering new RunnableSequence chain...[0m


[1m> Entering new PromptTemplate chain...[0m

[1m> Finished chain.[0m


[1m> Entering new PromptTemplate chain...[0m

[1m> Finished chain.[0m

[1m> Finished chain.[0m


In [51]:
print_lm(output.content)

La función `obtener_primeros_n_primos(n)` es una herramienta para generar un listado de los primeros `n` números primos. Se define como una función dentro del archivo `main.py`, y está diseñada para generar una lista que contiene cada uno de los primeros `n` números primos positivos.

Aquí te detallo lo más relevante sobre esta función:

1. **Parámetros de entrada:** La función acepta un parámetro `n`, el número a generar, como int.
2. **Validación inicial:** Si `n` es negativo, se devuelve una lista vacía vacía (`return []`).
3. **Inicialización:** Se almacenan los primeros números primos encontrados en una lista llamada `primos`. 
4. **Búsqueda de primos:** El proceso se lleva a cabo iterando desde el número 2, y cada vez que se comprobará si es primo hasta llegar a la raíz cuadrada del último número en la lista. Si un número está divisible por alguna de estas posibles factorizaciones, no será considerado primo.
5. **Añadir al listado:** Cada primer número primo encontrado en la lista será agregado a la lista global `primos`.
6. **Retorno:** Se devuelve la lista de números primos encontrados (`return primos`).

Este proceso se repite mientras los números primos se encuentran, hasta que hayahabido encontrar `n` primos (que es lo que le dan el nombre a la función). 

La función tiene una secuencia de llamadas recursivas donde:
- Asume que la función comienza a generar un número primo. Este primer número se llama `numero_actual`.
- Utiliza una búsquedas de divisibilidad por números intenales más pequeños hasta llegar a la raíz cuadrada del número actual.
- Si el número es divisible por uno de estos, recuerda que no es primo y finalmente comienza un nuevo bucle para investigar el siguiente paréntesis.
- Cualquier factor encontrado se agrega al listado de primeros números.

Se define un parámetro `tool_calls` en la metadatos del archivo y una propiedad `id`, así como algunas variables con información extra. 

En cuanto a los otros componentes de la aplicación, aquí te menciono algunos detalles adicionales que podrían ser relevantes:

- La función también tiene una `validación inicial` para asegurarse de que se invierta el valor `n <= 0`. Si es así, se devuelve una lista vacía.

- La función utiliza un bucle `while` hasta llegar a encontrar `n` números primos. 

- Una vez encontrados los primeros números primos, la función los agrega al listado de primeros números.

Es importante tener en cuenta que esta implementación de búsqueda de números primos es bastante eficiente con respecto a otras soluciones posibles, ya que solo recorre el range `2` para cada número hasta llegar a su raíz cuadrada y luego se detiene. Sin embargo, para números más grandes, se pueden necesitar usar técnicas como la factorización prima, pero estas generalmente tienen resultados mucho más rápidos.

In [52]:
# ESTO ES LO QUE SE ESTÁ HACIENDO INTERNAMENTE:
# Paso 1
step1 = (prompt_template1 | llm1)

result1 = step1.invoke({
    "concept": 'obtener los primeros "n" números primos'
})

print_lm("## 🧠 Código generado por Gemini\n")
print_lm(f"```python\n{result1.content}\n```")

# Paso 2
step2 = (prompt_template2 | llm2)

result2 = step2.invoke({
    "function": result1.content
})

print_lm("## 🔍 Explicación del código por LLaMA\n")
print_lm(result2.content)

## 🧠 Código generado por Gemini


```python
```python
import math

def obtener_primeros_n_primos(n):
    """
    Genera una lista de los primeros 'n' números primos.

    Args:
        n (int): La cantidad de números primos a generar.

    Returns:
        list: Una lista que contiene los primeros 'n' números primos.
    """
    if n <= 0:
        return []  # Si n es no positivo, devuelve una lista vacía.

    primos = []  # Inicializa una lista para almacenar los números primos encontrados.
    numero_actual = 2  # Comienza la búsqueda de primos desde el número 2.

    while len(primos) < n:  # Continúa hasta que se hayan encontrado 'n' números primos.
        es_primo = True  # Asume que el número actual es primo hasta que se demuestre lo contrario.

        # Comprueba la divisibilidad solo hasta la raíz cuadrada del número actual.
        # Si un número tiene un divisor mayor que su raíz cuadrada, también debe tener uno menor.
        limite_division = int(math.sqrt(numero_actual))

        for i in range(2, limite_division + 1):
            if numero_actual % i == 0:
                es_primo = False  # Si es divisible por algún número, no es primo.
                break  # No es necesario seguir comprobando divisores.

        if es_primo:
            primos.append(numero_actual)  # Si es primo, añádelo a la lista.

        numero_actual += 1  # Pasa al siguiente número para comprobar.

    return primos  # Devuelve la lista de los primeros 'n' números primos.

if __name__ == '__main__':
    # Ejemplo de uso de la función
    cantidad_primos = 10
    primeros_primos = obtener_primeros_n_primos(cantidad_primos)
    print(f"Los primeros {cantidad_primos} números primos son: {primeros_primos}")

    cantidad_primos_2 = 5
    primeros_primos_2 = obtener_primeros_n_primos(cantidad_primos_2)
    print(f"Los primeros {cantidad_primos_2} números primos son: {primeros_primos_2}")

    cantidad_primos_3 = 0
    primeros_primos_3 = obtener_primeros_n_primos(cantidad_primos_3)
    print(f"Los primeros {cantidad_primos_3} números primos son: {primeros_primos_3}")
```
```

## 🔍 Explicación del código por LLaMA


La función `obtener_primeros_n_primos(n)` es un procedimiento para generar una lista de los primeros `n` números primos. La implementación utiliza un algoritmo de búsqueda cuadrática y está diseñada para funcionar con valores positivos.

**Funcionamiento:**

1. La función inicializa una lista `primos` vacía y una variable `numero_actual` en 2, que es el primer número que se considerará primo.
2. Se utiliza un bucle condicional hasta que la longitud de la lista `primos` alcance la cantidad deseada de números primos (`n`).
3. Dentro del bucle, se realiza una búsqueda cuadrática para comprobar si cada número desde 2 es primo.
4. En cada iteración, se comienza un bucle que prueba los divisores potenciales de `numero_actual` usando una raíz cuadrada (función `math.sqrt()`).
5. Si `numero_actual` es divisible por algún número dentro del rango de comprobaciones (de 2 a la raíz cuadrada del número actual), se considera que no es primo.
6. Si no se encuentra ningún divisor, se agrega `numero_actual` a la lista `primos`.
7. Después de cada iteración del bucle para números, el procedimiento pasa al siguiente número en el rango para continuar la búsqueda.
8. Finalmente, la función devuelve la lista de números primos encontrados.

**Análisis:

* El uso de una lista y un bucle condicional permite una eficiente implementación de la búsqueda cuadrática, que tiene un tiempo de complejidad O(n \* sqrt(n)).
* La función utiliza una buena práctica en términos de almacenamiento de datos (utilizando una lista para almacenar los números primos) y de gestión de errores (retornando una lista vacía si el input `n` es negativo).
* El código se ha diseñado para ser modular y fácil de entender, con cada función o bloque de código dedicado a una tarea específica.

**Seguridad:**

* No hay preocupaciones sobre la seguridad debido al uso de métodos apropiados para manejar los números primos (como `math.sqrt()`).
* El procedimiento se diseñó para funcionar con valores enteros, lo que reduce la posibilidad de problemas de tipos o overflow en números grandes.

**Posibles mejoras:**

* Considerando implementar un algoritmo más eficiente, como el algoritmo de Eratosthenes para generar una lista completa de números primos.
* Utilizar técnicas de optimización, como compartir memoria con la función `math.sqrt()` para aprovechar los cálculos múltiplos.

# 3. TERCER CAPÍTULO - ReACT Agent (RAG)

Imagina que tienes un robot virtual que puede hacer tareas por ti en internet, como buscar la última noticia, revisar el clima, o incluso encontrar el perfil de LinkedIn de alguien. Ese robot es lo que llamamos un "agente" en LangChain. Pero este robot es especial, porque no solo sigue órdenes simples; primero piensa en cómo resolver tu petición, decide los pasos a seguir, y luego los ejecuta, como buscar en Google o consultar una base de datos. Es como darle superpoderes a los modelos de lenguaje, esos programas que entienden y generan texto, permitiéndoles interactuar con el mundo real y traerle la información que necesitas. Y lo más interesante es que puedes enseñarle a tu robot a hacer cosas nuevas, dándole acceso a diferentes herramientas y servicios en internet.

## Intro

In [3]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_ollama import ChatOllama 
from langchain_core.prompts import PromptTemplate, ChatPromptTemplate
from IPython.display import display, Markdown
from langchain_core.callbacks import StdOutCallbackHandler
import os
from dotenv import load_dotenv
load_dotenv()
os.getenv("GOOGLE_API_KEY") 

def print_lm(text: str):
        display(Markdown(text))

**SE ME ACABÓ EL LÍMITE DE GEMINI GRATUITO** - TAMBIÉN VERSIÓN CON OLLAMA

In [2]:
llm = ChatGoogleGenerativeAI(temperature=0.1, model='gemini-2.5-flash-lite')

In [3]:
output = llm.invoke('explica procesamiento del lenguaje natural en una oración, así sea una oración larga')

In [4]:
print_lm(output.content)

El Procesamiento del Lenguaje Natural (PLN) es un campo de la inteligencia artificial que permite a las computadoras comprender, interpretar y generar lenguaje humano de manera significativa, facilitando la interacción entre humanos y máquinas a través de tareas como la traducción automática, el análisis de sentimientos y la respuesta a preguntas.

Se le puede dar más contexto a la IA a través de los tipos de mensajes

In [5]:
from langchain_core.prompts import ChatPromptTemplate

In [6]:
prompt = ChatPromptTemplate.from_messages([
    ("system", "Eres un chef y respondes sólo con conceptos culinarios"),
    ("human", "Explica procesamiento del lenguaje natural en una oración, así sea una oración larga")
])

In [7]:
llm = ChatGoogleGenerativeAI(temperature=1.1, model='gemini-2.5-flash-lite')

In [8]:
chain = prompt | llm

In [9]:
output = chain.invoke({})

In [10]:
print_lm(output.content)

Imagina el Procesamiento del Lenguaje Natural como la intrincada técnica culinaria que permite a una máquina comprender, interpretar y generar el sabor y la esencia de nuestras palabras habladas y escritas, para luego transformarlas en ingredientes digeribles y acciones significativas en su propio lenguaje computacional.

VERSIÓN CON OLLAMA - Se pueden usar SystemMessage y HumanMessage (como con OpenAI) -> Gemini no lo admite

In [2]:
from langchain_ollama import ChatOllama
from langchain_core.messages import SystemMessage, HumanMessage

llm = ChatOllama(
    model="qwen3-vl:4b",
    temperature=1.1
)

messages = [
    SystemMessage(content="Eres un chef y respondes sólo con conceptos culinarios."),
    HumanMessage(content="Explica procesamiento del lenguaje natural en una oración, así sea una oración larga.")
]

output = llm.invoke(messages)
print_lm(output.content)

El procesamiento del lenguaje natural, al igual que un chef que diseña un plato complejo, implica descomponer las palabras en elementos básicos (tokenización) como cortar verduras en trozos para identificar cada ingrediente, organizar los pasos siguiendo las reglas sintácticas de la receta (análisis sintáctico) como si fuera moldear un pastel con precisión, interpretar el significado del mensaje (análisis semántico) reconociendo el sabor deseado del plato, extraer características clave como la textura o el equilibrio de sabores (extracción de características), y finalmente aplicar un aprendizaje por máquina basado en su experiencia culinaria (machine learning) para ajustar cada paso hasta lograr un resultado impecable, similar a cómo un buen chef busca siempre el equilibrio entre los componentes de un platillo sin perder su esencia.

## AGENTES EN ACCIÓN

In [None]:
#!pip3 install langchain_experimental -q

#### **EJECUCIÓN DE CÓDIGO DE PYTHON + LLM**

##### FORMA QUE YA ESTÁ DEPRECADA PERO PARECE QUE AÚN SIRVE FEBRERO DE 2026

In [1]:
from langchain_experimental.utilities import PythonREPL
python_repl = PythonREPL()
python_repl.run('print([n for n in range(1,100) if n % 13 == 0])')

Python REPL can execute arbitrary code. Use with caution.


'[13, 26, 39, 52, 65, 78, 91]\n'

In [2]:
from langchain_experimental.agents.agent_toolkits import create_python_agent
from langchain_experimental.tools.python.tool import PythonREPLTool
from langchain_ollama import ChatOllama

llm = ChatOllama(model="qwen3-vl:4b",temperature=0)

agent_executor = create_python_agent(
    llm=llm,
    tool=PythonREPLTool(),
    verbose=True
)

prompt = "Encuentra el promedio de los cubos de los números del 1 al 10 y fuerza a que se vean 3 decimales"
respuesta = agent_executor.invoke(prompt)

  from .autonotebook import tqdm as notebook_tqdm




[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: I need to calculate the average of the cubes of numbers from 1 to 10 and format the result to three decimal places. First, I'll compute the sum of cubes, divide by 10, and then format the result.

Action: Python_REPL
Action Input: 
```python
sum_cubes = sum(i**3 for i in range(1, 11))
average = sum_cubes / 10
print("{:.3f}".format(average))
```[0m
Observation: [36;1m[1;3m302.500
[0m
Thought:[32;1m[1;3mFinal Answer: 302.500[0m

[1m> Finished chain.[0m


In [18]:
print(respuesta['input']) # NO TIENE EL MISMO FORMATO QUE SE VIENE TRABAJANDO CON LAS CHAINS
print(respuesta['output']) # NO TIENE EL MISMO FORMATO QUE SE VIENE TRABAJANDO CON LAS CHAINS

Encuentra el promedio de los cubos de los números del 1 al 10 y fuerza a que se vean 3 decimales
302.500


### Herramientas para búsquedas: DuckDuckGo y Wikipedia

#### **DUCKDUCKGO**

In [None]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_ollama import ChatOllama 
from langchain_core.prompts import PromptTemplate, ChatPromptTemplate
from IPython.display import display, Markdown
from langchain_core.callbacks import StdOutCallbackHandler
import os
from dotenv import load_dotenv
load_dotenv()
os.getenv("GOOGLE_API_KEY") 

def print_lm(text: str):
        display(Markdown(text))

In [None]:
#pip3 install duckduckgo-search
#pip3 install -U ddgs

In [7]:
from langchain_community.tools import DuckDuckGoSearchRun
search = DuckDuckGoSearchRun()
output = search.invoke("Cuál es el principal ingrediente de la pizza Margarita?")
print_lm(output)

Os aconsejo que probéis esta pizza tan sencilla, barata y deliciosa. Esta pizza es la considerada como la base para hacer otras elaboraciones. El resultado es realmente espectacular, probarla y luego ya me contáis. Estoy seguro que la incorporáis como una de vuestras pizzas preferidas. El primer ingrediente de nuestra pizza Margarita es el tomate: crudo, triturado y que no esté aguado. Con ayuda de un cucharón vamos cubriendo toda la base de la pizza sin llegar al borde. Añadimos una pizca de sal. El amasado es más corto, pero se deja más tiempo en el horno para que pierda humedad y adquiera ese punto crocante. Tipos de pizzas populares en el mundo. Las variantes de pizza son innumerables. La básica es la Pizza Margarita , que lleva los colores de la bandera italiana: rojo (tomate), blanco (queso) y verde (albahaca). Síguenos en Google. La pizza es una de las más deliciosa mezclas de queso y embutidos. Hay infinidad de formas de hacerla. Foto: redaccion. La Pizza Margarita , con su simplicidad y calidad de ingredientes , es un verdadero placer para el paladar. Disfruta cada porción, cada sabor y cada aroma mientras transportas tus sentidos a Italia. Ya sea en una cena especial o como una deliciosa indulgencia, esta pizza te hará sentir...

In [18]:
from langchain_community.tools import DuckDuckGoSearchResults
search = DuckDuckGoSearchResults()
output = search.run("Cuál es el principal ingrediente de la pizza Margarita?")
print_lm(output)

snippet: La pizza margarita (en italiano pizza Margherita ) es una típica pizza napolitana elaborada con tomate, mozzarella (tradicionalmente se usa el Fior di latte), albahaca fresca, sal y aceite. Se trata de la pizza napolitana más popular, junto con la marinera., title: Pizza margarita - Wikipedia, la enciclopedia libre, link: https://es.wikipedia.org/wiki/Pizza_Margarita, snippet: En honor a la reina visitante, el panadero Raffaele Esposito creó una pizza que habría complacido a todos en su mesa: la Margherita. La historia cuenta que Esposito utilizó tomates, albahaca y mozzarella para crear una pizza con los colores de la bandera italiana: rojo, blanco y verde., title: La Pizza Margarita y sus ingredientes | Receta Italiana, link: https://pierorestaurante.com/pizza-margherita-margarita/, snippet: Dec 3, 2025 · Tan sencillo como un poco de tomate, queso mozzarella, albahaca fresca, sal, pimienta negra recién molida y aceite de oliva virgen extra. Es sin duda la pizza napolitana más popular. La pizza margarita (en italiano pizza Margherita ) es una típica pizza napolitana elaborada con tomate, mozzarella (tradicionalmente se usa el Fior di latte), albahaca fresca, sal y aceite. Se trata de la pizza napolitana más popular, junto con la marinera. La masa de la pizza es el ingrediente principal de este platillo. Se trata de una mezcla de harina de trigo, agua, levadura y sal, que se amasa y se deja reposar para que la levadura fermente y la masa se hinche. Sep 3, 2025 · Se llama pizza Margarita en honor a Margarita de Saboya que en el año 1889 decidieron agasajar con una pizza sencilla y deliciosa en una pizzería napolitana. Para hacer la pizza margarita ... May 22, 2024 · La pizza margarita combina masa crujiente, salsa de tomate fresca, mozzarella derretida, albahaca aromática y aceite de oliva virgen extra. ¿Cuáles son los ingredientes de la pizza margarita? La pizza Margarita se constituye a partir de componentes específicos: masa fina elaborada con harina, agua, sal y levadura; salsa de tomate, preferentemente preparada con tomates San Marzano; mozzarella di bufala, ese queso blanco y fresco que se funde en la superficie; y hojas de albahaca, cuyo verde contrasta evocando la bandera italiana. ¿Cuáles son los elementos centrales de una pizza margarita? Ahora bien, más allá del anecdotario histórico y sus vínculos con la realeza italiana, los elementos centrales que constituyen a una verdadera Pizza Margarita requieren un análisis meticuloso: La masa debe ser fina al centro y más gruesa en los bordes , logrando así un equilibrio entre crujiente y esponjoso. ¿Cuál es la base de una pizza? La Base: Masa de Procedencia Artisanal La fundación de toda pizza digna de elogio comienza con su masa. La Super Margarita exige una base elaborada con harina de trigo de alta calidad, agua purificada, levadura natural o masa madre, sal marina fina y un toque de aceite de oliva virgen extra. ¿Cuál es el significado de la pizza? En nuestra pizza simboliza la reverencia a la tierra fértil y generosa, así como también se asocia con la nobleza y el respeto, cualidades atribuidas a los miembros de la realeza como la Reina Margarita . El tomate: El rojo intenso del tomate no solo incita al apetito; representa también el ardor y pasión italianos. Mozzarella : El queso mozzarella es el protagonista indiscutible de la pizza margarita. Se utiliza en su versión fresca y se distribuye en trozos o rebanadas sobre la salsa de tomate., title: Pizza Margarita. Receta italiana paso a paso - De Rechupete Pizza margarita - Wikipedia, la enciclopedia libre Pizza margarita - 2026 Pizza margarita. Receta original italiana - Recetas de cocina ... Los Secretos de la Auténtica Pizza Margarita: Ingredientes y ... Los Secretos de la Auténtica Pizza Margarita : Ingredientes y Origen Los Secretos de la Auténtica Pizza Margarita : Ingredientes y Origen Los Secretos de la Auténtica Pizza Margarita : Ingredientes y Origen Los Secretos de la Auténtica Pizza Margarita : Ingredientes y Origen Pizza Margarita: Conoce los Ingredientes de esta Clásica ..., link: https://www.abc.es/recetasderechupete/pizza-margarita/13537/, snippet: La masa de la pizza es el ingrediente principal de este platillo. Se trata de una mezcla de harina de trigo, agua, levadura y sal, que se amasa y se deja reposar para que la levadura fermente y la masa se hinche., title: Pizza margarita - 2026, link: https://todareceta.co/bebida/pizza-margarita/

In [21]:
from langchain_community.utilities import DuckDuckGoSearchAPIWrapper
wrapper = DuckDuckGoSearchAPIWrapper(region='co-es', max_results=3, safesearch='moderate')
search = DuckDuckGoSearchResults(api_wrapper=wrapper, source='news')
output = search.run('selección colombia')
print_lm(output)

snippet: La selección de fútbol de Colombia es el equipo que representa a dicho país en las competiciones oficiales de fútbol masculino. Su organización está a cargo de la Federación Colombiana de Fútbol (FCF) y desde 1936 se encuentra afiliada tanto a la FIFA como a la Conmebol, de la cual es miembro asociado. Disputó su primer encuentro oficial el 10 de febrero de 1938 frente a México, cayendo por 3-1.La selección colombiana ha participado en seis Copas Mundiales de Fútbol (1962, 1990, 1994, 1998, 2014 y 2018), además se clasificó a la edición de 2026, que será su 7.ma participación. En Brasil 2014 cosechó su mejor participación llegando a cuartos de final, quedando en la quinta posición del torneo. Su mayor logro internacional es la Copa América 2001. También obtuvo dos subcampeonatos, en 1975 y 2024. Llegaría a semifinales varias veces. El título del 2001 le permitió participar en la Copa FIFA Confederaciones 2003 donde alcanzaría las semifinales y posteriormente el cuarto lugar. La 'Tricolor', como es conocida, también logró destacadas participaciones internacionales, obteniendo de los Juegos Centroamericanos y del Caribe la medalla de oro en 1946, la medalla de bronce en 1938 y de los Juegos Bolivarianos la medalla de oro en 1951 y la de plata en 1961, 1973 y 1981.Entre los jugadores más destacados están el centrocampista Carlos Valderrama (considerado uno de los mejores jugadores de la historia de Colombia, ocupando el 39.º lugar en el ranking del mejor jugador sudamericano del siglo XX publicado por la IFFHS en 2004), el centrocampista Marcos Coll (autor del único gol olímpico anotado en una Copa Mundial de Fútbol), el portero René Higuita (elegido por la IFFHS como el octavo mejor golero sudamericano del siglo XX en 2004 y recordado por la jugada del Escorpión), los delanteros Luis Díaz (subcampeón de la Copa América 2024, campeón de la Premier League 2024-25 con el Liverpool F. C.) Faustino Asprilla (ocupó el sexto lugar en la elección del Jugador Mundial de la FIFA 1993), Radamel Falcao García (elegido quinto mejor jugador del mundo en 2012, según la votación del FIFA Balón de Oro 2012) y James Rodríguez (ganador de la Bota de Oro en la Copa Mundial Brasil 2014 y el Premio Puskás 2014).En varias ocasiones se encontró dentro de las 10 mejores selecciones del escalafón de la FIFA. Su mejor posición la ha conseguido durante los meses de julio y agosto de 2013, ubicándose en la tercera posición del escalafón., title: Selección Colombia, link: https://es.wikipedia.org/wiki/Selección_Colombia, snippet: ''Colombia National Football Team'' is the men's national association football team of Colombia, controlled by the ..., title: Colombia National Football Team, link: https://grokipedia.com/page/Colombia_National_Football_Team, snippet: La selección de fútbol de Colombia ha sido el representante oficial de este país en las competiciones masculinas de fútbol desde 1924., title: Noticias actuales de Selección Colombiana en Diario Líbero, link: https://libero.pe/tag/seleccion-colombiana, snippet: ¿En busca de Selección Colombia ?: Diego Valoyes regresa al fútbol argentino.Mourinho preocupó a la Selección Colombia por la lesión de Richard Ríos., title: Últimas noticias Selección colombiana | Caracol Radio, link: https://caracol.com.co/tag/seleccion_colombiana/a/

In [29]:
# Más organizado:
import re
pattern = r'snippet: (.*?), title: (.*?), link: (.*?)\,'
matches = re.findall(pattern, output, re.DOTALL)
for snippet, title, link in matches:
    print(f'Snippet: {snippet}\nTitle: {title}\nLink: {link}\n')
    print('-'*50)

Snippet: La selección de fútbol de Colombia es el equipo que representa a dicho país en las competiciones oficiales de fútbol masculino. Su organización está a cargo de la Federación Colombiana de Fútbol (FCF) y desde 1936 se encuentra afiliada tanto a la FIFA como a la Conmebol, de la cual es miembro asociado. Disputó su primer encuentro oficial el 10 de febrero de 1938 frente a México, cayendo por 3-1.La selección colombiana ha participado en seis Copas Mundiales de Fútbol (1962, 1990, 1994, 1998, 2014 y 2018), además se clasificó a la edición de 2026, que será su 7.ma participación. En Brasil 2014 cosechó su mejor participación llegando a cuartos de final, quedando en la quinta posición del torneo. Su mayor logro internacional es la Copa América 2001. También obtuvo dos subcampeonatos, en 1975 y 2024. Llegaría a semifinales varias veces. El título del 2001 le permitió participar en la Copa FIFA Confederaciones 2003 donde alcanzaría las semifinales y posteriormente el cuarto lugar. L

#### **WIKIPEDIA**

In [None]:
#pip3 install wikipedia

In [32]:
from langchain_community.tools import WikipediaQueryRun
from langchain_community.utilities import WikipediaAPIWrapper
api_wrapper = WikipediaAPIWrapper(lang='es', top_k_results=1, doc_content_chars_max=10000)
wiki = WikipediaQueryRun(api_wrapper=api_wrapper)
result = wiki.invoke({'query': 'sora de openai'})
print_lm(result)

Page: Sora (inteligencia artificial)
Summary: Sora es un modelo de inteligencia artificial de texto a vídeo y multimodal desarrollado por OpenAI que permite generar vídeos realistas a partir de descripciones textuales.​ Fue publicado por primera vez el 15 de febrero de 2024.​
El modelo tiene un profundo conocimiento del lenguaje, lo que le permite interpretar con precisión las indicaciones y generar personajes convincentes que expresan emociones vibrantes. Sora también puede crear múltiples tomas dentro de un solo vídeo generado que conservan con precisión los personajes y el estilo visual. El modelo comprende no solo lo que el usuario ha pedido en la solicitud, sino también cómo existen esas cosas en el mundo físico, según la empresa.​ 
Inicialmente, la herramienta estará disponible para «un número limitado de creadores», escribió el director ejecutivo de OpenAI, Sam Altman, en una publicación en X (conocida como Twitter). OpenAI también otorgará acceso a un equipo de expertos encargado de evaluar la seguridad de Sora antes de incorporarlo a los productos de la empresa.​

### USANDO LAS HERRAMIENTAS + LLM  PARA CREAR UN AGENTE SENCILLO - ReAct aGent

#### **TODO ESTO ESTÁ DEPRECADO**

In [None]:
from langchain.prompts import PromptTemplate
from langchain import hub
from langchain.agents import Tool, AgentExecutor, initialize_agent, create_react_agent
from langchain.tools import DuckDuckGoSearchRun, WikipediaQueryRun
from langchain.utilities import WikipediaAPIWrapper
from langchain.experimental.tools.python.tool import PythonREPLTool
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model_name='gpt-4-turbo-preview', temperature=0)

template = '''
Responde las siguientes preguntas en Italiano lo mejor que puedas.
Preguntas: {q}
'''
prompt_template = PromptTemplate.from_template(template)

prompt = hub.pull('hwcase17/react')
'''
Este método te permite extraer y utilizar objetos, como agentes, configuraciones o plantillas, que han sido compartidos en LangChain Hub por otros usuarios o 
creadores o default de langchain. En este caso particular, 'hwchase17/react' hace referencia a una configuración o componente específico, que está relacionado con la funcionalidad.

Esta funcionalidad es particularmente útil cuando deseas implementar lógicas complejas o específicas sin tener que desarrollar todo desde cero. Al aprovechar los componentes 
compartidos en LangChain Hub, puedes enriquecer tus aplicaciones con funcionalidades avanzadas, facilitando el desarrollo de soluciones basadas en modelos de lenguaje grande 
(LLM) y otras herramientas de procesamiento de lenguaje natural (NLP).
'''

# 1. Python REPL Tool
python_repl = PythonREPLTool()
python_repl = Tool(
    name='Python REPL',
    func=python_repl.run,
    descriptions='Útil cuando necesitas usar Python para responder una pregunta. Debes ingresar código Python.'
)

# 2. Wikipedia Tool
api_wrapper = WikipediaAPIWrapper()
wikipedia = WikipediaQueryRun(api_wrapper=api_wrapper)
wikipedia_tool = Tool(
    name='Wikipedia',
    func=wikipedia.run,
    description='Útil cuando necesitas buscar un tema, país o persona en Wikipedia.'
)

# 3. DuckDuckGo Search Tool
search = DuckDuckGoSearchRun()
duckduckgo_tool = Tool(
    name = 'DuckDuckGo Search',
    func = search.run,
    description = 'Útil cuando necesatias realizar una búsqueda en internet para encontrar información que otra herramienta no puede encontrar.'
)

tools = [python_repl, wikipedia_tool, duckduckgo_tool]

agent= create_react_agent(llm, tools, prompt)

agent_executor = AgentExecutor(
    agent=agent,
    tools=tools,
    verbose=True,
    handle_parsing_errors=True,
    max_iterations=10
)

question = 'Cuéntame sobre la vida temprana de Lionel Messi'
output = agent_executor.invoke({'input': prompt_template.format(q=question)})

#### **MI INTENTO CON OLLAMA Y LIBRERÍAS ACTUALIZADAS**

In [None]:
#pip3 install langchainhub

In [1]:
from langchain_classic.agents import AgentExecutor, create_react_agent
from langchain_core.prompts import PromptTemplate
from langchain_experimental.tools.python.tool import PythonREPLTool
from langchain_community.tools import DuckDuckGoSearchRun, WikipediaQueryRun
from langchain_community.utilities import WikipediaAPIWrapper
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_ollama import ChatOllama
from IPython.display import display, Markdown
import os
from dotenv import load_dotenv

load_dotenv()

def print_lm(text: str):
    display(Markdown(text))

def create_agent(verbose: bool = True):
    """Crea una instancia nueva del agente para cada consulta"""
    
    # Inicializar LLM
    llm = ChatOllama(model="qwen2.5:7b", temperature=0)
    # llm = ChatGoogleGenerativeAI(temperature=0, model='gemini-2.5-flash-lite')
    
    # Configurar herramientas
    python_tool = PythonREPLTool()
    python_tool.name = "python_repl"
    python_tool.description = """Execute Python code for calculations and data processing.
    Input: Plain Python code ONLY. NO markdown, NO backticks, NO ``` symbols.
    Output: Execution result.

    Write code like this:
    numbers = [i for i in range(1, 101) if i % 13 == 0]
    print(numbers)

    NOT like this:
    ```python
        code here
    ```
    """
    
    search_tool = DuckDuckGoSearchRun()
    search_tool.name = "web_search"
    search_tool.description = """
    Useful for searching current information on the internet, recent news,
    current events, or information that changes frequently.
    Input: question or query in natural language.
    Output: relevant search results.
    """
    
    wiki_wrapper = WikipediaAPIWrapper(
        lang='en',
        top_k_results=2, 
        doc_content_chars_max=5000
    )
    wiki_tool = WikipediaQueryRun(api_wrapper=wiki_wrapper)
    wiki_tool.name = "wikipedia"
    wiki_tool.description = """
    Useful for getting detailed encyclopedic information about people,
    places, concepts, history, science, technology, etc.
    Input: term or concept to search for.
    Output: detailed Wikipedia summary.
    """
    
    tools = [python_tool, search_tool, wiki_tool]
    
    # Plantilla de prompt para ReAct
    template = """Answer the following question as best you can. You have access to the following tools:

                {tools}

                Use this format EXACTLY:

                Question: the input question you must answer
                Thought: you should always think about what to do
                Action: the action to take, should be one of [{tool_names}]
                Action Input: the input to the action
                Observation: the result of the action
                ... (this Thought/Action/Action Input/Observation can repeat N times)
                Thought: I now know the final answer
                Final Answer: the final answer to the original input question IN THE SAME LANGUAGE AS THE QUESTION

                IMPORTANT: 
                - Always use exactly "Action:" followed by the tool name
                - Always use exactly "Action Input:" followed by the input
                - Don't invent tool names, only use: {tool_names}
                - Respond in the same language the user asked the question
                - For python_repl: Write plain Python code WITHOUT markdown formatting (no ```python or ```)
                - If one search tool (wikipedia or web_search) doesn't find good information, try the other one
                - If wikipedia has no results or unclear results, try web_search
                - If web_search has no results or unclear results, try wikipedia

                CORRECT python_repl example:
                Action: python_repl
                Action Input: numbers = [i for i in range(1, 101) if i % 13 == 0]
                print(numbers)

                WRONG python_repl example (DO NOT DO THIS):
                Action: python_repl
                Action Input: ```python
                numbers = [i for i in range(1, 101) if i % 13 == 0]
                print(numbers)
                ```

                SEARCH STRATEGY:
                - For recent events/news: try web_search first, then wikipedia if needed
                - For encyclopedic topics: try wikipedia first, then web_search if needed
                - If first search tool returns "not found" or unclear results, use the other search tool

                Begin!

                Question: {input}
                Thought: {agent_scratchpad}"""
    
    prompt = PromptTemplate.from_template(template)
    
    # Crear agente
    agent = create_react_agent(
        llm=llm,
        tools=tools,
        prompt=prompt
    )
    
    # Crear ejecutor del agente
    agent_executor = AgentExecutor(
        agent=agent,
        tools=tools,
        verbose=verbose,
        handle_parsing_errors=True,
        max_iterations=15,  # Aumentado para permitir más intentos con diferentes herramientas
        max_execution_time=90
    )
    
    return agent_executor


def query(question: str, recreate_agent: bool = True, verbose: bool = False):
    """
    Consulta al agente con detección automática de idioma
    
    Args:
        question: La pregunta a realizar
        recreate_agent: Si es True, crea un agente nuevo (recomendado para evitar problemas de estado)
        verbose: Si es True, muestra el proceso interno del agente
    """
    if recreate_agent:
        agent_exec = create_agent(verbose)
    else:
        global agent_executor
        agent_exec = agent_executor
    
    print(f"\n{'='*70}")
    print(f"Question: {question}")
    print(f"{'='*70}\n")
    
    response = agent_exec.invoke({"input": question})
    
    print(f"\n{'='*70}")
    print_lm(f"Final Answer: {response['output']}")
    print(f"{'='*70}\n")

# Ejemplos de uso:
if __name__ == "__main__":
    query("Qué es SeeDance2.0, cuando se lanzó y para qué sirve?", verbose=True)
    
    query("Calcula el factorial de 5", verbose=True)
    
    query("Who invented Python programming language?", verbose=True)
    
    query("Calcula la suma de los números pares del 1 al 20", verbose=True)

  from .autonotebook import tqdm as notebook_tqdm



Question: Qué es SeeDance2.0, cuando se lanzó y para qué sirve?



[1m> Entering new AgentExecutor chain...[0m


Impersonate 'safari_16' does not exist, using 'random'


[32;1m[1;3mAction: web_search
Action Input: Qué es SeeDance2.0, cuando se lanzó y para qué sirve?[0m[33;1m[1;3m12 hours ago - Seedance 2.0 is an image-to-video and text-to-video model developed by ByteDance . It was released in February 2026. It was quickly denounced after release by the Motion Picture Association for copyright infringement. 5 days ago - Vamos a explicarte qué es Seedance 2.0, el modelo de inteligencia artificial diseñado por ByteDance . Concretamente se trata de un modelo de IA multimodal... 5 days ago - Seedance 2.0 es la nueva Inteligencia Artificial de ByteDance que permite crear videos para cine y televisión que reducirá costos de producción 5 days ago - Descubre qué es Seedance 2.0, el nuevo modelo de inteligencia artificial para generación de vídeo que permite crear imágenes en movimiento con audio sincronizado y consistencia narrativa a partir de texto, imágenes y clips de referencia. Se trata de un modelo de inteligencia artificial enfocado en generar vid

Final Answer: SeeDance2.0 es un modelo de inteligencia artificial desarrollado por Niobotics ByteDance que permite convertir imágenes y texto en videos. Fue lanzado en febrero de 2026. Se ha enfrentado a críticas por supuestamente infringir derechos de autor, especialmente del Motion Picture Association, Disney y Paramount Skydance. Como de costumbre, ByteDance anunció que respetaría los derechos de propiedad intelectual y fortalecería las medidas para prevenir la violación de estos derechos. Actualmente solo está disponible en China para usuarios con un ID de Douyin.



Question: Calcula el factorial de 5



[1m> Entering new AgentExecutor chain...[0m


Python REPL can execute arbitrary code. Use with caution.


[32;1m[1;3mPara calcular el factorial de 5, puedo usar un bucle o la función `math.factorial` en Python. Primero, intentaré usar `math.factorial`.

Action: python_repl
Action Input: import math
math.factorial(5)[0m[36;1m[1;3m[0m[32;1m[1;3mI now know the final answer
Final Answer: El factorial de 5 es 120.[0m

[1m> Finished chain.[0m



Final Answer: El factorial de 5 es 120.



Question: Who invented Python programming language?



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mAction: wikipedia
Action Input: Python (programming language)[0m[38;5;200m[1;3mPage: Python (programming language)
Summary: Python is a high-level, general-purpose programming language. Its design philosophy emphasizes code readability with the use of significant indentation. Python is dynamically type-checked and garbage-collected. It supports multiple programming paradigms, including structured (particularly procedural), object-oriented and functional programming.
Guido van Rossum began working on Python in the late 1980s as a successor to the ABC programming language. Python 3.0, released in 2008, was a major revision and not completely backward-compatible with earlier versions. Beginning with Python 3.5, capabilities and keywords for typing were added to the language, allowing optional static typing. As of 2026, the Python Software Foundation supports Python 3.10, 

Final Answer: The Python programming language was invented by Guido van Rossum, who began working on it in the late 1980s as a successor to the ABC programming language.



Question: Calcula la suma de los números pares del 1 al 20



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mPara calcular la suma de los números pares entre 1 y 20, puedo usar una lista comprensión para generar estos números y luego sumarlos.
Action: python_repl
Action Input: sum([i for i in range(1, 21) if i % 2 == 0])[0m[36;1m[1;3m[0m[32;1m[1;3mThe code executed correctly and returned the result. Let me provide the final answer based on the observation.

Final Answer: La suma de los números pares del 1 al 20 es 110.[0m

[1m> Finished chain.[0m



Final Answer: La suma de los números pares del 1 al 20 es 110.




In [2]:
query("Hoy es 15 de Febrero de 2026. Quién ganó el superbowl de 2026?")


Question: Hoy es 15 de Febrero de 2026. Quién ganó el superbowl de 2026?




Final Answer: En el Super Bowl de 2026, que fue el LX, los Seattle Seahawks ganaron a los New England Patriots con un marcador de 29-13.




In [3]:
query("Es verdad que OpenAI contrató al creador de OpenClaw?")


Question: Es verdad que OpenAI contrató al creador de OpenClaw?




Final Answer: Sí, es verdad que OpenAI contrató al creador de OpenClaw. Peter Steinberger, el creador de OpenClaw, ha anunciado que se incorpora al equipo de desarrollo de OpenAI.




In [4]:
query("Calcula la suma de los numeros divisibles por 13 del 1 al 100")


Question: Calcula la suma de los numeros divisibles por 13 del 1 al 100




Final Answer: La suma de los números divisibles por 13 del 1 al 100 es 364.




In [5]:
query("Calcula la suma de los cubos de los números del 1 al 20")


Question: Calcula la suma de los cubos de los números del 1 al 20




Final Answer: 44100




In [6]:
query("Cuéntame detalladamente sobre la vida temprana de Lionel Messi en español")


Question: Cuéntame detalladamente sobre la vida temprana de Lionel Messi en español




Final Answer: Lionel Messi nació el 24 de junio de 1987 en Rosario, Argentina. Desde pequeño, su entorno y la cultura del fútbol en la ciudad influyeron en su amor por el deporte. Su familia era muy pobre, lo que le llevó a unirse al club local Newell's Old Boys a los 5 años de edad para poder comer. Allí comenzó a mostrar sus habilidades excepcionales y fue descubierto por el club Barcelona, donde se formaría como jugador profesional.

En resumen, la vida temprana de Lionel Messi estuvo marcada por su amor por el fútbol desde muy joven, su origen humilde en Rosario, Argentina, y su talento que lo llevó a ser descubierto y formarse en uno de los clubes más grandes del mundo.




# 4. LangChain y Vector Stores (Pinecone o  ChromaDB)

In [None]:
#pip3 install pinecone  #-> la 6.0.0 para el 16 de Feb de 2026

## **ENTENDIENDO PINECONE**

#### **Se debe hacer el registro en la página de Pinecone y obtener el API TOKEN**

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)
![image-4.png](attachment:image-4.png)

####  **Se continúa luego del registro**

In [None]:
import os
from dotenv import load_dotenv
load_dotenv()
os.getenv("PINECONE_API_KEY")

**SE VALIDA QUE SE HAYA CREADO CORRECTAMENTE EL INDEX - SE LISTAN LOS QUE HAY**

In [6]:
from pinecone import Pinecone
pc = Pinecone()
pc.list_indexes() 

[
    {
        "name": "langchain",
        "metric": "cosine",
        "host": "langchain-igrls6v.svc.aped-4627-b74a.pinecone.io",
        "spec": {
            "serverless": {
                "region": "us-east-1",
                "cloud": "aws",
                "read_capacity": {
                    "mode": "OnDemand",
                    "status": {
                        "state": "Ready",
                        "current_shards": null,
                        "current_replicas": null
                    }
                }
            }
        },
        "status": {
            "ready": true,
            "state": "Ready"
        },
        "vector_type": "dense",
        "dimension": 3072,
        "deletion_protection": "disabled",
        "tags": null
    }
]

**SI SE TIENE LA VERSIÓN PAGA ES POSIBLE TENER VARIOS INDEX, ASÍ SE PUEDE BUSCAR ESPECÍFICAMENTE UNO:**

In [8]:
index_name = "langchain"    
pc.describe_index(index_name) 

{
    "name": "langchain",
    "metric": "cosine",
    "host": "langchain-igrls6v.svc.aped-4627-b74a.pinecone.io",
    "spec": {
        "serverless": {
            "region": "us-east-1",
            "cloud": "aws",
            "read_capacity": {
                "mode": "OnDemand",
                "status": {
                    "state": "Ready",
                    "current_shards": null,
                    "current_replicas": null
                }
            }
        }
    },
    "status": {
        "ready": true,
        "state": "Ready"
    },
    "vector_type": "dense",
    "dimension": 3072,
    "deletion_protection": "disabled",
    "tags": null,
    "_response_info": {
        "raw_headers": {
            "content-type": "application/json",
            "vary": "origin, access-control-request-method, access-control-request-headers",
            "access-control-allow-origin": "*",
            "access-control-expose-headers": "*",
            "x-pinecone-api-version": "2025-10

In [None]:
pc.list_indexes().names()
# pc.delete_index(index_name)  # si se quiere eliminar el index
# pc.list_indexes()
#PARA CREAR EL INDEX DE FORMA MANUAL LUEGO DE ELIMINARLO
# index_name = 'langchain'
# if not pc.has_index(index_name):
#     pc.create_index_for_model(
#         name=index_name,
#         cloud="aws",
#         dimension=3070,
#         metric='cosine',
#         region="us-east-1",
#         embed={
#             "model":"llama-text-embed-v2",
#             "field_map":{"text": "chunk_text"}
#         }
#     )

['langchain']

In [11]:
index = pc.Index(index_name)
index.describe_index_stats()

  from .autonotebook import tqdm as notebook_tqdm


{'_response_info': {'raw_headers': {'connection': 'keep-alive',
                                    'content-length': '151',
                                    'content-type': 'application/json',
                                    'date': 'Mon, 16 Feb 2026 19:40:32 GMT',
                                    'grpc-status': '0',
                                    'server': 'envoy',
                                    'x-envoy-upstream-service-time': '96',
                                    'x-pinecone-request-latency-ms': '96',
                                    'x-pinecone-response-duration-ms': '98'}},
 'dimension': 3072,
 'index_fullness': 0.0,
 'memoryFullness': 0.0,
 'metric': 'cosine',
 'namespaces': {},
 'storageFullness': 0.0,
 'total_vector_count': 0,
 'vector_type': 'dense'}

## **TRABAJANDO CON LOS VECTORES**

##### **GUARDADO DE VECTORES EN LA BASE DE DATOS**

In [None]:
import random   
vectors = [[random.random() for _ in range(3072)] for v in range(5)] #creación de vectores random

In [13]:
ids = list('abcde')
ids

['a', 'b', 'c', 'd', 'e']

In [14]:
index_name = 'langchain'
index=pc.Index(index_name)
index.upsert(vectors=zip(ids, vectors))

UpsertResponse(upserted_count=5, _response_info={'raw_headers': {'date': 'Mon, 16 Feb 2026 19:45:42 GMT', 'content-type': 'application/json', 'content-length': '19', 'connection': 'keep-alive', 'x-pinecone-request-lsn': '1', 'x-pinecone-request-logical-size': '61445', 'x-pinecone-request-latency-ms': '594', 'x-envoy-upstream-service-time': '268', 'x-pinecone-response-duration-ms': '595', 'grpc-status': '0', 'server': 'envoy'}})

![image.png](attachment:image.png)

##### **MODIFICAR VECTORES**

In [16]:
index.upsert(vectors=[('c', [0.5] *3072)]) # que todos los valores sean 0.5 del vector con index 'C'

UpsertResponse(upserted_count=1, _response_info={'raw_headers': {'date': 'Mon, 16 Feb 2026 19:49:20 GMT', 'content-type': 'application/json', 'content-length': '19', 'connection': 'keep-alive', 'x-pinecone-request-lsn': '2', 'x-pinecone-request-logical-size': '12289', 'x-pinecone-request-latency-ms': '158', 'x-envoy-upstream-service-time': '159', 'x-pinecone-response-duration-ms': '161', 'grpc-status': '0', 'server': 'envoy'}})

![image.png](attachment:image.png) ![image-2.png](attachment:image-2.png)


In [21]:
# Se pueden ver los vectores que se quieran
index.fetch(ids=['c', 'd'])

FetchResponse(namespace='', vectors={'d': Vector(id='d', values=[0.488059, 0.393327743, 0.477954626, 0.701318264, 0.971536696, 0.847099602, 0.355390906, 0.619198442, 0.80096674, 0.377435565, 0.951377273, 0.938468874, 0.990317702, 0.53537333, 0.777975082, 0.383718789, 0.00109736633, 0.335108101, 0.581814528, 0.341437787, 0.282828271, 0.65805459, 0.0504665114, 0.280653536, 0.603779137, 0.537287295, 0.202243343, 0.778499782, 0.978536606, 0.228685737, 0.418174356, 0.781689763, 0.639240205, 0.00188891136, 0.736682832, 0.353673339, 0.557092071, 0.824026883, 0.210504964, 0.490312874, 0.239777625, 0.209576502, 0.39011535, 0.686172843, 0.669371307, 0.571059823, 0.953653038, 0.122805253, 0.866212487, 0.813758194, 0.75689441, 0.75143981, 0.705670655, 0.274360865, 0.695774913, 0.652889848, 0.589655876, 0.443365127, 0.245424435, 0.776655, 0.614265859, 0.326936096, 0.0508725084, 0.4941, 0.101785786, 0.875082493, 0.442377508, 0.960755229, 0.48567614, 0.414350659, 0.877081573, 0.693966448, 0.390884519

##### **ELIMINAR VECTORES**

In [22]:
index.delete(ids=['b','c'])

{'_response_info': {'raw_headers': {'date': 'Mon, 16 Feb 2026 20:01:25 GMT',
   'content-type': 'application/json',
   'content-length': '2',
   'connection': 'keep-alive',
   'x-pinecone-request-lsn': '3',
   'x-pinecone-request-logical-size': '0',
   'x-pinecone-request-latency-ms': '187',
   'x-envoy-upstream-service-time': '188',
   'x-pinecone-response-duration-ms': '189',
   'grpc-status': '0',
   'server': 'envoy'}}}

In [23]:
index.describe_index_stats()

{'_response_info': {'raw_headers': {'connection': 'keep-alive',
                                    'content-length': '182',
                                    'content-type': 'application/json',
                                    'date': 'Mon, 16 Feb 2026 20:02:01 GMT',
                                    'grpc-status': '0',
                                    'server': 'envoy',
                                    'x-envoy-upstream-service-time': '5',
                                    'x-pinecone-request-latency-ms': '3',
                                    'x-pinecone-response-duration-ms': '6'}},
 'dimension': 3072,
 'index_fullness': 0.0,
 'memoryFullness': 0.0,
 'metric': 'cosine',
 'namespaces': {'__default__': {'vector_count': 3}},
 'storageFullness': 0.0,
 'total_vector_count': 3,
 'vector_type': 'dense'}

![image.png](attachment:image.png)

In [24]:
index.fetch(ids=['c'])

FetchResponse(namespace='', vectors={}, usage={'read_units': 1}, _response_info={'raw_headers': {'date': 'Mon, 16 Feb 2026 20:09:46 GMT', 'content-type': 'application/json', 'content-length': '53', 'connection': 'keep-alive', 'x-pinecone-request-latency-ms': '123', 'x-envoy-upstream-service-time': '123', 'x-pinecone-response-duration-ms': '125', 'grpc-status': '0', 'server': 'envoy'}})

##### **BÚSQUEDA SENCILLA**

In [None]:
#Se crea un vector aleatorio nuevamente (referencia)
query_vector= [random.random() for _ in range(3072)]
query_vector

[0.4446739971211955,
 0.14583146030481664,
 0.39831382854115804,
 0.3471539325179912,
 0.2254539949183233,
 0.8127294616508005,
 0.18546689490087276,
 0.17011900553335635,
 0.8128636298203383,
 0.41776177094100697,
 0.4581071267058453,
 0.6371365233796157,
 0.38811580690586833,
 0.2531596553743134,
 0.16075786239007028,
 0.21112847396302636,
 0.38785838987903287,
 0.7512082317082394,
 0.01996972570316713,
 0.9091591792005235,
 0.9571653510129516,
 0.970081410544769,
 0.8110571375628545,
 0.767777602626479,
 0.004304751797525763,
 0.025612584336068056,
 0.9569288953896451,
 0.1102781177371418,
 0.1364418203138934,
 0.6532605607683032,
 0.7085348476381472,
 0.43100954436321315,
 0.6827387809870535,
 0.12364545725637299,
 0.2714544472715984,
 0.3278874432234109,
 0.3090069495682727,
 0.8541356700795513,
 0.36674846863821664,
 0.6864999319115815,
 0.009982931469466716,
 0.557883456782722,
 0.6607395714233939,
 0.004545581167436641,
 0.3839793657415965,
 0.20302873744808092,
 0.411410717132

In [39]:
#Se buscará cual de los vectores que ya existen en la base de datos está "más cerca" al anterior vector creado
from IPython.display import display, Markdown
def print_pc(output):
    display(Markdown(str(output)))
print_pc(index.query(vector=query_vector, top_k=3, include_values=False)) #los 3 más cercanos (los únicos que quedan realmente)

QueryResponse(matches=[{'id': 'c', 'score': 0.752654612, 'values': []}, {'id': 'a', 'score': 0.75031, 'values': []}, {'id': 'e', 'score': 0.748941481, 'values': []}], namespace='', usage={'read_units': 1}, _response_info={'raw_headers': {'date': 'Mon, 16 Feb 2026 20:35:56 GMT', 'content-type': 'application/json', 'content-length': '190', 'connection': 'keep-alive', 'x-pinecone-max-indexed-lsn': '4', 'x-pinecone-request-latency-ms': '229', 'x-envoy-upstream-service-time': '68', 'x-pinecone-response-duration-ms': '231', 'grpc-status': '0', 'server': 'envoy'}})

#### **GUARDAR LOS VECTORES CON NAMESPACES** (COMO "ETIQUETAS")

In [None]:
# SE ACTUALIZAN TODOS LOS VECTORES QUE HABÍAN ANTES (SE CREAN LOS BORRADOS Y SE REEMPLAZAN LOS 3 QUE HABÍAN)
import random
index = pc.Index('langchain')
vectors = [[random.random() for _ in range(3072)] for _ in range(5)]
ids = list('abcde')
index.upsert(vectors=zip(ids, vectors))

UpsertResponse(upserted_count=5, _response_info={'raw_headers': {'date': 'Mon, 16 Feb 2026 20:26:17 GMT', 'content-type': 'application/json', 'content-length': '19', 'connection': 'keep-alive', 'x-pinecone-request-lsn': '4', 'x-pinecone-request-logical-size': '61445', 'x-pinecone-request-latency-ms': '546', 'x-envoy-upstream-service-time': '223', 'x-pinecone-response-duration-ms': '548', 'grpc-status': '0', 'server': 'envoy'}})

In [32]:
# SE HACE LO MISMO CON OTROS 3 VECTORES PERO DIFERENTES IDS
index = pc.Index('langchain')
vectors = [[random.random() for _ in range(3072)] for _ in range(3)]
ids = list('xyz')
index.upsert(vectors=zip(ids, vectors), namespace='primer-namespace')  # ETIQUETA A ESTOS 3!!!!!!!

UpsertResponse(upserted_count=3, _response_info={'raw_headers': {'date': 'Mon, 16 Feb 2026 20:28:21 GMT', 'content-type': 'application/json', 'content-length': '19', 'connection': 'keep-alive', 'x-pinecone-request-lsn': '1', 'x-pinecone-request-logical-size': '36867', 'x-pinecone-request-latency-ms': '486', 'x-envoy-upstream-service-time': '243', 'x-pinecone-response-duration-ms': '487', 'grpc-status': '0', 'server': 'envoy'}})

In [34]:
# SE HACE LO MISMO CON OTROS 2 VECTORES PERO DIFERENTES IDS
index = pc.Index('langchain')
vectors = [[random.random() for _ in range(3072)] for _ in range(2)]
ids = list('qp')
index.upsert(vectors=zip(ids, vectors), namespace='segundo-namespace')  # ETIQUETA A ESTOS 2!!!!!!!

UpsertResponse(upserted_count=2, _response_info={'raw_headers': {'date': 'Mon, 16 Feb 2026 20:28:58 GMT', 'content-type': 'application/json', 'content-length': '19', 'connection': 'keep-alive', 'x-pinecone-request-lsn': '1', 'x-pinecone-request-logical-size': '24578', 'x-pinecone-request-latency-ms': '493', 'x-envoy-upstream-service-time': '244', 'x-pinecone-response-duration-ms': '494', 'grpc-status': '0', 'server': 'envoy'}})

In [37]:
index.describe_index_stats()

{'_response_info': {'raw_headers': {'connection': 'keep-alive',
                                    'content-length': '258',
                                    'content-type': 'application/json',
                                    'date': 'Mon, 16 Feb 2026 20:33:36 GMT',
                                    'grpc-status': '0',
                                    'server': 'envoy',
                                    'x-envoy-upstream-service-time': '23',
                                    'x-pinecone-request-latency-ms': '23',
                                    'x-pinecone-response-duration-ms': '24'}},
 'dimension': 3072,
 'index_fullness': 0.0,
 'memoryFullness': 0.0,
 'metric': 'cosine',
 'namespaces': {'__default__': {'vector_count': 5},
                'primer-namespace': {'vector_count': 3},
                'segundo-namespace': {'vector_count': 2}},
 'storageFullness': 0.0,
 'total_vector_count': 10,
 'vector_type': 'dense'}

In [None]:
# AHORA PARA ACCEDER A LOS VECTORES TOCA ESPECIFICAR EL NAMESPACE!!!!!!!! TAMBIÉN PARA BORRAR Y PARA ACTUALIZARLO
index.fetch(ids=['x'], namespace='primer-namespace')

FetchResponse(namespace='primer-namespace', vectors={'x': Vector(id='x', values=[0.839841962, 0.125929415, 0.61792016, 0.357175529, 0.0949481577, 0.204153195, 0.00150983734, 0.669211388, 0.0233016964, 0.596050084, 0.184229583, 0.741789162, 0.160350427, 0.158708364, 0.650001109, 0.784905136, 0.302152932, 0.669761777, 0.591939211, 0.929639578, 0.16148378, 0.785053492, 0.448299855, 0.421170592, 0.253454715, 0.67674458, 0.660872757, 0.0978812873, 0.648304164, 0.612653673, 0.887886405, 0.366991729, 0.0930663943, 0.123942748, 0.849480331, 0.31525138, 0.789750755, 0.300047755, 0.65637362, 0.586585343, 0.56564945, 0.876612782, 0.976136863, 0.00727704028, 0.964666486, 0.107155763, 0.0879944786, 0.399931818, 0.426781267, 0.225690141, 0.902740598, 0.192505896, 0.491298974, 0.61655122, 0.187025443, 0.195168436, 0.55687, 0.741350591, 0.157154679, 0.597896457, 0.468271941, 0.689832091, 0.29387486, 0.184031919, 0.287891, 0.423981488, 0.126259461, 0.809903562, 0.234917074, 0.809699595, 0.996053338, 0.

In [45]:
# SE PUEDEN ELIMINAR TODOS LOS QUE SEAN DE UN MISMO NAMESPACE
index.delete(delete_all=True, namespace='primer-namespace')

{'_response_info': {'raw_headers': {'date': 'Mon, 16 Feb 2026 21:03:02 GMT',
   'content-type': 'application/json',
   'content-length': '2',
   'connection': 'keep-alive',
   'x-pinecone-request-latency-ms': '141',
   'x-envoy-upstream-service-time': '141',
   'x-pinecone-response-duration-ms': '143',
   'grpc-status': '0',
   'server': 'envoy'}}}

In [47]:
index.describe_index_stats()

{'_response_info': {'raw_headers': {'connection': 'keep-alive',
                                    'content-length': '220',
                                    'content-type': 'application/json',
                                    'date': 'Mon, 16 Feb 2026 21:03:28 GMT',
                                    'grpc-status': '0',
                                    'server': 'envoy',
                                    'x-envoy-upstream-service-time': '4',
                                    'x-pinecone-request-latency-ms': '3',
                                    'x-pinecone-response-duration-ms': '5'}},
 'dimension': 3072,
 'index_fullness': 0.0,
 'memoryFullness': 0.0,
 'metric': 'cosine',
 'namespaces': {'__default__': {'vector_count': 5},
                'segundo-namespace': {'vector_count': 2}},
 'storageFullness': 0.0,
 'total_vector_count': 7,
 'vector_type': 'dense'}

## **SPLITTING Y EMBEDDING DE TEXTOS USANDO LANGCHAIN (SIMILARITY SEARCH)**

#### **CARGA DEL LIBRO Y PRE-PROCESAMIENTO**

In [1]:
from langchain_text_splitters import RecursiveCharacterTextSplitter #Se deben dividir los texto que se usen en la base de datos para poder manejarlos/cargaros más fácilmente 
from langchain_community.document_loaders import PyPDFLoader #Para poder leer PDFs

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
loader = PyPDFLoader('HP7-en.pdf')
data_original = loader.load()

In [3]:
# Filtrado: sólo se quedan las páginas que tengan más de 10 caracteres (para evitar ruidos)
data = [doc for doc in data_original if len(doc.page_content.strip()) > 10]
for doc in data:
    # Reemplaza múltiples espacios/tabs por uno solo
    doc.page_content = " ".join(doc.page_content.split())
print(f"Páginas totales originales: {len(data_original)}")
print(f"Páginas útiles después del filtro: {len(data)}")

Páginas totales originales: 768
Páginas útiles después del filtro: 763


#### **SPLITTING**

In [4]:
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=1000,  #Tamaño del texto de cada chunk
    chunk_overlap=150, #Hace que al principio de cada chunk esten 800 caracteres del anterior, para dar continuidad
    length_function=len #Se hace que el chunk sea por longitud
    # Hay una forma de evaluar los chunks https://chunkviz.up.railway.app/
    )

In [5]:
# chunks = text_splitter.create_documents(data) #Se usa create_documents cuando el documento cargado es un archivo de texto por ejemplo (.txt) y por ende se tiene una lista de strings
chunks = text_splitter.split_documents(data)   #En este caso se usa split_documents porque es una lista de objetos tipo Documents -> porque se cargó con PyPDFLoader

In [6]:
chunks # Cada chunk tiene un fragmento del libro que comparte, donde 80 caractéres los comparte con el anterior chunk y 80 más con el siguiente chunk (overlapping) -> excepto el primer y último chunk

[Document(metadata={'producer': 'pdfeTeX-1.21a', 'creator': 'Dark Miasma', 'creationdate': '2007-07-23T04:17:48-07:00', 'author': 'J. K. Rowling', 'title': 'Harry Potter and the Deathly Hallows', 'subject': '', 'keywords': '', 'ptex.fullbanner': 'This is pdfeTeX, Version 3.141592-1.21a-2.2 (Web2C 7.5.4) kpathsea version 3.5.4', 'source': 'HP7-en.pdf', 'total_pages': 768, 'page': 2, 'page_label': 'i'}, page_content='Harry Potter and the Deathly Hallows by J. K. Rowling brought to you by Dark Miasma Special Thanks to the DSB release'),
 Document(metadata={'producer': 'pdfeTeX-1.21a', 'creator': 'Dark Miasma', 'creationdate': '2007-07-23T04:17:48-07:00', 'author': 'J. K. Rowling', 'title': 'Harry Potter and the Deathly Hallows', 'subject': '', 'keywords': '', 'ptex.fullbanner': 'This is pdfeTeX, Version 3.141592-1.21a-2.2 (Web2C 7.5.4) kpathsea version 3.5.4', 'source': 'HP7-en.pdf', 'total_pages': 768, 'page': 3, 'page_label': 'i'}, page_content='The dedication of this book is split seve

In [7]:
# Si se quiere acceder a un chunk se puede hacer:
print(chunks[0].page_content)
print(f'->Hay {len(chunks)} fragmentos')

Harry Potter and the Deathly Hallows by J. K. Rowling brought to you by Dark Miasma Special Thanks to the DSB release
->Hay 1484 fragmentos


#### **EMBEDDING**

EN SERVICIOS DE OPENAI O GOOGLE GENAI estos modelos de embeddings tienen costos por cierta X cantidad de tokens

In [8]:
# EL COSTO PARA OPENAI usando el modelo text-embedding-3-large $0.13 / 1M tokens
import tiktoken
def calculate_embedding_cost(texts):
    enc = tiktoken.encoding_for_model('text-embedding-3-large')
    total_tokens = sum([len(enc.encode(page.page_content)) for page in texts])

    print(f'Total Tokens: {total_tokens}')
    print(f'Embedding Cost in USD: {(total_tokens / 1000000) * 0.13:.6f}')

In [9]:
calculate_embedding_cost(chunks)

Total Tokens: 310562
Embedding Cost in USD: 0.040373


**CREACIÓN DEL EMBEDDING**

In [None]:
#ESTO SIRVE PERO NOMIC-EMBED-TEXT NO ES EL MÁS PRECISO EN LOS DETALLES DEL LIBRO
# from langchain_ollama import OllamaEmbeddings
# #1. Definir los Embeddings con Ollama
# #Usamos bge-m3 para máxima precisión en los detalles del libro
# embeddings = OllamaEmbeddings(model="nomic-embed-text")
# vector = embeddings.embed_query(chunks[0].page_content)
# vector

[0.028827965,
 0.013502842,
 -0.14661655,
 0.014066488,
 0.013694929,
 -0.07409282,
 -0.041747894,
 -0.027459603,
 -0.017519772,
 -0.012651237,
 -0.04028167,
 0.005937742,
 0.07497272,
 0.0008833673,
 0.047357164,
 -0.016440623,
 0.05582094,
 -0.03453134,
 -0.051807296,
 0.10663808,
 -0.016216397,
 -0.037623405,
 -0.056085765,
 -0.057815656,
 0.051122963,
 0.030980177,
 0.014718807,
 0.083621144,
 -0.019464834,
 -0.04650186,
 0.017014762,
 -0.07300637,
 -0.03289408,
 0.011774292,
 0.00927331,
 -0.040242005,
 0.05914094,
 0.03847355,
 0.047237713,
 -0.06642477,
 -0.005351475,
 0.014369494,
 -0.023236265,
 -0.033346817,
 0.038213164,
 -0.008745484,
 0.003666162,
 0.025710708,
 0.044920266,
 -0.056447335,
 -0.012308161,
 0.06386193,
 0.01043182,
 -0.05023294,
 0.019553822,
 0.02215521,
 -0.010132268,
 -0.056826428,
 -0.049963243,
 -0.058587383,
 0.06175284,
 0.026245603,
 -0.001987143,
 0.066843875,
 -0.010558344,
 -0.07186754,
 -0.017088428,
 0.07154725,
 -0.02509467,
 -0.036634404,
 0.0

CON HUGGINGFACE SE PUEDE HACER TAMBIÉN

USAR LANGCHAIN-HUGGINGFACE SERÍA LO IDEAL, PERO ESTO ROMPE CON VARIAS LIBRERÍAS QUE YA HAY INSTALADA, POR ESO SE USARÁ from langchain_community.embeddings import HuggingFaceEmbeddings (PRONTO SE DEPRECARÁ)

In [10]:
import os
os.getenv("HUGGING_FACE_TOKEN")

In [11]:
from langchain_community.embeddings import HuggingFaceEmbeddings

# Solo se ejecuta si 'embeddings' no está definido en el entorno
if 'embeddings' not in globals():    
    print("Cargando modelo en la GPU por primera vez...")
    embeddings = HuggingFaceEmbeddings(
        model_name="BAAI/bge-large-en-v1.5", #intfloat/multilingual-e5-large
        model_kwargs={'device': 'cuda'},
        encode_kwargs={'normalize_embeddings': True}
    )
else:
    print("El modelo ya está en memoria. Saltando carga.")

Cargando modelo en la GPU por primera vez...


  embeddings = HuggingFaceEmbeddings(
Loading weights: 100%|██████████| 391/391 [00:00<00:00, 510.42it/s, Materializing param=pooler.dense.weight]                               
[1mBertModel LOAD REPORT[0m from: BAAI/bge-large-en-v1.5
Key                     | Status     |  | 
------------------------+------------+--+-
embeddings.position_ids | UNEXPECTED |  | 

[3mNotes:
- UNEXPECTED[3m	:can be ignored when loading from different task/architecture; not ok if you expect identical arch.[0m


In [12]:
vector = embeddings.embed_query(chunks[0].page_content)
vector

[-0.011358333751559258,
 -0.012684406712651253,
 -0.0029765961226075888,
 0.009096258319914341,
 -0.022769659757614136,
 -0.014648337848484516,
 0.0251089408993721,
 -0.0121936509385705,
 0.018395399674773216,
 0.010056093335151672,
 -0.02749980054795742,
 -0.013700584881007671,
 0.024080907925963402,
 -0.01319883856922388,
 -0.04251750558614731,
 -0.05359192565083504,
 -0.030079545453190804,
 -0.015234952792525291,
 -0.01896936073899269,
 -0.0030086792539805174,
 0.009448254480957985,
 0.030642559751868248,
 -0.044418346136808395,
 -0.00975953321903944,
 -0.0035273616667836905,
 0.04430333524942398,
 0.004916141740977764,
 -0.006084873806685209,
 0.08311057090759277,
 0.04743274301290512,
 0.006157512776553631,
 0.01034944411367178,
 0.033786192536354065,
 -0.021066244691610336,
 0.031226998195052147,
 0.004862761590629816,
 0.02789837308228016,
 -0.02770392782986164,
 0.016376711428165436,
 -0.02503683976829052,
 0.04907571151852608,
 -0.005358464550226927,
 0.053031615912914276,
 0.

#### **SE INSERTA EL VECTOR A PINECONE**

In [None]:
#pip3 install -U langchain-pinecone --no-deps

In [None]:
import os
import pinecone
from langchain_community.vectorstores import Pinecone
from dotenv import load_dotenv
load_dotenv()
os.getenv("PINECONE_API_KEY")

In [14]:
pc = pinecone.Pinecone()

Si se tiene el index de las pruebas anteriores al probar Pinecone con los vectores y namespaces que se crearon, se procede a limpiarlo

In [15]:
indexes= pc.list_indexes().names()
for i in indexes:
    print('Borrando los indices ...', end='')
    pc.delete_index(i)
    print('Listo..')

![image.png](attachment:image.png)

**SE CREAL EL NUEVO INDEX EN PINECODE**

In [16]:
from pinecone import ServerlessSpec # Importación moderna
index_name = 'harry-potter-7'

In [17]:
if index_name not in pc.list_indexes().names():
    print(f'Creando el índice {index_name}...')
    pc.create_index(
        name=index_name,
        dimension=1024,   # Dimensiones exactas de tu BGE-Large local
        metric='cosine',  # Ideal para modelos BGE
        spec=ServerlessSpec(
            cloud='aws',    # O 'gcp' según tu preferencia
            region='us-east-1' # Región del plan gratuito actual
        )
    )
    print('✅ Índice Creado con éxito')
else:
    print(f'ℹ️ El índice {index_name} ya existe!')

Creando el índice harry-potter-7...
✅ Índice Creado con éxito


In [18]:
# NO SE USA EL Pinecone.from_documents(chunks, embeddings, index_name=index_name) PORQUE YA ESTÁ DEPRECADO Y GENERA ERRORES!
from langchain_pinecone import PineconeVectorStore
vector_store = PineconeVectorStore.from_documents(documents=chunks,embedding=embeddings,index_name=index_name) #crea los embeddings y los guarda en pinecone

![image.png](attachment:image.png)

In [19]:
index = pc.Index(index_name)
index.describe_index_stats()

{'_response_info': {'raw_headers': {'connection': 'keep-alive',
                                    'content-length': '188',
                                    'content-type': 'application/json',
                                    'date': 'Tue, 17 Feb 2026 20:00:09 GMT',
                                    'grpc-status': '0',
                                    'server': 'envoy',
                                    'x-envoy-upstream-service-time': '3',
                                    'x-pinecone-request-latency-ms': '3',
                                    'x-pinecone-response-duration-ms': '5'}},
 'dimension': 1024,
 'index_fullness': 0.0,
 'memoryFullness': 0.0,
 'metric': 'cosine',
 'namespaces': {'__default__': {'vector_count': 1484}},
 'storageFullness': 0.0,
 'total_vector_count': 1484,
 'vector_type': 'dense'}

#### **PREGUNTAS DE SIMILITUD**

In [20]:
question = "How did Ron and Hermione kiss?"
result = vector_store.similarity_search(question)
print(result)

[Document(id='417d9dd9-8724-4ce0-b0a4-dceac8374903', metadata={'author': 'J. K. Rowling', 'creationdate': '2007-07-23T04:17:48-07:00', 'creator': 'Dark Miasma', 'keywords': '', 'page': 123, 'page_label': '116', 'producer': 'pdfeTeX-1.21a', 'ptex.fullbanner': 'This is pdfeTeX, Version 3.141592-1.21a-2.2 (Web2C 7.5.4) kpathsea version 3.5.4', 'source': 'HP7-en.pdf', 'subject': '', 'title': 'Harry Potter and the Deathly Hallows', 'total_pages': 768}, page_content='honest.” “There’s the silver lining I’ve been looking for,” she whispered, and then she was kissing him as she had never kissed him before, and Harry was kissing her back, and it was blissful oblivion better than ﬁrewhisky; she was the only real thing in the world, Ginny, the feel of her, one hand at her back and one in her long, sweet- smelling hair — The door banged open behind them and they jumped apart. “Oh,” said Ron pointedly. “Sorry.” “Ron!” Hermione was just behind him, slightly out of breath. There was a strained silenc

In [21]:
from IPython.display import display, Markdown
for r in result:
    display(Markdown(r.page_content))
    print('-'*70)

honest.” “There’s the silver lining I’ve been looking for,” she whispered, and then she was kissing him as she had never kissed him before, and Harry was kissing her back, and it was blissful oblivion better than ﬁrewhisky; she was the only real thing in the world, Ginny, the feel of her, one hand at her back and one in her long, sweet- smelling hair — The door banged open behind them and they jumped apart. “Oh,” said Ron pointedly. “Sorry.” “Ron!” Hermione was just behind him, slightly out of breath. There was a strained silence, then Ginny said in a ﬂat little voice, “Well, happy birthday anyway, Harry.” 116

----------------------------------------------------------------------


The Battle of Hogwarts “Who?” asked Hermione. “The house-elves, they’ll all be down in the kitchen, won’t they?” “You mean we ought to get them ﬁghting?” asked Harry. “No,” said Ron seriously, “I mean we should tell them to get out. We don’t want anymore Dobbies, do we? We can’t order them to die for us — “ There was a clatter as the basilisk fangs cascaded out of Her- mione’s arms. Running at Ron, she ﬂung them around his neck and kissed him full on the mouth. Ron threw away the fangs and broomstick he was holding and responded with such enthusiasm that he lifted Hermione oﬀ her feet. “Is this the moment?” Harry asked weakly, and when nothing happened except that Ron and Hermione gripped each other still more ﬁrmly and swayed on the spot, he raised his voice. “Oi! There’s a war going on here!” Ron and Hermione broke apart, their arms still around each other. “I know, mate,” said Ron, who looked as though he had recently been hit on the back of the head with a Bludger, “so it’s now or

----------------------------------------------------------------------


Chapter 19 canvas. Hermione slipped out of her bunk and moved like a sleepwalker toward Ron, her eyes upon his pale face. She stopped right in front of him, her lips slightly parted, her eyes wide. Ron gave a weak, hopeful smile and half raised his arms. Hermione launched herself forward and started punching every inch of him that she could reach. “Ouch — ow — gerroﬀ! What the — ? Hermione — OW!” “You — complete — arse — Ronald — Weasley!” She punctuated every word with a blow: Ron backed away, shielding his head as Hermione advanced. “You — crawl — back — here — after — weeks — and — weeks — oh, where’s my wand ?” She looked as though ready to wrestle it out of Harry’s hands and he reacted instinctively. “Protego!!” The invisible shield erupted between Ron and Hermione. The force of it knocked her backward onto the ﬂoor. Spitting hair out of her mouth, she leapt up again. “Hermione!” said Harry. “Calm — ” “I will not calm down!” she screamed. Never before had he seen her lose control

----------------------------------------------------------------------


The Battle of Hogwarts Harry’s eyes dropped to the objects clutched in Ron and Her- mione’s arms: great curved fangs, torn, he now realized, from the skull of a dead basilisk. “But how did you get in there?” he asked, staring from the fangs to Ron. “You need to speak Parseltongue!” Ron made a horrible strangled hissing noise. “It’s what you did to open the locket,” he told Harry apologet- ically. “I had to have a few goes to get it right, but,” he shrugged modestly, “we got there in the end.” “He was amazing!” said Hermione, “Amazing!” “So . . . ” Harry was struggling to keep up. “So . . . ” “So we’re another Horcrux down,” said Ron, and from under his jacket he pulled the mangled remains of Huﬄepuﬀ’s cup. “Her- mione stabbed it. Thought she should. She hasn’t had the pleasure yet.” “Genius!” yelled Harry. “It was nothing,” said Ron, though he looked delighted with himself. “So what’s new with you?” As he said it, there was an explosion from overhead: All three of them looked up as

----------------------------------------------------------------------


In [22]:
question = "How did Harry find the sword?"
result = vector_store.similarity_search(question)
print(result)

[Document(id='055ed8d3-e158-4d6f-b04b-a451855b7ccf', metadata={'author': 'J. K. Rowling', 'creationdate': '2007-07-23T04:17:48-07:00', 'creator': 'Dark Miasma', 'keywords': '', 'page': 547, 'page_label': '540', 'producer': 'pdfeTeX-1.21a', 'ptex.fullbanner': 'This is pdfeTeX, Version 3.141592-1.21a-2.2 (Web2C 7.5.4) kpathsea version 3.5.4', 'source': 'HP7-en.pdf', 'subject': '', 'title': 'Harry Potter and the Deathly Hallows', 'total_pages': 768}, page_content='“Where’s the sword? It had the cup on it!” The clanking on the other side of the door was growing deafening — it was too late — “There!” It was Griphook who had seen it and Griphook who lunged, and in that instant Harry knew that the goblin had never expected them to keep their word. One hand holding tightly to a ﬁstful of Harry’s hair, to make sure he did not fall into the heaving sea of burning gold, Griphook seized the hilt of the sword and swung it high out of Harry’s reach. The tiny golden cup, skewered by the handle on the

In [23]:
for r in result:
    display(Markdown(r.page_content))
    print('-'*70)

“Where’s the sword? It had the cup on it!” The clanking on the other side of the door was growing deafening — it was too late — “There!” It was Griphook who had seen it and Griphook who lunged, and in that instant Harry knew that the goblin had never expected them to keep their word. One hand holding tightly to a ﬁstful of Harry’s hair, to make sure he did not fall into the heaving sea of burning gold, Griphook seized the hilt of the sword and swung it high out of Harry’s reach. The tiny golden cup, skewered by the handle on the sword’s blade was ﬂung into the air. The goblin astride him, Harry dived and caught it, and although he could feel it scalding his ﬂesh he did not relinquish it, even while countless 540

----------------------------------------------------------------------


at the rope’s tough ﬁbers to work the knots free. From upstairs they heard Bellatrix’s voice. “I’m going to ask you again! Where did you get this sword? Where?” “We found it — we found it — PLEASE!” Hermione screamed again; Ron struggled harder than ever, and the rusty nail slipped onto Harry’s wrist. “Ron, please stay still!” Luna whispered. “I can’t see what I’m doing — “ “My pocket!” said Ron, “In my pocket, there’s a Deluminator, and it’s full of light!” 464

----------------------------------------------------------------------


Chapter 19 known that the doe was benign, he knew that Ron had to be the one to wield the sword. Dumbledore had at least taught Harry something about certain kinds of magic, of the incalculable power of certain acts. “I’m going to open it,” said Harry, “and you stab it. Straight- away, okay? Because whatever’s in there will put up a ﬁght. The bit of Riddle in the diary tried to kill me.” “Hou are you going to open it?” asked Ron. He looked terriﬁed. “I’m going to ask it to open, using Parseltongue,” said Harry. The answer came so readily to his lips that he thought he had always known it deep down: Perhaps it had taken his recent en- counter with Nagini to make him realize it. He looked at the serpentine S inlaid with glittering green stones: It was easy to visualize it as a minuscule snake, curled upon the cold rock. “No!” said Ron. “No, don’t open it! I’m serious!” “Why not?” asked Harry. “Let’s get rid of the damn thing, it’s been months — ” “Because that thing’s bad for me!” said

----------------------------------------------------------------------


Chapter 19 drawn Hermione to this spot, or was the doe, which he had taken to be a Patronus, some kind of guardian of the pool? Or had the sword been put into the pool after they had arrived, precisely because they were here? In which case, where was the person who had wanted to pass it to Harry? Again he directed the wand at the surrounding trees and bushes, searching for a human outline, for the glint of an eye, but he could not see anyone there. All the same, a little more fear leavened his exhilaration as he returned his attention to the sword reposing upon the bottom of the frozen pool. He pointed the want at the silvery shape and murmured, “ Accio Sword.” It did not stir. He had not expected it to. If it had been that easy, the sword would have lain on the ground for him to pick up, not in the depths of a frozen pool. He set oﬀ around the circle of ice, thinking hard about the last time the sword had delivered itself to him. He had been in terrible danger then, and had asked for

----------------------------------------------------------------------


In [26]:
question = "What happen to Dobby?"
result = vector_store.similarity_search(question)
print(result)

[Document(id='13551d28-3200-47f2-a4cf-442750bdcfd7', metadata={'author': 'J. K. Rowling', 'creationdate': '2007-07-23T04:17:48-07:00', 'creator': 'Dark Miasma', 'keywords': '', 'page': 482, 'page_label': '475', 'producer': 'pdfeTeX-1.21a', 'ptex.fullbanner': 'This is pdfeTeX, Version 3.141592-1.21a-2.2 (Web2C 7.5.4) kpathsea version 3.5.4', 'source': 'HP7-en.pdf', 'subject': '', 'title': 'Harry Potter and the Deathly Hallows', 'total_pages': 768}, page_content='around. The little elf stood feet from him. “DOBBY!” The elf swayed slightly, stars reﬂected in his wide, shining eyes. Together, he and Harry looked down at the silver hilt of the knife protruding from the elf’s heaving chest. “Dobby — no — HELP!” Harry bellowed toward the cottage, to- ward the people moving there. “HELP!” He did not know or care whether they were wizards or Mug- gles, friends or foes; all he cared about was that a dark stain was spreading across Dobby’s front, and that he had stretched out his own arms to Harr

In [27]:
for r in result:
    display(Markdown(r.page_content))
    print('-'*70)

around. The little elf stood feet from him. “DOBBY!” The elf swayed slightly, stars reﬂected in his wide, shining eyes. Together, he and Harry looked down at the silver hilt of the knife protruding from the elf’s heaving chest. “Dobby — no — HELP!” Harry bellowed toward the cottage, to- ward the people moving there. “HELP!” He did not know or care whether they were wizards or Mug- gles, friends or foes; all he cared about was that a dark stain was spreading across Dobby’s front, and that he had stretched out his own arms to Harry with a look of supplication. Harry caught him and laid him sideways on the cool grass. “Dobby, no, don’t die, don’t die — ” The elf’s eyes found him, and his lips trembled with the eﬀort 475

----------------------------------------------------------------------


The door slammed shut and at the same moment a loud crack echoed inside the cellar. Ron clicked the Deluminator. Three balls of light ﬂew back into the air from his pocket, revealing Dobby the house-elf, who had just Apparated into their midst. “DOB — !” Harry hit Ron on the arm to stop him shouting, and Ron looked terriﬁed at his mistake. Footsteps crossed the ceiling overhead: Draco marching Griphook to Bellatrix. Dobby’s enormous, tennis — ball shaped eyes were wide; he was trembling from his feet to the tips of his ears. He was back in the home of his old masters, and it was clear that he was petriﬁed. “Harry Potter,” he squeaked in the tiniest quiver of a voice, “Dobby has come to rescue you.” 467

----------------------------------------------------------------------


Chapter 24 The Wandmaker I t was like sinking into an old nightmare; for an instant Harry knelt again beside Dumbledore’s body at the foot of the tallest tower at Hogwarts, but in reality he was staring at a tiny body curled upon the grass, pierced by Bellatrix’s sil- ver knife. Harry’s voice was still saying, “Dobby . . . Dobby . . . ” even though he knew that the elf had gone where he could not call him back. After a minute or so he realized that they had, after all, come to the right place, for here were Bill and Fleur, Dean and Luna, gathering around him as he knelt over the elf. “Hermione,” he said suddenly. “Where is she?” “Ron’s taken her inside,” said Bill. “She’ll be all right.” Harry looked back down at Dobby. He stretched out a hand and pulled the sharp blade from the elf’s body, then dragged oﬀ his own jacket and covered Dobby in it like a blanket. The sea was rushing against the rock somewhere nearby; Harry listened to it while the others talked, discussing matters in

----------------------------------------------------------------------


Chapter 23 “Dobby!” she screamed and even Bellatrix froze. “You! You dropped the chandelier — ?” The tiny elf trotted into the room, his shaking ﬁnger pointing at his old mistress. “You must not hurt Harry Potter,” he squeaked. “Kill him, Cissy!” shrieked Bellatrix, but there was another loud crack, and Narcissa’s wand too ﬂew into the air and landed on the other side of the room. “You dirty little monkey!” bawled Bellatrix. “How dare you take a witch’s wand, how dare you defy your masters?” “Dobby has no master!” squealed the elf. “Dobby is a free elf, and Dobby has come to save Harry Potter and his friends!” Harry’s scar was blinding him with pain. Dimly he knew that they had moments, seconds before Voldemort was with them. “Ron, catch — and GO!” he yelled, throwing one of the wands to him; then he bent down to tug Griphook out from under the chandelier. Hoisting the groaning goblin, who still clung to the sword, over one shoulder, Harry seized Dobby’s hand and spun on the spot to

----------------------------------------------------------------------


## **USAR LOS TEXTOS DE SIMILITUD DE PINECONE PARA RESPONDER EN NATURAL LANGUAGE USANDO LLM**

In [58]:
retriever = vector_store.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 5}
)

In [68]:
from langchain_community.chat_models import ChatOllama
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser

llm = ChatOllama(
    model="qwen2.5:7b", # 
    temperature=0
)

prompt = ChatPromptTemplate.from_template("""
Responde la pregunta usando el contexto (No diga "Usando el contexto proporcionado").
Si no está en el contexto, responde según tu conocimiento.
                                          

Contexto:
{context}

Pregunta:
{question}
""")

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

qa_chain = (
    {
        "context": retriever | format_docs,
        "question": lambda x: x
    }
    | prompt
    | llm
    | StrOutputParser()
)

In [69]:
qa_chain.invoke("Qué le pasó a Dobby?")

'Dobby, el elfo doméstico, sufrió una herida grave que resultó fatal. Según el contexto, Dobby estaba ayudando a Harry Potter y sus amigos en una situación peligrosa cuando fue herido gravemente. Un cuchillo se clavó en su pecho mientras intentaba proteger a Harry de Voldemort. Aunque Harry intentó salvarlo gritando por ayuda, un oscuro manchón se extendía por la frente del elfo, indicando que estaba muriendo. Finalmente, Dobby murmuró "Harry Potter" antes de exhalar su último aliento, dejando a Harry devastado y desesperado para que no muriera.'

In [70]:
qa_chain.invoke("Quién mató a Dobby?")

'Según el contexto proporcionado, Dobby fue asesinado por Bellatrix Lestrange. Esto se puede inferir del pasaje que menciona: "together he and Harry looked down at the silver hilt of the knife protruding from the elf’s heaving chest", y posteriormente se describe cómo Dobby estaba cubierto con la chaqueta de Harry, sugiriendo que ya había fallecido. Además, en otro fragmento se menciona explícitamente: "Dobby — no — HELP!"... "The elf\'s enormous, tennis-ball shaped eyes were wide; he was trembling from his feet to the tips of his ears. He was back in the home of his old masters, and it was clear that he was petrified." Luego, Harry saca el cuchillo de Dobby y cubre su cuerpo con su chaqueta, lo que indica claramente que Dobby había muerto.'

In [74]:
qa_chain.invoke("How did Ron and Hermione kiss?")


'Ron and Hermione kissed passionately, as described in the context. Specifically, it states: "Running at Ron, she flung them around his neck and kissed him full on the mouth. Ron threw away the fangs and broomstick he was holding and responded with such enthusiasm that he lifted Hermione off her feet." This indicates a very enthusiastic and intense kiss between them.'