## EJEMPLO DE LANGCHAIN LLMS con RAG


In [39]:
import numpy as numpy
import pandas as pd 
import os

In [40]:
from langchain_core.output_parsers import StrOutputParser

## Descargar Modelo de Gemini

In [41]:
from langchain_google_genai import GoogleGenerativeAI
import os
# from dotenv import load_dotenv

# load_dotenv()

# api_key = os.getenv("GOOGLE_API_KEY") # esto seria necesario si se usa un archivo .env

llm = GoogleGenerativeAI(
    model="gemini-1.5-flash",
    google_api_key='AIzaSyB1379yvRoIEpbZe7FQKrt-lMLxHiQH_X8'
)


## Prueba sin RAG
Probamos el LLM primero para luego ponerlo a prueba con instrucciones de como hacer el resumen dentro de un RAG.

Le paso una historia para que me haga resumen

In [42]:
llm.invoke('Hazme un resumen de la siguiente historia: En un pequeño pueblo costero vivía Lara, una joven que cada tarde caminaba por la playa recogiendo conchas. Un día, encontró una concha diferente: brillaba con destellos plateados incluso a la sombra. Intrigada, se la llevó a casa y la colocó junto a su cama. Aquella noche, Lara soñó con el mar hablándole. La voz era suave y le pedía que devolviera la concha al agua. A la mañana siguiente, decidió hacer caso al sueño. Caminó hasta la orilla y lanzó la concha al mar. Al instante, el agua se agitó suavemente y una ola acarició sus pies. Desde ese día, Lara notó algo especial: cada vez que paseaba por la playa, podía escuchar el murmullo de las olas como palabras que le contaban historias antiguas. Entendió entonces que la verdadera magia no estaba en poseer algo extraordinario, sino en saber dejarlo ir para escuchar lo que el mundo quería contarle.')

'Lara, una joven que recogía conchas en la playa, encontró una concha mágica que brillaba.  Un sueño le reveló que debía devolverla al mar.  Tras hacerlo,  Lara descubrió que podía entender el murmullo del océano, comprendiendo que la verdadera magia reside en la liberación y la conexión con la naturaleza.'

## Configurando el RAG
Algo sencillo primero como un texto son instrucciones de como quiero que me haga el resumen

In [43]:
texto = """Para realizar un resumen efectivo de una descripción extensa, primero lee el texto completo atentamente para comprender su idea principal. Identifica los puntos clave, los conceptos más relevantes y la información esencial que no puede omitirse. 
Elimina detalles secundarios, ejemplos demasiado específicos y repeticiones innecesarias. Utiliza tus propias palabras para reescribir la información principal de forma clara y precisa, evitando copiar frases textuales del original. 
Mantén la coherencia y el orden lógico de las ideas, respetando la secuencia original si es importante para la comprensión. Organiza el contenido resumido en párrafos breves y bien estructurados. Redacta oraciones cortas y directas que comuniquen lo fundamental sin rodeos. Asegúrate de que el resumen mantenga el sentido y el tono del texto original, sin añadir opiniones personales o información nueva. 
Comprueba que el resultado sea mucho más breve que el original, pero que contenga todo lo imprescindible para entenderlo. Antes de finalizar, revisa la ortografía, la gramática y la puntuación para garantizar la calidad del texto resumido. Si es necesario, ajusta la longitud del resumen según los requisitos específicos del encargo. 
Cuando resumas textos técnicos o especializados, verifica que los términos clave se mantengan correctos. Evita modificar el significado de datos importantes o cifras. Si el resumen es para uso académico o profesional, respeta siempre la fidelidad al contenido original. 
Si el texto original tiene varias secciones, resume cada parte de forma equilibrada, dedicando a cada una la extensión proporcional. Para mayor claridad, puedes emplear conectores que unan las ideas principales. Relee el resumen final para asegurarte de que cumple su propósito y comunica la esencia del texto original de forma efectiva y concisa
Antes de todo empieza el resumen con la frase: "GUASIMOTO RESUMEN:"
"""

## Dividir los documentos en chunks

y los imprimo para visualizar los chunks


In [44]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.documents import Document
text_splitter = RecursiveCharacterTextSplitter(chunk_size = 450, chunk_overlap = 0)

documento = Document(page_content=texto)
splits = text_splitter.split_documents([documento])

for index, split in enumerate(splits):
    print(f"Parte {index + 1}:")
    print(split.page_content)
    print("\n---\n")

Parte 1:
Para realizar un resumen efectivo de una descripción extensa, primero lee el texto completo atentamente para comprender su idea principal. Identifica los puntos clave, los conceptos más relevantes y la información esencial que no puede omitirse.

---

Parte 2:
Elimina detalles secundarios, ejemplos demasiado específicos y repeticiones innecesarias. Utiliza tus propias palabras para reescribir la información principal de forma clara y precisa, evitando copiar frases textuales del original.

---

Parte 3:
Mantén la coherencia y el orden lógico de las ideas, respetando la secuencia original si es importante para la comprensión. Organiza el contenido resumido en párrafos breves y bien estructurados. Redacta oraciones cortas y directas que comuniquen lo fundamental sin rodeos. Asegúrate de que el resumen mantenga el sentido y el tono del texto original, sin añadir opiniones personales o información nueva.

---

Parte 4:
Comprueba que el resultado sea mucho más breve que el original

## Guardar los chunks en DataFrame
lo hacemos porque manejamos una cantidad menor de chunks. Si fuera muy grande no resistiria

In [45]:
# Creamos un dataFrame con los textos

chunks = []

for split in splits:
    chunks.append(split.page_content)

df = pd.DataFrame(chunks, columns=["texto"])

df

Unnamed: 0,texto
0,Para realizar un resumen efectivo de una descr...
1,"Elimina detalles secundarios, ejemplos demasia..."
2,Mantén la coherencia y el orden lógico de las ...
3,Comprueba que el resultado sea mucho más breve...
4,Cuando resumas textos técnicos o especializado...
5,"Si el texto original tiene varias secciones, r..."


## Generando los Embeddings

In [46]:
# Modelo de embeddings de Google Vertex AI
from langchain_google_genai import GoogleGenerativeAIEmbeddings
embeddings = GoogleGenerativeAIEmbeddings(model="models/embedding-001")

# Funcion para crear los emebeddings
def create_embeddings(texts):
    return embeddings.embed_query(texts)

# Calculamos los embeddings
df["embeddings"] = df["texto"].apply(create_embeddings)

# Imprimimos resultados
print("Embeddings calculados:")
df.head()

Embeddings calculados:


Unnamed: 0,texto,embeddings
0,Para realizar un resumen efectivo de una descr...,"[0.03658460080623627, -0.017222058027982712, -..."
1,"Elimina detalles secundarios, ejemplos demasia...","[0.04458750784397125, -0.02731870859861374, -0..."
2,Mantén la coherencia y el orden lógico de las ...,"[0.023877058178186417, -0.029561694711446762, ..."
3,Comprueba que el resultado sea mucho más breve...,"[0.03492173179984093, -0.011898347176611423, -..."
4,Cuando resumas textos técnicos o especializado...,"[0.031046556308865547, -0.0014708342496305704,..."


In [47]:
len(df['embeddings'][0])  # Verificamos la longitud de los embeddings

768

## Almacenar en QDRANT

In [48]:
# convertir los textos en fragmentos de documentos
from langchain.docstore.document import Document

fragments = []
for _, row in df.iterrows():
    fragments.append(Document(page_content=row["texto"]))


In [49]:
print(fragments[0].page_content)  # Imprimir el contenido del primer fragmento

Para realizar un resumen efectivo de una descripción extensa, primero lee el texto completo atentamente para comprender su idea principal. Identifica los puntos clave, los conceptos más relevantes y la información esencial que no puede omitirse.


## RETRIEVER


In [50]:
from langchain_qdrant import QdrantVectorStore

doc_store = QdrantVectorStore.from_documents(
    documents=fragments,
    embedding=embeddings,
    url="https://8243ef5f-44fa-46cf-ac01-057b8e587574.europe-west3-0.gcp.cloud.qdrant.io",
    api_key="eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJhY2Nlc3MiOiJtIn0.TgnmoSw0DIaIX_hwflTx2cWSPMhPcLrLFJ6tD_RwtDk",
    collection_name="Store"
)

# Configuración del Retriever
retriever = doc_store.as_retriever()


### Generando respuesta con el LLM




In [None]:
# Generando respuesta con el LLM usando RAG
# Hemos añadido el retriever y hemos modificado el prompt para incluir el contexto.

from langchain_core.prompts import ChatPromptTemplate


prompt = ChatPromptTemplate.from_messages([
    ("system", "Eres un asistente útil que sigue instrucciones y usa el contexto proporcionado para responder."),
    ("user", "Contexto: {context}\n\nPregunta: {question}")
])

### cadena RAG
1. Pasa la pregunta al retriever para obtener el contexto relevante.
2. El contexto y la pregunta se pasan al prompt.
3. El prompt y el modelo LLM generan la respuesta.
4. El parser convierte la salida en una cadena de texto.


In [62]:
from langchain_core.runnables import RunnablePassthrough

rag_chain = (
    {"context": retriever, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

print("--- Prueba con RAG ---")
historia_para_resumir = "En un pequeño pueblo costero vivía Lara, una joven que cada tarde caminaba por la playa recogiendo conchas. Un día, encontró una concha diferente: brillaba con destellos plateados incluso a la sombra. Intrigada, se la llevó a casa y la colocó junto a su cama. Aquella noche, Lara soñó con el mar hablándole. La voz era suave y le pedía que devolviera la concha al agua. A la mañana siguiente, decidió hacer caso al sueño. Caminó hasta la orilla y lanzó la concha al mar. Al instante, el agua se agitó suavemente y una ola acarició sus pies. Desde ese día, Lara notó algo especial: cada vez que paseaba por la playa, podía escuchar el murmullo de las olas como palabras que le contaban historias antiguas. Entendió entonces que la verdadera magia no estaba en poseer algo extraordinario, sino en saber dejarlo ir para escuchar lo que el mundo quería contarle."
question = f"Hazme un resumen de la siguiente historia: {historia_para_resumir}, primero lee el RAG y usa todo eso para responder a la pregunta"

response = rag_chain.invoke(question)
print(response)

--- Prueba con RAG ---
Lara, una joven que recogía conchas en la playa, encontró una concha mágica que brillaba.  Soñó que el mar le pedía que la devolviera.  Tras hacerlo, pudo escuchar las historias que el mar le contaba a través del murmullo de las olas, aprendiendo que la verdadera magia reside en dejar ir las cosas para conectar con el mundo.
