![wompi](Wompi.png)
# **Prueba Técnica - Ingeniero IA**
## Prueba Analítica: *Agente IA pasarela de pagos*
### Ingeniero de IA:

* Daniel Felipe Pérez Grajales . dfperezg@unal.edu.co<br>

<br><br>


---
<br>

**Objetivo:**

Construir un sistema básico de RAC (Retrieval- Augmented Generation) que permita responder preguntas sobre un documento Usando *LangChain*, un *LLM* y un *vector store*.

**Instrucciones**

Se te entrega el archivo *bre_b.txt* con información sobre el sistema de pagos inmeditos en Colombia.
Debes construir un sistema que permita responder preguntas sobre su contenido mediante un LLM.

**Entregables**

Debes entregar un archivo Jupyter Notebook (.ipynb) funcional que cumpla con estos pasos:


* Carga del documento  
* Segmentación del texto(chunking)
* Generación de embeddings y almacenamiento en un vector store.
* uso de un LLM.
* Prompt de contexto.
* Sección realizar preguntas al documento que responda con referencia a los chunks recuperado/utilizados.

crear un agente IA en python funcional que cumpla con estos pasos:

* Carga del documento  
* Segmentación del texto(chunking)
* Generación de embeddings y almacenamiento en un vector store.
* uso de un LLM.
* Prompt de contexto.
* Sección realizar preguntas al documento que responda con referencia a los chunks recuperado/utilizados.

**Recomendaciones**

* Puedes utilizar el LLM de tu referencia. Se recomienda utilizar alguno open source mediante Hugging Face u Open Router.
*  Puedes usar ek vector store de tu preferencia, local u externo.


--------

<br>
Solución agente IA:

0. Carga de Módulos.<br>
1. Carga del documento.<br>
2. Segmentación del texto(chunking).<br>
3. Generación de embeddings y almacenamiento en un vector store.<br>
4. uso de un LLM.<br>
5. Prompt de contexto.<br>
6. Sección realizar preguntas al documento que responda con referencia a los chunks recuperado/utilizados.

### o. Carga de Modulos requeridos

In [1]:
!pip install transformers torch accelerate gradio langchain chromadb sentence_transformers bitsandbytes



In [2]:
!pip install -U langchain-community



In [3]:
from langchain.document_loaders import TextLoader
from langchain.vectorstores import Chroma
from langchain.embeddings import OpenAIEmbeddings
from langchain.text_splitter import RecursiveCharacterTextSplitter

### 1. Carga de documento

In [4]:
loader = TextLoader(r'/content/bre-b.txt', encoding='latin1')
documents = loader.load()
documents

[Document(metadata={'source': '/content/bre-b.txt'}, page_content='La interoperabilidad bancaria en Colombia ha ganado relevancia en los últimos años. Pero ¿qué significa exactamente y cómo hace parte del día a día de las personas?\xa0\n¿Qué es la interoperabilidad bancaria?\nLa interoperabilidad en el sistema financiero es la capacidad de hacer transacciones financieras de manera fluida y eficiente a través de la interconexión entre diferentes entidades que hacen parte de la industria financiera.\xa0\n\xa0Imagina que tienes una cuenta en el\xa0Banco A, pero necesitas hacer un pago o transferencia a alguien que tiene una cuenta en el\xa0Banco B. Antes, este proceso podía ser complicado y lento debido a los sistemas y procesos de cada banco.\xa0\xa0\n\xa0Por medio de la interoperabilidad, puedes hacer esta transacción de manera rápida y sencilla, sin importar en qué entidad tengas tu cuenta. Este concepto no es nuevo en el país; ejemplos como\xa0Transfiya\xa0y\xa0PSE\xa0demuestran que l

### 2.Segmentación del texto(chunking).

In [5]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_documents(documents)
texts

[Document(metadata={'source': '/content/bre-b.txt'}, page_content='La interoperabilidad bancaria en Colombia ha ganado relevancia en los últimos años. Pero ¿qué significa exactamente y cómo hace parte del día a día de las personas?\xa0\n¿Qué es la interoperabilidad bancaria?\nLa interoperabilidad en el sistema financiero es la capacidad de hacer transacciones financieras de manera fluida y eficiente a través de la interconexión entre diferentes entidades que hacen parte de la industria financiera.\xa0\n\xa0Imagina que tienes una cuenta en el\xa0Banco A, pero necesitas hacer un pago o transferencia a alguien que tiene una cuenta en el\xa0Banco B. Antes, este proceso podía ser complicado y lento debido a los sistemas y procesos de cada banco.\xa0\xa0\n\xa0Por medio de la interoperabilidad, puedes hacer esta transacción de manera rápida y sencilla, sin importar en qué entidad tengas tu cuenta. Este concepto no es nuevo en el país; ejemplos como\xa0Transfiya\xa0y\xa0PSE\xa0demuestran que l

### 3. Generación de embeddings y almacenamiento en un vector store.

In [6]:
from langchain.embeddings import HuggingFaceEmbeddings
embedding = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2",
)

  embedding = HuggingFaceEmbeddings(
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


### vectorizar texto

In [7]:
vectordb = Chroma.from_documents(texts, embedding)
vectordb


<langchain_community.vectorstores.chroma.Chroma at 0x7c31e2d9f150>

# Realizar una búsqueda simple en el documento por similitud

In [8]:
# **Search**
query = "¿Qué es la interoperabilidad bancaria?"
results = vectordb.similarity_search(query, k=3)
for result in results:
    print(f"Document: {result.page_content}")

Document: Latinoamérica es una región que se ha caracterizado por tener un amplio uso del efectivo y porque muchas personas aún no tienen una cuenta en el banco o en billeteras digitales como Nequi, pero esta realidad ha cambiado y cada vez son más las posibilidades para que los pagos se hagan en minutos y sin complicaciones.
Dentro de este contexto, las transacciones en línea también juegan un papel importante, con pocos clics pagas el recibo de la luz, alguna compra en internet o disfrutas de tu película favorita. La facilidad con la que se hacen estos pagos y cómo lo usamos en la vida diaria ha hecho que las empresas del sector financiero hablen cada vez más de interoperabilidad.
¿Interoperabilidad? ¿Eso qué es?
Document: Muchas veces, las transferencias entre cuentas bancarias pueden demorarse días y, si haces tus transacciones los fines de semana o festivos, deberás esperar hasta el lunes o martes para que sea efectiva. Así, que aprovecha las ventajas que te dará Bre-B para mover 

### 4. uso de un LLM.

In [9]:
#Login to Hugginface
!huggingface-cli login


    _|    _|  _|    _|    _|_|_|    _|_|_|  _|_|_|  _|      _|    _|_|_|      _|_|_|_|    _|_|      _|_|_|  _|_|_|_|
    _|    _|  _|    _|  _|        _|          _|    _|_|    _|  _|            _|        _|    _|  _|        _|
    _|_|_|_|  _|    _|  _|  _|_|  _|  _|_|    _|    _|  _|  _|  _|  _|_|      _|_|_|    _|_|_|_|  _|        _|_|_|
    _|    _|  _|    _|  _|    _|  _|    _|    _|    _|    _|_|  _|    _|      _|        _|    _|  _|        _|
    _|    _|    _|_|      _|_|_|    _|_|_|  _|_|_|  _|      _|    _|_|_|      _|        _|    _|    _|_|_|  _|_|_|_|

    A token is already saved on your machine. Run `huggingface-cli whoami` to get more information or `huggingface-cli logout` if you want to log out.
    Setting a new token will erase the existing one.
    To log in, `huggingface_hub` requires a token generated from https://huggingface.co/settings/tokens .
Enter your token (input will not be visible): 
Add token as git credential? (Y/n) n
Token is valid (permission: read)

In [10]:
!huggingface-cli whoami

dfperezg
[1morgs: [0m The0rganization


In [11]:
import transformers
from transformers import AutoTokenizer
import torch
from torch import cuda, bfloat16

### Se Establezca la configuración de cuantificación para un menor uso de memoria de la GPU

In [12]:
bnb_config = transformers.BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_quant_type='nf4',
    bnb_4bit_use_double_quant=True,
    bnb_4bit_compute_dtype=bfloat16
)

Carga de modelos Free LLM Huggis face

In [37]:
model_id = "facebook/bart-large-cnn"#"google-bert/bert-base-uncased""facebook/bart-large-cnn" posibles modelos free LLMs

model_config = transformers.AutoConfig.from_pretrained(
    model_id,
)
model = transformers.AutoModelForCausalLM.from_pretrained(
    model_id,
    trust_remote_code=True,
    config=model_config,
    quantization_config=bnb_config,
    device_map='auto',
)

tokenizer = AutoTokenizer.from_pretrained(model_id, use_auth_token=True)



### 5. Prompt de contexto.

In [38]:
from langchain.llms import HuggingFacePipeline

llm = HuggingFacePipeline(pipeline=pipeline)

In [16]:
llm(prompt="What is Sentiment analysis")

  llm(prompt="What is Sentiment analysis")


'What is Sentiment analysis overra SheoTheseraoo youo oneraorao dorara over downase over over do over over over down over over Take over over their over over only over over one over over at down over only down over at over over a one over at only over do one over down at over do at over at do over do just only over onlyke over do down over down/ over over is over atather over at/ down over Che over overashaterash over at atater over over Che at at overash Che down Che downater downateraterash Che over ataterater overater over Cheaterashaterker Cheater Che over'

Inicializar cadena

In [39]:
from langchain.chains import RetrievalQA

### 6. Sección realizar preguntas al documento que responda con referencia a los chunks recuperado/utilizados.

In [40]:
retriever = vectordb.as_retriever()

retrieve = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    verbose=True
)

In [41]:
def rag(qa, query):
    print(f"Query: {query}\n")
    result = qa.run(query)
    print("\nResult: ", result)

In [42]:
prompt = "¿Qué es la interoperabilidad bancaria?"
rag(retrieve, prompt)

Query: ¿Qué es la interoperabilidad bancaria?



[1m> Entering new RetrievalQA chain...[0m


TypeError: unhashable type: 'list'

Fin
------------