# RAG (Retrieval Augmented Generation) con Mistral

Adaptado y editado por **Etson Ronaldao Rojas Cahuana**.

La generación aumentada por recuperación (RAG) es un marco de IA que sinergiza las capacidades de los modelos de lenguaje de gran escala (LLMs) y los sistemas de recuperación de información. Es útil para responder preguntas o generar contenido aprovechando el conocimiento externo. 
Hay dos pasos principales en RAG: 
1) recuperación: recuperar información relevante de una base de conocimientos con incrustaciones de texto almacenadas en una base de datos de vectores. 
2) generación: insertar la información relevante en el prompt para que el LLM genere información.

## RAG con Mistral y LangChain

Descargar el modelo de: https://mistral.ai/news/announcing-mistral-7b/ 

- mistral-7b-v0.1.tar 
- 13.5GB

O descargarlo directamente desde HuggingFace atraves de un token de acceso gratuito:
https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.1 en este cuaderno usaremos este metodo.

Instalar librerias
```python
!pip install gradio --quiet 
!pip install xformer --quiet 
!pip install chromadb --quiet 
!pip install langchain==0.2.6 --quiet 
!pip install accelerate --quiet 
!pip install transformers --quiet
!pip install bitsandbytes --quiet 
!pip install unstructured --quiet
!pip install -u sentence-transformers --quiet 
!pip install langchain-community langchain-core 
!pip install huggingface_hub 
```

Importar las librerias necesarias

In [1]:
import torch  # Importa la biblioteca PyTorch para machine learning.
#import gradio as gr  # Importa Gradio, una biblioteca para crear interfaces de usuario para modelos de aprendizaje automático.
from textwrap import fill  # Importa la función fill de textwrap para envolver texto en líneas de ancho fijo.
from IPython.display import Markdown, display  # Importa funciones de IPython para mostrar texto en formato Markdown.

from langchain.prompts.chat import ChatPromptTemplate, HumanMessagePromptTemplate, SystemMessagePromptTemplate # python vesrion 3.12.3 !pip install -U pydantic pydantic_core 
from langchain import PromptTemplate  # Importa la clase PromptTemplate de la biblioteca langchain.
from langchain import HuggingFacePipeline  # Importa el pipeline de HuggingFace para procesamiento de lenguaje natural.
from langchain.vectorstores import Chroma  # Importa el almacenamiento de vectores Chroma de langchain.
from langchain.schema import AIMessage, HumanMessage  # Importa clases de esquema para mensajes AI y humanos.
from langchain.memory import ConversationBufferMemory  # Importa la memoria de buffer de conversación de langchain.
from langchain.embeddings import HuggingFaceEmbeddings  # Importa los embeddings de HuggingFace para procesamiento de texto.
from langchain.text_splitter import RecursiveCharacterTextSplitter  # Importa el divisor de texto de caracteres recursivo de langchain.
from langchain.document_loaders import UnstructuredMarkdownLoader, UnstructuredURLLoader  # Importa cargadores de documentos sin estructura de langchain.
from langchain.chains import LLMChain, SimpleSequentialChain, RetrievalQA, ConversationalRetrievalChain

from transformers import  BitsAndBytesConfig, AutoModelForCausalLM, AutoTokenizer, GenerationConfig, pipeline # Importa configuraciones, modelos y pipelines de la biblioteca Transformers.
#pip install transformers[sklearn] --force-reinstall
import warnings  # Importa el módulo warnings para manejar advertencias.
warnings.filterwarnings('ignore')  # Ignora las advertencias durante la ejecución.

from huggingface_hub import notebook_login  # Importa la función notebook_login de huggingface_hub para iniciar sesión desde un cuaderno. !pip install ipywidgets

from langchain.docstore.document import Document
from langchain_community.document_loaders import PyMuPDFLoader

Configuracion de nuestro entorno, es necesario una GPU para acelerar con los experimentos.

In [5]:
print("Torch".ljust(25) + f":{torch.__version__}")
print("GPU Available".ljust(25) + f":{torch.cuda.is_available()}")
print("Cuda Built".ljust(25) + f":{torch.cuda.device_count()}")
print("Name of GPU".ljust(25) + f":{torch.cuda.get_device_name(0)}")
print('Memory Usage:')
print("".ljust(25)+'Allocated', round(torch.cuda.memory_allocated(0)/1024**3,1), 'GB')
print("".ljust(25)+'Cached   ', round(torch.cuda.memory_reserved(0)/1024**3,1), 'GB')

Torch                    :2.3.0
GPU Available            :True
Cuda Built               :1
Name of GPU              :NVIDIA GeForce RTX 3070 Ti Laptop GPU
Memory Usage:
                         Allocated 0.0 GB
                         Cached    0.0 GB


# Cargar Mistral

Obtener acceso al repositorio de HuggingFace

In [6]:
notebook_login()
#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

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

Especificar el modelo a utilizar en este caso ``Mistral-7B-Instruct-v0.1`` con direccion de huggingface.

In [7]:
MODEL_NAME = "mistralai/Mistral-7B-Instruct-v0.1"

Los modelos PyTorch utilizan puntos flotantes de 32 bits, lo que significa que un solo parámetro ocupa 32 "bits" en la memoria de la GPU. La cuantificación tiene como objetivo reemplazar estos parámetros con puntos flotantes de 16 bits, enteros de 8 bits o incluso enteros de 4 bits. Una cuantificación exitosa conduce a mejoras dramáticas en la velocidad computacional y reducciones en el uso de memoria, lo que significa que los modelos grandes se pueden ejecutar en GPU de gama baja, chips gráficos integrados o incluso CPU.

<img src='https://miro.medium.com/v2/resize:fit:500/1*hWIaIAQ7GWbrjfbaoUoYxw.jpeg'>

Fuente: 
- https://pub.towardsai.net/llm-quantisation-quantise-hugging-face-model-with-gptq-awq-and-bitsandbytes-a4ad45cd8b48
- https://towardsdatascience.com/introduction-to-weight-quantization-2494701b9c0c

In [8]:
quantization_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=True
)
# Se configura la cuantización utilizando BitsAndBytesConfig:
# - load_in_4bit=True: Cuantización de 4 bits.
# - bnb_4bit_compute_dtype=torch.float16: Define el tipo de datos para los cálculos como float16.
# - bnb_4bit_quant_type="nf4": Normalize float4.
# - bnb_4bit_use_double_quant=True: Se habilita la segunda cuantizacion.

``tokenizer`` proporciona una interfaz sencilla para cargar el tokenizador adecuado basado en el nombre del modelo ``MODEL_NAME``. El tokenizer se encarga de convertir texto en tokens (unidades de texto más pequeñas) que el modelo puede procesar.

In [9]:
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, use_fast=True)
# Se carga el tokenizer utilizando el nombre del modelo especificado anteriormente.
# - use_fast=True: Habilita el uso de la versión rápida del tokenizer si está disponible.
#tokenizer.pad_token = tokenizer.eos_token
# Se ajusta el token de relleno del tokenizer al token de fin de secuencia (EOS, end of sequence).

tokenizer_config.json:   0%|          | 0.00/2.10k [00:00<?, ?B/s]

tokenizer.model:   0%|          | 0.00/493k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.80M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

- ``AutoModelForCausalLM`` forma parte de la clase ``transformers`` e instancia una clase de modelo en función de una configuración proporcionada.
- ``from_pretrained`` devuelve una instancia del modelo preentrenado correspondiente según la configuración.

In [10]:
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    torch_dtype=torch.float16,
    trust_remote_code=True,
    device_map="auto",
    quantization_config=quantization_config,
)
# Se carga un modelo de lenguaje causal utilizando AutoModelForCausalLM.from_pretrained().
# - MODEL_NAME: Especifica el nombre del modelo preentrenado que se va a cargar.
# - torch_dtype=torch.float16: Indica el tipo de datos de PyTorch que se utilizará para los cálculos, en este caso, float16 para cuantización.
# - trust_remote_code=True: Confirma la confianza en el código remoto (por ejemplo, del hub de modelos de Hugging Face).
# - device_map="auto": Asigna automáticamente dispositivos (por ejemplo, GPU) disponibles para ejecución.
# - quantization_config=quantization_config: Aplica la configuración de cuantización previamente definida al modelo cargado.

config.json:   0%|          | 0.00/571 [00:00<?, ?B/s]

model.safetensors.index.json:   0%|          | 0.00/25.1k [00:00<?, ?B/s]

Downloading shards:   0%|          | 0/2 [00:00<?, ?it/s]

model-00001-of-00002.safetensors:   0%|          | 0.00/9.94G [00:00<?, ?B/s]

model-00002-of-00002.safetensors:   0%|          | 0.00/4.54G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/116 [00:00<?, ?B/s]

### Hiperparametros de Mistral

Con ``GenerationConfig.from_pretrained`` se carga una configuración preentrenada para la generación de texto desde un modelo específico identificado por ``MODEL_NAME``. Esta configuración incluye parámetros predefinidos como la temperatura (temperature), la probabilidad de muestreo (top_p), entre otros.

In [11]:
generation_config = GenerationConfig.from_pretrained(MODEL_NAME) 

#Establece el máximo número de nuevos tokens que el modelo puede generar en una sola llamada de generación.
generation_config.max_new_tokens = 1024 
#Ajusta la temperatura de muestreo para controlar la creatividad de la generación de texto. 
#Una temperatura baja tiende a producir predicciones más determinísticas.
generation_config.temperature = 0.0001 
#Establece la probabilidad acumulativa máxima para la selección de tokens durante el muestreo con la técnica de (top_p).
generation_config.top_p = 1 #0.95 
#Habilita el muestreo estocástico durante la generación de texto 
#lo cual permite que el modelo explore diferentes opciones en lugar de generar siempre la salida más probable.
generation_config.do_sample = True 
#Aplica un factor de penalización para reducir la probabilidad de que el modelo repita secuencias de tokens durante la generación.
generation_config.repetition_penalty = 1.15 

Un ``pipeline`` permite crear de manera sencilla un objeto que encapsula la funcionalidad de un modelo preentrenado para realizar una tarea específica de NLP, en este caso ``text-generation``.

El ``token_pad``, a menudo abreviado como ``PAD``, es un token especial que se utiliza para estandarizar la longitud de las secuencias de entrada durante el entrenamiento. En el ajuste, los modelos de lenguaje se entrenan en lotes de datos, y estos lotes suelen constar de secuencias de diferentes longitudes. Para procesar eficientemente estas secuencias, deben tener la misma longitud. Aquí es donde entra en juego ``token_pad``.

El ``eos_token``, denotado como ``EOS`` u otra etiqueta similar, sirve como una señal para el modelo de que una secuencia ha llegado a su conclusión. Indica el punto de terminación de una secuencia y ayuda al modelo a comprender los límites entre diferentes fragmentos de texto. En las tareas de generación de lenguaje natural, el token de fin de secuencia guía al modelo para producir una salida coherente y bien estructurada.

Mas informacion en: https://www.natebrake.com/blog/llm/end-of-sequence-explained

In [12]:
pipeline = pipeline(
    "text-generation",
    model = model,
    tokenizer = tokenizer,
    return_full_text = True, #Indica que se desea obtener el texto completo generado en lugar de segmentos más pequeños.
    generation_config = generation_config, #Carcar la configuracfion de hiperparametros
    pad_token_id = tokenizer.eos_token_id # Se ajusta el token de relleno del tokenizer al token de fin de secuencia (EOS, end of sequence).
                                          # Se evita la advertencia Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.
)

Lograremos encapsular el modelo en ``llm`` con ``HuggingFacePipeline`` que nos proporciona una interfaz conveniente para utilizar pipelines preentrenados de Hugging Face, permitiendo realizar tareas como generación de texto, resumen de texto, traducción, entre otras.

In [13]:
llm = HuggingFacePipeline(
    pipeline = pipeline
)

# Experimentos

## Generar texto

Probamos el modelo base generando consultas para que nos de informacion de algun tema.

In [14]:
# Es importante indicar en el query que genere algo corto por que puede tardar mas tiempo en generar la respuesta.
query = "Explica acerca de los tipos de investigación cientifica en un par de oraciones."  
result = llm(query)

display(Markdown(f"<p>{result}</p>"))

<p>Explica acerca de los tipos de investigación cientifica en un par de oraciones.

La investigación científica se puede dividir en dos categorías principales: la investigación fundamental y la investigación aplicada. La investigación fundamental es una exploración del conocimiento por su propio interés, mientras que la investigación aplicada tiene como objetivo resolver problemas reales o crear productos útiles para el ser humano. Además, existen varios subtipos de investigación científica, incluyendo la observación, la experimentación, la teoría y la simulación.</p>

In [15]:
query = "Explica la diferencia entre ChatGPT y los LLM de código abierto en un par de líneas."
result = llm(query)

display(Markdown(f"<p>{result}</p>"))

<p>Explica la diferencia entre ChatGPT y los LLM de código abierto en un par de líneas.

ChatGPT es una herramienta de generación de texto creada por OpenAI, que utiliza el modelo de lenguaje propietario de la empresa para crear respuestas a preguntas en tiempo real. Los LLMs de código abierto son modelos de aprendizaje profundo que han sido entrenados con código fuente públicamente disponible y pueden ser utilizados para generar código o analizar código existente.</p>

## Generar texto usando un template

Un prompt es una entrada cuidadosamente elaborada que se le da a un modelo de lenguaje para obtener una respuesta deseada específica. Los prompt son, en esencia, instrucciones o preguntas diseñadas para guiar la salida del modelo en una dirección determinada. 

``PromptTemplate`` nos permite personalizar nuestras consultas o preguntas, en general esta compuesto por:
- **Instrucciones**: Informa al modelo sobre la tarea general en cuestión y cómo abordarla, como utilizar la información externa proporcionada, procesar consultas y estructurar la salida. Esta sección suele ser constante dentro de una plantilla de prompt. Un caso de uso común implica decirle al modelo "Eres un asistente útil de XX", motivándolo a tomar su rol más seriamente.

- **Contexto**: Actúa como una fuente adicional de conocimiento para el modelo. Esta información puede ser insertada manualmente en el prompt, recuperada a través de búsquedas en bases de datos vectoriales o traída mediante otros métodos (como llamadas a APIs, uso de calculadoras, etc.). 

- **Prompt ingresado**: Representa la pregunta o tarea específica para que el modelo grande la aborde. Esta parte podría fusionarse con la sección de "Instrucciones", pero separarla en un componente independiente organiza mejor la estructura y facilita la reutilización de la plantilla. Normalmente se pasa como una variable a la plantilla del prompt antes de invocar al modelo para formar un prompt específico.

- **Indicador de salida**: Marca el inicio del texto a ser generado. Es similar a escribir "Solución:" en un examen de matemáticas en la infancia, señalando el comienzo de tu respuesta. Si se genera código Python, la palabra "import" puede usarse para indicar al modelo que comience a escribir código Python (ya que la mayoría de los scripts de Python comienzan con importaciones). Esta parte a menudo es superflua al conversar con ChatGPT, pero en LangChain, los agentes a menudo utilizan un "Pensamiento:" como introducción, indicando al modelo que comience a generar su razonamiento.

<img src='https://miro.medium.com/v2/resize:fit:512/1*C-VbyYG5Iukrpc_3VbHvhw.png'>

Fuente:
- https://tonylixu.medium.com/langchain-prompt-template-0359d96090c5

In [17]:
template = """<b>Instrucciones: </b>
<em> Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible.
Agrega "¡Gracias por preguntar!" al final de la respuesta. </em>

<b>Consulta: {text}</b>

<b>Respuesta: </b>
"""

prompt = PromptTemplate(
    input_variables = ["text"],
    template = template,
)

In [18]:
query = "Explica acerca de los tipos de investigación cientifica"
result = llm(prompt.format(text=query))

# Mostrar informacion completa de la consulta
display(Markdown(f"<p>{result}</p>"))

<p><b>Instrucciones: </b>
<em> Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible.
Agrega "¡Gracias por preguntar!" al final de la respuesta. </em>

<b>Consulta: Explica acerca de los tipos de investigación cientifica</b>

<b>Respuesta: </b>
Los tipos de investigación científica son diversas y se clasifican según su objetivo, método y ámbito. Hay cuatro tipos principales: observacional, experimental, teórica y aplicada. ¡Gracias por preguntar!</p>

In [19]:
query = "Quienes son los autores?\n UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO \n \nFACULTAD DE INGENIERÍA ELÉCTRICA, ELECTRÓNICA, INFORMÁTICA Y \nMECÁNICA \nESCUELA PROFESIONAL DE INGENIERÍA INFORMÁTICA Y DE SISTEMAS \n \nTESIS \n \n \n \n \n \n \nPRESENTADO POR: \nBr. VICTOR ABEL CHOQUEVILCA QUISPE \n \nBr. ERIKA ALEXANDRA MORALES VALENCIA  \n \nPARA OPTAR EL TITULO PROFESIONAL DE \nINGENIERO INFORMÁTICO Y DE SISTEMAS \n \nASESOR: \nDr. RONY VILLAFUERTE SERNA \n \nCUSCO - PERÚ \n2024"
result = llm(prompt.format(text=query))

# Mostrar informacion completa de la consulta
display(Markdown(f"<p>{result}</p>"))

<p><b>Instrucciones: </b>
<em> Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible.
Agrega "¡Gracias por preguntar!" al final de la respuesta. </em>

<b>Consulta: Quienes son los autores?
 UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO 
 
FACULTAD DE INGENIERÍA ELÉCTRICA, ELECTRÓNICA, INFORMÁTICA Y 
MECÁNICA 
ESCUELA PROFESIONAL DE INGENIERÍA INFORMÁTICA Y DE SISTEMAS 
 
TESIS 
 
 
 
 
 
 
PRESENTADO POR: 
Br. VICTOR ABEL CHOQUEVILCA QUISPE 
 
Br. ERIKA ALEXANDRA MORALES VALENCIA  
 
PARA OPTAR EL TITULO PROFESIONAL DE 
INGENIERO INFORMÁTICO Y DE SISTEMAS 
 
ASESOR: 
Dr. RONY VILLAFUERTE SERNA 
 
CUSCO - PERÚ 
2024</b>

<b>Respuesta: </b>
Los autores son Br. Victor Abel Choquevilca Quispe y Br. Erika Alexandra Morales Valencia.</p>

# Utilizando Embedding

Un ``embedding`` es una representación numérica de una información, por ejemplo, texto, documentos, imágenes, audio, etc. La representación captura el significado semántico de lo que se está incrustando, lo que la hace robusta para muchas aplicaciones de la industria.

<img src='https://miro.medium.com/v2/resize:fit:550/1*ICGYEfQuwRUoadqbWrZLkw.png'>

- ``thenlper/gte-large`` es un modelo de embedding de texto que destaca por su eficacia y tamaño, pero está especializado en texto en ingles y se trunca en 512 tokens, mas info en: https://huggingface.co/thenlper/gte-large
- ``hiiamsid/sentence_similarity_spanish_es`` es un modelo de embedding de texto especializado para texto en español, por lo que podria ser la mejor opcion, mas info en: https://huggingface.co/hiiamsid/sentence_similarity_spanish_es

In [20]:
embedding_model = 'hiiamsid/sentence_similarity_spanish_es' #thenlper/gte-large

embeddings = HuggingFaceEmbeddings(
    model_name = embedding_model,
    model_kwargs = {"device": "cuda"},
    encode_kwargs = {"normalize_embeddings": True}
)

### Obtener datos
En este ejemplo muy simple, estamos obteniendo datos historicos de la carrera de ingenieria Informática y de sistemas de la UNSAAC:

In [2]:
text = '''La escuela profesional de Ingenieria Informatica y de sistemas fue creado el 13 de Diciembre de 1971, 
dentro de la Aprobación del Plan de Estructuración del Programa Académico de Ciencias Fí­sico-Matemáticas según 
resolución Nº CG-110-71; luego, mediante resolución Nº CU-056-91 se aprueba el Proyecto para la Creación del 
Departamento Académico de Informática para ser elevado a Asamblea Universitaria y es Reaperturado el 22 de Enero 
de 1993 mediante resolución del Consejo Universitario Nº CU-009-93. Se aprueba el Proyecto de Acreditación de 
la Carrera Profesional de Ingenierí­a Informática y de Sistemas el 28 de noviembre del año 2013 por resolución 
Nº R-2193-2013-UNSAAC. Finalmente con nuevo Currí­culo de Estudios, con fecha 10 de septiembre del año 2014, 
es aprobado por resolución CU-232-2014-UNSAAC.'''
document1 = Document(page_content=(text))

text2 = '''Con la Ley Universitaria Nº 30220, Aprobado el Estatuto, la Asamblea Estatutaria asume funciones de la 
Asamblea Universitaria, instalándose el 14 de agosto del 2015 y mediante Resolución Nº 002-2015-AU-UNSAAC de 20 
de agosto de 2015, se produce encargatura de Decanatos. En caso de la Carrera Profesional de Ingenierí­a Informática 
y de Sistemas, se convierte parte de la Facultad denominada 'Facultad de Ingenierí­a Eléctrica, Electrónica, Informática 
y de Sistemas' con nombre de 'Escuela Profesional de Ingenierí­a Informática y de Sistemas'.​'''
document2 = Document(page_content=(text2))

### Dividir el documento en fragmentos
En un sistema RAG, es crucial dividir el documento en fragmentos (chunks) más pequeños para que sea más efectivo identificar y recuperar la información más relevante en el proceso de recuperación posterior. En este ejemplo, simplemente dividimos nuestro texto por caracteres, combinando 256 caracteres en cada fragmento. Donde se obtienen 7 chunks.

In [13]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=256, chunk_overlap=64)
texts_chunks = text_splitter.split_documents([document1, document2])

len(texts_chunks)

7

In [14]:
texts_chunks

[Document(page_content='La escuela profesional de Ingenieria Informatica y de sistemas fue creado el 13 de Diciembre de 1971, \ndentro de la Aprobación del Plan de Estructuración del Programa Académico de Ciencias Fí\xadsico-Matemáticas según'),
 Document(page_content='resolución Nº CG-110-71; luego, mediante resolución Nº CU-056-91 se aprueba el Proyecto para la Creación del \nDepartamento Académico de Informática para ser elevado a Asamblea Universitaria y es Reaperturado el 22 de Enero'),
 Document(page_content='de 1993 mediante resolución del Consejo Universitario Nº CU-009-93. Se aprueba el Proyecto de Acreditación de \nla Carrera Profesional de Ingenierí\xada Informática y de Sistemas el 28 de noviembre del año 2013 por resolución'),
 Document(page_content='Nº R-2193-2013-UNSAAC. Finalmente con nuevo Currí\xadculo de Estudios, con fecha 10 de septiembre del año 2014, \nes aprobado por resolución CU-232-2014-UNSAAC.'),
 Document(page_content='Con la Ley Universitaria Nº 30220, Apr

- Consideraciones:

1. **Tamaño de los fragmentos:** Dependiendo del caso de uso específico, puede ser necesario personalizar o experimentar con diferentes tamaños de fragmentos y solapamientos para lograr un rendimiento óptimo en RAG. Por ejemplo, los fragmentos (chunks) más pequeños pueden ser más beneficiosos en los procesos de recuperación, ya que los fragmentos de texto más grandes a menudo contienen texto de relleno que puede oscurecer la representación semántica. Por lo tanto, el uso de fragmentos de texto más pequeños en el proceso de recuperación puede permitir que el sistema RAG identifique y extraiga información relevante de manera más efectiva y precisa. Sin embargo, vale la pena considerar los compromisos que conlleva el uso de fragmentos más pequeños, como el aumento del tiempo de procesamiento y los recursos computacionales.

2. **Cómo dividir:** Si bien el método más simple es dividir el texto por caracteres, existen otras opciones dependiendo del caso de uso y la estructura del documento. Por ejemplo, para evitar exceder los límites de tokens en las llamadas a la API, puede ser necesario dividir el texto por tokens. Para mantener la cohesión de los fragmentos, puede ser útil dividir el texto por oraciones, párrafos o encabezados HTML. Si trabajas con código, a menudo se recomienda dividir por fragmentos de código significativos, por ejemplo, utilizando un analizador de Árbol de Sintaxis Abstracta (AST).


### Crear incrustaciones para cada fragmento de texto con Chroma
Para cada fragmento de texto, luego necesitamos crear embeddings (incrustaciones) de texto, que son representaciones numéricas del texto en el espacio vectorial. Se espera que las palabras con significados similares estén en una proximidad más cercana o tengan una distancia más corta en el espacio vectorial. 

Para crear un embedding se utiliza la biblioteca ``Chroma`` para crear una base de datos de vectores a partir de fragmentos de texto (``texts_chunks``) y sus correspondientes ``embeddings``. La base de datos se guarda en el directorio especificado (``"db"``).

In [27]:
try:
    if db != None:  # Re instanciar chroma
        print(f"Existe un base de datos Chroma, contiene {len(db.get()['documents'])} documentos, se eliminara.")
        db.delete_collection()
except Exception as e:
    print("No existe una base de datos.")

db = Chroma.from_documents(texts_chunks, embeddings)#, persist_directory="db")
print(f"Se creó una base de datos Chroma con {len(db.get()['documents'])} elementos.")
db._collection.get(include=['embeddings'])

Existe un base de datos Chroma, contiene 7 documentos, se eliminara.
Se creó una base de datos Chroma con 7 elementos.


{'ids': ['43244376-3a40-4efa-8342-9f10a35f14f8',
  '440d154f-4655-4532-a33d-d13b92cbaf16',
  '7827875d-9975-41a3-8a8a-8b762feb7207',
  '93df00ef-4e7e-4980-ac25-7e91e0a6e80d',
  'aaabec9f-710d-4518-8065-6b1eda96015c',
  'ddcdf871-08ef-4cc5-a5f3-8b9b6f6b5c32',
  'fe0a5fa4-bc96-43d4-b1fc-b1329acf541b'],
 'embeddings': [[0.0314459465444088,
   0.046568479388952255,
   0.056343454867601395,
   0.021587194874882698,
   0.018055496737360954,
   0.010089612565934658,
   -0.040507473051548004,
   0.02550540678203106,
   0.018279485404491425,
   -0.045723091810941696,
   -0.04806908220052719,
   -0.01080153789371252,
   -0.013547913171350956,
   0.03653066232800484,
   -0.0534295029938221,
   -0.04747997224330902,
   0.08202711492776871,
   -0.06562255322933197,
   0.043084390461444855,
   -0.0007258955738507211,
   -0.040550392121076584,
   0.007316114380955696,
   -0.01937718130648136,
   -0.019717691466212273,
   -0.021446852013468742,
   -0.03142827749252319,
   -0.012747504748404026,
   0.0

Mostrar los embeddings

## Aplicacion de RAG

In [28]:
template = """<b>Instrucciones: </b>
<em> Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible. </em>

<b>Contextos: </b><em>{context}</em>\n
<b>Pregunta: {question}</b>

<b>Respuesta: </b>
"""

prompt = PromptTemplate(template=template, input_variables=["context", "question"])

qa_chain = RetrievalQA.from_chain_type(
    llm = llm,
    chain_type = "stuff",
    retriever = db.as_retriever(search_kwargs = {"k": 3}),
    return_source_documents = True,
    chain_type_kwargs = {"prompt": prompt}
)

In [29]:
query = "En que provincia esta Sicuani?"
result_= qa_chain(query)
result = result_["result"].strip()

display(Markdown(f"<p>{result}</p>"))

<p><b>Instrucciones: </b>
<em> Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible. </em>

<b>Contextos: </b><em>Con la Ley Universitaria Nº 30220, Aprobado el Estatuto, la Asamblea Estatutaria asume funciones de la 
Asamblea Universitaria, instalándose el 14 de agosto del 2015 y mediante Resolución Nº 002-2015-AU-UNSAAC de 20

de agosto de 2015, se produce encargatura de Decanatos. En caso de la Carrera Profesional de Ingenierí­a Informática 
y de Sistemas, se convierte parte de la Facultad denominada 'Facultad de Ingenierí­a Eléctrica, Electrónica, Informática

La escuela profesional de Ingenieria Informatica y de sistemas fue creado el 13 de Diciembre de 1971, 
dentro de la Aprobación del Plan de Estructuración del Programa Académico de Ciencias Fí­sico-Matemáticas según</em>

<b>Pregunta: En que provincia esta Sicuani?</b>

<b>Respuesta: </b>
No se proporciona información sobre la provincia en donde se encuentra Sicuani.</p>

In [30]:
query = "Cuando fue fundada la escuela profesional?"
result_= qa_chain(query)
result = result_["result"].strip()

display(Markdown(f"<p>{result}</p>"))

<p><b>Instrucciones: </b>
<em> Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible. </em>

<b>Contextos: </b><em>La escuela profesional de Ingenieria Informatica y de sistemas fue creado el 13 de Diciembre de 1971, 
dentro de la Aprobación del Plan de Estructuración del Programa Académico de Ciencias Fí­sico-Matemáticas según

de agosto de 2015, se produce encargatura de Decanatos. En caso de la Carrera Profesional de Ingenierí­a Informática 
y de Sistemas, se convierte parte de la Facultad denominada 'Facultad de Ingenierí­a Eléctrica, Electrónica, Informática

y de Sistemas' con nombre de 'Escuela Profesional de Ingenierí­a Informática y de Sistemas'.​</em>

<b>Pregunta: Cuando fue fundada la escuela profesional?</b>

<b>Respuesta: </b>
<ul>
    <li>La escuela profesional de Ingeniería Informatica y de sistemas fue fundada en 1971.</li>
</ul></p>

# Extracción de información de PDFS con RAG

Lectura de datos de un PDF.

In [31]:
loader = PyMuPDFLoader("tess.pdf")
data = loader.load()

# Convertir todos los elementos de 'data' en objetos 'Document'
documents = [Document(page_content=item.page_content) for item in data]

Dividir el documento en trozos

In [34]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=4096, chunk_overlap=64)
texts_chunks = text_splitter.split_documents(documents)

In [35]:
len(texts_chunks)

105

In [36]:
try:
    if db != None:  # Re instanciar chroma
        print(f"Existe un base de datos Chroma, contiene {len(db.get()['documents'])} documentos, se eliminara.")
        db.delete_collection()
except Exception as e:
    print("No existe una base de datos.")

db = Chroma.from_documents(texts_chunks, embeddings)#, persist_directory="db")
print(f"Se creó una base de datos Chroma con {len(db.get()['documents'])} elementos.")
db._collection.get(include=['embeddings'])

Existe un base de datos Chroma, contiene 7 documentos, se eliminara.
Se creó una base de datos Chroma con 105 elementos.


{'ids': ['0295c164-e47f-43d0-ba90-cb2d4924e406',
  '05a0c10b-7001-4776-8b66-6be0fb4e5f01',
  '05c887aa-c9d9-4742-b071-d615883e4537',
  '0640d3fb-f819-4620-9e0a-a566836d7418',
  '0665a706-9205-4d90-b82f-3fef5b7bda61',
  '0ee9b7b0-9192-49c8-9d90-2497ca9130c9',
  '0efcb826-fffd-407b-b0e4-2a4430c93ef9',
  '100ea783-7e0d-40aa-b68d-e44456ef1a5a',
  '109efcee-248b-409e-9187-8c67c8efd30d',
  '1528245f-6703-4035-89e8-56e2baceb702',
  '15560f4b-214d-4983-b35a-87b1f2f525d2',
  '180e52fe-f8a3-4ecd-a42e-c48279ab3046',
  '2481a5d7-82da-4b8b-ae11-678d73e56d13',
  '26f530a4-92ee-4b05-908c-c0fe53072eda',
  '2702dac9-69ca-4954-813e-3b93f161c33c',
  '2c236ff1-3d68-4945-b9ef-c0a6aa6785e2',
  '339eda98-8e0a-4a34-b4a0-015505f3162d',
  '34af404a-e1ef-4e4f-8588-ed1210c3fe64',
  '36952738-b4ef-4f2c-b727-bde7867ffeef',
  '392d0224-1d7b-49a8-bce0-a0f80c66cce9',
  '3b076d85-f053-4ffc-a65b-7fca5f184cc5',
  '3e5b4330-6dcc-4fe0-bfd8-5fdaf72761a6',
  '43c9e0dc-4f2a-4aba-84d8-9a89eb9269a5',
  '470ded09-9be7-482e-8d72-

In [37]:
template = """<b>Instrucciones: </b>
<em> Vas a analizar una tesis.
Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible. </em>

<b>Contextos: </b><em>{context}</em>\n
<b>Pregunta: {question}</b>

<b>Respuesta: </b>
"""

prompt = PromptTemplate(template=template, input_variables=["context", "question"])

qa_chain = RetrievalQA.from_chain_type(
    llm = llm,
    chain_type = "stuff",
    retriever = db.as_retriever(search_kwargs = {"k": 3}),
    return_source_documents = True,
    chain_type_kwargs = {"prompt": prompt}
)

### Consultas

In [38]:
query = "cuales son las metodologias de investigacion que se utilizan?"
result_= qa_chain(query)
result = result_["result"].strip()

display(Markdown(f"<p>{result}</p>"))

<p><b>Instrucciones: </b>
<em> Vas a analizar una tesis.
Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible. </em>

<b>Contextos: </b><em>25 
 
infracciones de tránsito en la Municipalidad Provincial del Cusco. Por lo tanto, es 
considerado como una investigación APLICADA. Siendo la definición: “La 
investigación Aplicada o Técnica tiende a la resolución de problemas o al desarrollo 
de ideas, dirigidas a conseguir innovaciones, mejoras de procesos o productos, etc.” 
(Sanchez, 2011). 
b) Por el propósito del estudio: El presente proyecto realizará la identificación de las 
características más sobresalientes de la implementación de un Servicio Web con 
Blockchain, destacando los aspectos más sobresalientes para la mejora en la seguridad 
de gestión de infracciones de tránsito en la Municipalidad Provincial del Cusco. Por lo 
tanto, es considerada como DESCRIPTIVA. Siendo la definición: “Los estudios 
descriptivos buscan especificar las propiedades, las características y los aspectos 
importantes del fenómeno que se somete a análisis” (Gomez, 2006). 
 
1.7.2 Metodología de desarrollo de software 
Se aplicará la metodología de desarrollo “Extreme Programming”, que es una 
metodología ágil muy exitosa porque hace hincapié en la satisfacción del cliente y 
permite a los desarrolladores responder con confianza a las necesidades cambiantes de 
los clientes, incluso al final del ciclo de vida. 
El Extreme Programming, que es un diagrama general que abarca todas las fases del 
proyecto, el cual tiene como inicio la administración, donde se encuentran las tareas 
necesarias de coordinación para la dotación del espacio de trabajo para el equipo en la 
organización y de supervisión de la aplicación en los parámetros de la metodología. A 
continuación, la fase de planeamiento en donde se recogen los requerimientos del

24 
 
mediante Servicios Web a la base de datos del Registro Nacional de Identificación y Estado 
Civil (RENIEC), de la Superintendencia Nacional de Registros Públicos (SUNARP) y del 
Ministerio de Transportes y Comunicaciones (MTC), de donde se obtendrán los datos de la 
persona, licencia de conducir y del vehículo. 
 
1.6 Limitaciones 
• 
Política de Reserva de Información: La Municipalidad Provincial del Cusco mantiene 
una política de reserva de información que restringe la divulgación completa de los 
datos almacenados en su base de datos. Esta política limita el acceso y la difusión de 
ciertos datos, lo que puede afectar la transparencia y la capacidad de realizar un 
análisis exhaustivo. 
• 
Actualización de Datos:  La actualización de los datos almacenados en la base de datos 
es un proceso que requiere tiempo. Dada la naturaleza progresiva de este proceso, que 
depende de la cantidad de datos que se agregan diariamente, la actualización completa 
de los datos con el sistema que se desarrollará puede llevar un tiempo considerable. 
 
1.7 Metodología 
La metodología de este proyecto se divide en dos componentes principales: la metodología 
de investigación y la metodología de desarrollo de software. 
1.7.1 Metodología de investigación 
La metodología de investigación se clasifica de la siguiente manera: 
a) Por la forma en que la investigación es usada: El siguiente proyecto desea dar 
solución a los problemas que presenta la falta de seguridad en la gestión de

28 
 
sistema implementado así como también nos describe la implementación de la API, la 
cual se realizó mediante consultas POST al servidor que permite interactuar con el 
Blockchain a través de una serie de rutas. 
➢   Espíritu Aranda, Walter Augusto y Machuca Nieva, Christian Fernando (2021) “Modelo   
de Referencia para la Gestión de la Seguridad de Datos de Salud soportado en una 
Plataforma Blockchain” (Para optar el título profesional de Ingeniero de Sistemas de   
Información) Universidad Peruana de Ciencias Aplicadas (Espíritu Aranda & Machuca 
Nieva, 2021). 
Conclusiones: 
• Los resultados obtenidos indican que los costos de implementar controles mitigantes 
en los centros de salud son elevados a comparación de utilizar la tecnología 
Blockchain la cual minimiza en su mayoría las brechas de seguridad, con relación a 
la cantidad de riesgos y vulnerabilidades encontrados en los sistemas de la clínica 
que albergan los datos de salud de pacientes. 
• Con la implementación del modelo de referencia, los centros de salud tienen una 
visión detallada y específica acerca de los posibles riesgos que podrían ocurrir, 
evitando problemas legales o sanciones económicas por parte del ente regulador. 
• El uso del modelo de referencia tiene un impacto positivo para la gestión de la 
seguridad en los centros de salud debido a que permite realizar un diagnóstico sobre 
los activos de información que tiene como objetivo conocer la criticidad de cada uno 
de ellos.</em>

<b>Pregunta: cuales son las metodologias de investigacion que se utilizan?</b>

<b>Respuesta: </b>

<p>Las metodologías de investigación que se utilizan son:</p>

<ol>
<li>Descriptiva</li>
<li>Aplicada</li>
</ol></p>

In [39]:
query = "quienes son PARA OPTAR EL TITULO PROFESIONAL DE INGENIERO INFORMÁTICO Y DE SISTEMAS"
result_= qa_chain(query)
result = result_["result"].strip()

display(Markdown(f"<p>{result}</p>"))

<p><b>Instrucciones: </b>
<em> Vas a analizar una tesis.
Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible. </em>

<b>Contextos: </b><em>UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO 
 
FACULTAD DE INGENIERÍA ELÉCTRICA, ELECTRÓNICA, INFORMÁTICA Y 
MECÁNICA 
ESCUELA PROFESIONAL DE INGENIERÍA INFORMÁTICA Y DE SISTEMAS 
 
TESIS 
 
 
 
 
 
 
PRESENTADO POR: 
Br. VICTOR ABEL CHOQUEVILCA QUISPE 
 
Br. ERIKA ALEXANDRA MORALES VALENCIA  
 
PARA OPTAR EL TITULO PROFESIONAL DE 
INGENIERO INFORMÁTICO Y DE SISTEMAS 
 
ASESOR: 
Dr. RONY VILLAFUERTE SERNA 
 
CUSCO - PERÚ 
2024 
BLOCKCHAIN APLICADO A LA SEGURIDAD PARA LA GESTIÓN DE 
INFRACCIONES DE TRÁNSITO EN LA MUNICIPALIDAD PROVINCIAL 
DEL CUSCO

31 
 
computacional que le toma al sistema procesar el algoritmo. Este último punto, es 
fundamental considerarlo ya que debido a que mientras más procesamiento 
computacional se realice más monedas electrónicas se utiliza en el sistema y esto 
puede incrementar en gran manera los costos del uso del sistema. 
• El tercer objetivo específico fue utilizar estándares legales y técnicos en las fases de 
emisión, escrutinio y auditoría. En tal sentido, un resultado alcanzado fundamental 
fue la creación del catálogo de requerimientos, el cual constituye la base para la 
definición del nivel de seguridad que posee el sistema. Es por ello, que el catálogo de 
requerimientos sufrió tres versiones a lo largo del proyecto de tesis. Así mismo, se 
implementó el módulo de verificación individual de los votos y funcionalidades que 
permitan auditar el sistema. Con estas últimas características se pudo incrementar y 
finalizar el nivel de seguridad del sistema propuesto. En este objetivo más enfocado 
al control de cambios registrados en el sistema lo que permitían un nivel alto de 
auditoría del sistema por parte del elector como por parte del auditor.  
• Finalmente, el gobierno electrónico en el cual se implementó el sistema fue las 
elecciones generales para procesos electores en el Perú. En tal sentido, el alcance del 
proyecto es a nivel nacional; sin embargo, es factible poder implementarlo en un 
gobierno electrónico distrital, donde se debería tener en consideración el lugar de 
residencia del elector, o en un nivel de gobierno electrónico de colegio de 
profesionales en el Perú en donde el uso de sistema de voto electrónico no 
presencial es más utilizado. Inclusive se podría agregar mayor nivel en la fase de 
configuración del proceso electoral para aceptar otros tipos de procesos electorales, 
tales como el referéndum.

72 
 
CAPÍTULO IV 
IMPLEMENTACION DEL BLOCKCHAIN 
4.1 Diseño del modelo 
Representando diferentes modelos y arquitecturas técnicas gubernamentales, se realizó el 
análisis para el manejo de las infracciones de tránsito como contexto y técnica. Siendo así se 
desarrolló el siguiente modelo técnico.   
  
Componentes del modelo 
Datos del Infractor
Datos del Vehiculo
Datos 
Complementarios
Infracción 
de Transito
Reportes
Fase de Ingreso
Fase de control
Verificación
Creación
Consultas
Proceso
Conservación
Entrada
Gestión de Infracciones
Salida
Tecnologia y Seguridad
Autenticación
Cadena de Bloques
 
El modelo planteado en la Figura 14 se divide en 4 componentes, que permite la gestión de 
infracciones de tránsito. 
A continuación, se detalla cada uno de los componentes del modelo. 
4.1.1 Entrada. 
En este componente se detalla la forma de ingreso de los datos al modelo tecnológico 
con relación a la capa de gestión de infracciones.</em>

<b>Pregunta: quienes son PARA OPTAR EL TITULO PROFESIONAL DE INGENIERO INFORMÁTICO Y DE SISTEMAS</b>

<b>Respuesta: </b>

<ul>
<li>Br. Victor Abel Chuquevilca Quispe</li>
<li>Br. Erika Alexandra Morales Valencian</li>
</ul></p>

In [40]:
query = "Quienes son los dictaminantes de la tesis?"
result_= qa_chain(query)
result = result_["result"].strip()

display(Markdown(f"<p>{result}</p>"))

<p><b>Instrucciones: </b>
<em> Vas a analizar una tesis.
Utiliza los siguientes fragmentos de contexto para responder la pregunta al final.
Si no sabes la respuesta, simplemente di que no lo sabes, no intentes inventar una respuesta.
Utiliza un máximo de tres oraciones y mantén la respuesta lo más concisa posible. </em>

<b>Contextos: </b><em>AGRADECIMIENTO 
 
A nuestro asesor Dr. Rony Villafuerte Serna por el tiempo, conocimiento y apoyo profesional 
que nos brindó durante todo el proceso de investigación para la culminación de este proyecto. 
 
A nuestros dictaminantes, el Ing. Robert Wilbert Alzamora Paredes y el Ing. José Mauro Pillco 
Quispe, los cuales gentilmente, nos brindaron aportes para nuestro proyecto. 
 
A nuestros profesores, por todo el conocimiento y aportes que nos brindaron durante los años 
que estuvimos estudiando en la Universidad Nacional San Antonio Abad del Cusco. 
 
A la Gerencia de Tránsito, Viabilidad y Transito de la Municipal Provincial del Cusco por su 
valioso tiempo y apoyo hacia nuestro proyecto.

29 
 
• Los resultados obtenidos indican que hay una disminución de un 26% en el nivel de 
riesgo con el uso de la tecnología Blockchain a comparación de usar un sistema 
tradicional. 
Comentario: 
En este proyecto de investigación proponen un modelo referencial para ser utilizados en 
instituciones de salud, ya que permite la gestión de la seguridad de datos sensibles y 
confidenciales apoyado en una plataforma Blockchain que integra el estándar ISO/IEC 
27799, así mismo, mediante una evaluación del riesgo concluyen que el uso de la 
tecnología Blockchain disminuye el nivel del riesgo. 
➢ Sebastián Andrés Sánchez Herrera (2021) “Sistema de voto electrónico basado en 
Blockchain” (Tesis Para optar por el Título de Ingeniero Informático) Pontificia 
Universidad Católica del Perú, Lima Perú  (Sanchez Herrera, 2021). 
Conclusiones: 
• El primer objetivo específico fue implementar un sistema de voto electrónico de 
código abierto que gestione la información del proceso electoral de forma 
descentralizada para los actores del proceso electoral. En base a la arquitectura 
diseñada resultante de las fases de análisis y diseño, se consiguió implementar un 
sistema de voto electrónico para elecciones generales en el Perú compuesto por una 
capa front-end en React Js y una capa de back-end en la tecnología Blockchain con 
un servicio de envío de correos desarrollado en Spring. Una vez escogida la 
arquitectura del sistema a utilizar, se definieron tres módulos que permitieron 
conseguir este primer objetivo específico. Estos tres módulos fueron el módulo de 
emisión de votos, escrutinio de los votos y mantener un repositorio del proyecto con

UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO 
 
FACULTAD DE INGENIERÍA ELÉCTRICA, ELECTRÓNICA, INFORMÁTICA Y 
MECÁNICA 
ESCUELA PROFESIONAL DE INGENIERÍA INFORMÁTICA Y DE SISTEMAS 
 
TESIS 
 
 
 
 
 
 
PRESENTADO POR: 
Br. VICTOR ABEL CHOQUEVILCA QUISPE 
 
Br. ERIKA ALEXANDRA MORALES VALENCIA  
 
PARA OPTAR EL TITULO PROFESIONAL DE 
INGENIERO INFORMÁTICO Y DE SISTEMAS 
 
ASESOR: 
Dr. RONY VILLAFUERTE SERNA 
 
CUSCO - PERÚ 
2024 
BLOCKCHAIN APLICADO A LA SEGURIDAD PARA LA GESTIÓN DE 
INFRACCIONES DE TRÁNSITO EN LA MUNICIPALIDAD PROVINCIAL 
DEL CUSCO</em>

<b>Pregunta: Quienes son los dictaminantes de la tesis?</b>

<b>Respuesta: </b>
Los dictaminadores de la tesis son el Ing. Robert Wilbert Alzamora Paredes y el Ing. José Mauro Pillco Quispe.</p>