# **Asistente de conceptos financieros y finanzas personales con IA Generativa**

## ü§ñ **Proyecto Final de IA Generativa Aplicada a la Econom√≠a**


**Curso:** Inteligencia Artificial Aplicada para la Econom√≠a  
**Estudiante:** Valentina Latorre R
**Codigo:** 201912974  

Este proyecto desarrolla un asistente de educaci√≥n financiera con IA Generativa, basado en arquitectura RAG, embeddings sem√°nticos y el modelo FLAN-T5.

##**Planteamiento del problema y objetivos**

### **¬øCu√°l es el problema que aborda este proyecto?**

En Am√©rica Latina, una parte significativa de la poblaci√≥n, especialmente j√≥venes, trabajadores informales y peque√±os emprendedores, carece de conocimientos financieros b√°sicos. Esta falta de educaci√≥n financiera se traduce en decisiones econ√≥micas deficientes, como sobreendeudamiento, bajo ahorro, desconfianza en el sistema bancario y baja participaci√≥n en instrumentos de inversi√≥n. El problema se agrava por la complejidad del lenguaje t√©cnico utilizado en el sector financiero y por la escasa oferta de herramientas accesibles y personalizadas que fomenten el aprendizaje pr√°ctico.


Este proyecto busca desarrollar un **asistente conversacional de educaci√≥n financiera**, basado en inteligencia artificial generativa, que sea capaz de:
- Responder preguntas sobre conceptos financieros de forma clara, breve y adaptada al lenguaje cotidiano.
- Simular decisiones de consumo a cr√©dito (como la compra de un celular) y ofrecer recomendaciones basadas en los ingresos del usuario.
- Facilitar el acceso al conocimiento financiero sin necesidad de habilidades t√©cnicas ni conexi√≥n con entidades bancarias.

### **¬øC√≥mo se relaciona este problema con la econom√≠a?**

El proyecto aborda un problema de **asimetr√≠a de informaci√≥n** en los mercados financieros y promueve la **eficiencia econ√≥mica** mediante la toma de decisiones m√°s informadas. Tambi√©n se relaciona con conceptos de **econom√≠a del comportamiento**, ya que busca mejorar la toma de decisiones individuales mediante herramientas que reducen sesgos y errores comunes.

### **¬øPor qu√© es relevante este problema en el contexto actual?**

- Las tasas de endeudamiento informal y de sobreendeudamiento son elevadas en varios pa√≠ses de la regi√≥n.
- Muchos j√≥venes acceden a productos financieros sin comprender plenamente sus costos, lo que genera c√≠rculos de deuda.
- Con la digitalizaci√≥n del cr√©dito y el consumo, la educaci√≥n financiera es m√°s urgente que nunca para evitar fraudes, malas decisiones y exclusi√≥n econ√≥mica.

###**¬øPor qu√© se aplica IA Generativa y no Predictiva?**
Porque el objetivo no es clasificar ni predecir, sino explicar y conversar.

La IA generativa puede adaptar su respuesta al contexto y a la pregunta con mayor flexibilidad que un modelo tradicional de clasificaci√≥n.



In [23]:
#---------CONFIGURACIONES INICIALES---------

# --- Instalaci√≥n de librer√≠as necesarias para el proyecto ---
## Estas librer√≠as permiten embeddings, modelos de lenguaje y la interfaz
# Se instalan las bibliotecas para procesamiento de lenguaje (transformers),
# generaci√≥n de embeddings (sentence-transformers) y b√∫squeda vectorial (faiss).
!pip install -q faiss-cpu sentence-transformers transformers
!pip install gradio -q

# --- Importaci√≥n de librer√≠as ---
import ipywidgets as widgets
from IPython.display import display, Markdown

# --- Librer√≠as cient√≠ficas y de IA ---
import math               # Operaciones matem√°ticas est√°ndar
import pandas as pd       # Manipulaci√≥n y an√°lisis de datos en tablas (DataFrame)
import torch              # Biblioteca para computaci√≥n acelerada (GPU) y deep learning
import faiss              # Biblioteca de Facebook para b√∫squeda vectorial eficiente

# --- Librer√≠a para interfaz gr√°fica ---
import gradio as gr

# --- Modelos de lenguaje y embeddings ---
from sentence_transformers import SentenceTransformer
from transformers import AutoTokenizer, AutoModelForCausalLM

In [24]:
#---------CARGA Y PREPARACION DEL CORPUS---------

# --- Cargar base de conocimiento ---
# Cargar archivo CSV
df = pd.read_csv("base_conocimiento_finanzas.csv")  # Carga el archivo con temas y contenidos
df.dropna(inplace=True)                             # Elimina filas con valores vac√≠os
df.reset_index(drop=True, inplace=True)             # Reasigna los √≠ndices tras eliminar filas
df.head()                                           # Muestra las primeras filas para inspecci√≥n

#Este corpus contiene temas y definiciones. El sistema buscar√° el fragmento m√°s similar a la pregunta del usuario.


Unnamed: 0,tema,contenido
0,Que es el interes compuesto,El interes compuesto es aquel que se calcula s...
1,Como funciona una cuenta de ahorro,Una cuenta de ahorro es un producto financiero...
2,Que es un CDT,Un CDT es un certificado de deposito a termino...
3,Presupuesto personal,El presupuesto personal es una herramienta que...
4,Endeudamiento responsable,El endeudamiento responsable consiste en adqui...


In [25]:
#---------GENERACION DE EMBEDDINGS Y CREACI√ìN DEL INDICE---------

# --- Embeddings e √≠ndice sem√°ntico ---
model_embed = SentenceTransformer('all-MiniLM-L6-v2')  # Cargar modelo de embeddings
embeddings = model_embed.encode(df['contenido'].tolist())  # Convertir cada contenido en un vector
index = faiss.IndexFlatL2(embeddings.shape[1])  # Crear √≠ndice FAISS basado en distancia euclidiana
index.add(embeddings)  # Agregar los vectores al √≠ndice



###**¬øQu√© es Word Embedding?**
Es una t√©cnica de NLP que convierte frases en vectores num√©ricos que capturan su significado sem√°ntico.

In [26]:
#---------CARGAR MODELO GENERATIVO FLAN-T5---------

# --- Cargar modelo generativo para generaci√≥n de respuestas ---

# Importamos las clases necesarias para cargar modelos de tipo encoder-decoder (seq2seq)
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM

# Nombre del modelo preentrenado que usaremos: FLAN-T5 en su versi√≥n base
model_name = "google/flan-t5-base"

# Cargar el tokenizador correspondiente al modelo FLAN-T5
# Este tokenizador transforma texto en tensores num√©ricos compatibles con el modelo
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Cargar el modelo generativo FLAN-T5
# Este modelo est√° optimizado para tareas de generaci√≥n de texto tipo instrucci√≥n ‚Üí respuesta
model = AutoModelForSeq2SeqLM.from_pretrained(model_name)


### **¬øPor qu√© FLAN-T5 y no GPT?**
Porque FLAN-T5 est√° dise√±ado para seguir instrucciones, genera respuestas m√°s estructuradas y es eficiente en CPU.

### **¬øQu√© es RAG?**
RAG = Retrieval-Augmented Generation.\
Combina b√∫squeda eficiente en una base de conocimiento (sem√°ntica), generando texto en lenguaje natural a partir del contexto encontrado.

**Ventaja:** El modelo no necesita memorizar todo el conocimiento; puede ‚Äúbuscar y razonar‚Äù. Esto reduce errores y mejora interpretabilidad.


### **¬øC√≥mo se relaciona con conceptos de NLP y Transformers?**
- Tokenizaci√≥n: Se usa AutoTokenizer para convertir texto a tensores.

- Word embedding: Se generan vectores de textos completos con SentenceTransformer.

- Similitud sem√°ntica: m√©trica L2 (distancia euclidiana) con FAISS.

- Transformer: FLAN-T5 implementa codificador-decodificador.

- Hiperpar√°metros de inferencia: Para controlar la creatividad y longitud de la respuesta.

Con el contexto se limita la longitud del prompt para evitar truncamiento.



In [27]:
#---------CREAR FUNCION PRINCIPAL PARA EL AGENTE---------

# --- Agente generativo de preguntas ---
def responder_pregunta(pregunta):
    # Vectorizamos la pregunta usando el modelo de embeddings
    pregunta_vector = model_embed.encode([pregunta])

    # Buscamos el √≠ndice del fragmento m√°s cercano (k=1 significa el m√°s similar)
    _, I = index.search(pregunta_vector, k=1)

    # Extraemos el contenido m√°s relevante desde el DataFrame
    contexto = df.iloc[I[0][0]]["contenido"]

    # Creamos un prompt estructurado con la informaci√≥n y la pregunta
    prompt = f"""
Informaci√≥n financiera:

{contexto}

Pregunta: {pregunta}

Respuesta en espa√±ol:
"""

    # Preparamos los tensores de entrada para el modelo generativo (tokenizaci√≥n)
    inputs = tokenizer(prompt, return_tensors="pt", padding=True, truncation=True)

    # Generamos la respuesta usando el modelo FLAN-T5
    outputs = model.generate(
        **inputs,
        max_new_tokens=100,       # Limita longitud de la respuesta
        temperature=0.7,          # Introduce algo de aleatoriedad controlada
        top_p=0.9,                # Nucleus sampling para diversidad
        do_sample=True            # Activa la aleatoriedad en la generaci√≥n
    )

    # Mostrar el contexto y el prompt generado en consola
    print("üìÑ CONTEXTO:", contexto)
    print("üß† PROMPT:", prompt)

    # Decodificamos la respuesta del modelo a texto legible
    return tokenizer.decode(outputs[0], skip_special_tokens=True)



### **Prompt Engineering:**
System Prompt estructurado que incluye el contexto + la instrucci√≥n clara de responder brevemente en espa√±ol.

- Instrucciones expl√≠citas: se pide ‚Äúrespuesta breve en espa√±ol‚Äù.

- Control de generaci√≥n: Se usan hiperpar√°metros como ```temperature```, ```top_p```, ```max_new_tokens``` regulan creatividad y longitud.

\
**¬øPor qu√© funciona el Prompt Engineering?**

Porque los modelos generativos siguen instrucciones mejor cuando el formato es expl√≠cito, estructurado y claro. Adem√°s, un buen prompt reduce repeticiones o respuestas gen√©ricas.

Diferencia entre user y system prompt:\
- System prompt: se genera internamente.

- User prompt: lo que el usuario escribe, la pregunta.



In [28]:

#---------CREAR FUNCION PRINCIPAL PARA EL SIMULADOR FINANCIERO---------

# --- Simulaci√≥n financiera ---
def calcular_simulacion(valor_compra, cuotas, interes_mensual, ingreso_mensual):
    tasa_decimal = interes_mensual / 100  # Convertir a porcentaje decimal

    # F√≥rmula de cuota mensual (anualidad ordinaria)
    if tasa_decimal == 0:
        cuota = valor_compra / cuotas
    else:
        cuota = (valor_compra * tasa_decimal) / (1 - (1 + tasa_decimal) ** (-cuotas))

    total = cuota * cuotas
    interes = total - valor_compra

    # Explicaci√≥n en formato Markdown
    explicacion = (
        f"üí≥ **Simulaci√≥n de compra**\n\n"
        f"- Cuota mensual aproximada: **${cuota:,.0f}**\n"
        f"- Total pagado al final: **${total:,.0f}**\n"
        f"- Intereses acumulados: **${interes:,.0f}**\n\n"
    )

    # Advertencia si la cuota es mayor al 40% del ingreso
    if cuota > 0.4 * ingreso_mensual:
        explicacion += "‚ö†Ô∏è **Advertencia:** La cuota representa m√°s del 40% de tu ingreso mensual. Considera reducir el valor o aumentar las cuotas."
    else:
        explicacion += "‚úÖ La cuota est√° en un rango manejable respecto a tus ingresos."

    return explicacion# --- Crear la interfaz con dos pesta√±as ---


In [29]:
#---------CREAR INTERFAZ CON GRADIO---------

# --- Crear la interfaz con dos pesta√±as ---
with gr.Blocks(title="Finance Assistant con IA") as demo:
    gr.Markdown("# Finance Assistant con IA ‚Äì Tu asistente de finanzas personales")

    # Pesta√±a 1: Asistente generativo
    with gr.Tab("Asistente de Finanzas"):
        pregunta_input = gr.Textbox(label="Haz tu pregunta sobre finanzas")
        respuesta_output = gr.Textbox(label="Respuesta del asistente")
        gr.Button("Responder").click(fn=responder_pregunta, inputs=pregunta_input, outputs=respuesta_output)

    # Pesta√±a 2: Simulador financiero
    with gr.Tab("Simulador de Compra"):
        with gr.Row():
            valor_input = gr.Number(label="Valor compra ($)", value=800000)
            cuotas_input = gr.Slider(label="Cuotas", minimum=1, maximum=36, value=12, step=1)
        with gr.Row():
            interes_input = gr.Slider(label="Inter√©s mensual (%)", minimum=0, maximum=5, value=2.2, step=0.1)
            ingreso_input = gr.Number(label="Ingreso mensual ($)", value=2000000)
        simulacion_output = gr.Markdown()
        gr.Button("Simular y explicar").click(
            fn=calcular_simulacion,
            inputs=[valor_input, cuotas_input, interes_input, ingreso_input],
            outputs=simulacion_output
        )

# app con URL p√∫blica
demo.launch(share=True)

#---------PRUEBAS---------

#-----Asistente de Finanzas------

#Se pregunt√≥:¬øQue es un CDT?
#Respuesta: A CDT es un certificado de deposito a termino, una inversion que se realiza por un tiempo fijo y que genera un interes definido.

#Se pregunt√≥: ¬øQue es interes ?
#Respuesta: El interes compuesto es el que se calcula sobre el capital initial y tambien sobre los intereses que se han generado en periodos anteriores.

#Se pregunt√≥: Como invertir?
#Respuesta: As, el primer lugar de entender es que las empresas empresas de capital en el sector financiero, el cual tiene productos como CDTs, acciones, bonos o fondos mutuos de bajo riesgo, incluyen productos como CDTs, ac

#-----Simulador de Compra------

#Valor de compra: 4¬¥500.000
#Cuotas: 24
#Interes mensual: 2,2%
#Ingreso mensual: 2¬¥000.000
#Respuesta:

#Cuota mensual aproximada: $243,344
#Total pagado al final: $5,840,264
#Intereses acumulados: $1,340,264
# ‚úÖ La cuota est√° en un rango manejable respecto a tus ingresos.

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://6bf6973dbdb1d34132.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)




## **Conclusiones**

Este proyecto demuestra c√≥mo integrar IA generativa con recuperaci√≥n sem√°ntica para brindar educaci√≥n financiera accesible y pr√°ctica. Se usaron modelos abiertos y gratuitos, con resultados satisfactorios en generaci√≥n de texto, aunque el simulador financiero no aplica modelos de IA generativa es un buen complemento para la planificacion financiera.

### **Evaluaci√≥n y validaci√≥n**
Se probaron m√∫ltiples preguntas y se observ√≥ que FLAN-T5 responde de forma m√°s concisa y clara que modelos causales. La funci√≥n ```responder_pregunta``` imprime el contexto recuperado y el prompt generado, facilitando la trazabilidad. Adicional, el simulador financiero tambi√©n fue validado con ejemplos reales y advertencias.

### **Posibles mejoras**

- Expansi√≥n del corpus con fuentes oficiales permitira que las respuestas sean mas precisas.


