**PROYECTO CHATVOZ IA CONVERSACIONAL**


**Introducción:**
El desarrollo de un chatbot que interactúa no solo mediante texto, sino también con respuestas auditivas, es una de las mejoras más atractivas en la experiencia del usuario. La tecnología Text-to-Speech (TTS) ha avanzado lo suficiente como para proporcionar respuestas de voz naturales y personalizadas. Al combinar la interacción conversacional del chatbot con la capacidad de generar audio, puedes crear una interfaz más accesible e inmersiva para los usuarios, facilitando el acceso a la información de manera más inclusiva y eficiente.

En este proyecto, hemos integrado un modelo de TTS para que el chatbot no solo responda con texto, sino que también convierta sus respuestas en audio. Esta característica permite que los usuarios no solo lean, sino también escuchen las respuestas del chatbot, mejorando la experiencia y la accesibilidad.

**Objetivos del Proyecto:**
Integrar un sistema de Text-to-Speech (TTS): Implementar un mecanismo en el que el chatbot pueda convertir sus respuestas textuales en audio utilizando tecnologías de conversión de texto a voz, como la biblioteca gTTS.

Crear una interfaz interactiva usando Gradio: Proporcionar una interfaz de usuario en la que el chatbot pueda recibir preguntas, responder con texto, y ofrecer una reproducción en audio de sus respuestas.

Permitir la personalización de la voz: Incluir opciones que permitan a los usuarios ajustar la velocidad de la voz y seleccionar diferentes idiomas para la conversión de texto a voz.

Generar respuestas tanto en texto como en audio: Cada vez que el usuario realice una consulta al chatbot, éste responderá con un texto que se podrá leer y, simultáneamente, con un archivo de audio que se puede reproducir directamente en la interfaz.

**Gestionar el historial de conversación:** Mantener un registro del historial de conversación entre el usuario y el chatbot, con un formato claro y visual, que permita ver las interacciones anteriores.

Facilitar la carga de documentos PDF: Proporcionar la capacidad de cargar y procesar documentos PDF, de los cuales el chatbot puede extraer información para responder preguntas de manera contextual.

Este enfoque ofrece una experiencia de interacción enriquecida, con la ventaja añadida de la accesibilidad auditiva, ideal para usuarios que prefieren o necesitan respuestas por voz en lugar de texto.



In [1]:
!pip install pypdf
!pip install langchain
!pip install langchain-openai
!pip install gtts
!pip install playsound
!pip install python-dotenv
!pip install openai-whisper
!pip install pymupdf pdfplumber PyPDF2 gradio faiss-cpu tiktoken
!pip install -U langchain-community
!pip install openai
!pip install SpeechRecognition
!pip install fpdf
!pip freeze > requirements.txt


Collecting pypdf
  Downloading pypdf-5.0.1-py3-none-any.whl.metadata (7.4 kB)
Downloading pypdf-5.0.1-py3-none-any.whl (294 kB)
[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/294.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━━━━━━━━━━━━━━━━━━━[0m [32m143.4/294.5 kB[0m [31m4.1 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m294.5/294.5 kB[0m [31m4.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pypdf
Successfully installed pypdf-5.0.1
Collecting langchain
  Downloading langchain-0.3.3-py3-none-any.whl.metadata (7.1 kB)
Collecting langchain-core<0.4.0,>=0.3.10 (from langchain)
  Downloading langchain_core-0.3.12-py3-none-any.whl.metadata (6.3 kB)
Collecting langchain-text-splitters<0.4.0,>=0.3.0 (from langchain)
  Downloading langchain_text_splitters-0.3.0-py3-none-any.whl.metadata (2.3 kB)
Collecting langsmith<0.2.0,>=0.1.17 (from langchain)
  Downlo


# Biblotecas Usadas
*   os: Para manejar archivos y rutas.
*   gradio: Para construir la interfaz web interactiva.
*   requests: Para hacer solicitudes HTTP.
*   time: Para gestionar tiempos de espera y reintentos.
*   PyPDF2: Para manejar archivos PDF.
*   speech_recognition: Para convertir audio a texto.
*   gtts: Para convertir texto a audio.
*   dotenv: Para cargar variables de entorno
*   FPDF: Para generar archivos PDF.
*   tempfile: Para crear archivos temporales.**



In [37]:
import os
import gradio as gr
import requests
import time
import PyPDF2
import speech_recognition as sr
from gtts import gTTS
from dotenv import load_dotenv
from datetime import datetime
from fpdf import FPDF
import tempfile
from pydub import AudioSegment

**Cargar Claves API desde un archivo .env:**

In [4]:
dotenv_path = '/content/sample_data/ech/Clave.env'  # Reemplaza con la ruta correcta a tu archivo .env
load_dotenv(dotenv_path)

api_key = os.getenv("OPENAI_API_KEY")
if not api_key:
    raise ValueError("La clave de API no está definida. Asegúrate de que está configurada correctamente en el archivo .env.")

print(f"Clave API cargada correctamente")

Clave API cargada correctamente


In [5]:
# Configuración del endpoint
endpoint = "https://aoai-ine.openai.azure.com/openai/deployments/gpt-4o-mini/chat/completions?api-version=2024-02-15-preview"


 **Función para enviar solicitudes a OpenAI
Envía una solicitud al modelo de OpenAI,pasando el prompt (instrucciones) y la entrada del usuario,
y maneja posibles errores de red (especialmente errores HTTP 429 que indican demasiadas solicitudes).**

In [54]:
def send_request_to_model(prompt, user_input, api_key, endpoint, retries=5):
    headers = {
        "Content-Type": "application/json",
        "api-key": api_key,
    }

    payload = {
        "messages": [
            {"role": "system", "content": prompt},
            {"role": "user", "content": user_input}
        ],
        "temperature": 0.7,
        "top_p": 0.95,
        "max_tokens": 3000
    }

    attempt = 0
    while attempt < retries:
        try:
            response = requests.post(endpoint, headers=headers, json=payload, timeout=10)
            response.raise_for_status()  # Esto detecta errores HTTP automáticamente
            response_json = response.json()
            return response_json['choices'][0]['message']['content']
        except requests.exceptions.Timeout:
            print("Error: La solicitud ha superado el tiempo de espera.")
            attempt += 1
            time.sleep(2)  # Espera antes de reintentar
        except requests.exceptions.ConnectionError:
            print("Error: Problema de conexión. Verifique la red.")
            attempt += 1
            time.sleep(2)  # Espera antes de reintentar
        except requests.exceptions.HTTPError as e:
            if response.status_code == 429:
                attempt += 1
                wait_time = 5 * (2 ** attempt)
                print(f"HTTP 429: Too Many Requests. Reintentando en {wait_time} segundos...")
                time.sleep(wait_time)
            else:
                print(f"Fallo en la solicitud. Error HTTP: {e.response.status_code}")
                break
        except Exception as e:
            print(f"Error inesperado: {e}")
            break

    raise SystemExit("Fallo en la solicitud después de varios intentos.")

 **Función para convertir texto a audio usando gTTS
Convierte una cadena de texto en un archivo de audio utilizando Google Text-to-Speech (gTTS).**

In [40]:
def convertir_texto_a_audio(texto):
    if not texto.strip():
        raise ValueError("No se puede convertir un texto vacío a audio.")

    try:
        tts = gTTS(texto, lang='es')
        audio_path = "output_audio.mp3"
        tts.save(audio_path)
        return audio_path
    except Exception as e:
        print(f"Error al convertir texto a audio: {e}")
        return None

**Convertir audio a texto con speech_recognition**


In [41]:
# Función para convertir audio a texto
def convertir_audio_a_texto(audio_path):
    recognizer = sr.Recognizer()

    # Primero convertir a WAV si es MP3 u otro formato
    if not audio_path.endswith(".wav"):
        audio_path = convertir_a_wav(audio_path)

    try:
        with sr.AudioFile(audio_path) as source:
            audio_data = recognizer.record(source)
            texto = recognizer.recognize_google(audio_data, language='es-ES')
            return texto
    except sr.UnknownValueError:
        return "No se pudo entender el audio."
    except sr.RequestError as e:
        return f"Error en la solicitud de reconocimiento de audio: {e}"
    except Exception as e:
        return f"Error al procesar el archivo de audio: {e}"

In [35]:
# Función para convertir cualquier formato de audio a WAV
def convertir_a_wav(audio_path):
    try:
        audio = AudioSegment.from_file(audio_path)
        wav_path = "temp_audio.wav"
        audio.export(wav_path, format="wav")
        return wav_path
    except Exception as e:
        print(f"Error al convertir el archivo de audio a WAV: {e}")
        return None

**Función para extraer texto desde un PDF usando PyPDF2
Extrae texto de un archivo PDF utilizando PyPDF2.
Detalles:
Extracción por página: Extrae el texto página por página.
Control de errores: Verifica si el archivo existe y si es posible extraer texto de las páginas. Si alguna página está vacía, lanza advertencias.**

In [9]:
def extract_text_from_pdf(pdf_path):
    text = ""
    if not os.path.exists(pdf_path):
        raise FileNotFoundError(f"El archivo PDF no se encuentra en la ruta especificada: {pdf_path}")

    try:
        with open(pdf_path, 'rb') as file:
            reader = PyPDF2.PdfReader(file)
            for page_num, page in enumerate(reader.pages):
                page_text = page.extract_text()
                if page_text:
                    text += page_text + "\n\n"
                else:
                    print(f"Advertencia: No se pudo extraer texto de la página {page_num + 1}.")
    except Exception as e:
        raise ValueError(f"Error al intentar leer el archivo PDF: {e}")

    if not text.strip():
        raise ValueError("No se pudo extraer texto del PDF o el archivo está vacío.")

    return text


**Divide el texto en fragmentos ("chunks") de tamaño manejable, limitados por el número de caracteres.
Palabras: El texto se divide por palabras y se reorganiza en fragmentos más pequeños basados en el límite de tamaño (max_chunk_size).
**El propósito de esta función es esencial para reducir la longitud de textos largos. Está bien situada en el código y debería ejecutarse después de extraer el texto de los PDFs**

In [10]:
def chunk_text(text, max_chunk_size=1000):
    chunks = []
    words = text.split(" ")
    current_chunk = []
    for word in words:
        if len(" ".join(current_chunk)) + len(word) + 1 <= max_chunk_size:
            current_chunk.append(word)
        else:
            chunks.append(" ".join(current_chunk))
            current_chunk = [word]
    if current_chunk:
        chunks.append(" ".join(current_chunk))
    return chunks

In [None]:
# este codigo lo usamos para un unico PDF
# Cargar y chunkear un único PDF
# Este codigo lo dejamos implementado pero comentado para un archivo pdf
#def load_single_pdf_and_chunk(pdf_path):
 #   text = extract_text_from_pdf(pdf_path)
  #  if text:
   #     print("Texto extraído correctamente del PDF. Aquí hay una muestra:")
    #    print(text[:500])  # Imprimir los primeros 500 caracteres del texto
    #else:
     #   print("No se pudo extraer texto del PDF.")
    #chunks = chunk_text_by_paragraphs(text)
    #return chunks

**Función para cargar y extraer el texto de todos los PDFs en una carpeta
Propósito:
Carga todos los PDFs de un directorio, extrae el texto y los divide en fragmentos ("chunks")**

* **Detalles:
Extracción masiva: Procesa todos los archivos PDF en un directorio.
Integración con extract_text_from_pdf y chunk_text: Combina las funciones anteriores para obtener los fragmentos.#Esta función la usamos para varios pdf***

In [11]:
def load_pdfs_from_directory(directory_path):
    all_chunks = []
    for file_name in os.listdir(directory_path):
        if file_name.endswith(".pdf"):
            try:
                pdf_path = os.path.join(directory_path, file_name)
                text = extract_text_from_pdf(pdf_path)
                if text:
                    print(f"Texto extraído correctamente del archivo {file_name}.")
                    chunks = chunk_text(text, max_chunk_size=1000)
                    all_chunks.extend(chunks)
                else:
                    print(f"No se pudo extraer texto del archivo {file_name}.")
            except Exception as e:
                print(f"Error al procesar {file_name}: {e}")

    if not all_chunks:
        raise ValueError("No se pudo extraer texto de ningún archivo PDF o todos los archivos están vacíos.")

    return all_chunks

 **Función para encontrar el chunk más relevante basado en la pregunta del usuario
Propósito:
Encuentra el fragmento más relevante en función de la cantidad de palabras comunes entre la pregunta del usuario y los fragmentos de texto.
Detalles:
Búsqueda basada en intersección: Compara las palabras en el fragmento y la pregunta del usuario para calcular el "overlap" (superposición)
y selecciona el fragmento más relevante.
Esta función es esencial para asegurarse de que el modelo reciba el fragmento más relevante antes de responder.**

In [12]:
def find_relevant_chunk(chunks, user_input):
    """Encuentra el chunk más relevante en función de la pregunta del usuario."""
    relevant_chunk = ""
    max_overlap = 0
    user_words = set(user_input.lower().split())

    # Comparamos la cantidad de palabras comunes entre el chunk y la pregunta
    for chunk in chunks:
        chunk_words = set(chunk.lower().split())
        overlap = len(user_words.intersection(chunk_words))
        if overlap > max_overlap:
            max_overlap = overlap
            relevant_chunk = chunk

    return relevant_chunk

 **Función para manejar la conversación con el chatbot
Propósito:
Maneja la conversación entre el usuario y el chatbot, buscando el fragmento relevante,
enviando la solicitud al modelo y devolviendo la respuesta en texto y audio (opcional).**

**Detalles:
Combinación de funciones: Integra todas las funciones anteriores para buscar el fragmento relevante,
interactuar con el modelo y generar una respuesta.
Audio opcional: Si se solicita, también convierte la respuesta en formato de audio.
Sugerencia:
Es el punto central que conecta todas las demás funcionalidades del chatbot**

In [13]:
# Función para interactuar con el chatbot y enviar la respuesta
def chatbot_conversation(chunks, user_input, api_key, endpoint, respuesta_con_audio=False):
    relevant_chunk = find_relevant_chunk(chunks, user_input)

    if relevant_chunk:
        prompt = f"Basado en el siguiente texto extraído de archivos PDF:\n\n{relevant_chunk}\n\nResponde a la pregunta del usuario:"
    else:
        prompt = "No se pudo encontrar información relevante en los archivos PDF."

    try:
        response = send_request_to_model(prompt, user_input, api_key, endpoint)
        audio_file = None
        if respuesta_con_audio:
            audio_file = convertir_texto_a_audio(response)
        return response, audio_file
    except Exception as e:
        return "Error en la conversación con el modelo.", None


**Funcion para generar un resumen en PDF**

In [15]:
def generar_resumen(texto_pdf, api_key, endpoint):
    prompt = f"Resume el siguiente texto: {texto_pdf}"
    return send_request_to_model(prompt, "", api_key, endpoint)

# Explicación de la función `procesar_pdf_con_progreso`

La función `**procesar_pdf_con_progreso**` se encarga de procesar un archivo PDF para extraer su texto y generar un resumen, mostrando un indicador de progreso durante todo el proceso. A continuación se detallan los pasos que realiza la función:

## Argumentos de la función:

1. **`pdf_path`**: Es la ruta del archivo PDF que se desea procesar.
2. **`api_key`**: Clave de API que probablemente se utiliza para interactuar con un servicio de resumen.
3. **`endpoint`**: El endpoint de la API al que se envía la solicitud para generar el resumen.

## Indicador de progreso (`**gr.Progress()**`):

- La función utiliza `**gr.Progress()**` para crear un indicador visual del progreso. Se basa en la biblioteca **Gradio**, que facilita la creación de interfaces interactivas en Python.
- Se define un total del progreso de **100** (representando el 100%).

## Proceso:

1. **Extracción de texto del PDF**:
   - La función llama a `**extract_text_from_pdf(pdf_path)**` para extraer el texto del PDF proporcionado.
   - Tras completar la extracción, se actualiza el progreso al **50%** (`**pbar.update(50)**`).

2. **Generación del resumen**:
   - A continuación, llama a `**generar_resumen(texto_pdf, api_key, endpoint)**`, que genera un resumen del texto extraído utilizando un servicio API.
   - Una vez generado el resumen, el progreso se actualiza al **100%** (`**pbar.update(50)**`), indicando que el proceso ha finalizado.

3. **Retorno**:
   - Finalmente, la función devuelve el **resumen generado**.

## Consideraciones:

- La función utiliza un flujo de trabajo sencillo con dos pasos claros: **extracción de texto** y **generación del resumen**.
- El progreso se divide en dos actualizaciones de **50%** cada una.
- No se incluye manejo de errores en esta implementación, por lo que puede ser necesario agregar controles adicionales para asegurar que funcione en escenarios no ideales (como fallos en la API o problemas con el archivo PDF).

Este enfoque es útil para dar retroalimentación visual al usuario durante tareas que pueden tomar algún tiempo, como el procesamiento de archivos PDF grandes o solicitudes a servicios externos.

In [16]:
def procesar_pdf_con_progreso(pdf_path, api_key, endpoint):
    progress = gr.Progress()

    with progress.tqdm(total=100) as pbar:
        # Paso 1: Extraer texto del PDF
        texto_pdf = extract_text_from_pdf(pdf_path)
        pbar.update(50)  # Actualiza el progreso a la mitad

        # Paso 2: Generar resumen del PDF
        resumen = generar_resumen(texto_pdf, api_key, endpoint)
        pbar.update(50)  # Completa el progreso

    return resumen


La función **`exportar_resumen_pdf`** genera un archivo PDF a partir de un texto de resumen y lo guarda temporalmente.

### Proceso:

1. **Crear el PDF**: Se utiliza la biblioteca **FPDF** para crear un objeto PDF, se agrega una página y se define la fuente y tamaño del texto.
2. **Insertar el resumen**: El resumen se añade al PDF usando `**pdf.multi_cell()**`, que ajusta el texto a varias líneas.
3. **Guardar el archivo**: Se crea un archivo PDF temporal con `**tempfile.NamedTemporaryFile**` y se guarda el contenido del PDF en ese archivo.
4. **Devolver la ruta**: La función retorna la ruta del archivo PDF temporal generado.

### Consideraciones:
- Se utiliza un archivo temporal para almacenar el PDF, lo que permite un manejo dinámico del archivo.
- Ideal para exportar resúmenes a PDF y gestionarlos temporalmente.

In [18]:
def exportar_resumen_pdf(resumen):
    pdf = FPDF()
    pdf.add_page()
    pdf.set_font("Arial", size=12)
    pdf.multi_cell(200, 10, resumen)

    with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as temp_file:
        pdf.output(temp_file.name)
        return temp_file.name

La función **`cargar_pdf_y_generar_resumen`** extrae el texto de un archivo PDF y genera un resumen utilizando una API.

### Pasos:

1. **Extraer texto**: Usa `extract_text_from_pdf` para obtener el contenido del PDF.
2. **Generar resumen**: Llama a `generar_resumen` con el texto, la clave de API y el endpoint.

### Resultado:
- Devuelve el **resumen** del PDF.

In [19]:
# Función para manejar la carga y chunking del PDF
def cargar_pdf_y_generar_resumen(pdf_path, api_key, endpoint):
    # Extraer texto del PDF
    texto_pdf = extract_text_from_pdf(pdf_path)

    # Generar el resumen del PDF
    resumen = generar_resumen(texto_pdf, api_key, endpoint)

    return resumen

In [20]:
# Función para formatear el historial del chat en HTML
def format_history(chat_history):
    formatted_history = ""
    for entry in chat_history:
        timestamp = obtener_fecha_hora()
        if entry["role"] == "user":
            formatted_history += f"""
            <div style="background-color: #d4e6f1; color: #000; border-radius: 10px; padding: 10px; margin-bottom: 10px; width: fit-content;">
                <strong>🧑 Usuario:</strong> {entry['content']}
                <br><small>{timestamp}</small>
            </div>
            """
        else:
            formatted_history += f"""
            <div style="background-color: #b8e994; color: #000; border-radius: 10px; padding: 10px; margin-bottom: 10px; width: fit-content;">
                <strong>🤖 Bot:</strong> {entry['content']}
                <br><small>{timestamp}</small>
            </div>
            """
    return formatted_history

In [21]:
# Nueva función para limpiar el historial
def limpiar_historial(chat_history):
    chat_history.clear()
    return format_history(chat_history)

In [22]:
from datetime import datetime

# Función para obtener la fecha y la hora actual
def obtener_fecha_hora():
    return datetime.now().strftime("%Y-%m-%d %H:%M:%S")

La función **`format_history`** formatea un historial de chat en HTML, mostrando mensajes del usuario y del bot en burbujas de color.

### Proceso:

1. **Recorrer el historial**: Itera sobre cada entrada del historial de chat, que incluye el contenido y el rol (usuario o bot).
2. **Formatear cada mensaje**:
   - Los mensajes del **usuario** se muestran en una burbuja azul claro (`#d4e6f1`).
   - Los mensajes del **bot** se muestran en una burbuja verde claro (`#b8e994`).
3. **Agregar marca de tiempo**: Para cada mensaje, se añade una marca de tiempo obtenida con `obtener_fecha_hora()`.
4. **HTML final**: Los mensajes se formatean en HTML con bordes redondeados, color de fondo, y etiquetas para identificar quién los envió.

### Resultado:
- Devuelve el historial formateado en HTML con burbujas de chat diferenciadas para usuario y bot.

In [23]:
# Función para formatear el historial del chat en HTML con burbujas de color
def format_history(chat_history):
    formatted_history = ""
    for entry in chat_history:
        timestamp = obtener_fecha_hora()  # Añadimos la marca de tiempo para cada mensaje
        if entry["role"] == "user":
            formatted_history += f"""
            <div style="background-color: #d4e6f1; color: #000; border-radius: 10px; padding: 10px; margin-bottom: 10px; width: fit-content;">
                <strong>🧑 Usuario:</strong> {entry['content']}
                <br><small>{timestamp}</small>
            </div>
            """
        else:
            formatted_history += f"""
            <div style="background-color: #b8e994; color: #000; border-radius: 10px; padding: 10px; margin-bottom: 10px; width: fit-content;">
                <strong>🤖 Bot:</strong> {entry['content']}
                <br><small>{timestamp}</small>
            </div>
            """
    return formatted_history

In [24]:
# Función para generar el resumen con un indicador de progreso sin tqdm
def procesar_pdf_con_progreso(pdf_path, api_key, endpoint):
    progress = gr.Progress()

    # Paso 1: Extraer texto del PDF
    texto_pdf = extract_text_from_pdf(pdf_path)
    progress(50)  # Actualiza el progreso al 50%

    # Paso 2: Generar resumen del PDF
    resumen = generar_resumen(texto_pdf, api_key, endpoint)
    progress(100)  # Completa el progreso al 100%

    return resumen

La función **`exportar_resumen_pdf`** genera un archivo PDF a partir de un resumen proporcionado y lo guarda temporalmente.

### Proceso:

1. **Crear un PDF**: Se utiliza la biblioteca **FPDF** para crear un objeto PDF.
2. **Agregar contenido**: Se añade una página, se establece la fuente (`Arial` de tamaño 12), y se inserta el texto del resumen usando `multi_cell`.
3. **Guardar temporalmente**: Se guarda el archivo en un archivo temporal con el sufijo `.pdf`.
4. **Retornar la ruta**: Devuelve la ruta del archivo PDF temporal generado.

### Resultado:
- Un archivo PDF con el resumen guardado temporalmente.

In [25]:
def exportar_resumen_pdf(resumen):
    pdf = FPDF()
    pdf.add_page()
    pdf.set_font("Arial", size=12)
    pdf.multi_cell(200, 10, resumen)

    with tempfile.NamedTemporaryFile(delete=False, suffix=".pdf") as temp_file:
        pdf.output(temp_file.name)
        return temp_file.name

In [26]:
# Función para generar el resumen con un indicador de progreso
def procesar_pdf_con_progreso(pdf_path, api_key, endpoint):
    progress = gr.Progress()

    # Paso 1: Extraer texto del PDF
    texto_pdf = extract_text_from_pdf(pdf_path)
    progress(50)  # Actualiza el progreso al 50%

    # Paso 2: Generar resumen del PDF
    resumen = generar_resumen(texto_pdf, api_key, endpoint)
    progress(100)  # Completa el progreso al 100%

    return resumen

In [27]:
def limpiar_historial(chat_history):
    chat_history.clear()  # Limpiamos el historial
    return format_history(chat_history)  # Devolvemos el historial vacío

 **Interfaz del chatbot
Propósito:
Crea la interfaz gráfica para interactuar con el chatbot usando Gradio.
Detalles:
Gradio: Genera la interfaz donde el usuario puede hacer preguntas al chatbot, ver el historial de chat y recibir respuestas en texto o audio.
Interacción con el chatbot: Llama a las funciones necesarias para procesar las solicitudes del usuario y mostrar las respuestas.
Utilizamos Gradio para manejar las interacciones con el usuario.**

In [52]:
# Función para la interfaz del chatbot

import gradio as gr

# Función para la interfaz del chatbot y el resumen de PDFs
def chatbot_ui():
    try:
        directory_path = "/content/sample_data/ech"  # Ruta de la carpeta de los PDFs
        chunks = load_pdfs_from_directory(directory_path)  # Carga y chunking de PDFs
        chat_history = []

        with gr.Blocks() as demo:
            with gr.Tab("Chatbot"):
                with gr.Row():
                    with gr.Column(scale=4):
                        gr.Markdown("# CHATBOT BASADO EN MÚLTIPLES PDFs")

                        # Campo de entrada de texto para preguntas al chatbot
                        user_input = gr.Textbox(label="Pregunta al chatbot", placeholder="Escribe tu pregunta aquí...")

                        # Campo para mostrar la respuesta del chatbot
                        chat_output = gr.Textbox(label="Respuesta del chatbot", interactive=False)

                        # Checkbox para respuesta en formato de audio
                        respuesta_con_audio = gr.Checkbox(label="¿Deseas que la respuesta sea en audio?", value=False)

                        # Botón para enviar la pregunta
                        send_button = gr.Button("Enviar")

                        # Campo para mostrar el audio de la respuesta
                        audio_output = gr.Audio(label="Respuesta en Audio", interactive=False)

                        # Campo para cargar un archivo de audio
                        audio_input = gr.Audio(label="Cargar archivo de audio", type="filepath")

                        # Botón para convertir audio a texto
                        audio_to_text_button = gr.Button("Convertir Audio a Texto")

                    with gr.Column(scale=2):
                        with gr.Row():
                            # Botón para limpiar el historial
                            clear_button = gr.Button("Limpiar historial")

                        gr.Markdown("## Historial del Chat")

                        # Campo para mostrar el historial del chat
                        history_output = gr.HTML(value="""<div style="border: 2px solid #ccc; border-radius: 15px; padding: 15px; background-color: #f9f9f9; height: 400px; width: 100%; overflow-y: auto;" id="chat_container"></div>""")

            # Nueva pestaña para el resumen de PDFs
            with gr.Tab("Resumen de PDFs"):
                gr.Markdown("## Sección de Resumen de PDFs")

                # Botón para cargar un archivo PDF
                pdf_input = gr.File(label="Cargar PDF", type="filepath")

                # Botón para generar el resumen del PDF
                resumen_output = gr.Textbox(label="Resumen del PDF", interactive=False)
                resumen_button = gr.Button("Generar Resumen del PDF")

                # Botón para exportar resumen a PDF
                export_button = gr.Button("Exportar Resumen a PDF")

            # Función para interactuar con el chatbot
            def interact(input_text, con_audio):
                nonlocal chat_history, chunks
                answer, audio_file = chatbot_conversation(chunks, input_text, api_key, endpoint, con_audio)
                timestamp = obtener_fecha_hora()

                chat_history.append({"role": "user", "content": input_text})
                chat_history.append({"role": "bot", "content": answer})

                formatted_history = format_history(chat_history)
                return answer, formatted_history, audio_file if con_audio else None

            # Función para limpiar el historial
            def limpiar(input_text=None):
                nonlocal chat_history
                return "", limpiar_historial(chat_history), None

            # Función para convertir el audio a texto
            def convertir_audio(input_audio_path):
                if input_audio_path:
                    texto = convertir_audio_a_texto(input_audio_path)
                    return texto
                else:
                    return "No se ha cargado ningún archivo de audio."

            # Función para generar el resumen del PDF cargado con progreso
            def generar_resumen_pdf_con_progreso(pdf):
                if pdf:
                    resumen = procesar_pdf_con_progreso(pdf, api_key, endpoint)
                    return resumen
                else:
                    return "No se ha cargado ningún archivo PDF."

            # Función para exportar el resumen a un archivo PDF
            def exportar_resumen(resumen):
                if resumen.strip():
                    pdf_file = exportar_resumen_pdf(resumen)
                    return pdf_file
                else:
                    return None

            # Vincular las funciones a los eventos en la pestaña del chatbot
            send_button.click(interact, inputs=[user_input, respuesta_con_audio], outputs=[chat_output, history_output, audio_output])

            # Vincular la función de limpiar historial al botón clear_button
            clear_button.click(limpiar, inputs=None, outputs=[chat_output, history_output, audio_output])

            # Vincular la conversión de audio a texto al botón correspondiente
            audio_to_text_button.click(convertir_audio, inputs=[audio_input], outputs=[chat_output])

            # Vincular el botón de resumen del PDF cargado y mostrar progreso en la pestaña de Resumen de PDFs
            resumen_button.click(generar_resumen_pdf_con_progreso, inputs=[pdf_input], outputs=[resumen_output])

            # Vincular el botón de exportar resumen a PDF
            export_button.click(exportar_resumen, inputs=[resumen_output], outputs=[gr.File()])

        demo.launch(share=True, debug=True)

    except Exception as e:
        print(f"Error creando la interfaz del chatbot: {e}")


In [56]:
# Ejecutar la interfaz
if __name__ == "__main__":
    chatbot_ui()


Texto extraído correctamente del archivo Lugar de trabajo.pdf.
Texto extraído correctamente del archivo Ingresos.pdf.
Texto extraído correctamente del archivo Manual Operativo ECH 2021.pdf.
Texto extraído correctamente del archivo Manual del Supervisor ECH 2021.pdf.
Texto extraído correctamente del archivo Ocupado.pdf.
Texto extraído correctamente del archivo Residencia habitual.pdf.
Texto extraído correctamente del archivo Puntualización sobre cursos que acreditan EMB y cursos que no acreditan EMB ni EMS.pdf.
Texto extraído correctamente del archivo Manual de Critica Codificacion 2021.pdf.
Texto extraído correctamente del archivo Manual Dispositivo ECH 2021.pdf.
Texto extraído correctamente del archivo Desempleo.pdf.
Texto extraído correctamente del archivo Marco de referencia pobreza subjetiva 2021.pdf.
Texto extraído correctamente del archivo Cómo y dónde se registra canasta de emergencia alimentaria otorgada a través de la aplicación TUAPP.pdf.
Texto extraído correctamente del arch

Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7861 <> https://6587da7a8cb0256f16.gradio.live
