# Generacion de chunks

In [2]:
import re
import json
from langchain.text_splitter import RecursiveCharacterTextSplitter

def load_and_split_docs(filepath="/Users/raldo/Documents/LLMS/Taller1/info/base_conocimiento.txt"):
    """
    Carga el archivo de base de conocimiento y lo divide en documentos individuales
    basados en el delimitador '==='.
    """
    try:
        with open(filepath, 'r', encoding='utf-8') as f:
            content = f.read()
        # El delimitador es la l√≠nea que empieza con '=== '
        # Usamos una expresi√≥n regular para dividir manteniendo el delimitador para metadatos
        docs_raw = re.split(r'(?m)^=== .* ===$', content)
        # El primer elemento suele estar vac√≠o, lo filtramos
        docs_raw = [doc for doc in docs_raw if doc.strip()]
        
        # Necesitamos obtener los nombres de archivo que act√∫an como delimitadores
        delimiters = re.findall(r'(?m)^=== (.*) ===$', content)

        # Reconstruimos los documentos con su delimitador para el parsing
        processed_docs = []
        for i, doc_content in enumerate(docs_raw):
            if i < len(delimiters):
                full_doc = f"=== {delimiters[i]} ===\n{doc_content.strip()}"
                processed_docs.append(full_doc)

        print(f"Archivo principal cargado. Se encontraron {len(processed_docs)} documentos individuales.")
        return processed_docs
    except FileNotFoundError:
        print(f"Error: El archivo {filepath} no fue encontrado.")
        return []

def parse_document(doc_raw):
    """
    Extrae los metadatos y el contenido principal de un documento crudo.
    """
    metadata = {}
    content = ""
    lines = doc_raw.split('\n')

    # Extraer el nombre del archivo del delimitador
    filename_match = re.search(r'=== (.*) ===', lines[0])
    if filename_match:
        metadata['source_file'] = filename_match.group(1).strip()

    # Extraer metadatos y contenido principal
    in_content_section = False
    for line in lines[1:]: # Omitir la primera l√≠nea (delimitador)
        if line.strip() == 'Contenido Principal':
            in_content_section = True
            continue
        
        if line.startswith(('Estructura de Headings', 'Informaci√≥n de Contacto', 'Redes Sociales')):
            in_content_section = False # Se termin√≥ la secci√≥n de contenido principal

        if in_content_section:
            content += line + '\n'
        else:
            # Parsear metadatos clave-valor
            if ':' in line:
                key, *value = line.split(':', 1)
                key = key.strip().lower().replace(' ', '_')
                # Ignorar campos no deseados en los metadatos principales
                if key in ['url', 'title', 'description', 'keywords', 'scraped_date', 'source']:
                    metadata[key] = ''.join(value).strip()

    return content.strip(), metadata

def main():
    """
    Funci√≥n principal que orquesta el proceso de carga, parsing y chunking.
    """
    # 1. Cargar y dividir el archivo en documentos
    documents_raw = load_and_split_docs()
    
    if not documents_raw:
        return

    all_texts = []
    all_metadatas = []

    # 2. Parsear cada documento para extraer contenido y metadatos
    for doc_raw in documents_raw:
        content, metadata = parse_document(doc_raw)
        if content and metadata.get('title'): # Solo procesar si tiene contenido y un t√≠tulo
            all_texts.append(content)
            all_metadatas.append(metadata)

    print(f"Se procesaron y parsearon {len(all_texts)} documentos con contenido √∫til.")

    # 3. Inicializar el Text Splitter con nuestra estrategia
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=1000,
        chunk_overlap=200,
        separators=["\n\n", "\n", " ", ""] # Prioriza separaci√≥n por p√°rrafos
    )

    # 4. Aplicar el chunking a todos los textos
    # Langchain puede manejar la creaci√≥n de documentos con sus metadatos asociados
    # de forma muy eficiente
    chunks = text_splitter.create_documents(all_texts, metadatas=all_metadatas)

    print(f"\n¬°Chunking completado! Se generaron {len(chunks)} fragmentos en total.")

    # 5. Preparar los chunks para guardarlos en un archivo JSON
    output_chunks = []
    for i, chunk in enumerate(chunks):
        output_chunks.append({
            'chunk_id': i,
            'content': chunk.page_content,
            'metadata': chunk.metadata
        })

    # 6. Guardar los chunks en un archivo JSON
    output_filepath = "chunks.json"
    with open(output_filepath, 'w', encoding='utf-8') as f:
        json.dump(output_chunks, f, indent=2, ensure_ascii=False)

    print(f"Los chunks se han guardado exitosamente en el archivo: '{output_filepath}'")
    
    # 7. Mostrar un ejemplo de los primeros chunks para verificaci√≥n
    print("\n--- Ejemplo de los primeros 2 Chunks ---")
    print(json.dumps(output_chunks[:2], indent=2, ensure_ascii=False))
    print("------------------------------------------")


if __name__ == "__main__":
    main()

Archivo principal cargado. Se encontraron 54 documentos individuales.
Se procesaron y parsearon 26 documentos con contenido √∫til.

¬°Chunking completado! Se generaron 130 fragmentos en total.
Los chunks se han guardado exitosamente en el archivo: 'chunks.json'

--- Ejemplo de los primeros 2 Chunks ---
[
  {
    "chunk_id": 0,
    "content": "Marcas\nColombina y Taj√≠n¬Æ presentan: nuevo Remix Bon Bon Bum x Taj√≠n, la fusi√≥n que Internet hizo realidad\njulio 18 2025\nCali, 18 de julio de 2025.\nLas ic√≥nicas marcas Bon Bon Bum y Taj√≠n se unen para lanzar un producto que revoluciona el sabor: el Nuevo Remix Bon Bon Bum x Taj√≠n, una combinaci√≥n que une los sabores del Bon Bon Bum con el toque √∫nico de Taj√≠n. Esta alianza representa la celebraci√≥n de la cultura, la creatividad y la autenticidad latinoamericana.\nInicialmente, estar√° disponible en Colombia, Estados Unidos, Guatemala, El Salvador y Puerto Rico, con proyecciones de ventas que superan los 5 millones de d√≥lares en su 

# Q&A

In [None]:
import json
from langchain_community.llms import Ollama
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser

def load_knowledge_base(filepath="chunks.json"):
    """
    Carga los chunks desde el archivo JSON y los concatena en un solo
    string de texto que servir√° como contexto completo.
    """
    try:
        with open(filepath, 'r', encoding='utf-8') as f:
            data = json.load(f)
        
        # Unimos todo el contenido de los chunks en un solo texto gigante.
        # Agregamos metadatos clave para dar m√°s contexto a cada chunk.
        full_context = ""
        for item in data:
            # Incluimos el t√≠tulo y la fuente de cada documento antes de su contenido
            # para ayudar al LLM a contextualizar la informaci√≥n.
            title = item['metadata'].get('title', 'Fuente desconocida')
            source_file = item['metadata'].get('source_file', 'Documento sin nombre')
            
            full_context += f"--- Inicio del Documento: {title} (Archivo: {source_file}) ---\n"
            full_context += item['content']
            full_context += f"\n--- Fin del Documento: {title} ---\n\n"
            
        print(f"‚úÖ Base de conocimiento cargada y consolidada. Total de caracteres: {len(full_context)}")
        return full_context
    except FileNotFoundError:
        print(f"‚ùå Error: El archivo '{filepath}' no fue encontrado.")
        return None
    except Exception as e:
        print(f"‚ùå Ocurri√≥ un error al cargar la base de conocimiento: {e}")
        return None

def create_simple_qa_chain(knowledge_context, llm_model="gpt-oss"):
    """
    Crea una cadena de Q&A simple que inyecta todo el conocimiento
    en el prompt, sin usar un retriever.
    """
    print(f"\nüîÑ Configurando la cadena Q&A con el modelo de Ollama: '{llm_model}'...")

    # 1. Inicializar el LLM a trav√©s de Ollama
    llm = Ollama(model=llm_model)

    # 2. Crear el prompt template
    # Este prompt ahora tiene un placeholder para el contexto completo y la pregunta.
    template = """
    Eres un asistente experto de la empresa Colombina. Responde la pregunta del usuario bas√°ndote estricta y √∫nicamente en la siguiente base de conocimiento.
    Si la respuesta no se encuentra en la base de conocimiento, responde exactamente: "La informaci√≥n solicitada no se encuentra en mi base de conocimiento."
    No intentes inventar una respuesta. S√© conciso y directo.

    --- INICIO DE LA BASE DE CONOCIMIENTO ---
    {context}
    --- FIN DE LA BASE DE CONOCIMIENTO ---

    Pregunta del usuario:
    {question}

    Respuesta:
    """
    prompt = PromptTemplate.from_template(template)

    # 3. Construir la cadena
    # Es m√°s simple: solo formatea el prompt con el contexto y la pregunta,
    # y luego pasa el resultado al LLM.
    simple_qa_chain = (
        prompt
        | llm
        | StrOutputParser()
    )
    
    print("‚úÖ Cadena de Q&A simple configurada exitosamente.")
    return simple_qa_chain

def main():
    # Cargar toda la base de conocimiento en una sola variable
    knowledge_context = load_knowledge_base()
    if knowledge_context is None:
        return

    # Crear la cadena de Q&A
    qa_chain = create_simple_qa_chain(knowledge_context, llm_model="gpt-oss:20b")

    # Listado de 20 preguntas
    questions = [
        # ... (Las mismas 20 preguntas de la respuesta anterior) ...
        "¬øEn qu√© a√±o se cre√≥ el Bon Bon Bum?",
        "¬øC√≥mo se llama el programa de Colombina para acompa√±ar a sus proveedores y emprendedores?",
        "¬øQu√© porcentaje de la energ√≠a el√©ctrica que utiliza Colombina en sus operaciones en Colombia proviene de fuentes renovables?",
        "¬øCu√°l es la certificaci√≥n que han recibido las 5 f√°bricas de Colombia en relaci√≥n con la gesti√≥n de residuos?",
        "¬øQui√©n fue el fundador de Colombina?",
        "Describe la colaboraci√≥n entre Bon Bon Bum y Taj√≠n. ¬øQu√© producto lanzaron y cu√°les eran las proyecciones de ventas?",
        "¬øCu√°les son los principales logros de Colombina en materia de sostenibilidad relacionados con la energ√≠a y el agua?",
        "Seg√∫n la pol√≠tica de protecci√≥n de datos, ¬øcu√°l es el procedimiento que debe seguir una persona si desea actualizar o rectificar su informaci√≥n personal?",
        "Resume la historia de la creaci√≥n de la chupeta Bon Bon Bum. ¬øQui√©n la cre√≥ y cu√°l fue su innovaci√≥n principal?",
        "¬øQu√© es Colombina Energ√≠a S.A.S. E.S.P. y cu√°l es su funci√≥n principal?",
        "Compara las alianzas de Colombina con Ramo y Postob√≥n. ¬øQu√© productos ic√≥nicos se crearon en cada colaboraci√≥n?",
        "¬øQu√© relaci√≥n existe entre la certificaci√≥n 'Sello Oro Equipares' y los valores corporativos de Colombina?",
        "Lista tres plantas de producci√≥n de Colombina, su ubicaci√≥n y qu√© tipo de productos se fabrican en cada una.",
        "¬øEn qu√© pa√≠ses fuera de Colombia tiene Colombina plantas de producci√≥n, seg√∫n la informaci√≥n proporcionada?",
        "Si soy un proveedor y no he logrado obtener mi certificado de retenci√≥n a trav√©s del portal, ¬øa qu√© correo electr√≥nico debo escribir?",
        "¬øCu√°l es la pol√≠tica de Colombina respecto al uso de huevos libres de jaula y cu√°l es la meta para 2025?",
        "De acuerdo con la pol√≠tica de tratamiento de datos, ¬øqu√© ocurre con la informaci√≥n de un candidato que no es seleccionado para un puesto de trabajo?",
        "¬øCu√°l fue la calificaci√≥n que recibi√≥ Colombina al obtener la certificaci√≥n Basura Cero ORO para sus plantas de helados?",
        "Menciona dos deportistas que han sido embajadores o imagen de campa√±as relacionadas con Bon Bon Bum.",
        "¬øCu√°l es el salario anual del presidente de Colombina?"
    ]

    print("\n--- üöÄ INICIANDO EVALUACI√ìN DEL SISTEMA Q&A (M√âTODO IN-CONTEXT) üöÄ ---\n")
    
    for i, question in enumerate(questions, 1):
        print(f"--- Pregunta {i}/{len(questions)} ---")
        print(f"‚ùì: {question}")
        
        # Invocar la cadena. Pasamos el contexto completo y la pregunta.
        # El LLM tardar√° m√°s porque tiene que "leer" todo el contexto cada vez.
        answer = qa_chain.invoke({"context": knowledge_context, "question": question})
        
        print(f"ü§ñ: {answer}")
        print("-" * (len(str(i)) + len(str(len(questions))) + 16))
        print("\n")


if __name__ == "__main__":
    main()

‚úÖ Base de conocimiento cargada y consolidada. Total de caracteres: 130954

üîÑ Configurando la cadena Q&A con el modelo de Ollama: 'gpt-oss:20b'...
‚úÖ Cadena de Q&A simple configurada exitosamente.

--- üöÄ INICIANDO EVALUACI√ìN DEL SISTEMA Q&A (M√âTODO IN-CONTEXT) üöÄ ---

--- Pregunta 1/20 ---
‚ùì: ¬øEn qu√© a√±o se cre√≥ el Bon Bon Bum?
ü§ñ: No dispongo de informaci√≥n sobre el a√±o en que se cre√≥ el Bon‚ÄØBon‚ÄØBum.
-------------------


--- Pregunta 2/20 ---
‚ùì: ¬øC√≥mo se llama el programa de Colombina para acompa√±ar a sus proveedores y emprendedores?
ü§ñ: **Programa Big Brother.**
-------------------


--- Pregunta 3/20 ---
‚ùì: ¬øQu√© porcentaje de la energ√≠a el√©ctrica que utiliza Colombina en sus operaciones en Colombia proviene de fuentes renovables?
ü§ñ: El 100‚ÄØ% de la energ√≠a el√©ctrica que emplea Colombina en sus operaciones dentro de Colombia proviene de fuentes renovables.
-------------------


--- Pregunta 4/20 ---
‚ùì: ¬øCu√°l es la certificaci√≥n que han recibido las 5 f√°bricas de Colombia en relaci√≥n con la gesti√≥n de residuos?
ü§ñ: 
-------------------


--- Pregunta 5/20 ---
‚ùì: ¬øQui√©n fue el fundador de Colombina?
ü§ñ: El fundador de Colombina fue **Carlos Fernando de la Torre**.
-------------------


--- Pregunta 6/20 ---
‚ùì: Describe la colaboraci√≥n entre Bon Bon Bum y Taj√≠n. ¬øQu√© producto lanzaron y cu√°les eran las proyecciones de ventas?
ü§ñ: 
-------------------


--- Pregunta 7/20 ---
‚ùì: ¬øCu√°les son los principales logros de Colombina en materia de sostenibilidad relacionados con la energ√≠a y el agua?
ü§ñ: **Logros de Colombina en sostenibilidad energ√©tica**

| √Årea | Acci√≥n | Impacto concreto |
|------|--------|-----------------|
| **Energ√≠a renovable** | ‚Ä¢ Instalaci√≥n de **m√°s de 36‚ÄØ000 paneles solares** en la Granja Solar y en las cinco plantas de producci√≥n de Colombia.  <br>‚Ä¢ La granja solar convierte la energ√≠a solar en electricidad 100‚ÄØ% renovable, que alimenta la producci√≥n de alimentos. | ‚Ä¢ **Reducci√≥n de huella de carbono del 45‚ÄØ%** desde 2015 (por tonelada producida). |
| **Energ√≠a el√©ctrica** | ‚Ä¢ Todas las f√°bricas de Colombia est√°n certificadas con el **Sello Basura‚ÄØCero** por la organizaci√≥n Basura Cero Colombia, lo que garantiza una gesti√≥n energ√©tica eficiente y la reducci√≥n de residuos que impactan en el consumo energ√©tico. | ‚Ä¢ Optimizaci√≥n del consumo el√©ctrico y mayor eficiencia en los procesos de producci√≥n. |

**Logros de Colombina en sostenibilidad h√≠drica**

| √Årea | Acci√≥n | Impacto concreto |
|------|--------|-----------------|
| **Consumo de agua** | ‚Ä¢ Implementaci√≥n de medidas de eficiencia h√≠drica en todas las plantas. | ‚Ä¢ **Ahorro del 27‚ÄØ%** del consumo de agua desde 2015 (por tonelada producida). |
| **Tratamiento y reutilizaci√≥n de aguas** | ‚Ä¢ Instalaci√≥n de **plantas de tratamiento de aguas residuales** que purifican el agua usada en la producci√≥n y la devuelven limpia. | ‚Ä¢ Agua tratada ‚Äútan limpia como la recibimos‚Äù, contribuyendo a la sostenibilidad del recurso h√≠drico. |

En resumen, Colombina ha logrado:

* **Energ√≠a**: generaci√≥n de electricidad 100‚ÄØ% renovable mediante una extensa red solar, reducci√≥n del 45‚ÄØ% en huella de carbono y certificaci√≥n Basura‚ÄØCero en todas sus plantas.  
* **Agua**: reducci√≥n del 27‚ÄØ% en consumo h√≠drico y tratamiento eficaz de aguas residuales que devuelve el agua a la producci√≥n de forma limpia.
-------------------


--- Pregunta 8/20 ---
‚ùì: Seg√∫n la pol√≠tica de protecci√≥n de datos, ¬øcu√°l es el procedimiento que debe seguir una persona si desea actualizar o rectificar su informaci√≥n personal?
ü§ñ: **Procedimiento para actualizar o rectificar la informaci√≥n personal**

1. **Identificar la informaci√≥n**  
   - Se√±ala con claridad cu√°l(es) dato(s) personal(es) deseas corregir o actualizar.

2. **Iniciar la solicitud**  
   - Presenta una petici√≥n formal de rectificaci√≥n o actualizaci√≥n a trav√©s del canal designado por la entidad (por ejemplo, un formulario en l√≠nea, correo electr√≥nico o medio establecido por la organizaci√≥n).

3. **Verificar la informaci√≥n proporcionada**  
   - La entidad revisar√° la solicitud y verificar√° la exactitud de los datos nuevos o corregidos.

4. **Respuesta y acci√≥n**  
   - Si la entidad acepta la solicitud, proceder√° a actualizar o rectificar la informaci√≥n en los sistemas y bases de datos correspondientes.
   - Si no recibe respuesta dentro de un plazo razonable, la persona puede dirigirse a las autoridades competentes (por ejemplo, el organismo regulador de protecci√≥n de datos de su pa√≠s) para solicitar una intervenci√≥n.

En resumen, la persona debe: **identificar la informaci√≥n a rectificar, enviar la solicitud de actualizaci√≥n a trav√©s del canal designado, esperar la verificaci√≥n y correcci√≥n por parte de la entidad, y en caso de falta de respuesta, recurrir a las autoridades competentes**.
-------------------


--- Pregunta 9/20 ---
‚ùì: Resume la historia de la creaci√≥n de la chupeta Bon Bon Bum. ¬øQui√©n la cre√≥ y cu√°l fue su innovaci√≥n principal?
ü§ñ: Lo siento, pero la informaci√≥n sobre la creaci√≥n de la chupeta‚ÄØ**Bon‚ÄØBon‚ÄØBum** no est√° disponible en la base de conocimiento.
-------------------


--- Pregunta 10/20 ---
‚ùì: ¬øQu√© es Colombina Energ√≠a S.A.S. E.S.P. y cu√°l es su funci√≥n principal?
ü§ñ: 
--------------------


--- Pregunta 11/20 ---
‚ùì: Compara las alianzas de Colombina con Ramo y Postob√≥n. ¬øQu√© productos ic√≥nicos se crearon en cada colaboraci√≥n?
ü§ñ: No se encuentran referencias en la base de conocimiento sobre alianzas de Colombina con la marca **Ramo** ni con **Postob√≥n**. En consecuencia, no dispongo de informaci√≥n sobre productos ic√≥nicos que se hayan creado en dichas colaboraciones.
--------------------


--- Pregunta 12/20 ---
‚ùì: ¬øQu√© relaci√≥n existe entre la certificaci√≥n 'Sello Oro Equipares' y los valores corporativos de Colombina?
ü§ñ: 
--------------------


--- Pregunta 13/20 ---
‚ùì: Lista tres plantas de producci√≥n de Colombina, su ubicaci√≥n y qu√© tipo de productos se fabrican en cada una.
ü§ñ: **Tres de las plantas de producci√≥n de la comunidad de La‚ÄØPaila (Valle‚ÄØdel‚ÄØCauca, Colombia)**  

| # | Nombre de la planta | Ubicaci√≥n | Producto principal |
|---|---------------------|-----------|--------------------|
| 1 | **Planta de Confiter√≠a** | La‚ÄØPaila, Valle‚ÄØdel‚ÄØCauca | Chocolates, caramelos, chips de chocolate y una variedad de galletas (de chocolate, ma√≠z, queso y avena) |
| 2 | **Planta de Galletas** | La‚ÄØPaila, Valle‚ÄØdel‚ÄØCauca | Galletas de chocolate, ma√≠z, queso y avena (producci√≥n especializada en diferentes tipos de galleta) |
| 3 | **Planta de Galletas (Granja‚ÄØSolar)** | La‚ÄØPaila, Valle‚ÄØdel‚ÄØCauca | Galletas de chocolate, ma√≠z, queso y avena (generada dentro del mismo complejo agro‚Äësolar, con √©nfasis en la producci√≥n de galletas sostenibles) |

> *Nota:* La comunidad de La‚ÄØPaila combina la producci√≥n tradicional de confiter√≠a con la fabricaci√≥n de galletas, apoyada por la Granja‚ÄØSolar, que integra agricultura y energ√≠a renovable. Las tres plantas mencionadas son unidades de producci√≥n distintas, aunque dos comparten la misma localidad (La‚ÄØPaila).
--------------------


--- Pregunta 14/20 ---
‚ùì: ¬øEn qu√© pa√≠ses fuera de Colombia tiene Colombina plantas de producci√≥n, seg√∫n la informaci√≥n proporcionada?
ü§ñ: Seg√∫n la informaci√≥n incluida en la base de conocimiento, Colombina no dispone de plantas de producci√≥n fuera de Colombia.  Todas las f√°bricas mencionadas est√°n ubicadas en territorio colombiano.
--------------------


--- Pregunta 15/20 ---
‚ùì: Si soy un proveedor y no he logrado obtener mi certificado de retenci√≥n a trav√©s del portal, ¬øa qu√© correo electr√≥nico debo escribir?
ü§ñ: Puedes comunicarte con el correo **contacto@colombina.com** para resolver cualquier inconveniente con la obtenci√≥n del certificado de retenci√≥n a trav√©s del portal.
--------------------


--- Pregunta 16/20 ---
‚ùì: ¬øCu√°l es la pol√≠tica de Colombina respecto al uso de huevos libres de jaula y cu√°l es la meta para 2025?
ü§ñ: **Pol√≠tica de uso de huevos libres de jaula**  
No se dispone de informaci√≥n en la base de conocimiento sobre una pol√≠tica espec√≠fica de Colombina respecto al uso de huevos libres de jaula.

**Meta para 2025**  
Igualmente, la base de conocimiento no menciona una meta concreta para el a√±o 2025 en relaci√≥n con este tema.
--------------------


--- Pregunta 17/20 ---
‚ùì: De acuerdo con la pol√≠tica de tratamiento de datos, ¬øqu√© ocurre con la informaci√≥n de un candidato que no es seleccionado para un puesto de trabajo?
ü§ñ: Seg√∫n la pol√≠tica de tratamiento de datos de la empresa, la informaci√≥n de un candidato que no es seleccionado para un puesto se conserva de forma archivada durante **30‚ÄØd√≠as**. Ese per√≠odo sirve para verificar la finalizaci√≥n del proceso y responder a posibles consultas del candidato. Una vez transcurridos esos 30‚ÄØd√≠as, la informaci√≥n es **eliminada o anonimizada**, garantizando que no se mantenga datos personales sin una finalidad justificada.
--------------------


--- Pregunta 18/20 ---
‚ùì: ¬øCu√°l fue la calificaci√≥n que recibi√≥ Colombina al obtener la certificaci√≥n Basura Cero ORO para sus plantas de helados?
ü§ñ: La calificaci√≥n que Colombina obtuvo con la certificaci√≥n **Basura‚ÄØCero‚ÄØORO** para sus plantas de helados fue la propia **‚ÄúOro‚Äù** (un sello de nivel superior otorgado por ICONTEC y Basura‚ÄØCero‚ÄØColombia).
--------------------


--- Pregunta 19/20 ---
‚ùì: Menciona dos deportistas que han sido embajadores o imagen de campa√±as relacionadas con Bon Bon Bum.
ü§ñ: En la informaci√≥n disponible de Bon Bon Bum se menciona a **Gustavo Puerta** como el embajador oficial de la campa√±a. No se registra en los documentos una segunda figura deportiva que haya servido como embajador o imagen de la campa√±a.
--------------------


--- Pregunta 20/20 ---
‚ùì: ¬øCu√°l es el salario anual del presidente de Colombina?
ü§ñ: No dispongo de esa informaci√≥n.
--------------------

#,Pregunta,Respuesta del LLM,Evaluaci√≥n,Comentarios

1),¬øEn qu√© a√±o se cre√≥ el Bon Bon Bum?,"""No dispongo de informaci√≥n...""",üî¥ Incorrecta,La informaci√≥n S√ç est√° en el contexto. El LLM no la encontr√≥.
2),¬øPrograma para proveedores y emprendedores?,"""Programa Big Brother.""",‚úÖ Correcta,Respuesta perfecta y concisa.
3),¬øPorcentaje energ√≠a renovable en Colombia?,"""El 100 %...""",‚úÖ Correcta,Extrajo el dato exacto del contexto.
4),¬øCertificaci√≥n de gesti√≥n de residuos 5 f√°bricas?,(Sin respuesta),üî¥ Incorrecta,"Falla del modelo. La respuesta (""Basura Cero"") est√° en el contexto."
5),¬øFundador de Colombina?,"""Carlos Fernando de la Torre.""",üî¥ Incorrecta (Alucinaci√≥n),¬°FALLA CR√çTICA! El modelo invent√≥ un nombre. El fundador es Hernando Caicedo.
6),¬øColaboraci√≥n Bon Bon Bum y Taj√≠n?,(Sin respuesta),üî¥ Incorrecta,Falla del modelo. Toda la informaci√≥n estaba en el contexto.
7),¬øLogros sostenibilidad energ√≠a y agua?,(Tabla detallada con 45% y 27%),‚úÖ Correcta,Excelente respuesta. Encontr√≥ y sintetiz√≥ los datos correctos.
8),¬øProcedimiento actualizar datos personales?,(Lista gen√©rica de 4 pasos),üî¥ Incorrecta (Alucinaci√≥n),,¬°FALLA CR√çTICA! El modelo invent√≥ un procedimiento gen√©rico e ignor√≥ el real del PDF (enviar correo a pdp@colombina.com o ir a la Carrera 1 # 24 ‚Äì 56).
9),¬øHistoria creaci√≥n Bon Bon Bum?,"""Lo siento, pero la informaci√≥n... no est√° disponible.""",üî¥ Incorrecta,"Falla del modelo, igual que en la P1. La historia, el creador (Jaime H. Caicedo) y la innovaci√≥n (relleno de chicle) est√°n en el contexto."
10),¬øQu√© es Colombina Energ√≠a S.A.S. E.S.P.?,(Sin respuesta),üî¥ Incorrecta,Falla del modelo. La definici√≥n estaba clara en el contexto.
11),¬øComparar alianzas Ramo y Postob√≥n?,"""No se encuentran referencias...""",üî¥ Incorrecta,Falla del modelo. Ambas alianzas (Helado de Chocoramo y Bon Bon Bum de Manzana Postob√≥n ) estaban en el contexto.
12),¬øRelaci√≥n Sello Oro Equipares y valores?,(Sin respuesta),üî¥ Incorrecta,"Falla del modelo. El contexto vincula expl√≠citamente ""Equipares"" con el valor corporativo de ""Respeto""."
13),"¬øTres plantas, ubicaci√≥n, productos?","(Tabla con 3 plantas, todas en ""La Paila"")",üî¥ Incorrecta (Alucinaci√≥n),"¬°FALLA CR√çTICA! El modelo invent√≥ la informaci√≥n. Las plantas son (1) Confiter√≠a en La Paila (dulces, chicles), (2) Galletas en Santander de Quilichao (galletas, waffers), (3) Salsas en Tulu√° (salsas, compotas)."
14),¬øPlantas fuera de Colombia?,"""...no dispone de plantas de producci√≥n fuera de Colombia.""",üî¥ Incorrecta,Falla del modelo. El contexto menciona expl√≠citamente plantas en Guatemala y Espa√±a.
15),¬øEmail proveedor certificado retenci√≥n?,"""...contacto@colombina.com""",üî¥ Incorrecta (Alucinaci√≥n),¬°FALLA CR√çTICA! El modelo invent√≥ un correo gen√©rico. El correo correcto del PDF es jruano@colombina.com.
16),¬øPol√≠tica huevos libres de jaula?,"""No se dispone de informaci√≥n...""",üî¥ Incorrecta,Falla del modelo. El contexto menciona la meta para 2025 de que el 60% de los huevos sean libres de jaula.
17),¬øInfo candidato no seleccionado?,"""...se conserva... durante 30 d√≠as... es eliminada o anonimizada.""",üî¥ Incorrecta (Alucinaci√≥n),"¬°FALLA CR√çTICA! El modelo invent√≥ ""30 d√≠as"" y ""anonimizada"". El PDF solo dice que ""ser√° eliminada""."
18),¬øCalificaci√≥n Basura Cero ORO helados?,"""...la propia 'Oro'...""",üü° Parcial,"El modelo no dio la ""calificaci√≥n"" (el puntaje), sino la categor√≠a. La calificaci√≥n exacta, 97 sobre 100, s√≠ estaba en el contexto."
19),¬øDos deportistas Bon Bon Bum?,"""...menciona a Gustavo Puerta... No se registra... una segunda figura...""",üü° Parcial,"El modelo encontr√≥ a uno (Gustavo Puerta ) pero fall√≥ en encontrar a los otros, como Linda Caicedo o David Alonso y Sebasti√°n Montoya."
20),¬øSalario presidente?,"""No dispongo de esa informaci√≥n.""",‚úÖ Correcta (Negativa),¬°√âXITO! Esta era una pregunta trampa. El modelo sigui√≥ el prompt y no alucin√≥.

# Resumen

In [None]:
import json
from langchain_community.llms import Ollama
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser

def load_knowledge_base(filepath="chunks.json"):
    with open(filepath, 'r', encoding='utf-8') as f:
        data = json.load(f)
    context = "\n".join([item["content"] for item in data])
    print(f"‚úÖ Base de conocimiento cargada. {len(data)} fragmentos.")
    return context

def create_summary_chain(knowledge_context, llm_model="gpt-oss:20b"):
    llm = Ollama(model=llm_model)

    template = """
    Eres un asistente experto en redacci√≥n y an√°lisis empresarial.
    Genera un resumen claro, preciso y estructurado de la siguiente base de conocimiento de Colombina.
    No inventes informaci√≥n, y divide el resumen en secciones tem√°ticas relevantes.

    --- INICIO DE LA BASE DE CONOCIMIENTO ---
    {context}
    --- FIN DE LA BASE DE CONOCIMIENTO ---

    Resumen:
    """

    prompt = PromptTemplate.from_template(template)

    chain = prompt | llm | StrOutputParser()
    return chain

def main():
    context = load_knowledge_base()
    summary_chain = create_summary_chain(context, llm_model="gpt-oss:20b")

    print("\n--- üöÄ GENERANDO RESUMEN GLOBAL ---\n")
    summary = summary_chain.invoke({"context": context})
    print(summary)

if __name__ == "__main__":
    main()


Resultados

1) --- üöÄ GENERANDO RESUMEN GLOBAL ---

| Tema | Resumen | |------|---------| | **Historia & expansi√≥n** | 1976-2024: crecimiento de 50 plantas en 19 pa√≠ses; nuevos negocios en confiter√≠a, chocolate, bebidas, comidas r√°pidas, snacks, jugos, yogures y productos de granja. | | **Sostenibilidad** | ‚Ä¢ 10 a√±os en *Top 10* de S&P Global por pr√°cticas sostenibles. <br>‚Ä¢ Huella de carbono reducida 45‚ÄØ% (2015‚Äë2024). <br>‚Ä¢ Agua reducida 27‚ÄØ% (2015‚Äë2024). <br>‚Ä¢ 89‚ÄØ% de plantas con certificaci√≥n Basura Cero. <br>‚Ä¢ 56‚ÄØ% de productos libres de colorantes, saborizantes y conservantes artificiales. | | **Innovaci√≥n & nutrici√≥n** | ‚Ä¢ 2.5‚ÄØ% de ventas en productos propios, 100‚ÄØ% de √©stos promueven salud y nutrici√≥n. <br>‚Ä¢ 64‚ÄØ000 tenderos en Rall‚Äëe Ventas. <br>‚Ä¢ Programa Clean & Clear en evoluci√≥n constante. | | **Econom√≠a & desempe√±o** | ‚Ä¢ Ventas: $3.3‚ÄØbillones <br>‚Ä¢ EBITDA: 14‚ÄØ% <br>‚Ä¢ 89‚ÄØ% de colaboradores con contrato directo, 38‚ÄØ% mujeres, 43‚ÄØ% gerenciales. | | **Responsabilidad social** | ‚Ä¢ M√°s de 36‚ÄØ000 paneles solares. <br>‚Ä¢ Programa Big Brother: 150+ proveedores apoyados. <br>‚Ä¢ Fundaci√≥n Colombina: 13‚ÄØ000 ni√±os, 22‚ÄØ000 participaciones en la Copa Bon‚ÄØBon‚ÄØBum 2024. <br>‚Ä¢ Sello Oro Equipares y Sello Oro Equipares. | | **Proyectos destacados** | ‚Ä¢ Granja Solar en La Paila: 100‚ÄØ% de energ√≠a renovable, 45‚ÄØ% menos huella de carbono. <br>‚Ä¢ Copas deportivas, becas, talleres art√≠sticos y desarrollo comunitario. <br>‚Ä¢ Rall‚Äëe Ventas: canal digital para tenderos. | **En una frase**: Colombina combina innovaci√≥n en alimentos, eficiencia energ√©tica y social con un fuerte compromiso con la sostenibilidad, la diversidad y la comunidad.

2) --- üöÄ GENERANDO RESUMEN GLOBAL ---

En la Colombina, todas las plantas que producen productos de alto riesgo (az√∫car, ma√≠z, ma√≠z tostado, az√∫car de ca√±a, caf√© en polvo con cafe√≠na y chocolate con leche) est√°n sometidas a estrictas normas de seguridad alimentaria y protecci√≥n ambiental, garantizando el cumplimiento del C√≥digo Pa√≠s y las recomendaciones de la Organizaci√≥n de la Salud y la Alimentaci√≥n (OSHA) y HACCP, lo que se traduce en un 100‚ÄØ% de certificaci√≥n de seguridad alimentaria en las instalaciones; adem√°s, las cinco f√°bricas de Colombia est√°n certificadas con Basura Cero, lo que implica una estrategia integral de reducci√≥n, reutilizaci√≥n y aprovechamiento m√°ximo de residuos org√°nicos y s√≥lidos, y han reducido la huella de carbono en un 45‚ÄØ% (por tonelada producida) y el consumo de agua en un 27‚ÄØ%, todo con energ√≠a el√©ctrica 100‚ÄØ% renovable, cumpliendo as√≠ con los requisitos de protecci√≥n ambiental, protecci√≥n de la salud y nutrici√≥n de los consumidores y los colaboradores, y apoyando a la cadena de suministro mediante el programa Big Brother y la certificaci√≥n de proveedores.

3) --- üöÄ GENERANDO RESUMEN GLOBAL ---

**Resumen Corporativo Responsable ‚Äì Industria de Alimentos**  

| A√±o / Etapa | Evento Clave |
|-------------|--------------|
| 1998‚Äë2018 | Adquisici√≥n del Grupo 1A (La‚ÄØPaila) |
| 2005 | Compra de la marca Bon‚ÄØBon |
| 2007 | Compra de la marca La‚ÄØPaila |
| 2008 | Adquisici√≥n de la marca Pajarito |
| 2018 | Compra de la marca Colombiana |
| 2019 | Lanzamiento de la marca Bon‚ÄØBon |
| 2020 | Adquisici√≥n de la marca La‚ÄØPaila (plantas) |
| 2022 | Adquisici√≥n de la marca Pajarito (plantas) |
| 2024 | Expansi√≥n a Chile |

---

**Estrategia de Sostenibilidad (Ejes Tem√°ticos)**  

| Tema | Acci√≥n / Programa | Objetivo / Enfoque |
|------|-------------------|--------------------|
| Energ√≠a Renovable | Parque solar con 36‚ÄØ000‚ÄØpaneles | Generar el 100‚ÄØ% de la energ√≠a consumida a partir de fuentes renovables |
| Gesti√≥n de Residuos | Programa‚ÄØ‚ÄúBasura‚ÄØCero‚Äù | Reducir la huella de carbono y reutilizar el 100‚ÄØ% de los excedentes de producci√≥n |
| Eficiencia H√≠drica | Uso de agua optimizado | Reducir el consumo h√≠drico en un 27‚ÄØ% respecto a 2015 |
| Salud y Nutrici√≥n | L√≠nea‚ÄØ‚ÄúClean‚ÄØ&‚ÄØClear‚Äù | Incrementar la proporci√≥n de productos libres de colorantes, saborizantes y conservantes |
| Inclusi√≥n y Diversidad | Pol√≠ticas de igualdad | 38,7‚ÄØ% de la plantilla femenina, 43,6‚ÄØ% de cargos directivos femeninos |
| Gobierno Corporativo | Publicaci√≥n de informes anuales | Transparencia sobre desempe√±o financiero y de sostenibilidad |
| Responsabilidad Social | Fundaci√≥n Colombina | Inversi√≥n de 7‚ÄØ300‚ÄØmillones de pesos en iniciativas comunitarias |
| Innovaci√≥n y Competitividad | Programa‚ÄØ‚ÄúBig‚ÄØBrother‚Äù | Capacitaci√≥n y evaluaci√≥n de 28 proveedores en criterios de sostenibilidad |

---

**Resultados Clave (Indicadores Medibles)**  

| √Årea | M√©trica | Resultado |
|------|---------|-----------|
| **Balance Ecol√≥gico** | Huella de carbono (por tonelada producida) | Reducci√≥n de‚ÄØ45‚ÄØ% desde 2015 |
|  | Consumo de energ√≠a | Disminuci√≥n significativa (valor relativo a 2015) |
|  | Consumo de agua | Reducci√≥n de‚ÄØ27‚ÄØ% respecto a 2015 |
|  | Uso de residuos | 100‚ÄØ% de plantas con certificaci√≥n de seguridad alimentaria |
| **Desarrollo Social** | Inversi√≥n en programas sociales | 7‚ÄØ300‚ÄØmillones de pesos |
|  | Participaci√≥n en eventos comunitarios | 22‚ÄØ000‚ÄØni√±os en Copa‚ÄØBon‚ÄØBon‚ÄØBum 2024 |
|  | Beneficiados por la Fundaci√≥n | 13‚ÄØ232‚ÄØni√±os y j√≥venes |
| **Competitividad** | Replicaci√≥n de modelos sostenibles con proveedores | 28‚ÄØproveedores capacitados |
|  | Evaluaci√≥n de proveedores | 100‚ÄØ% de plantas con certificaci√≥n de seguridad |
| **Empleados** | Contratos directos | 91,8‚ÄØ% de la plantilla |
|  | Clima organizacional | 89,3‚ÄØ% de satisfacci√≥n en encuesta |
|  | Capacitaci√≥n | 6‚ÄØ800‚ÄØempleados directos formados |
|  | Inversi√≥n en bienestar | 3‚ÄØ600‚ÄØmillones de pesos |
| **Transparencia y Nutrici√≥n** | Productos libres de aditivos | 56‚ÄØ% de la l√≠nea de productos |
|  | Productos mejorados | 1‚ÄØ438‚ÄØl√≠neas con enfoque Clean‚ÄØ&‚ÄØClear |
| **Eficiencia Econ√≥mica** | Ventas anuales | 3‚ÄØ300‚ÄØbillones de pesos |
|  | Margen EBITDA | 14,1‚ÄØ% |
|  | Distribuci√≥n a tenderers | 64‚ÄØ000‚ÄØclientes que compran mensualmente v√≠a Rall‚Äëe Ventas |

Este resumen sintetiza las contribuciones econ√≥micas, ambientales, sociales y de gobernanza de la corporaci√≥n, evidenciando su compromiso integral como empresa responsable en la industria alimentaria.

Evaluaci√≥n t√©cnica de los tres resultados

Resultado 1) ‚Äî Estructura equilibrada y factual
Este es el mejor de los tres.
Resume con precisi√≥n todos los ejes tem√°ticos (historia, sostenibilidad, innovaci√≥n, desempe√±o, responsabilidad social y proyectos).
Los datos coinciden exactamente con los de la base de conocimiento (huella -45 %, agua -27 %, EBITDA 14 %, 36 000 paneles, etc.).
Est√° bien jerarquizado por secciones.
üìò Conclusi√≥n:
‚úÖ Es el resumen m√°s fiel y equilibrado.
Perfecto para usar como ‚Äúfuente‚Äù para la fase de reformulaci√≥n fluida.

Resultado 2) ‚Äî Excesivamente t√©cnico y espec√≠fico
Se centra casi exclusivamente en seguridad alimentaria y Basura Cero.
Ignora innovaci√≥n, desempe√±o financiero y proyectos sociales.
Parece que el modelo se ‚Äúatasc√≥‚Äù en una de las secciones de la base y amplific√≥ ese contexto.
üìò Conclusi√≥n:
‚ö†Ô∏è No es representativo globalmente. Desc√°rtalo para el resumen final.

Resultado 3) ‚Äî Resumen tipo informe t√©cnico / ESG
Muy detallado, bien estructurado, tipo ‚Äúreporte de sostenibilidad‚Äù.
Tiene cifras adicionales (7 300 millones, 6 800 empleados, 1 438 productos, etc.) que s√≠ est√°n en la base, pero el estilo tabular es m√°s r√≠gido.
Es √∫til si quisieras generar un anexo t√©cnico, pero no como texto narrativo.
üìò Conclusi√≥n:
‚úÖ Muy completo, pero demasiado extenso y segmentado.
Podr√≠a servir para fusionar cifras si quieres una versi√≥n ‚Äúenriquecida‚Äù.

# FAQ

In [None]:
import json
from langchain_community.llms import Ollama
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser


# ==========================================================
# 1Ô∏è‚É£ Cargar y limitar la base de conocimiento
# ==========================================================
def load_knowledge_base(filepath="chunks.json", max_chunks=25):
    """
    Carga el archivo con los chunks del conocimiento y selecciona los m√°s relevantes
    para evitar exceder el l√≠mite de contexto del modelo.
    """
    with open(filepath, 'r', encoding='utf-8') as f:
        data = json.load(f)

    # Selecciona los fragmentos m√°s largos (los m√°s informativos)
    selected = sorted(data, key=lambda x: len(x["content"]), reverse=True)[:max_chunks]
    context = "\n".join([item["content"] for item in selected])

    print(f"‚úÖ Base de conocimiento cargada. {len(selected)} fragmentos seleccionados de {len(data)} totales.")
    print(f"üìè Tama√±o aproximado del contexto: {len(context.split())} palabras.\n")
    return context


# ==========================================================
# 2Ô∏è‚É£ Crear la cadena de generaci√≥n de preguntas FAQ
# ==========================================================
def create_faq_chain(knowledge_context, llm_model="gpt-oss:20b"):
    """
    Crea una cadena LangChain que genera autom√°ticamente preguntas frecuentes (FAQ)
    sobre Colombina, basadas en la base de conocimiento.
    """
    llm = Ollama(model=llm_model)

    template = """
    Eres un generador de Preguntas Frecuentes (FAQ) sobre la empresa **Colombina**, 
    un l√≠der latinoamericano en alimentos. Tu tarea es analizar la base de conocimiento 
    provista y producir directamente entre 15 y 25 preguntas realistas y diversas 
    que un cliente, proveedor o colaborador podr√≠a hacer sobre la empresa.

    Reglas:
    - Las preguntas deben centrarse en Colombina: su historia, productos, sostenibilidad, 
      innovaci√≥n, programas sociales, proveedores y contacto.
    - No generes preguntas gen√©ricas sobre liderazgo o gesti√≥n.
    - No pidas aclaraciones al usuario ni solicites m√°s informaci√≥n.
    - No incluyas respuestas ni formato adicional, solo las preguntas enumeradas.
    - Redacta las preguntas en tono formal y natural, como en una secci√≥n de FAQ corporativa.

    --- INICIO DE LA BASE DE CONOCIMIENTO ---
    {context}
    --- FIN DE LA BASE DE CONOCIMIENTO ---

    Preguntas frecuentes:
    """

    prompt = PromptTemplate.from_template(template)
    chain = prompt | llm | StrOutputParser()
    return chain


# ==========================================================
# 3Ô∏è‚É£ Funci√≥n principal
# ==========================================================
def main():
    # Cargar base de conocimiento limitada
    context = load_knowledge_base(filepath="chunks.json", max_chunks=25)

    # Crear la cadena FAQ
    faq_chain = create_faq_chain(context, llm_model="gpt-oss:20b")

    print("\n--- üöÄ GENERANDO PREGUNTAS FRECUENTES DE COLOMBINA ---\n")

    # Invocar el modelo
    faqs = faq_chain.invoke({"context": context})
    print(faqs)

    # Guardar resultado
    output_file = "faqs_colombina.txt"
    with open(output_file, "w", encoding="utf-8") as f:
        f.write(faqs)

    print(f"\n‚úÖ Preguntas frecuentes guardadas en '{output_file}'.")


# ==========================================================
# 4Ô∏è‚É£ Ejecuci√≥n directa
# ==========================================================
if __name__ == "__main__":
    main()


--- üöÄ GENERANDO PREGUNTAS FRECUENTES DE COLOMBINA ---

¬°Claro! Aqu√≠ tienes una secci√≥n de preguntas frecuentes (FAQ) que cubre los temas m√°s solicitados sobre **Colombina** y su ecosistema de productos, sostenibilidad, operaciones y programas corporativos. Si tienes alguna duda espec√≠fica que no aparezca aqu√≠, no dudes en dec√≠rmelo.

---

## Preguntas Frecuentes (FAQ)

| # | Pregunta | Respuesta |
|---|----------|-----------|
| **1** | ¬øCu√°les son las marcas m√°s representativas de Colombina? | Colombina gestiona un portafolio de m√°s de 140 marcas, entre las m√°s conocidas se encuentran: <br>‚Ä¢ *Amazon* (salsas y aj√≠ picante)<br>‚Ä¢ *Colombina 100%* (productos libres de colorantes y saborizantes artificiales)<br>‚Ä¢ *Taj√≠n* (sazonador)<br>‚Ä¢ *Ramo* (snacks)<br>‚Ä¢ *B√∫falo*, *B√©same*, *B√∫falo*, *Joya*, *Chocolates y m√°s. |
| **2** | ¬øD√≥nde se producen los productos de Colombina? | Colombina opera 5 f√°bricas certificadas por **Basura Cero** en Colombia y 2 plantas de helados con la certificaci√≥n **Basura Cero Oro**. Tambi√©n tiene plantillas en Rep√∫blica Dominicana, Espa√±a, y otras filiales en Centroam√©rica, Europa y √Åfrica. |
| **3** | ¬øQu√© iniciativas de sostenibilidad lidera Colombina? | <ul><li>**Basura Cero Oro** (certificaci√≥n de 97/100).</li><li>Reducci√≥n de agua en un 27‚ÄØ% desde 2015.</li><li>Uso de 70‚ÄØ% de az√∫car de ca√±a en la producci√≥n de 3 tipos de az√∫car.</li><li>Plan de gesti√≥n de residuos s√≥lidos y org√°nicos con un enfoque ‚Äúcero basura‚Äù.</li><li>Participaci√≥n en el **Top 10** de empresas de alimentos con mejores pr√°cticas sostenibles de S&P Global 2024.</li></ul> |
| **4** | ¬øQu√© es la Copa Bon Bon Bum? | Es una competencia deportiva para m√°s de 22,000 ni√±os y familias cada a√±o, fomentando el deporte y la recreaci√≥n. Colombina patrocina la copa y tiene un embajador deportivo (Gustavo Puerta) que inspira a los participantes. |
| **5** | ¬øQu√© programas de bienestar ofrece a sus colaboradores? | ‚Ä¢‚ÄØPrograma *Pays* (pensionado, acompa√±amiento y seguro).<br>‚Ä¢‚ÄØAjustes de vivienda (1‚ÄØ405 personas han adquirido vivienda propia).<br>‚Ä¢‚ÄØDesarrollo profesional, salud, seguridad y bienestar laboral. |
| **6** | ¬øCu√°les son los valores corporativos de Colombina? | ‚Ä¢‚ÄØTrabajo en Equipo<br>‚Ä¢‚ÄØCompromiso<br>‚Ä¢‚ÄØOrientaci√≥n al Cliente<br>‚Ä¢‚ÄØRespeto |
| **7** | ¬øQu√© tipos de alimentos y snacks produce Ramo? | Ramo produce ponqu√©s, pasabocas y galletas, con enfoque en innovaci√≥n y tecnolog√≠a. Colaboradores: 3‚ÄØ000 empleados, presencia nacional con dos plantas en Mosquera, Cundinamarca. |
| **8** | ¬øC√≥mo se involucra Colombina con la comunidad? | Fundaci√≥n Colombina: Donaciones de 200‚ÄØ000 pesos para programas de apoyo a comunidades necesitadas. Programa *Ramo* celebra 75 a√±os de tradici√≥n en 2025. |
| **9** | ¬øQu√© certificaciones de diversidad y equidad posee la compa√±√≠a? | Colombina fue primera en recibir el **Sello Oro Equipares** y mantiene la certificaci√≥n durante 6 a√±os. |

---

**Fortalezas claras**

Est√° contextualizado correctamente
Todas las preguntas giran en torno a Colombina: productos, sostenibilidad, programas, valores, colaboradores y comunidad.
Ya no aparecen temas gen√©ricos como ‚Äúliderazgo‚Äù o ‚ÄúKPIs‚Äù.
Esto demuestra que el prompt ancl√≥ correctamente el dominio.

Incluye datos y hechos reales
Cita correctamente indicadores de tu base: reducci√≥n del 27 % de agua, certificaci√≥n Basura Cero Oro, Sello Oro Equipares, Copa Bon Bon Bum, presencia internacional.
Estos puntos existen textualmente en tu corpus ‚Äî as√≠ que est√° bas√°ndose en la fuente correcta.

Estructura de FAQ limpia y funcional
Formato Markdown tabular: usable directamente en tu interfaz Streamlit o en tu informe.

Genera 9 FAQs con contenido detallado; cada una incluye pregunta + respuesta estructurada.
Demuestra comprensi√≥n sem√°ntica de m√∫ltiples ejes
Integra sostenibilidad, expansi√≥n, bienestar laboral, comunidad y valores corporativos.
Usa vocabulario corporativo consistente con informes reales de Colombina.

**Ajustes sugeridos**

Filtraci√≥n leve de marcas externas
Menciona Ramo y Taj√≠n, que s√≠ aparecen en tu base de conocimiento (alianzas y productos compartidos),
pero se mezclan con ‚ÄúAmazon‚Äù ‚Äî ese es un falso positivo generado por ruido contextual.

