In [5]:
from docx import Document

# Create a new Document
doc = Document()

# Add a title
doc.add_heading('Funcionamiento del sistema de optimización y despacho de pedidos con Delta Lake y Spark Streaming', 0)

# Add introduction section
doc.add_heading('Introducción', level=1)
doc.add_paragraph(
    "Este documento explica el funcionamiento de un sistema de optimización y despacho de pedidos utilizando "
    "Delta Lake, Spark Streaming y servicios de AWS. El sistema tiene como objetivo procesar órdenes en tiempo real, "
    "acumulando datos hasta alcanzar ciertos umbrales (peso, volumen) y enviarlos a un optimizador de rutas para "
    "organizar el despacho de las órdenes."
)

# Add section on Streaming Data with Delta Lake
doc.add_heading('Procesamiento de Datos en Streaming con Delta Lake', level=1)
doc.add_paragraph(
    "Delta Lake es una capa de almacenamiento que permite transacciones ACID sobre datos de grandes volúmenes. "
    "Al integrarlo con Spark Streaming, el sistema puede manejar flujos de datos de manera confiable, escribiendo y "
    "leyendo datos continuamente a medida que se generan nuevas órdenes."
)
doc.add_paragraph(
    "El sistema recibe datos de pedidos en formato JSON, los cuales se almacenan inicialmente en una tabla en el nivel "
    "Bronce. A través de un proceso en streaming, se realiza la agregación de los pedidos para verificar si se han "
    "alcanzado los umbrales necesarios para iniciar el despacho."
)

# Add section on Threshold Logic and Optimization
doc.add_heading('Lógica de Umbrales y Optimización de Despacho', level=1)
doc.add_paragraph(
    "El sistema está diseñado para despachar pedidos una vez que el volumen total o el peso total acumulado alcanza "
    "ciertos umbrales predefinidos. La lógica del sistema incluye la agrupación de pedidos por ventanas de tiempo "
    "(por ejemplo, 10 minutos) y la verificación de estos umbrales antes de marcar los pedidos como listos para despacho."
)
doc.add_paragraph(
    "En caso de que el volumen o peso total supere la capacidad máxima de los camiones disponibles, el sistema debe "
    "dividir los pedidos en lotes más pequeños, asegurando que cada camión reciba un volumen y peso manejable."
)

# Add section on Handling Leftover Orders
doc.add_heading('Manejo de Órdenes Restantes', level=1)
doc.add_paragraph(
    "Una vez que se procesa un lote de pedidos y es enviado para optimización, cualquier pedido restante que no haya sido "
    "despachado se mantiene en estado 'RECEIVED'. Estos pedidos serán reanalizados en las próximas ventanas de tiempo "
    "para su despacho."
)

# Add section on Integration with Route Optimizer
doc.add_heading('Integración con el Optimizador de Rutas', level=1)
doc.add_paragraph(
    "Cuando los pedidos están listos para ser despachados, se envían al optimizador de rutas (por ejemplo, Routific) para "
    "determinar las rutas óptimas para los camiones. Este paso asegura que las entregas se realicen de manera eficiente "
    "y se minimicen los costos de transporte."
)

# Add section on Batch vs. Streaming Logic
doc.add_heading('Lógica Batch versus Streaming', level=1)
doc.add_paragraph(
    "El sistema puede operar en modo batch o en streaming, dependiendo de los requerimientos de procesamiento de los "
    "pedidos. En modo streaming, los pedidos se procesan en tiempo real a medida que se generan, mientras que en modo "
    "batch, los datos se acumulan y se procesan de una sola vez, generalmente en intervalos de tiempo predefinidos."
)

# Add section on AWS Infrastructure
doc.add_heading('Infraestructura de AWS', level=1)
doc.add_paragraph(
    "El sistema utiliza varios servicios de AWS, como S3 para el almacenamiento de datos, Kinesis para la ingesta de "
    "datos en tiempo real, y AWS EMR para ejecutar los trabajos de Spark. Estos servicios permiten que el sistema escale "
    "según las necesidades de procesamiento de datos y garantizan una alta disponibilidad."
)

# Add conclusion
doc.add_heading('Conclusión', level=1)
doc.add_paragraph(
    "El sistema descrito en este documento combina tecnologías de procesamiento en tiempo real, almacenamiento transaccional "
    "y optimización de rutas para gestionar de manera eficiente el despacho de pedidos. Utilizando Spark Streaming y Delta "
    "Lake, el sistema puede manejar grandes volúmenes de datos en tiempo real y despachar pedidos de manera óptima."
)

# Save the document
doc_path = "/Users/borja/Documents/Somniumrema/projects/de/route_optimizer/notebooks/morralla/Funcionamiento_Sistema_Optimizacion_Pedidos.docx"
doc.save(doc_path)

doc_path


'/Users/borja/Documents/Somniumrema/projects/de/route_optimizer/notebooks/morralla/Funcionamiento_Sistema_Optimizacion_Pedidos.docx'