Ejemplo invocación Gemini
En este notebook se muestra cómo trabajar con la API de Google Gemini.

Universidad Nacional de Colombia

Departamento de Ciencias de la Computación y de la Decisión

Profesor Juan David Ospina

Introducción a Redes Neuronales y Algoritmos Bioinspirados

Semestre 2024-02

Fecha: 26 de febrero de 2025

In [1]:
%%capture
!apt-get update
!apt-get install pandoc # para usar markdown
!apt-get install texlive-xetex # Toma un buen tiempo la instalación
!pip install markdown2 # para usar markdown
!pip install pypandoc # para usar markdown

In [2]:
!pip install fitz

Collecting fitz
  Downloading fitz-0.0.1.dev2-py2.py3-none-any.whl.metadata (816 bytes)
Collecting configobj (from fitz)
  Downloading configobj-5.0.9-py2.py3-none-any.whl.metadata (3.2 kB)
Collecting configparser (from fitz)
  Downloading configparser-7.1.0-py3-none-any.whl.metadata (5.4 kB)
Collecting nipype (from fitz)
  Downloading nipype-1.9.2-py3-none-any.whl.metadata (6.8 kB)
Collecting pyxnat (from fitz)
  Downloading pyxnat-1.6.3-py3-none-any.whl.metadata (5.4 kB)
Collecting prov>=1.5.2 (from nipype->fitz)
  Downloading prov-2.0.1-py3-none-any.whl.metadata (3.6 kB)
Collecting rdflib>=5.0.0 (from nipype->fitz)
  Downloading rdflib-7.1.3-py3-none-any.whl.metadata (11 kB)
Collecting simplejson>=3.8.0 (from nipype->fitz)
  Downloading simplejson-3.20.1-cp311-cp311-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.2 kB)
Collecting traits>=6.2 (from nipype->fitz)
  Downloading traits-7.0.2-cp311-cp311-manylinux_2_5_x86_64.manylinux1_x8

In [3]:
!pip install --upgrade pymupdf

Collecting pymupdf
  Downloading pymupdf-1.25.3-cp39-abi3-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (3.4 kB)
Downloading pymupdf-1.25.3-cp39-abi3-manylinux2014_x86_64.manylinux_2_17_x86_64.whl (20.0 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m20.0/20.0 MB[0m [31m115.1 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pymupdf
Successfully installed pymupdf-1.25.3


In [4]:
import os
from google.colab import userdata
from markdown2 import markdown
import pypandoc

#os.environ['GOOGLE_API_KEY'] = userdata.get('GOOGLE_API_KEY')

import google.generativeai as genai

In [5]:
import fitz  # PyMuPDF para leer PDFs
import google.generativeai as genai

# Configura la API de Gemini (sustituye con tu clave)
genai.configure(api_key="AIzaSyAooWfS3xzumCHk4xw4lMjl2yGdcoj3sog")
model = genai.GenerativeModel('gemini-2.0-flash-001')

initial_prompt = """
Eres un desarrollador experto de contenido educativo con amplia experiencia en la creación de materiales de cursos universitarios. Posees un profundo conocimiento en principios pedagógicos, diseño curricular y redacción académica. Tu tarea es ayudar a desarrollar un agente inteligente basado en modelos de lenguaje (LLM) que, a partir de un plan de estudios (syllabus), genere materiales educativos integrales que cumplan con altos estándares académicos.

Contexto y Objetivos
El agente debe:

Analizar y Comprender el Syllabus:

Extraer los componentes esenciales (objetivos, competencias, temáticas, metodologías, evaluaciones, etc.).
Identificar puntos clave para la generación de contenido pedagógico.
Generar Materiales Educativos:

Elaborar módulos detallados para cada tema o área, definiendo objetivos, contenidos, actividades y evaluaciones.
Crear notas de clase comprensivas que expliquen en profundidad cada módulo, incluyendo ejemplos, explicaciones teóricas y prácticos retos para el estudiante.
Mantener un alto rigor académico, asegurando la confiabilidad de la información y la integración de buenas prácticas pedagógicas.
Formato de Salida Específico:

Toda la salida generada debe estructurarse en formato JSON.
La estructura JSON debe incluir secciones claras para módulos y notas de clase.
Ejemplo de formato JSON:

{
  "course_title": "Título del Curso",
  "modules": [
    {
      "module_title": "Título del Módulo 1",
      "objectives": ["Objetivo 1", "Objetivo 2"],
      "module_num": "1",
      "content_outline": "Resumen de contenidos",
      "class_notes": {
        "class_num": "1",
        "introduction": "Introducción detallada del tema",
        "theory": "Desarrollo teórico con explicaciones y ejemplos",
        "challenges": "Retos y actividades prácticas para el estudiante"
      }
    },
    {
      "module_title": "Título del Módulo 2",
      "objectives": ["Objetivo A", "Objetivo B"],
      "content_outline": "Resumen de contenidos",
      "class_notes": {
        "introduction": "Introducción al tema",
        "theory": "Explicaciones teóricas y casos de estudio",
        "challenges": "Ejercicios y retos para aplicar lo aprendido"
      }
    }
  ]
}


SYLLABUS:
"""

# Función para extraer texto de un PDF
def extract_text_from_pdf(pdf_path):
    doc = fitz.open(pdf_path)
    text = "\n".join([page.get_text() for page in doc])  # Extrae el texto de todas las páginas
    return text


# Cargar el PDF y extraer el texto
pdf_path = "/content/1503714_Desarrollo_Económico - firmado.pdf"  # Cambia por tu archivo
document_text = extract_text_from_pdf(pdf_path)


In [6]:
prompt = f"{initial_prompt}\n{document_text}"



response = model.generate_content(prompt)

In [7]:
# Convertir el texto en un PDF

# Resultado del promt
text = response.text

# Archivo intermedio html
html = markdown(text)

# Convierte el archivo html en PDF
extra_args = ['--pdf-engine=xelatex',
              '-V', 'mainfont=Latin Modern Roman'
             ]
pypandoc.convert_text(html, 'pdf', format='html', outputfile='materiales_curso.pdf', extra_args=extra_args)
# Revisar el resultado en la carpeta de archivos de Colab.

''

In [8]:
import json

respuesta = response.text

# Find the start and end of the JSON object
start = respuesta.find('{')
end = respuesta.rfind('}') + 1  # +1 to include the closing brace

# Extract the JSON string
json_string = respuesta[start:end]

# Try to parse the JSON
try:
    data_json = json.loads(json_string)
    print(data_json)  # Or do something else with the data
except json.JSONDecodeError as e:
    print(f"Error decoding JSON: {e}")
    print(f"Problematic JSON string: {json_string}")

{'course_title': 'Desarrollo Económico', 'course_code': '1503714', 'academic_unit': 'Facultad de Ciencias Económicas', 'credits': 3, 'validity': '2022-1 y 2022-2', 'professor': 'Maria Isabel Restrepo E.', 'professor_email': 'isabel.restrepo@udea.edu.co', 'modules': [{'module_num': '1', 'module_title': 'Principios del desarrollo económico', 'objectives': ['Distinguir las principales teorías del desarrollo económico en un contexto histórico.', 'Identificar los principales retos al desarrollo económico de los países.', 'Sustentar opiniones sobre los retos, las políticas y las estrategias del desarrollo.'], 'content_outline': 'Introducción al desarrollo económico, Modelos clásicos y neoclásicos de crecimiento y desarrollo económico, Modelos contemporáneos de desarrollo económico, Determinantes fundamentales', 'class_notes': {'class_num': '1', 'introduction': 'Este módulo introduce los conceptos fundamentales del desarrollo económico, explorando su evolución histórica y las diferentes escue

In [12]:
import markdown
import pypandoc

def crear_material_clase_i(model, i, data_json):
    # Extraer solo la información del módulo actual
    modulo_info = data_json["modules"][i]

    prompt = """Eres un desarrollador experto de contenido educativo con amplia experiencia en la creación de materiales de cursos universitarios.
    Posees un profundo conocimiento en principios pedagógicos, diseño curricular y redacción académica.
    Tu tarea es ayudar a desarrollar materiales educativos integrales a partir de un plan de estudios (syllabus), asegurando altos estándares académicos.

    ### Contexto y Objetivos
    - **Analizar y comprender el syllabus**:
      - Extraer los componentes esenciales (objetivos, competencias, temáticas, metodologías, evaluaciones, etc.).
      - Identificar puntos clave para la generación de contenido pedagógico.
    - **Generar materiales educativos**:
      - Analizar detalladamente cada módulo, definiendo objetivos, contenidos, actividades y evaluaciones.
      - Crear notas de clase comprensivas que expliquen en profundidad cada módulo, con ejemplos, explicaciones teóricas y retos prácticos.
      - Mantener un alto rigor académico y coherencia con módulos previos.

    ### Plan de estudios - Módulo {i}
    {modulo_info}

    ### Instrucciones
    - Genera **únicamente** el material detallado del **módulo {i}**.
    - **No copies ni reformules información de módulos anteriores.**
    - Si un tema se repite en distintos módulos, **explica las diferencias y profundiza en los aspectos específicos de este módulo**.
    - Asegúrate de seguir el esquema de clases indicado en el syllabus.
    - Verifica el orden y la coherencia de los temas con las demás clases.

    **Revisa antes de entregar la respuesta. No incluyas el historial en la respuesta, solo el nuevo contenido.**
    """.format(i=i, modulo_info=modulo_info)

    # Generar contenido con el modelo
    material = model.generate_content(prompt)

    # Imprimir la salida para verificar si es repetida
    print(f"Material generado para el módulo {i}:\n", material.text)

    # Generar resumen del material
    resumen = model.generate_content("Resume el siguiente texto sin perder información clave:\n" + material.text)

    # Convertir a HTML
    html = markdown.markdown(material.text)

    # Convertir a PDF
    output_name = "material_modulo_{}.pdf".format(i)
    extra_args = ['--pdf-engine=xelatex', '-V', 'mainfont=Latin Modern Roman']
    pypandoc.convert_text(html, 'pdf', format='html', outputfile=output_name, extra_args=extra_args)

    return material, resumen

In [16]:
import json

def crear_materiales(model, data_json):
    history = ""  # Ya no es necesario usarlo en la generación

    for i in range(len(data_json["modules"])):
        _, resumen = crear_material_clase_i(model, i, data_json)  # Pasamos data_json como dict

        # Si aún quieres acumular el resumen, puedes hacerlo sin que afecte la generación de contenido
        if resumen and resumen.text.strip():
            history += "\n" + resumen.text.strip()

    return history

In [17]:
history = ""
history = crear_materiales(model,data_json)

Material generado para el módulo 0:
 ## Módulo 1: Principios del Desarrollo Económico

**Objetivos del Módulo:**

*   Distinguir las principales teorías del desarrollo económico en un contexto histórico.
*   Identificar los principales retos al desarrollo económico de los países.
*   Sustentar opiniones sobre los retos, las políticas y las estrategias del desarrollo.

**Contenido del Módulo:**

*   Introducción al desarrollo económico.
*   Modelos clásicos y neoclásicos de crecimiento y desarrollo económico.
*   Modelos contemporáneos de desarrollo económico.
*   Determinantes fundamentales del desarrollo económico.

---

**Clase 1: Introducción al Desarrollo Económico y Modelos Clásicos y Neoclásicos**

**Introducción:**

Esta clase introduce el campo del desarrollo económico, diferenciándolo del simple crecimiento económico. El desarrollo económico abarca mejoras en el bienestar general de la población, incluyendo el acceso a la salud, la educación, la reducción de la pobreza y la de





Material generado para el módulo 1:
 ## Módulo 2: La perspectiva doméstica del desarrollo económico

**Objetivo General:** Identificar los principales retos al desarrollo económico de los países.

**Contenido:** Pobreza, desigualdad y desarrollo económico, Crecimiento de la población, Capital humano: educación y salud, Urbanización y migración rural – urbana, Transformación agrícola y desarrollo rural, Medio ambiente y desarrollo.

### Clase 1: Introducción a los Desafíos Internos del Desarrollo Económico

**Introducción:**

Este módulo se enfoca en los desafíos internos que enfrentan los países en desarrollo. Se analizarán temas como la pobreza, la desigualdad, el crecimiento poblacional, la inversión en capital humano, la urbanización y la sostenibilidad ambiental. Comprender estos desafíos es crucial para diseñar políticas y estrategias efectivas que impulsen el desarrollo económico sostenible y equitativo. A diferencia de los factores externos, los desafíos internos están más direc

In [23]:
import json

# Muestra la estructura completa
print(json.dumps(data_json, indent=4))

# Si solo quieres ver un módulo en particular
i = 0  # Ajusta según sea necesario
print(json.dumps(data_json["modules"][i], indent=4))


{
    "course_title": "Desarrollo Econ\u00f3mico",
    "course_code": "1503714",
    "academic_unit": "Facultad de Ciencias Econ\u00f3micas",
    "credits": 3,
    "validity": "2022-1 y 2022-2",
    "professor": "Maria Isabel Restrepo E.",
    "professor_email": "isabel.restrepo@udea.edu.co",
    "modules": [
        {
            "module_num": "1",
            "module_title": "Principios del desarrollo econ\u00f3mico",
            "objectives": [
                "Distinguir las principales teor\u00edas del desarrollo econ\u00f3mico en un contexto hist\u00f3rico.",
                "Identificar los principales retos al desarrollo econ\u00f3mico de los pa\u00edses.",
                "Sustentar opiniones sobre los retos, las pol\u00edticas y las estrategias del desarrollo."
            ],
            "content_outline": "Introducci\u00f3n al desarrollo econ\u00f3mico, Modelos cl\u00e1sicos y neocl\u00e1sicos de crecimiento y desarrollo econ\u00f3mico, Modelos contempor\u00e1neos de desarro

In [32]:
import json
import markdown
import pypandoc
import google.generativeai as genai

def crear_material_clase(model, modulo_info, modulo_num, clase_num, total_clases, semanas_curso, clases_semana, previous_classes_summaries=""):
    """
    Genera el material para una clase específica dentro de un módulo

    Args:
        model: Modelo de Gemini a utilizar
        modulo_info: Información del módulo actual
        modulo_num: Número del módulo
        clase_num: Número de la clase dentro del módulo
        total_clases: Total de clases para este módulo
        semanas_curso: Duración total del curso en semanas
        clases_semana: Número de clases por semana
        previous_classes_summaries: Resumen de clases anteriores para mantener coherencia
    """

    prompt = f"""Eres un desarrollador experto de contenido educativo con amplia experiencia en la creación de materiales de cursos universitarios.
    Posees un profundo conocimiento en principios pedagógicos, diseño curricular y redacción académica.
    Tu tarea es ayudar a desarrollar materiales educativos integrales a partir de un plan de estudios (syllabus), asegurando altos estándares académicos.

    ### Contexto del Curso
    - Este curso tiene una duración total de {semanas_curso} semanas
    - Se imparten {clases_semana} clases por semana
    - El módulo actual ({modulo_num}) debe dividirse en {total_clases} clases distintas

    ### Contexto y Objetivos
    - **Analizar y comprender el syllabus**:
      - Extraer los componentes esenciales (objetivos, competencias, temáticas, metodologías, evaluaciones, etc.).
      - Identificar puntos clave para la generación de contenido pedagógico.
    - **Generar materiales educativos**:
      - Analizar detalladamente cada módulo, definiendo objetivos, contenidos, actividades y evaluaciones.
      - Crear notas de clase comprensivas que expliquen en profundidad cada tema, con ejemplos, explicaciones teóricas y retos prácticos.
      - Mantener un alto rigor académico y coherencia con clases previas.

    ### Plan de estudios - Módulo {modulo_num}
    {json.dumps(modulo_info, indent=2)}

    ### Clases anteriores de este módulo (resumen)
    {previous_classes_summaries}

    ### Instrucciones
    - Genera **únicamente** el material detallado de la **clase {clase_num} del módulo {modulo_num}**.
    - Esta es la clase {clase_num} de {total_clases} para este módulo.
    - Divide el contenido del módulo de manera lógica entre las {total_clases} clases.
    - Asegúrate de que esta clase tenga continuidad con las clases anteriores del módulo.
    - Incluye en el material:
      1. Título de la clase
      2. Objetivos específicos de la clase
      3. Contenido teórico detallado
      4. Ejemplos o casos de estudio
      5. Actividades prácticas o ejercicios
      6. Materiales complementarios recomendados

    **Revisa antes de entregar la respuesta. No incluyas el historial en la respuesta, solo el nuevo contenido para esta clase específica.**
    """

    # Generar contenido con el modelo
    material = model.generate_content(prompt)

    # Generar resumen de la clase para mantener coherencia
    resumen_prompt = f"Resume brevemente los principales puntos tratados en la siguiente clase (máximo 200 palabras):\n{material.text}"
    resumen = model.generate_content(resumen_prompt)

    # Convertir a HTML
    html = markdown.markdown(material.text)

    # Convertir a PDF
    output_name = f"material_modulo_{modulo_num}_clase_{clase_num}.pdf"
    extra_args = ['--pdf-engine=xelatex', '-V', 'mainfont=Latin Modern Roman']
    pypandoc.convert_text(html, 'pdf', format='html', outputfile=output_name, extra_args=extra_args)

    return material, resumen.text

def crear_materiales_modulo(model, modulo_info, modulo_idx, semanas_curso, clases_semana):
    """
    Genera los materiales para todas las clases de un módulo

    Args:
        model: Modelo de Gemini a utilizar
        modulo_info: Información del módulo actual
        modulo_idx: Índice del módulo en la lista
        semanas_curso: Duración total del curso en semanas
        clases_semana: Número de clases por semana
    """
    # Calcular el número de clases para este módulo
    # Por defecto asignamos 2 clases por módulo, pero se puede ajustar según la lógica deseada
    total_modulos = len(data_json["modules"])
    total_clases_curso = semanas_curso * clases_semana

    # Distribuir clases de manera proporcional entre módulos
    clases_por_modulo = max(1, round(total_clases_curso / total_modulos))

    # Asegurar que los módulos más importantes tengan al menos 2 clases si es posible
    if modulo_idx < (total_clases_curso % total_modulos):
        clases_por_modulo += 1

    print(f"Generando {clases_por_modulo} clases para el módulo {modulo_idx+1}")

    # Para mantener coherencia entre clases
    previous_classes_summaries = ""

    # Generar cada clase del módulo
    for clase_num in range(1, clases_por_modulo + 1):
        print(f"Generando clase {clase_num} de {clases_por_modulo} del módulo {modulo_idx+1}...")

        material, resumen = crear_material_clase(
            model,
            modulo_info,
            modulo_idx + 1,  # Módulo comienza en 1, no en 0
            clase_num,
            clases_por_modulo,
            semanas_curso,
            clases_semana,
            previous_classes_summaries
        )

        # Agregar resumen de esta clase para las siguientes
        previous_classes_summaries += f"\n\nResumen de la clase {clase_num}:\n{resumen}"

    return previous_classes_summaries

def crear_todos_materiales(model, data_json, semanas_curso=16, clases_semana=2):
    """
    Genera los materiales para todos los módulos del curso

    Args:
        model: Modelo de Gemini a utilizar
        data_json: Datos estructurados del curso
        semanas_curso: Duración total del curso en semanas (por defecto 16)
        clases_semana: Número de clases por semana (por defecto 2)
    """
    all_summaries = ""

    for i, modulo in enumerate(data_json["modules"]):
        modulo_summaries = crear_materiales_modulo(
            model,
            modulo,
            i,
            semanas_curso,
            clases_semana
        )
        all_summaries += f"\n\n--- RESUMEN MÓDULO {i+1} ---\n{modulo_summaries}"

    # Opcionalmente, genera un documento con todos los resúmenes
    with open("resumen_curso_completo.txt", "w", encoding="utf-8") as f:
        f.write(all_summaries)

    return all_summaries

In [33]:
# Reemplaza tu actual llamada a crear_materiales con esto:
semanas_curso = 16  # Puedes cambiar este valor o solicitar al usuario que lo ingrese
clases_semana = 2   # Puedes cambiar este valor o solicitar al usuario que lo ingrese

history = crear_todos_materiales(model, data_json, semanas_curso, clases_semana)

Generando 12 clases para el módulo 1
Generando clase 1 de 12 del módulo 1...
Generando clase 2 de 12 del módulo 1...
Generando clase 3 de 12 del módulo 1...






Generando clase 4 de 12 del módulo 1...
Generando clase 5 de 12 del módulo 1...


KeyboardInterrupt: 

In [34]:
import json
import markdown
import pypandoc
import google.generativeai as genai

def crear_material_clase(model, modulo_info, modulo_num, clase_num, total_clases, semanas_curso, clases_semana, previous_classes_summaries=""):
    """
    Genera el material para una clase específica dentro de un módulo

    Args:
        model: Modelo de Gemini a utilizar
        modulo_info: Información del módulo actual
        modulo_num: Número del módulo
        clase_num: Número de la clase dentro del módulo
        total_clases: Total de clases para este módulo
        semanas_curso: Duración total del curso en semanas
        clases_semana: Número de clases por semana
        previous_classes_summaries: Resumen de clases anteriores para mantener coherencia
    """

    prompt = f"""Eres un desarrollador experto de contenido educativo con amplia experiencia en la creación de materiales de cursos universitarios.
    Posees un profundo conocimiento en principios pedagógicos, diseño curricular y redacción académica.
    Tu tarea es ayudar a desarrollar materiales educativos integrales a partir de un plan de estudios (syllabus), asegurando altos estándares académicos.

    ### Contexto del Curso
    - Este curso tiene una duración total de {semanas_curso} semanas
    - Se imparten {clases_semana} clases por semana
    - El módulo actual ({modulo_num}) debe dividirse en {total_clases} clases distintas

    ### Contexto y Objetivos
    - **Analizar y comprender el syllabus**:
      - Extraer los componentes esenciales (objetivos, competencias, temáticas, metodologías, evaluaciones, etc.).
      - Identificar puntos clave para la generación de contenido pedagógico.
    - **Generar materiales educativos**:
      - Analizar detalladamente cada módulo, definiendo objetivos, contenidos, actividades y evaluaciones.
      - Crear notas de clase comprensivas que expliquen en profundidad cada tema, con ejemplos, explicaciones teóricas y retos prácticos.
      - Mantener un alto rigor académico y coherencia con clases previas.

    ### Plan de estudios - Módulo {modulo_num}
    {json.dumps(modulo_info, indent=2)}

    ### Clases anteriores de este módulo (resumen)
    {previous_classes_summaries}

    ### Instrucciones
    - Genera **únicamente** el material detallado de la **clase {clase_num} del módulo {modulo_num}**.
    - Esta es la clase {clase_num} de {total_clases} para este módulo.
    - Divide el contenido del módulo de manera lógica entre las {total_clases} clases.
    - Asegúrate de que esta clase tenga continuidad con las clases anteriores del módulo.
    - Inicia con un encabezado markdown de nivel 1 (# Clase {clase_num}: [Título de la clase])
    - Incluye en el material:
      1. Objetivos específicos de la clase
      2. Contenido teórico detallado
      3. Ejemplos o casos de estudio
      4. Actividades prácticas o ejercicios
      5. Materiales complementarios recomendados

    **Revisa antes de entregar la respuesta. No incluyas el historial en la respuesta, solo el nuevo contenido para esta clase específica.**
    """

    # Generar contenido con el modelo
    material = model.generate_content(prompt)

    # Generar resumen de la clase para mantener coherencia
    resumen_prompt = f"Resume brevemente los principales puntos tratados en la siguiente clase (máximo 200 palabras):\n{material.text}"
    resumen = model.generate_content(resumen_prompt)

    return material.text, resumen.text

def crear_materiales_modulo(model, modulo_info, modulo_idx, semanas_curso, clases_semana):
    """
    Genera los materiales para todas las clases de un módulo y los combina en un solo PDF

    Args:
        model: Modelo de Gemini a utilizar
        modulo_info: Información del módulo actual
        modulo_idx: Índice del módulo en la lista
        semanas_curso: Duración total del curso en semanas
        clases_semana: Número de clases por semana
    """
    # Calcular el número de clases para este módulo
    total_modulos = len(data_json["modules"])
    total_clases_curso = semanas_curso * clases_semana

    # Distribuir clases de manera proporcional entre módulos
    clases_por_modulo = max(1, round(total_clases_curso / total_modulos))

    # Asegurar que los módulos más importantes tengan al menos 2 clases si es posible
    if modulo_idx < (total_clases_curso % total_modulos):
        clases_por_modulo += 1

    print(f"Generando {clases_por_modulo} clases para el módulo {modulo_idx+1}")

    # Para mantener coherencia entre clases
    previous_classes_summaries = ""

    # Contenido combinado de todas las clases
    contenido_completo = f"# Módulo {modulo_idx+1}: {modulo_info.get('module_title', 'Sin título')}\n\n"

    # Agregar información general del módulo
    contenido_completo += "## Información General del Módulo\n\n"
    if 'objectives' in modulo_info:
        contenido_completo += "### Objetivos del Módulo\n\n"
        for objetivo in modulo_info['objectives']:
            contenido_completo += f"- {objetivo}\n"
        contenido_completo += "\n"

    if 'content_outline' in modulo_info:
        contenido_completo += "### Esquema de Contenido\n\n"
        contenido_completo += f"{modulo_info['content_outline']}\n\n"

    contenido_completo += "---\n\n"

    # Generar cada clase del módulo
    for clase_num in range(1, clases_por_modulo + 1):
        print(f"Generando clase {clase_num} de {clases_por_modulo} del módulo {modulo_idx+1}...")

        material_clase, resumen = crear_material_clase(
            model,
            modulo_info,
            modulo_idx + 1,  # Módulo comienza en 1, no en 0
            clase_num,
            clases_por_modulo,
            semanas_curso,
            clases_semana,
            previous_classes_summaries
        )

        # Agregar material de esta clase al contenido completo
        contenido_completo += f"{material_clase}\n\n"
        contenido_completo += "---\n\n"

        # Agregar resumen de esta clase para las siguientes
        previous_classes_summaries += f"\n\nResumen de la clase {clase_num}:\n{resumen}"

    # Convertir a HTML
    html = markdown.markdown(contenido_completo)

    # Convertir a PDF (un solo PDF para todo el módulo)
    output_name = f"material_modulo_{modulo_idx+1}.pdf"
    extra_args = [
        '--pdf-engine=xelatex',
        '-V', 'mainfont=Latin Modern Roman',
        '-V', 'geometry:margin=1in',
        '-V', 'linkcolor=blue',
        '-V', 'toc'  # Agregar tabla de contenidos
    ]
    pypandoc.convert_text(html, 'pdf', format='html', outputfile=output_name, extra_args=extra_args)

    print(f"PDF generado para el módulo {modulo_idx+1}: {output_name}")

    return previous_classes_summaries, contenido_completo

def crear_todos_materiales(model, data_json, semanas_curso=16, clases_semana=2):
    """
    Genera los materiales para todos los módulos del curso

    Args:
        model: Modelo de Gemini a utilizar
        data_json: Datos estructurados del curso
        semanas_curso: Duración total del curso en semanas (por defecto 16)
        clases_semana: Número de clases por semana (por defecto 2)
    """
    all_summaries = ""
    todos_contenidos = []

    for i, modulo in enumerate(data_json["modules"]):
        modulo_summaries, contenido_modulo = crear_materiales_modulo(
            model,
            modulo,
            i,
            semanas_curso,
            clases_semana
        )
        all_summaries += f"\n\n--- RESUMEN MÓDULO {i+1} ---\n{modulo_summaries}"
        todos_contenidos.append(contenido_modulo)

    # Opcionalmente, genera un documento con todos los resúmenes
    with open("resumen_curso_completo.txt", "w", encoding="utf-8") as f:
        f.write(all_summaries)

    # Opcionalmente, genera un PDF con todo el contenido del curso
    contenido_curso_completo = "\n\n".join(todos_contenidos)
    html_curso = markdown.markdown(contenido_curso_completo)

    extra_args = [
        '--pdf-engine=xelatex',
        '-V', 'mainfont=Latin Modern Roman',
        '-V', 'geometry:margin=1in',
        '-V', 'linkcolor=blue',
        '-V', 'toc'  # Agregar tabla de contenidos
    ]
    pypandoc.convert_text(html_curso, 'pdf', format='html', outputfile="curso_completo.pdf", extra_args=extra_args)

    print("Generación de materiales completada. Se han creado:")
    print(f"- {len(data_json['modules'])} PDFs de módulos individuales")
    print("- 1 PDF con el curso completo: curso_completo.pdf")
    print("- 1 archivo de resumen: resumen_curso_completo.txt")

    return all_summaries

# Ejemplo de uso:
# crear_todos_materiales(model, data_json, semanas_curso=16, clases_semana=2)

In [None]:
# Define estos parámetros según lo que necesites o pídelos al usuario
semanas_curso = 16  # Duración total del curso en semanas
clases_semana = 2   # Clases por semana

# Llama a la función principal para generar todos los materiales
history = crear_todos_materiales(model, data_json, semanas_curso, clases_semana)

Generando 12 clases para el módulo 1
Generando clase 1 de 12 del módulo 1...
