Ejemplo invocación Gemini
En este notebook se muestra cómo trabajar con la API de Google Gemini.

Universidad Nacional de Colombia

Departamento de Ciencias de la Computación y de la Decisión

Profesor Juan David Ospina

Introducción a Redes Neuronales y Algoritmos Bioinspirados

Semestre 2024-02

Fecha: 26 de febrero de 2025

In [None]:
%%capture
!apt-get update
!apt-get install pandoc # para usar markdown
!apt-get install texlive-xetex # Toma un buen tiempo la instalación
!pip install markdown2 # para usar markdown
!pip install pypandoc # para usar markdown

In [None]:
!pip install fitz

Collecting fitz
  Downloading fitz-0.0.1.dev2-py2.py3-none-any.whl.metadata (816 bytes)
Collecting configobj (from fitz)
  Downloading configobj-5.0.9-py2.py3-none-any.whl.metadata (3.2 kB)
Collecting configparser (from fitz)
  Downloading configparser-7.1.0-py3-none-any.whl.metadata (5.4 kB)
Collecting nipype (from fitz)
  Downloading nipype-1.9.2-py3-none-any.whl.metadata (6.8 kB)
Collecting pyxnat (from fitz)
  Downloading pyxnat-1.6.3-py3-none-any.whl.metadata (5.4 kB)
Collecting prov>=1.5.2 (from nipype->fitz)
  Downloading prov-2.0.1-py3-none-any.whl.metadata (3.6 kB)
Collecting rdflib>=5.0.0 (from nipype->fitz)
  Downloading rdflib-7.1.3-py3-none-any.whl.metadata (11 kB)
Collecting simplejson>=3.8.0 (from nipype->fitz)
  Downloading simplejson-3.20.1-cp311-cp311-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.2 kB)
Collecting traits>=6.2 (from nipype->fitz)
  Downloading traits-7.0.2-cp311-cp311-manylinux_2_5_x86_64.manylinux1_x8

In [None]:
!pip install --upgrade pymupdf

Collecting pymupdf
  Downloading pymupdf-1.25.3-cp39-abi3-manylinux2014_x86_64.manylinux_2_17_x86_64.whl.metadata (3.4 kB)
Downloading pymupdf-1.25.3-cp39-abi3-manylinux2014_x86_64.manylinux_2_17_x86_64.whl (20.0 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m20.0/20.0 MB[0m [31m48.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pymupdf
Successfully installed pymupdf-1.25.3


In [None]:
import os
from google.colab import userdata
from markdown2 import markdown
import pypandoc

#os.environ['GOOGLE_API_KEY'] = userdata.get('GOOGLE_API_KEY')

import google.generativeai as genai

In [None]:
import fitz  # PyMuPDF para leer PDFs
import google.generativeai as genai

# Configura la API de Gemini (sustituye con tu clave)
genai.configure(api_key="AIzaSyAooWfS3xzumCHk4xw4lMjl2yGdcoj3sog")
model = genai.GenerativeModel('gemini-2.0-flash-001')

initial_prompt = """
Eres un desarrollador experto de contenido educativo con amplia experiencia en la creación de materiales de cursos universitarios. Posees un profundo conocimiento en principios pedagógicos, diseño curricular y redacción académica. Tu tarea es ayudar a desarrollar un agente inteligente basado en modelos de lenguaje (LLM) que, a partir de un plan de estudios (syllabus), genere materiales educativos integrales que cumplan con altos estándares académicos.

Contexto y Objetivos
El agente debe:

Analizar y Comprender el Syllabus:

Extraer los componentes esenciales (objetivos, competencias, temáticas, metodologías, evaluaciones, etc.).
Identificar puntos clave para la generación de contenido pedagógico.
Generar Materiales Educativos:

Elaborar módulos detallados para cada tema o área, definiendo objetivos, contenidos, actividades y evaluaciones.
Crear notas de clase comprensivas que expliquen en profundidad cada módulo, incluyendo ejemplos, explicaciones teóricas y prácticos retos para el estudiante.
Mantener un alto rigor académico, asegurando la confiabilidad de la información y la integración de buenas prácticas pedagógicas.
Formato de Salida Específico:

Toda la salida generada debe estructurarse en formato JSON.
La estructura JSON debe incluir secciones claras para módulos y notas de clase.
Ejemplo de formato JSON:

{
  "course_title": "Título del Curso",
  "modules": [
    {
      "module_title": "Título del Módulo 1",
      "objectives": ["Objetivo 1", "Objetivo 2"],
      "module_num": "1",
      "content_outline": "Resumen de contenidos",
      "class_notes": {
        "class_num": "1",
        "introduction": "Introducción detallada del tema",
        "theory": "Desarrollo teórico con explicaciones y ejemplos",
        "challenges": "Retos y actividades prácticas para el estudiante"
      }
    },
    {
      "module_title": "Título del Módulo 2",
      "objectives": ["Objetivo A", "Objetivo B"],
      "content_outline": "Resumen de contenidos",
      "class_notes": {
        "introduction": "Introducción al tema",
        "theory": "Explicaciones teóricas y casos de estudio",
        "challenges": "Ejercicios y retos para aplicar lo aprendido"
      }
    }
  ]
}


SYLLABUS:
"""

# Función para extraer texto de un PDF
def extract_text_from_pdf(pdf_path):
    doc = fitz.open(pdf_path)
    text = "\n".join([page.get_text() for page in doc])  # Extrae el texto de todas las páginas
    return text


# Cargar el PDF y extraer el texto
pdf_path = "/content/1503714_Desarrollo_Económico - firmado.pdf"  # Cambia por tu archivo
document_text = extract_text_from_pdf(pdf_path)


In [None]:
prompt = f"{initial_prompt}\n{document_text}"



response = model.generate_content(prompt)

In [None]:
# Convertir el texto en un PDF

# Resultado del promt
text = response.text

# Archivo intermedio html
html = markdown(text)

# Convierte el archivo html en PDF
extra_args = ['--pdf-engine=xelatex',
              '-V', 'mainfont=Latin Modern Roman'
             ]
pypandoc.convert_text(html, 'pdf', format='html', outputfile='materiales_curso.pdf', extra_args=extra_args)
# Revisar el resultado en la carpeta de archivos de Colab.

''

In [None]:
import json

respuesta = response.text

# Find the start and end of the JSON object
start = respuesta.find('{')
end = respuesta.rfind('}') + 1  # +1 to include the closing brace

# Extract the JSON string
json_string = respuesta[start:end]

# Try to parse the JSON
try:
    data_json = json.loads(json_string)
    print(data_json)  # Or do something else with the data
except json.JSONDecodeError as e:
    print(f"Error decoding JSON: {e}")
    print(f"Problematic JSON string: {json_string}")

{'course_title': 'Desarrollo Económico', 'course_code': '1503714', 'credits': 3, 'faculty': 'Facultad de Ciencias Económicas', 'term': '2022-1 y 2022-2', 'instructor': 'Maria Isabel Restrepo E.', 'instructor_email': 'isabel.restrepo@udea.edu.co', 'course_description': 'Este curso proporciona una descripción general de los problemas de la economía del desarrollo y de las contribuciones que el análisis económico puede hacer para explicar por qué algunas naciones son pobres y otras ricas, y las circunstancias económicas y restricciones a las que se enfrenta el mundo en desarrollo. Al final del curso los estudiantes podrán demostrar su comprensión sobre los conceptos básicos, las teorías y discursos de la economía del desarrollo, así como de los problemas y las políticas. Asimismo, podrán discutir y evaluar diferentes enfoques de manera crítica.', 'general_objective': 'Analizar los conceptos básicos, las teorías y discursos de la economía del desarrollo, así como algunos de los problemas a

In [None]:
import markdown
import pypandoc

def crear_material_clase_i(model, i, data_json):
    # Extraer solo la información del módulo actual
    modulo_info = data_json["modules"][i]

    prompt = """Eres un desarrollador experto de contenido educativo con amplia experiencia en la creación de materiales de cursos universitarios.
    Posees un profundo conocimiento en principios pedagógicos, diseño curricular y redacción académica.
    Tu tarea es ayudar a desarrollar materiales educativos integrales a partir de un plan de estudios (syllabus), asegurando altos estándares académicos.

    ### Contexto y Objetivos
    - **Analizar y comprender el syllabus**:
      - Extraer los componentes esenciales (objetivos, competencias, temáticas, metodologías, evaluaciones, etc.).
      - Identificar puntos clave para la generación de contenido pedagógico.
    - **Generar materiales educativos**:
      - Analizar detalladamente cada módulo, definiendo objetivos, contenidos, actividades y evaluaciones.
      - Crear notas de clase comprensivas que expliquen en profundidad cada módulo, con ejemplos, explicaciones teóricas y retos prácticos.
      - Mantener un alto rigor académico y coherencia con módulos previos.

    ### Plan de estudios - Módulo {i}
    {modulo_info}

    ### Instrucciones
    - Genera **únicamente** el material detallado del **módulo {i}**.
    - **No copies ni reformules información de módulos anteriores.**
    - Si un tema se repite en distintos módulos, **explica las diferencias y profundiza en los aspectos específicos de este módulo**.
    - Asegúrate de seguir el esquema de clases indicado en el syllabus.
    - Verifica el orden y la coherencia de los temas con las demás clases.

    **Revisa antes de entregar la respuesta. No incluyas el historial en la respuesta, solo el nuevo contenido.**
    """.format(i=i, modulo_info=modulo_info)

    # Generar contenido con el modelo
    material = model.generate_content(prompt)

    # Imprimir la salida para verificar si es repetida
    print(f"Material generado para el módulo {i}:\n", material.text)

    # Generar resumen del material
    resumen = model.generate_content("Resume el siguiente texto sin perder información clave:\n" + material.text)

    # Convertir a HTML
    html = markdown.markdown(material.text)

    # Convertir a PDF
    output_name = "material_modulo_{}.pdf".format(i)
    extra_args = ['--pdf-engine=xelatex', '-V', 'mainfont=Latin Modern Roman']
    pypandoc.convert_text(html, 'pdf', format='html', outputfile=output_name, extra_args=extra_args)

    return material, resumen

In [None]:
import json

def crear_materiales(model, data_json):
    history = ""  # Ya no es necesario usarlo en la generación

    for i in range(len(data_json["modules"])):
        _, resumen = crear_material_clase_i(model, i, data_json)  # Pasamos data_json como dict

        # Si aún quieres acumular el resumen, puedes hacerlo sin que afecte la generación de contenido
        if resumen and resumen.text.strip():
            history += "\n" + resumen.text.strip()

    return history

In [None]:
history = ""
history = crear_materiales(model,data_json)

Material generado para el módulo 0:
 ## Módulo 1: Principios del Desarrollo Económico

**Objetivos del Módulo:**

*   Comprender la introducción al desarrollo económico.
*   Analizar modelos clásicos y neoclásicos de crecimiento y desarrollo económico.
*   Evaluar modelos contemporáneos de desarrollo económico.
*   Identificar los determinantes fundamentales del desarrollo económico.

**Esquema del Contenido:**

*   Introducción
*   Modelos clásicos y neoclásicos
*   Modelos contemporáneos
*   Determinantes fundamentales

---

**Clase 1: Introducción al Desarrollo Económico**

**Objetivos de la Clase:**

*   Definir el desarrollo económico y diferenciarlo del crecimiento económico.
*   Identificar las características de las economías desarrolladas y en desarrollo.
*   Comprender los principales indicadores de desarrollo económico y sus limitaciones.
*   Analizar la naturaleza multidimensional del desarrollo económico.
*   Explorar las diferentes escuelas de pensamiento sobre el desarro





Material generado para el módulo 1:
 ## Módulo 2: La perspectiva doméstica del desarrollo económico

**Objetivos del Módulo:**

*   Analizar la relación entre pobreza, desigualdad y desarrollo económico.
*   Evaluar el impacto del crecimiento de la población en el desarrollo.
*   Comprender la importancia del capital humano (educación y salud) para el desarrollo.
*   Analizar los procesos de urbanización y migración rural-urbana en el contexto del desarrollo.
*   Evaluar la transformación agrícola y el desarrollo rural.
*   Comprender la relación entre medio ambiente y desarrollo.

**Contenido del Módulo:**

*   Pobreza, desigualdad
*   Crecimiento de la población
*   Capital humano
*   Urbanización y migración
*   Transformación agrícola
*   Medio ambiente

---

**Clase 1: Introducción a la Perspectiva Doméstica del Desarrollo Económico**

**Introducción:**

Este módulo se enfoca en los factores internos que moldean el desarrollo económico de una nación. A diferencia de los enfoques q

In [None]:
import json

# Muestra la estructura completa
print(json.dumps(data_json, indent=4))

# Si solo quieres ver un módulo en particular
i = 0  # Ajusta según sea necesario
print(json.dumps(data_json["modules"][i], indent=4))


{
    "course_title": "Desarrollo Econ\u00f3mico",
    "course_code": "1503714",
    "credits": 3,
    "faculty": "Facultad de Ciencias Econ\u00f3micas",
    "term": "2022-1 y 2022-2",
    "instructor": "Maria Isabel Restrepo E.",
    "instructor_email": "isabel.restrepo@udea.edu.co",
    "course_description": "Este curso proporciona una descripci\u00f3n general de los problemas de la econom\u00eda del desarrollo y de las contribuciones que el an\u00e1lisis econ\u00f3mico puede hacer para explicar por qu\u00e9 algunas naciones son pobres y otras ricas, y las circunstancias econ\u00f3micas y restricciones a las que se enfrenta el mundo en desarrollo. Al final del curso los estudiantes podr\u00e1n demostrar su comprensi\u00f3n sobre los conceptos b\u00e1sicos, las teor\u00edas y discursos de la econom\u00eda del desarrollo, as\u00ed como de los problemas y las pol\u00edticas. Asimismo, podr\u00e1n discutir y evaluar diferentes enfoques de manera cr\u00edtica.",
    "general_objective": "

In [None]:
import json
import markdown
import pypandoc
import google.generativeai as genai

def crear_material_clase(model, modulo_info, modulo_num, clase_num, total_clases, semanas_curso, clases_semana, previous_classes_summaries=""):
    """
    Genera el material para una clase específica dentro de un módulo

    Args:
        model: Modelo de Gemini a utilizar
        modulo_info: Información del módulo actual
        modulo_num: Número del módulo
        clase_num: Número de la clase dentro del módulo
        total_clases: Total de clases para este módulo
        semanas_curso: Duración total del curso en semanas
        clases_semana: Número de clases por semana
        previous_classes_summaries: Resumen de clases anteriores para mantener coherencia
    """

    prompt = f"""Eres un desarrollador experto de contenido educativo con amplia experiencia en la creación de materiales de cursos universitarios.
    Posees un profundo conocimiento en principios pedagógicos, diseño curricular y redacción académica.
    Tu tarea es ayudar a desarrollar materiales educativos integrales a partir de un plan de estudios (syllabus), asegurando altos estándares académicos.

    ### Contexto del Curso
    - Este curso tiene una duración total de {semanas_curso} semanas
    - Se imparten {clases_semana} clases por semana
    - El módulo actual ({modulo_num}) debe dividirse en {total_clases} clases distintas

    ### Contexto y Objetivos
    - **Analizar y comprender el syllabus**:
      - Extraer los componentes esenciales (objetivos, competencias, temáticas, metodologías, evaluaciones, etc.).
      - Identificar puntos clave para la generación de contenido pedagógico.
    - **Generar materiales educativos**:
      - Analizar detalladamente cada módulo, definiendo objetivos, contenidos, actividades y evaluaciones.
      - Crear notas de clase comprensivas que expliquen en profundidad cada tema, con ejemplos, explicaciones teóricas y retos prácticos.
      - Mantener un alto rigor académico y coherencia con clases previas.

    ### Plan de estudios - Módulo {modulo_num}
    {json.dumps(modulo_info, indent=2)}

    ### Clases anteriores de este módulo (resumen)
    {previous_classes_summaries}

    ### Instrucciones
    - Genera **únicamente** el material detallado de la **clase {clase_num} del módulo {modulo_num}**.
    - Esta es la clase {clase_num} de {total_clases} para este módulo.
    - Divide el contenido del módulo de manera lógica entre las {total_clases} clases.
    - Asegúrate de que esta clase tenga continuidad con las clases anteriores del módulo.
    - Incluye en el material:
      1. Título de la clase
      2. Objetivos específicos de la clase
      3. Contenido teórico detallado
      4. Ejemplos o casos de estudio
      5. Actividades prácticas o ejercicios
      6. Materiales complementarios recomendados

    **Revisa antes de entregar la respuesta. No incluyas el historial en la respuesta, solo el nuevo contenido para esta clase específica.**
    """

    # Generar contenido con el modelo
    material = model.generate_content(prompt)

    # Generar resumen de la clase para mantener coherencia
    resumen_prompt = f"Resume brevemente los principales puntos tratados en la siguiente clase (máximo 200 palabras):\n{material.text}"
    resumen = model.generate_content(resumen_prompt)

    # Convertir a HTML
    html = markdown.markdown(material.text)

    # Convertir a PDF
    output_name = f"material_modulo_{modulo_num}_clase_{clase_num}.pdf"
    extra_args = ['--pdf-engine=xelatex', '-V', 'mainfont=Latin Modern Roman']
    pypandoc.convert_text(html, 'pdf', format='html', outputfile=output_name, extra_args=extra_args)

    return material, resumen.text

def crear_materiales_modulo(model, modulo_info, modulo_idx, semanas_curso, clases_semana):
    """
    Genera los materiales para todas las clases de un módulo

    Args:
        model: Modelo de Gemini a utilizar
        modulo_info: Información del módulo actual
        modulo_idx: Índice del módulo en la lista
        semanas_curso: Duración total del curso en semanas
        clases_semana: Número de clases por semana
    """
    # Calcular el número de clases para este módulo
    # Por defecto asignamos 2 clases por módulo, pero se puede ajustar según la lógica deseada
    total_modulos = len(data_json["modules"])
    total_clases_curso = semanas_curso * clases_semana

    # Distribuir clases de manera proporcional entre módulos
    clases_por_modulo = max(1, round(total_clases_curso / total_modulos))

    # Asegurar que los módulos más importantes tengan al menos 2 clases si es posible
    if modulo_idx < (total_clases_curso % total_modulos):
        clases_por_modulo += 1

    print(f"Generando {clases_por_modulo} clases para el módulo {modulo_idx+1}")

    # Para mantener coherencia entre clases
    previous_classes_summaries = ""

    # Generar cada clase del módulo
    for clase_num in range(1, clases_por_modulo + 1):
        print(f"Generando clase {clase_num} de {clases_por_modulo} del módulo {modulo_idx+1}...")

        material, resumen = crear_material_clase(
            model,
            modulo_info,
            modulo_idx + 1,  # Módulo comienza en 1, no en 0
            clase_num,
            clases_por_modulo,
            semanas_curso,
            clases_semana,
            previous_classes_summaries
        )

        # Agregar resumen de esta clase para las siguientes
        previous_classes_summaries += f"\n\nResumen de la clase {clase_num}:\n{resumen}"

    return previous_classes_summaries

def crear_todos_materiales(model, data_json, semanas_curso=16, clases_semana=2):
    """
    Genera los materiales para todos los módulos del curso

    Args:
        model: Modelo de Gemini a utilizar
        data_json: Datos estructurados del curso
        semanas_curso: Duración total del curso en semanas (por defecto 16)
        clases_semana: Número de clases por semana (por defecto 2)
    """
    all_summaries = ""

    for i, modulo in enumerate(data_json["modules"]):
        modulo_summaries = crear_materiales_modulo(
            model,
            modulo,
            i,
            semanas_curso,
            clases_semana
        )
        all_summaries += f"\n\n--- RESUMEN MÓDULO {i+1} ---\n{modulo_summaries}"

    # Opcionalmente, genera un documento con todos los resúmenes
    with open("resumen_curso_completo.txt", "w", encoding="utf-8") as f:
        f.write(all_summaries)

    return all_summaries

In [None]:
# Reemplaza tu actual llamada a crear_materiales con esto:
semanas_curso = 16  # Puedes cambiar este valor o solicitar al usuario que lo ingrese
clases_semana = 2   # Puedes cambiar este valor o solicitar al usuario que lo ingrese

history = crear_todos_materiales(model, data_json, semanas_curso, clases_semana)

Generando 12 clases para el módulo 1
Generando clase 1 de 12 del módulo 1...
Generando clase 2 de 12 del módulo 1...
Generando clase 3 de 12 del módulo 1...
Generando clase 4 de 12 del módulo 1...






Generando clase 5 de 12 del módulo 1...
Generando clase 6 de 12 del módulo 1...
Generando clase 7 de 12 del módulo 1...
Generando clase 8 de 12 del módulo 1...
Generando clase 9 de 12 del módulo 1...
Generando clase 10 de 12 del módulo 1...
Generando clase 11 de 12 del módulo 1...
Generando clase 12 de 12 del módulo 1...
Generando 12 clases para el módulo 2
Generando clase 1 de 12 del módulo 2...
Generando clase 2 de 12 del módulo 2...
Generando clase 3 de 12 del módulo 2...
Generando clase 4 de 12 del módulo 2...
Generando clase 5 de 12 del módulo 2...
Generando clase 6 de 12 del módulo 2...
Generando clase 7 de 12 del módulo 2...
Generando clase 8 de 12 del módulo 2...
Generando clase 9 de 12 del módulo 2...
Generando clase 10 de 12 del módulo 2...
Generando clase 11 de 12 del módulo 2...
Generando clase 12 de 12 del módulo 2...
Generando 11 clases para el módulo 3
Generando clase 1 de 11 del módulo 3...
Generando clase 2 de 11 del módulo 3...
Generando clase 3 de 11 del módulo 3...


In [None]:
import json
import markdown
import pypandoc
import google.generativeai as genai

def crear_material_clase(model, modulo_info, modulo_num, clase_num, total_clases, semanas_curso, clases_semana, previous_classes_summaries=""):
    """
    Genera el material para una clase específica con prompts optimizados
    """
    # Prompt base con información esencial
    prompt_base = f"""Eres un desarrollador experto de contenido educativo.

    ### Contexto del Curso
    - Duración: {semanas_curso} semanas, {clases_semana} clases por semana
    - Módulo actual ({modulo_num}) dividido en {total_clases} clases
    - Esta es la clase {clase_num} de {total_clases} para este módulo

    ### Instrucciones
    Genera el material detallado para la clase {clase_num} del módulo {modulo_num}, incluyendo:
    1. Título de la clase
    2. Objetivos específicos
    3. Contenido teórico detallado
    4. Ejemplos o casos de estudio
    5. Actividades prácticas
    6. Materiales complementarios"""

    # Extraer solo la información esencial del módulo
    modulo_info_simplificado = {
        "title": modulo_info.get("title", ""),
        "description": modulo_info.get("description", ""),
        "topics": modulo_info.get("topics", [])
    }

    # Primer paso: obtener estructura general de la clase
    primer_prompt = f"""{prompt_base}

    ### Información del módulo
    {json.dumps(modulo_info_simplificado, indent=2)}

    Primero, proporciona solo un esquema detallado con los temas principales
    que deberías cubrir en esta clase específica."""

    esquema = model.generate_content(primer_prompt)

    # Solo enviar resúmenes relevantes para mantener contexto
    resumenes_relevantes = ""
    if previous_classes_summaries:
        # Extraer solo los últimos resúmenes si hay muchos
        resumenes_split = previous_classes_summaries.split("Resumen de la clase")
        if len(resumenes_split) > 3:  # Si hay más de 3 resúmenes
            resumenes_relevantes = "Resumen de la clase".join(resumenes_split[-3:])
        else:
            resumenes_relevantes = previous_classes_summaries

    # Segundo paso: generar el contenido completo basado en el esquema
    segundo_prompt = f"""{prompt_base}

    ### Información del módulo
    {json.dumps(modulo_info_simplificado, indent=2)}

    ### Esquema aprobado
    {esquema.text}

    ### Contexto de clases anteriores
    {resumenes_relevantes}

    Desarrolla ahora el contenido completo siguiendo este esquema,
    asegurando continuidad con las clases anteriores."""

    material = model.generate_content(segundo_prompt)

    # Generar resumen de la clase para mantener coherencia (prompt corto)
    resumen_prompt = "Resume en 150 palabras los puntos clave tratados en la siguiente clase:\n" + material.text[:2000]  # Limitamos a los primeros 2000 caracteres para el resumen
    resumen = model.generate_content(resumen_prompt)

    # Convertir a HTML y PDF
    html = markdown.markdown(material.text)
    output_name = f"material_modulo_{modulo_num}_clase_{clase_num}.pdf"
    try:
        extra_args = ['--pdf-engine=xelatex', '-V', 'mainfont=Latin Modern Roman']
        pypandoc.convert_text(html, 'pdf', format='html', outputfile=output_name, extra_args=extra_args)
    except Exception as e:
        print(f"Error al generar PDF: {e}")

    return material, resumen.text

def crear_materiales_modulo(model, modulo_info, modulo_idx, semanas_curso, clases_semana):
    """
    Genera los materiales para todas las clases de un módulo
    """
    # Calcular el número de clases para este módulo
    total_modulos = len(data_json["modules"])
    total_clases_curso = semanas_curso * clases_semana

    # Distribuir clases de manera proporcional entre módulos
    clases_por_modulo = max(1, round(total_clases_curso / total_modulos))

    # Asegurar que los módulos más importantes tengan al menos 2 clases si es posible
    if modulo_idx < (total_clases_curso % total_modulos):
        clases_por_modulo += 1

    print(f"Generando {clases_por_modulo} clases para el módulo {modulo_idx+1}")

    # Para mantener coherencia entre clases
    previous_classes_summaries = ""

    # Generar cada clase del módulo
    for clase_num in range(1, clases_por_modulo + 1):
        print(f"Generando clase {clase_num} de {clases_por_modulo} del módulo {modulo_idx+1}...")

        material, resumen = crear_material_clase(
            model,
            modulo_info,
            modulo_idx + 1,
            clase_num,
            clases_por_modulo,
            semanas_curso,
            clases_semana,
            previous_classes_summaries
        )

        # Agregar resumen de esta clase para las siguientes
        previous_classes_summaries += f"\n\nResumen de la clase {clase_num}:\n{resumen}"

    return previous_classes_summaries

def crear_todos_materiales(model, data_json, semanas_curso=16, clases_semana=2):
    """
    Genera los materiales para todos los módulos del curso
    """
    all_summaries = ""

    for i, modulo in enumerate(data_json["modules"]):
        print(f"\n--- GENERANDO MÓDULO {i+1} ---")
        modulo_summaries = crear_materiales_modulo(
            model,
            modulo,
            i,
            semanas_curso,
            clases_semana
        )
        all_summaries += f"\n\n--- RESUMEN MÓDULO {i+1} ---\n{modulo_summaries}"

        # Guardar resúmenes después de cada módulo en caso de error
        with open(f"resumen_modulo_{i+1}.txt", "w", encoding="utf-8") as f:
            f.write(modulo_summaries)

    # Documento final con todos los resúmenes
    with open("resumen_curso_completo.txt", "w", encoding="utf-8") as f:
        f.write(all_summaries)

    return all_summaries

In [None]:
semanas_curso = 16  # Puedes cambiar este valor
clases_semana = 2   # Puedes cambiar este valor
history = crear_todos_materiales(model, data_json, semanas_curso, clases_semana)

In [None]:
import json
import markdown
import pypandoc
import google.generativeai as genai

def crear_material_clase(model, modulo_info, modulo_num, clase_num, total_clases, semanas_curso, clases_semana, previous_classes_summaries=""):
    """
    Genera el material para una clase específica con prompts optimizados
    """
    # Prompt base con información esencial
    prompt_base = f"""Eres un desarrollador experto de contenido educativo.

    ### Contexto del Curso
    - Duración: {semanas_curso} semanas, {clases_semana} clases por semana
    - Módulo actual ({modulo_num}) dividido en {total_clases} clases
    - Esta es la clase {clase_num} de {total_clases} para este módulo

    ### Instrucciones
    Genera el material detallado para la clase {clase_num} del módulo {modulo_num}, incluyendo:
    1. Título de la clase
    2. Objetivos específicos
    3. Contenido teórico detallado
    4. Ejemplos o casos de estudio
    5. Actividades prácticas
    6. Materiales complementarios"""

    # Extraer solo la información esencial del módulo
    modulo_info_simplificado = {
        "title": modulo_info.get("title", ""),
        "description": modulo_info.get("description", ""),
        "topics": modulo_info.get("topics", [])
    }

    # Primer paso: obtener estructura general de la clase
    primer_prompt = f"""{prompt_base}

    ### Información del módulo
    {json.dumps(modulo_info_simplificado, indent=2)}

    Primero, proporciona solo un esquema detallado con los temas principales
    que deberías cubrir en esta clase específica."""

    esquema = model.generate_content(primer_prompt)

    # Solo enviar resúmenes relevantes para mantener contexto
    resumenes_relevantes = ""
    if previous_classes_summaries:
        # Extraer solo los últimos resúmenes si hay muchos
        resumenes_split = previous_classes_summaries.split("Resumen de la clase")
        if len(resumenes_split) > 3:  # Si hay más de 3 resúmenes
            resumenes_relevantes = "Resumen de la clase".join(resumenes_split[-3:])
        else:
            resumenes_relevantes = previous_classes_summaries

    # Segundo paso: generar el contenido completo basado en el esquema
    segundo_prompt = f"""{prompt_base}

    ### Información del módulo
    {json.dumps(modulo_info_simplificado, indent=2)}

    ### Esquema aprobado
    {esquema.text}

    ### Contexto de clases anteriores
    {resumenes_relevantes}

    Desarrolla ahora el contenido completo siguiendo este esquema,
    asegurando continuidad con las clases anteriores."""

    material = model.generate_content(segundo_prompt)

    # Generar resumen de la clase para mantener coherencia (prompt corto)
    resumen_prompt = "Resume en 150 palabras los puntos clave tratados en la siguiente clase:\n" + material.text[:2000]  # Limitamos a los primeros 2000 caracteres para el resumen
    resumen = model.generate_content(resumen_prompt)

    # Convertir a HTML y PDF
    html = markdown.markdown(material.text)
    output_name = f"material_modulo_{modulo_num}_clase_{clase_num}.pdf"
    try:
        extra_args = ['--pdf-engine=xelatex', '-V', 'mainfont=Latin Modern Roman']
        pypandoc.convert_text(html, 'pdf', format='html', outputfile=output_name, extra_args=extra_args)
    except Exception as e:
        print(f"Error al generar PDF: {e}")

    return material, resumen.text

def crear_materiales_modulo(model, modulo_info, modulo_idx, semanas_curso, clases_semana):
    """
    Genera los materiales para todas las clases de un módulo
    """
    # Calcular el número de clases para este módulo
    total_modulos = len(data_json["modules"])
    total_clases_curso = semanas_curso * clases_semana

    # Distribuir clases de manera proporcional entre módulos
    clases_por_modulo = max(1, round(total_clases_curso / total_modulos))

    # Asegurar que los módulos más importantes tengan al menos 2 clases si es posible
    if modulo_idx < (total_clases_curso % total_modulos):
        clases_por_modulo += 1

    # Limitamos a máximo 6 clases por módulo como solicitado
    clases_por_modulo = min(clases_por_modulo, 6)

    print(f"Generando {clases_por_modulo} clases para el módulo {modulo_idx+1}")

    # Para mantener coherencia entre clases
    previous_classes_summaries = ""

    # Generar cada clase del módulo
    for clase_num in range(1, clases_por_modulo + 1):
        print(f"Generando clase {clase_num} de {clases_por_modulo} del módulo {modulo_idx+1}...")

        material, resumen = crear_material_clase(
            model,
            modulo_info,
            modulo_idx + 1,
            clase_num,
            clases_por_modulo,
            semanas_curso,
            clases_semana,
            previous_classes_summaries
        )

        # Agregar resumen de esta clase para las siguientes
        previous_classes_summaries += f"\n\nResumen de la clase {clase_num}:\n{resumen}"

    return previous_classes_summaries

def crear_todos_materiales(model, data_json, semanas_curso=16, clases_semana=2):
    """
    Genera los materiales para todos los módulos del curso
    """
    all_summaries = ""

    for i, modulo in enumerate(data_json["modules"]):
        print(f"\n--- GENERANDO MÓDULO {i+1} ---")
        modulo_summaries = crear_materiales_modulo(
            model,
            modulo,
            i,
            semanas_curso,
            clases_semana
        )
        all_summaries += f"\n\n--- RESUMEN MÓDULO {i+1} ---\n{modulo_summaries}"

        # Guardar resúmenes después de cada módulo en caso de error
        with open(f"resumen_modulo_{i+1}.txt", "w", encoding="utf-8") as f:
            f.write(modulo_summaries)

    # Documento final con todos los resúmenes
    with open("resumen_curso_completo.txt", "w", encoding="utf-8") as f:
        f.write(all_summaries)

    return all_summaries

In [None]:
semanas_curso = 16  # Duración total del curso en semanas
clases_semana = 2   # Número de clases por semana

# Ejecutar la generación del curso con el código modificado
history = crear_todos_materiales(model, data_json, semanas_curso, clases_semana)