# Converter.ipynb ‚Äî Exportador de Notebooks a PDF (Google Colab)

Este notebook permite **convertir cualquier archivo `.ipynb`** en un **PDF con las gr√°ficas de Plotly en alta resoluci√≥n (PNG HD)** directamente desde Google Colab. Se ocultan celdas t√©cnicas de la conversi√≥n de manera autom√°tica.

---

### **INSTRUCCIONES**

#### 1Ô∏è‚É£ **Abrir Colab**
Abre o sube este archivo `Converter.ipynb` en Google Colab.

#### 2Ô∏è‚É£ **Carga tus archivos adicionales**

Si tu notebook utiliza archivos como CSV, Excel, im√°genes u otros recursos que se cargan desde el disco, debes subirlos tambi√©n a este mismo entorno de Colab antes de ejecutar el converter.

#### 3Ô∏è‚É£ **Ejecutar**

Da click en el √≠cono para correr el c√≥digo.


#### 4Ô∏è‚É£ **Cargar tu notebook**

Despu√©s de ejecutar el c√≥digo, el programa te pedir√° subir tu `.ipynb`.  

---

In [6]:
# ================================================================
# IPYNB ‚Üí PDF (Colab) ‚Äî Sirve incluso para gr√°ficas Plotly
# ================================================================

# 0) DEPENDENCIAS (se instalan solo si faltan)
def _pip_install_if_needed():
    import importlib, sys, subprocess
    pkgs = [
        ("plotly", "plotly==5.24.1"),
        ("kaleido", "kaleido==0.2.1"),
        ("nbconvert", "nbconvert==7.*"),
        ("nbformat", "nbformat"),
        ("pyppeteer", "pyppeteer==2.0.0"),
        ("pyee", "pyee==11.1.0"),
        ("nest_asyncio", "nest_asyncio"),
    ]
    for mod, spec in pkgs:
        try:
            importlib.import_module(mod)
        except Exception:
            print(f"[INFO] Installing {spec} ‚Ä¶")
            subprocess.check_call([sys.executable, "-m", "pip", "install", "-q", spec])

_pip_install_if_needed()

# 1) PAR√ÅMETROS DEL USUARIO (ajusta aqu√≠)
NOTEBOOK_PATH = None           # Ruta al .ipynb en /content/...  (o deja None para subirlo)
OUTPUT_PDF   = None            # None => <nombre>_export.pdf
HIDE_CODE    = False           # True = ocultar TODAS las celdas de c√≥digo (si lo deseas)
ALLOW_ERRORS = True            # True = continuar si alguna celda falla
PAGE_FORMAT  = "A4"            # "A4" o "Letter"
IMG_WIDTH    = 1200            # px
IMG_HEIGHT   = 800             # px
IMG_SCALE    = 2               # 2-3 recomendado

# 2) LIBRER√çAS
import os, asyncio, tempfile, nbformat, pathlib
from nbconvert.preprocessors import ExecutePreprocessor
from nbconvert import HTMLExporter
from traitlets.config import Config
import nest_asyncio; nest_asyncio.apply()

# 3) CARGAR ARCHIVO (si NO diste ruta, abrimos selector)
if NOTEBOOK_PATH is None:
    try:
        from google.colab import files
        print("üîº Selecciona tu archivo .ipynb ‚Ä¶")
        up = files.upload()
        NOTEBOOK_PATH = list(up.keys())[0]
    except Exception as e:
        raise RuntimeError("En Colab puedes subir el .ipynb con files.upload() o fija NOTEBOOK_PATH.") from e

# 4) CONFIGURAR NOMBRE DE SALIDA
if OUTPUT_PDF is None:
    base = os.path.splitext(os.path.basename(NOTEBOOK_PATH))[0]
    OUTPUT_PDF = f"{base}_export.pdf"

# 5) CELDA DE SETUP PARA PLOTLY‚ÜíPNG HD (se inyecta, con TAG 'hide_input')
_PLOTLY_SETUP_CODE = f"""
import plotly.io as pio
if getattr(pio, "kaleido", None) is None:
    raise RuntimeError("Kaleido no disponible; usa plotly==5.24.1 y kaleido==0.2.1.")
pio.kaleido.scope.default_format = "png"
pio.kaleido.scope.default_width  = {IMG_WIDTH}
pio.kaleido.scope.default_height = {IMG_HEIGHT}
pio.kaleido.scope.default_scale  = {IMG_SCALE}
pio.renderers.default = "png"
"""

def _prepend_setup_cell(nb):
    # üö© metadatos con tag 'hide_input' para ocultar SOLO esta celda en el PDF
    cell = nbformat.v4.new_code_cell(
        _PLOTLY_SETUP_CODE,
        metadata={"tags": ["hide_input"]}
    )
    first_src = nb.cells[0].source if nb.cells else ""
    if _PLOTLY_SETUP_CODE.strip() not in first_src:
        nb.cells.insert(0, cell)
    return nb

# 6) ASEGURAR CHROMIUM PARA PYPPETEER (sincr√≥nico)
def _ensure_chromium():
    from pyppeteer.chromium_downloader import check_chromium, download_chromium, chromium_executable
    if not check_chromium():
        print("[INFO] Descargando Chromium (una sola vez)‚Ä¶")
        download_chromium()  # sin await en pyppeteer 2.0.0
    return chromium_executable()

# 7) HTML ‚Üí PDF con Pyppeteer
async def _html_to_pdf_with_pyppeteer(html_path, pdf_path, page_format="A4"):
    from pyppeteer import launch
    exec_path = _ensure_chromium()
    browser = await launch(executablePath=exec_path, args=["--no-sandbox", "--disable-dev-shm-usage"])
    page = await browser.newPage()
    file_url = pathlib.Path(html_path).absolute().as_uri()
    await page.goto(file_url, {"waitUntil": "networkidle0"})

    if hasattr(page, "emulateMediaType"):
        await page.emulateMediaType("print")
    elif hasattr(page, "emulateMedia"):
        await page.emulateMedia("print")

    await page.waitForSelector("body")
    await page.pdf(
        path=pdf_path,
        printBackground=True,
        format=page_format,
        margin={"top": "12mm", "bottom": "12mm", "left": "12mm", "right": "12mm"},
    )
    await browser.close()

# 8) PIPELINE: Ejecutar .ipynb ‚Üí HTML ‚Üí PDF
def export_ipynb_to_pdf(ipynb_path, out_pdf_path, hide_code=False, allow_cell_errors=True, page_format="A4"):
    assert os.path.exists(ipynb_path), f"No se encontr√≥ el archivo: {ipynb_path}"

    # Leer notebook e inyectar setup de Plotly (tag 'hide_input')
    with open(ipynb_path, "r", encoding="utf-8") as f:
        nb = nbformat.read(f, as_version=4)
    nb = _prepend_setup_cell(nb)

    # Ejecutar notebook (captura PNGs de Plotly)
    workdir = os.path.dirname(ipynb_path) or "."
    ep = ExecutePreprocessor(timeout=1200, kernel_name="python3", allow_errors=bool(allow_cell_errors))
    ep.preprocess(nb, {"metadata": {"path": workdir}})

    # Exportar a HTML:
    #  - Si HIDE_CODE=True ‚Üí se ocultan TODAS las celdas de c√≥digo (opcional).
    #  - Si HIDE_CODE=False ‚Üí se muestran todas, EXCEPTO las que tengan tag 'hide_input'.
    c = Config()
    c.HTMLExporter.exclude_input_prompt  = True
    c.HTMLExporter.exclude_output_prompt = True

    if hide_code:
        c.TemplateExporter.exclude_input = True
    else:
        # Ocultar solo celdas con tag 'hide_input'
        c.TemplateExporter.exclude_input = False
        c.TagRemovePreprocessor.remove_input_tags = {"hide_input"}
        c.HTMLExporter.preprocessors = ["nbconvert.preprocessors.TagRemovePreprocessor"]

    html_exporter = HTMLExporter(config=c)
    body, _ = html_exporter.from_notebook_node(nb)

    # Guardar HTML temporal
    tmp_html = os.path.join(tempfile.gettempdir(), "notebook_export.html")
    with open(tmp_html, "w", encoding="utf-8") as f:
        f.write(body)

    # HTML ‚Üí PDF
    loop = asyncio.get_event_loop()
    loop.run_until_complete(_html_to_pdf_with_pyppeteer(tmp_html, out_pdf_path, page_format=page_format))

    print(f"‚úÖ PDF generado: {out_pdf_path}")
    return out_pdf_path

# 9) EJECUTAR
print("üìÑ Notebook:", NOTEBOOK_PATH)
print("üñ®Ô∏è Exportando a:", OUTPUT_PDF)
export_ipynb_to_pdf(
    NOTEBOOK_PATH,
    OUTPUT_PDF,
    hide_code=HIDE_CODE,          # ‚Üê deja False para ver todo el c√≥digo excepto la celda t√©cnica
    allow_cell_errors=ALLOW_ERRORS,
    page_format=PAGE_FORMAT,
)

# 10) DESCARGA (si est√°s en Colab)
try:
    from google.colab import files
    files.download(OUTPUT_PDF)
except Exception:
    pass

print("üéâ Listo.")


üîº Selecciona tu archivo .ipynb ‚Ä¶


Saving Reto.ipynb to Reto.ipynb
üìÑ Notebook: Reto.ipynb
üñ®Ô∏è Exportando a: Reto_export.pdf
‚úÖ PDF generado: Reto_export.pdf


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

üéâ Listo.


---

### <small>**Tiempos de ejecuci√≥n y errores**

<small> El proceso puede tardar entre 2 y 5 minutos, dependiendo del tama√±o de tu notebook, la cantidad de gr√°ficas o im√°genes, y la velocidad de Colab. Durante este tiempo, es normal que no aparezca ning√∫n mensaje nuevo. Solo espera a que aparezca la l√≠nea:

<small>`‚úÖ PDF generado: /content/Nombre_export.pdf`

<small> Si el mensaje termina con Traceback, ImportError, o FileNotFoundError, significa que hubo un problema real (por ejemplo, faltan archivos o rutas incorrectas). Si el proceso lleva m√°s de 7 minutos sin mostrar progreso, det√©n la celda y vuelve a ejecutarla.

<small>Los errores m√°s comunes son:

* <small>Falta un archivo CSV o Excel en /content/.

* <small>El notebook tiene celdas interactivas (por ejemplo, input() o plotly.show() en modo web).

* <small>Conexi√≥n lenta de Colab.

---
<small>El script instala autom√°ticamente las dependencias necesarias:

- <small>**Plotly 5.24.1** + **Kaleido 0.2.1** ‚Üí exporta las gr√°ficas como im√°genes PNG.  
- **nbconvert 7.x** + **pyppeteer 2.0.0** ‚Üí convierte el HTML generado a PDF.  
- **nest_asyncio** ‚Üí permite que Colab ejecute procesos asincr√≥nicos sin errores.

---

## Cr√©ditos
Desarrollado por **Abi Rodr√≠guez**.
Este notebook fue dise√±ado como una herramienta personal para convertir archivos de Google Colab `.ipynb` a PDF con gr√°ficas de Plotly en alta resoluci√≥n.

Con apoyo de **ChatGPT (OpenAI)** para depurar errores t√©cnicos.