# PALABRIA – Notebook de ejecución

Este notebook permite ejecutar la aplicación PALABRIA de forma sencilla en Google Colab, y exponerlo mediante una URL pública.


Privacidad y datos:
- Cada usuario crea su propia base de datos.
- La base de datos NO se comparte con los autores del proyecto.


In [1]:
from google.colab import drive

drive.mount('/content/drive')

Mounted at /content/drive


In [18]:
# Ejecuta esta celda SOLO si ya tienes la carpeta aplicacion_PALABRIA en tu Drive

import os, sys

PROJECT_PATH = "/content/drive/MyDrive/aplicacion_PALABRIA"

if not os.path.exists(PROJECT_PATH):
    raise FileNotFoundError(
        "No se encontró la carpeta 'aplicacion_PALABRIA' en tu Drive.\n"
        "Copia ahí el proyecto o usa la celda de GitHub."
    )

os.chdir(PROJECT_PATH)
sys.path.append(PROJECT_PATH)

In [21]:
# Ejecuta esta celda SOLO si vas a descargar el proyecto desde GitHub en el sistema TEMPORAL de Colab

import os, sys

PROJECT_PATH = "/content/drive/MyDrive/aplicacion_PALABRIA"
REPO_URL = "https://github.com/ncenteno-arch/APP-PALABRIA.git"


if not os.path.exists(PROJECT_PATH):
    !git clone $REPO_URL $PROJECT_PATH

os.chdir(PROJECT_PATH)
sys.path.append(PROJECT_PATH)

In [22]:
# Define la base de datos SQL
# La BD se guarda en tú Google Drive, independientemente de si el código viene de Drive o de GitHub

import pathlib

DB_PATH = "/content/drive/MyDrive/PALABRIA/data/palabria.db"
pathlib.Path(os.path.dirname(DB_PATH)).mkdir(parents=True, exist_ok=True)

os.environ["DB_PATH"] = DB_PATH

print("Base de datos personal configurada en:", DB_PATH)

Base de datos personal configurada en: /content/drive/MyDrive/PALABRIA/data/palabria.db


In [4]:
!pip install -r requirements.txt

Collecting streamlit (from -r requirements.txt (line 1))
  Downloading streamlit-1.53.1-py3-none-any.whl.metadata (10 kB)
Collecting rapidfuzz (from -r requirements.txt (line 10))
  Downloading rapidfuzz-3.14.3-cp312-cp312-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl.metadata (12 kB)
Collecting bitsandbytes (from -r requirements.txt (line 15))
  Downloading bitsandbytes-0.49.1-py3-none-manylinux_2_24_x86_64.whl.metadata (10 kB)
Collecting pdfplumber (from -r requirements.txt (line 17))
  Downloading pdfplumber-0.11.9-py3-none-any.whl.metadata (43 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m43.6/43.6 kB[0m [31m4.3 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting fpdf (from -r requirements.txt (line 18))
  Downloading fpdf-1.7.2.tar.gz (39 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting pyngrok (from -r requirements.txt (line 20))
  Downloading pyngrok-7.5.0-py3-none-any.whl.metadata (8.1 kB)
Collecting pydeck<1,>=0.8.0b4 (from streamlit->-r

In [5]:
# Se descarga el modelo lingüístico de spaCy para español (necesario para la app)

!python -m spacy download es_core_news_lg

Collecting es-core-news-lg==3.8.0
  Downloading https://github.com/explosion/spacy-models/releases/download/es_core_news_lg-3.8.0/es_core_news_lg-3.8.0-py3-none-any.whl (568.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m568.0/568.0 MB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: es-core-news-lg
Successfully installed es-core-news-lg-3.8.0
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('es_core_news_lg')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [23]:
# Permite que el backend pueda quedarse funcionando en segundo plano, de forma que después podamos arrancar la interfaz web (frontend) sin que el notebook se bloquee

import nest_asyncio, logging

nest_asyncio.apply()
logging.basicConfig(level=logging.INFO)

In [24]:
# Se lanza el backend en local

import subprocess, time, os

os.chdir(PROJECT_PATH)

backend_process = subprocess.Popen(
    [
        "uvicorn",
        "backend.main:app",
        "--host", "127.0.0.1",
        "--port", "8000",
        "--log-level", "warning"
    ]
)

time.sleep(15)
print("Backend activo")

Backend activo


In [25]:
# El frontend se conecta al backend local

import os

BACKEND_URL = "http://127.0.0.1:8000"

os.environ["BACKEND_URL"] = BACKEND_URL

print("Frontend conectado al backend")

Frontend conectado al backend


In [26]:
# Introduce TU token de ngrok (ngrok crea una dirección web pública temporal)

from pyngrok import ngrok

NGROK_TOKEN = input("Pega aquí tu NGROK AUTHTOKEN (no se guarda): ").strip()
ngrok.set_auth_token(NGROK_TOKEN)
ngrok.kill()

Pega aquí tu NGROK AUTHTOKEN (no se guarda): 32pBH53FrH3RTAqrYXzXqtYTpZp_7Y6ZsXYkb7dF1i1ddHCF7


In [27]:
# Se lanza el frontend Streamlit y se muestra la URL visible externamente con ngrok

import subprocess

frontend_tunnel = ngrok.connect(8501)

subprocess.Popen([
    "streamlit", "run", "frontend/app.py",
    "--server.port=8501",
    "--server.headless=true",
    "--browser.serverAddress=0.0.0.0"
])

print("APLICACIÓN DISPONIBLE EN:")
print(frontend_tunnel.public_url)

APLICACIÓN DISPONIBLE EN:
https://9db1e3c95964.ngrok-free.app


**Recomendación:** lo más fiable es reiniciar el entorno de Colab para volver a ejecutar la aplicación.
Si no quieres reiniciar, prueba primero a limpiar los procesos en segundo plano.

In [28]:
# Limpia los procesos anteriores (backend, frontend y ngrok)

import subprocess

subprocess.run(["pkill", "-f", "uvicorn"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
subprocess.run(["pkill", "-f", "streamlit"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)
subprocess.run(["pkill", "-f", "ngrok"], stdout=subprocess.DEVNULL, stderr=subprocess.DEVNULL)

CompletedProcess(args=['pkill', '-f', 'ngrok'], returncode=0)