In [None]:
import requests
from bs4 import BeautifulSoup
from openai import OpenAI

# ===========================================
# CONFIGURACI√ìN
# ===========================================
# üîë Reemplaza con tu token de OpenAI
client = OpenAI(api_key="")

# ===========================================
# FUNCI√ìN: obtener texto de una p√°gina web
# ===========================================
def obtener_texto(url):
    """Extrae el texto principal de una p√°gina web."""
    try:
        r = requests.get(url, timeout=15)
        r.raise_for_status()
        soup = BeautifulSoup(r.text, "html.parser")

        # Eliminar scripts, estilos, secciones no deseadas
        for s in soup(["script", "style", "noscript", "header", "footer", "aside", "form"]):
            s.extract()

        texto = " ".join(soup.stripped_strings)
        return texto[:8000]  # hasta 8000 caracteres
    except Exception as e:
        return f"Error al obtener el texto: {e}"

# ===========================================
# FUNCI√ìN: analizar noticia con justificaci√≥n y criterios estrictos
# ===========================================
def analizar_noticia(url):
    """Analiza una noticia en espa√±ol sobre paros docentes con suspensi√≥n de clases."""
    contenido = obtener_texto(url)

    if "Error" in contenido:
        return contenido

    prompt = f"""
    Analiza la siguiente noticia en espa√±ol sobre educaci√≥n, sindicatos o protestas de docentes.

    IMPORTANTE:
    - Considera que **solo existe un paro docente verdadero** si hay evidencia de que se suspendieron clases programadas.
    - Si fue una manifestaci√≥n, marcha o concentraci√≥n sin suspensi√≥n de clases, NO lo clasifiques como paro docente.
    - Explica tu razonamiento.

    Devuelve la respuesta en formato JSON con las siguientes claves:

    - "es_paro_docente": true o false ‚Üí true solo si hubo suspensi√≥n de clases.
    - "justificacion_paro": texto breve (2-4 l√≠neas) que explique por qu√© se considera o no un paro (menciona si hubo o no suspensi√≥n de clases y c√≥mo se deduce).
    - "organizaciones_sindicales": lista con los nombres de sindicatos o federaciones mencionadas (por ejemplo ["FECODE", "ADE"]), o [] si no se mencionan.
    - "hay_suspension_clases": true o false ‚Üí si se suspenden clases programadas.
    - "duracion_dias": n√∫mero estimado de d√≠as del paro o manifestaci√≥n, o null si no aparece.
    - "razones_paro": texto corto que resuma los motivos o demandas principales.
    - "ubicacion_bogota": true o false ‚Üí si el hecho ocurre en Bogot√° o Cundinamarca.
    - "costo_mencionado": texto con el monto econ√≥mico si se menciona (por ejemplo "20 mil millones de pesos"), o null si no hay.
    - "resumen": breve resumen (m√°x. 3 l√≠neas) que explique de qu√© trata la noticia.

    Aseg√∫rate de devolver un **JSON v√°lido** (sin comentarios ni texto extra).

    Texto:
    {contenido}
    """

    response = client.chat.completions.create(
        model="gpt-4o-mini",
        temperature=0.1,
        messages=[{"role": "user", "content": prompt}],
    )

    return response.choices[0].message.content.strip()

# ===========================================
# EJECUCI√ìN PRINCIPAL
# ===========================================
if __name__ == "__main__":
    #url = input("Pega la URL de la noticia: ").strip()
    # o puedes fijar una URL directamente:
    url = "https://www.eltiempo.com/vida/educacion/fecode-anuncia-paro-nacional-de-24-horas-el-proximo-30-de-octubre-estas-son-las-principales-razones-de-la-manifestacion-3496052"

    resultado = analizar_noticia(url)
    print("\n--- Resultado del an√°lisis ---")
    print(resultado)


--- Resultado del an√°lisis ---
```json
{
    "es_paro_docente": true,
    "justificacion_paro": "Se considera un paro docente porque se anuncia una suspensi√≥n de clases programadas durante 24 horas el 30 de octubre, lo que implica que no habr√° clases ese d√≠a.",
    "organizaciones_sindicales": ["Fecode"],
    "hay_suspension_clases": true,
    "duracion_dias": 1,
    "razones_paro": "Defensa del derecho a la salud digna y oportuna para docentes y sus beneficiarios, y exigencias sobre la financiaci√≥n de la educaci√≥n p√∫blica.",
    "ubicacion_bogota": false,
    "costo_mencionado": null,
    "resumen": "Fecode ha convocado un paro nacional de 24 horas para el 30 de octubre, buscando presionar al gobierno por la defensa de los derechos del magisterio y la soluci√≥n a problemas en salud y financiaci√≥n educativa."
}
```


In [7]:
import requests
import datetime

api_key = "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"  # Reempl√°zalo con tu clave real

hoy = datetime.date.today()
inicio = hoy - datetime.timedelta(days=7)

url = f"https://api.openai.com/v1/usage?start_date={inicio.isoformat()}&end_date={hoy.isoformat()}"
headers = {"Authorization": f"Bearer {api_key}"}

response = requests.get(url, headers=headers)

if response.status_code == 200:
    data = response.json()
    total_prompt = sum(day.get("n_context_tokens_total", 0) for day in data.get("data", []))
    total_completion = sum(day.get("n_generated_tokens_total", 0) for day in data.get("data", []))
    total = total_prompt + total_completion

    print("=== USO DE LOS √öLTIMOS 7 D√çAS ===")
    print(f"Tokens prompt: {total_prompt:,}")
    print(f"Tokens completion: {total_completion:,}")
    print(f"Tokens totales: {total:,}")

    # Estimaci√≥n de costo si usas gpt-4o-mini
    COSTO_POR_1000_TOKENS = 0.00015
    usd_usado = (total / 1000) * COSTO_POR_1000_TOKENS
    print(f"Estimado gastado: ${usd_usado:.4f} USD")
else:
    print("Error al consultar uso:", response.text)


Error al consultar uso: {
  "error": {
    "message": "Missing query parameter 'date'",
    "type": "invalid_request_error",
    "param": null,
    "code": null
  }
}

