# Lenguaje de Seguridad Educativo
---

[URL](https://github.com/cberto/Parseo-Generacion)

## Objetivo

Ser un lenguaje de programación en español que permita expresar y automatizar tareas básicas de seguridad (detectar vulnerabilidades simples, validar entradas) de forma clara y accesible, con reglas simples y cercanas al ámbito de seguridad informática

## Especificaciones léxicas

- Sensible a mayúsculas/minúsculas (**case-sensitive**).

- Comentarios: `// …` y `/* … */`.
- Números enteros no negativos, textos entre comillas `"…"`.
- Operadores y signos: `+ - * / == != < > <= >= ( ) [ ] ,` y lógicos `y`, `o`, `no`.
- Palabras clave: `INICIO`, `FIN.`, `anotar`, `mostrar`, `evaluar`, `si pasa:`, `si no pasa:`, `mientras`, `hacer`, `funcion`, `retornar`, `finFuncion`, `procedimiento`, `finProcedimiento`, `agregar`, `quitar`, `limpiar`, `vacia`, `vulnerable`, `seguro`, `probar`, `reportar`.

## Especificaciones sintácticas

- Programa: `INICIO <sentencias> FIN.`
- Asignación:
  - Declaración: `anotar <tipo> <id> = <valor>`
  - Reasignación: `anotar <id> = <valor>`
  - Listas: `anotar lista<tipo_base> L = []` o `vacia`; acceso `L[i]`
- Impresión: `mostrar <expresion_texto>` (concatenación con `+`).
- Condicional:

```
evaluar <condicion>
    si pasa: <sentencias>
    si no pasa: <sentencias>   // opcional
```

- Iteración: `mientras <condicion> hacer <sentencias>`
- Expresiones: precedencia `* /` > `+ -`; paréntesis para agrupar.

- Funciones: Se debe definir que tipo de dato devolvera la funcion al momento de crearla.


```
<programa> ::= INICIO <sentencias> FIN.
<sentencias> ::= <sentencia> <sentencias> | λ
<sentencia> ::= <asignacion> | <impresion> | <condicional> | <iteracion>
| <definicion_funcion>
| <definicion_procedimiento>
| <llamada_procedimiento>
| <operacion_lista>
<asignacion> ::= anotar <tipo> <identificador> = <valor>
| anotar <identificador> = <valor>
| anotar lista<tipo_base> <identificador> = vacia
<tipo> ::= numero | texto | vulnerabilidad | bool | lista<tipo_base>
<tipo_base> ::= numero | texto | vulnerabilidad | bool
<impresion> ::= mostrar <expresion_texto>
<expresion_texto> ::= <valor_texto> | <valor_texto> + <expresion_texto>
<valor_texto> ::= <texto> | <identificador> | <booleano> | <numero> | <acceso_lista> | <llamada_funcion>
<condicional> ::= evaluar <condicion> <bloque_condicional>
<bloque_condicional> ::= si pasa: <sentencias>
| si pasa: <sentencias> si no pasa: <sentencias>
<condicion> ::= no <condicion>
| <valor> <operador_relacional> <valor>
| <condicion> <operador_logico> <condicion>
| <booleano> | <identificador>
<iteracion> ::= mientras <condicion> hacer <sentencias>
<valor> ::= <valor> <op_suma> <termino> | <termino>
<termino> ::= <termino> <op_mul> <factor> | <factor>
<factor> ::= <numero> | <texto> | <identificador> | <booleano>
| <acceso_lista> | <llamada_funcion> | "(" <valor> ")"
<op_suma> ::= + | -
<op_mul> ::= \* | /
<acceso_lista> ::= <identificador> [ <valor> ]
<operacion_lista> ::= agregar <valor> a <identificador>
| quitar en <identificador> [ <valor> ]
| limpiar <identificador>
<definicion_funcion> ::= funcion <tipo> <identificador> ( <parametros_opt> )
<sentencias>
retornar <valor>
finFuncion
<definicion_procedimiento> ::= procedimiento <identificador> ( <parametros_opt> )
<sentencias>
finProcedimiento
<llamada_funcion> ::= <identificador> ( <argumentos_opt> )
<llamada_procedimiento> ::= <identificador> ( <argumentos_opt> )
<parametros_opt> ::= λ | <lista_parametros>
<lista_parametros> ::= <parametro> <resto_parametros>
<resto_parametros> ::= , <lista_parametros> | λ
<parametro> ::= <tipo> <identificador>
<argumentos_opt> ::= λ | <lista_argumentos>
<lista_argumentos> ::= <valor> | <valor> , <lista_argumentos>
<booleano> ::= vulnerable | seguro
<vulnerabilidad> ::= sqli | xss | rce
<operador_relacional> ::= == | != | < | > | <= | >=
<operador_logico> ::= y | o
<numero> ::= <digito> <numero> | <digito>
<texto> ::= "<contenido_texto>"
<contenido_texto ::= <identificador>
<identificador> ::= <letra> | <letra> <identificador> <letra> ::= a | b | ... | z | A | B | ... | Z
<digito> ::= 0 | 1 | ... | 9<comentario_linea> ::= "//" {cualquier_caracter_excepto_salto}
<comentario_bloque> ::= "/*" {cualquier_caracter} "*/"
<vacia> ::= vacia

```

## Especificaciones semánticas

- **Tipos:** verificación estática; declarar tipo al crear variable.  
  Ej.:  
  ```
  anotar numero contador = 0
  ```
- **vulnerabilidad:** debe estar en `[sqli,xss,rce]`.  
  Ej.:  
  ```
  anotar vulnerabilidad tipo = sqli
  ```
- **Listas:** tipo base estricto; error si se inserta tipo distinto.  
  Ej.:  
  ```
  anotar lista<texto> sitios = []
  agregar "https://ejemplo.com" a sitios
  ```
- **mostrar:** convierte a `texto` al concatenar/mostrar.  
  Ej.:  
  ```
  mostrar "Detectado: " + tipo
  ```
- **Ámbitos:** variables/params de funciones/procedimientos son locales.  
  Ej.:  
  ```
  funcion numero sumar(numero a, numero b)
      retornar a + b
  finFuncion
  ```
- **Errores runtime:** índice fuera de rango, división por cero, etc.  
  Ej.:  
  ```
  mostrar lista[10]  # Índice inválido
  ```

## Ejemplo

```
INICIO

anotar bool r1 = probar("https://ejemplo.com/login", sqli, "admin' OR 1=1--")
anotar bool r2 = probar("https://ejemplo.com/comentarios", xss, "Hola mundo")
anotar bool r3 = probar("https://ejemplo.com/admin", rce, "ping -c 1 127.0.0.1")

mostrar "Login vulnerable? " + r1
mostrar "Comentarios vulnerables? " + r2
mostrar "Admin vulnerable? " + r3

FIN.
```

## Scanner

In [None]:
import ply.lex as lex

# =============================================================================
# PALABRAS RESERVADAS DEL LENGUAJE
# =============================================================================
reserved = {
    'INICIO': 'INICIO',
    'anotar': 'ANOTAR',
    'mostrar': 'MOSTRAR',
    'evaluar': 'EVALUAR',
    'si': 'SI',
    'pasa:': 'PASA',
    'no': 'NO',
    'mientras': 'MIENTRAS',
    'hacer': 'HACER',
    'y': 'Y',
    'o': 'O',
    'funcion': 'FUNCION',
    'retornar': 'RETORNAR',
    'finFuncion': 'FINFUNCION',
    'procedimiento': 'PROCEDIMIENTO',
    'finProcedimiento': 'FINPROCEDIMIENTO',
    'agregar': 'AGREGAR',
    'a': 'A',
    'quitar': 'QUITAR',
    'en': 'EN',
    'limpiar': 'LIMPIAR',
    'vacia': 'VACIA',
    'vulnerable': 'VULNERABLE',
    'seguro': 'SEGURO',
    'sqli': 'SQLI',
    'xss': 'XSS',
    'rce': 'RCE',
    'probar': 'PROBAR',
    'reportar': 'REPORTAR',
    'numero': 'NUMERO_TIPO',
    'texto': 'TEXTO_TIPO',
    'vulnerabilidad': 'VULNERABILIDAD_TIPO',
    'bool': 'BOOL_TIPO',
    'lista': 'LISTA'
}

# =============================================================================
# DEFINICIÓN DE TOKENS
# =============================================================================
tokens = [
    # Tokens especiales
    'FIN',              # Fin del programa (FIN.)
    'ID',               # Identificadores de variables/funciones
    'NUMERO',           # Números enteros
    'TEXTO',            # Cadenas de texto entre comillas
    
    # Operadores aritméticos
    'MAS',              # Suma (+)
    'MENOS',            # Resta (-)
    'POR',              # Multiplicación (*)
    'DIV',              # División (/)
    
    # Operadores de comparación
    'IGUAL',            # Igualdad (==)
    'DIF',              # Desigualdad (!=)
    'MENOR',            # Menor que (<)
    'MAYOR',            # Mayor que (>)
    'MENORIG',          # Menor o igual (<=)
    'MAYORIG',          # Mayor o igual (>=)
    
    # Operadores de asignación y agrupación
    'ASIGNAR',          # Asignación (=)
    'LPAREN',           # Paréntesis izquierdo (()
    'RPAREN',           # Paréntesis derecho ())
    'LBRACKET',         # Corchete izquierdo ([)
    'RBRACKET',         # Corchete derecho (])
    'COMA',             # Separador de argumentos (,)
] + list(reserved.values())

# =============================================================================
# EXPRESIONES REGULARES PARA SÍMBOLOS SIMPLES
# =============================================================================
# Según la documentación de PLY, los tokens simples se definen como variables
t_MAS = r'\+'
t_MENOS = r'-'
t_POR = r'\*'
t_DIV = r'/'
t_IGUAL = r'=='
t_DIF = r'!='
t_MENORIG = r'<='
t_MAYORIG = r'>='
t_MENOR = r'<'
t_MAYOR = r'>'
t_ASIGNAR = r'='
t_LPAREN = r'\('
t_RPAREN = r'\)'
t_LBRACKET = r'\['
t_RBRACKET = r'\]'
t_COMA = r','

# =============================================================================
# CARACTERES IGNORADOS
# =============================================================================
# Espacios, tabs y saltos de línea
t_ignore = ' \t\r\n'

# =============================================================================
# FUNCIONES DE RECONOCIMIENTO DE TOKENS COMPLEJOS
# =============================================================================

def t_FIN(t):
    r'FIN\.'
    return t

def t_NUMERO(t):
    r'\d+'
    t.value = int(t.value)
    return t

def t_TEXTO(t):
    r'\"([^"\\\n]|(\\.))*\"'
    t.value = t.value[1:-1]  # Quitar las comillas
    return t

def t_ID(t):
    r'[a-zA-Z_][a-zA-Z0-9_]*'
    t.type = reserved.get(t.value, 'ID')
    return t

def t_COMMENTLINE(t):
    r'//.*'
    pass  # No retorna nada, se ignora

def t_newline(t):
    r'\n+'
    t.lexer.lineno += len(t.value)

def t_error(t):
    print(f"Error léxico: Carácter ilegal '{t.value[0]}' en línea {t.lineno}")
    t.lexer.skip(1)

# =============================================================================
# CONSTRUCCIÓN DEL LEXER
# =============================================================================
lexer = lex.lex()

## Builtins

In [None]:
"""
Funciones predefinidas del Lenguaje de Seguridad Educativo

Este módulo implementa las funciones built-in del lenguaje:
- probar(): Simula pruebas de vulnerabilidades
- reportar(): Genera reportes de seguridad

Las funciones están diseñadas para fines educativos y no realizan
ataques reales contra sistemas.
"""

import re

# =============================================================================
# CONSTANTES DEL LENGUAJE
# =============================================================================
VULNERABLE = "vulnerable"  # Valor booleano verdadero
SEGURO = "seguro"          # Valor booleano falso

# =============================================================================
# PATRONES DE DETECCIÓN DE VULNERABILIDADES
# =============================================================================
# Patrones precompilados para mejorar rendimiento
# Estos patrones detectan payloads típicos de cada tipo de vulnerabilidad

# SQL Injection: considera cadenas típicas para forzar la lógica de consultas.
# Ejemplos: "' OR 1=1--" hace que la condición siempre sea verdadera.
P_SQLI = re.compile(r"(?:' OR|1=1|UNION|--)", re.IGNORECASE)

# Cross-Site Scripting: detecta etiquetas o atributos que inyectan JavaScript.
# Ejemplos: "<script>" abre un bloque de script, `onerror=` ejecuta JS en eventos.
P_XSS = re.compile(r"(?:<script>|onerror=|onload=|\"<)", re.IGNORECASE)

# Remote Code Execution: busca operadores de shell o comandos peligrosos.
# Ejemplos: ";" encadena comandos, "`...`" ejecuta subshell, "ping -c" suele usarse en pruebas.
P_RCE = re.compile(r"(?:;|&&|\||`|\$\(|ping -c)", re.IGNORECASE)

# =============================================================================
# FUNCIONES AUXILIARES
# =============================================================================

def fn_regex(texto: str, patron, flags="i") -> str:
    """
    Función auxiliar para aplicar patrones regex
    
    Args:
        texto: Cadena a analizar
        patron: Patrón regex compilado
        flags: Flags adicionales (no usado, el patrón ya está compilado)
    
    Returns:
        "vulnerable" si encuentra el patrón, "seguro" en caso contrario
    """
    return VULNERABLE if patron.search(texto) else SEGURO

# =============================================================================
# FUNCIONES PREDEFINIDAS DEL LENGUAJE
# =============================================================================

def fn_probar(url: str, tipo: str, payload: str) -> str:
    """
    Función predefinida 'probar' - Simula pruebas de vulnerabilidades
    
    Esta función simula un test de seguridad sin realizar requests HTTP reales.
    Imprime en consola el detalle de la prueba y devuelve el resultado.
    
    Args:
        url: URL del sitio a probar (solo para logging)
        tipo: Tipo de vulnerabilidad ('sqli', 'xss', 'rce')
        payload: Payload a analizar
    
    Returns:
        "vulnerable" si el payload contiene patrones de ataque
        "seguro" si no se detectan patrones maliciosos
    
    Ejemplo:
        probar("https://ejemplo.com", "sqli", "admin' OR 1=1--")
        # Salida: [probar] URL=https://ejemplo.com | Tipo=sqli | Payload=admin' OR 1=1--
        # Retorna: "vulnerable"
    """
    # Log de la prueba realizada
    print(f"[probar] URL={url} | Tipo={tipo} | Payload={payload}")
    # La evaluación es puramente heurística: se revisa si el `payload`
    # contiene rasgos característicos del ataque. Si el patrón aparece,
    # se considera "vulnerable"; si no, se marca "seguro".
    
    # Aplicar el patrón correspondiente según el tipo de vulnerabilidad
    if tipo == 'sqli':
        return fn_regex(payload, P_SQLI)
    elif tipo == 'xss':
        return fn_regex(payload, P_XSS)
    elif tipo == 'rce':
        return fn_regex(payload, P_RCE)
    else:
        # Tipo de vulnerabilidad no reconocido
        return SEGURO

def fn_reportar(mensaje: str):
    """
    Función predefinida 'reportar' - Genera reportes de seguridad
    
    Emite un reporte con el mensaje especificado. En la implementación
    actual solo imprime en consola, pero podría extenderse para escribir
    a archivos o bases de datos.
    
    Args:
        mensaje: Mensaje del reporte a generar
    
    Ejemplo:
        reportar("Vulnerabilidad SQL detectada en login")
        # Salida: [REPORTE] Vulnerabilidad SQL detectada en login
    """
    print(f"[REPORTE] {mensaje}")

## Parser

In [None]:
import ply.yacc as yacc
from scanner import tokens
import builtins

# =============================================================================
# PRECEDENCIA DE OPERADORES
# =============================================================================
# Según la documentación de PLY, la precedencia se define como una tupla
precedence = (
    ('left', 'MAS', 'MENOS'),    # Suma y resta (misma precedencia)
    ('left', 'POR', 'DIV'),      # Multiplicación y división (mayor precedencia)
    ('left', 'IGUAL', 'DIF', 'MENOR', 'MAYOR', 'MENORIG', 'MAYORIG'),  # Comparaciones
    ('left', 'Y'),               # AND lógico
    ('left', 'O'),               # OR lógico
    ('right', 'NO'),             # NOT lógico (asociatividad derecha)
)

# =============================================================================
# REGLAS DE GRAMÁTICA - ESTRUCTURA DEL PROGRAMA
# =============================================================================

def p_programa(p):
    'programa : INICIO sentencias FIN'
    p[0] = ("programa", p[2])

def p_sentencias(p):
    '''sentencias : sentencia sentencias
                  | sentencia'''
    if len(p) == 3:
        p[0] = [p[1]] + p[2]
    else:
        p[0] = [p[1]]

# =============================================================================
# REGLAS DE GRAMÁTICA - SENTENCIAS
# =============================================================================

def p_sentencia_asignacion_sin_tipo(p):
    'sentencia : ANOTAR ID ASIGNAR expresion'
    p[0] = ("asignar", p[2], p[4])

def p_sentencia_asignacion_con_tipo(p):
    'sentencia : ANOTAR tipo ID ASIGNAR expresion'
    p[0] = ("declarar_asignar", p[2], p[3], p[5])

def p_sentencia_asignacion_lista_vacia(p):
    'sentencia : ANOTAR LISTA MENOR tipo_base MAYOR ID ASIGNAR VACIA'
    p[0] = ("declarar_lista_vacia", p[4], p[6])

def p_sentencia_asignacion_lista_literal(p):
    'sentencia : ANOTAR LISTA MENOR tipo_base MAYOR ID ASIGNAR LBRACKET RBRACKET'
    p[0] = ("declarar_lista_vacia", p[4], p[6])

def p_sentencia_mostrar(p):
    'sentencia : MOSTRAR expresion'
    p[0] = ("mostrar", p[2])

def p_sentencia_evaluar(p):
    'sentencia : EVALUAR condicion PASA sentencias'
    p[0] = ("evaluar", p[2], p[4], None)

def p_sentencia_evaluar_con_else(p):
    'sentencia : EVALUAR condicion PASA sentencias SI NO PASA sentencias'
    p[0] = ("evaluar", p[2], p[4], p[7])

def p_sentencia_mientras(p):
    'sentencia : MIENTRAS condicion HACER sentencias'
    p[0] = ("mientras", p[2], p[4])

def p_sentencia_agregar(p):
    'sentencia : AGREGAR expresion A ID'
    p[0] = ("agregar", p[2], p[4])

def p_sentencia_quitar(p):
    'sentencia : QUITAR EN ID LBRACKET expresion RBRACKET'
    p[0] = ("quitar", p[3], p[5])

def p_sentencia_limpiar(p):
    'sentencia : LIMPIAR ID'
    p[0] = ("limpiar", p[2])

def p_sentencia_definicion_funcion(p):
    'sentencia : FUNCION tipo ID LPAREN parametros_opt RPAREN sentencias RETORNAR expresion FINFUNCION'
    p[0] = ("definir_funcion", p[2], p[3], p[5], p[7], p[9])

def p_sentencia_definicion_procedimiento(p):
    'sentencia : PROCEDIMIENTO ID LPAREN parametros_opt RPAREN sentencias FINPROCEDIMIENTO'
    p[0] = ("definir_procedimiento", p[2], p[4], p[6])

def p_sentencia_llamada_procedimiento(p):
    'sentencia : ID LPAREN argumentos_opt RPAREN'
    p[0] = ("llamada_procedimiento", p[1], p[3])

# =============================================================================
# REGLAS DE GRAMÁTICA - TIPOS DE DATOS
# =============================================================================

def p_tipo(p):
    '''tipo : NUMERO_TIPO
            | TEXTO_TIPO
            | VULNERABILIDAD_TIPO
            | BOOL_TIPO
            | LISTA MENOR tipo_base MAYOR'''
    if len(p) == 2:
        p[0] = p[1]
    else:
        p[0] = ("lista", p[3])

def p_tipo_base(p):
    '''tipo_base : NUMERO_TIPO
                 | TEXTO_TIPO
                 | VULNERABILIDAD_TIPO
                 | BOOL_TIPO'''
    p[0] = p[1]

# =============================================================================
# REGLAS DE GRAMÁTICA - EXPRESIONES
# =============================================================================

def p_expresion_binaria(p):
    '''expresion : expresion MAS expresion
                 | expresion MENOS expresion
                 | expresion POR expresion
                 | expresion DIV expresion'''
    p[0] = ("binop", p[2], p[1], p[3])

def p_expresion_numero(p):
    'expresion : NUMERO'
    p[0] = ("num", p[1])

def p_expresion_texto(p):
    'expresion : TEXTO'
    p[0] = ("texto", p[1])

def p_expresion_id(p):
    'expresion : ID'
    p[0] = ("var", p[1])

def p_expresion_acceso_lista(p):
    'expresion : ID LBRACKET expresion RBRACKET'
    p[0] = ("acceso_lista", p[1], p[3])

def p_expresion_sqli(p):
    'expresion : SQLI'
    p[0] = ("texto", "sqli")

def p_expresion_xss(p):
    'expresion : XSS'
    p[0] = ("texto", "xss")

def p_expresion_rce(p):
    'expresion : RCE'
    p[0] = ("texto", "rce")

def p_expresion_vulnerable(p):
    'expresion : VULNERABLE'
    p[0] = ("bool", "vulnerable")

def p_expresion_seguro(p):
    'expresion : SEGURO'
    p[0] = ("bool", "seguro")

def p_expresion_probar(p):
    'expresion : PROBAR LPAREN expresion COMA expresion COMA expresion RPAREN'
    p[0] = ("probar", p[3], p[5], p[7])

def p_expresion_reportar(p):
    'expresion : REPORTAR LPAREN expresion RPAREN'
    p[0] = ("reportar", p[3])

def p_expresion_llamada_funcion(p):
    'expresion : ID LPAREN argumentos_opt RPAREN'
    p[0] = ("llamada_funcion", p[1], p[3])

def p_expresion_parentesis(p):
    'expresion : LPAREN expresion RPAREN'
    p[0] = p[2]

# =============================================================================
# REGLAS DE GRAMÁTICA - CONDICIONES Y OPERADORES LÓGICOS
# =============================================================================

def p_condicion_comparacion(p):
    '''condicion : expresion IGUAL expresion
                 | expresion DIF expresion
                 | expresion MENOR expresion
                 | expresion MAYOR expresion
                 | expresion MENORIG expresion
                 | expresion MAYORIG expresion'''
    p[0] = ("comparacion", p[2], p[1], p[3])

def p_condicion_logica_and(p):
    'condicion : condicion Y condicion'
    p[0] = ("y", p[1], p[3])

def p_condicion_logica_or(p):
    'condicion : condicion O condicion'
    p[0] = ("o", p[1], p[3])

def p_condicion_negacion(p):
    'condicion : NO condicion'
    p[0] = ("no", p[2])

def p_condicion_expresion(p):
    'condicion : expresion'
    p[0] = p[1]

# =============================================================================
# REGLAS DE GRAMÁTICA - FUNCIONES Y PROCEDIMIENTOS
# =============================================================================

def p_parametros_opt(p):
    '''parametros_opt : parametros
                      | empty'''
    if len(p) == 2 and p[1] is not None:
        p[0] = p[1]
    else:
        p[0] = []

def p_parametros(p):
    '''parametros : parametro
                  | parametro COMA parametros'''
    if len(p) == 2:
        p[0] = [p[1]]
    else:
        p[0] = [p[1]] + p[3]

def p_parametro(p):
    'parametro : tipo ID'
    p[0] = (p[1], p[2])

def p_argumentos_opt(p):
    '''argumentos_opt : argumentos
                      | empty'''
    if len(p) == 2 and p[1] is not None:
        p[0] = p[1]
    else:
        p[0] = []

def p_argumentos(p):
    '''argumentos : expresion
                  | expresion COMA argumentos'''
    if len(p) == 2:
        p[0] = [p[1]]
    else:
        p[0] = [p[1]] + p[3]

def p_empty(p):
    'empty :'
    pass

# =============================================================================
# MANEJO DE ERRORES Y CONSTRUCCIÓN DEL PARSER
# =============================================================================

def p_error(p):
    if p:
        print(f"Error de sintaxis en token '{p.value}' en línea {p.lineno}")
    else:
        print("Error de sintaxis: fin de archivo inesperado")

# Construir el analizador sintáctico
parser = yacc.yacc()

## Main

In [None]:
"""
Intérprete principal del lenguaje de seguridad educativo.

Secuencia de ejecución:
1. El código fuente se tokeniza con `scanner.lexer`.
2. El parser (`scanner.addons.parser`) construye un AST.
3. Las funciones `ejecutar` y `evaluar` recorren el AST y mantienen el estado
   en estructuras globales:
   - `variables_globales`: valores de las variables declaradas.
   - `tipos_de_variables`: tipos asociados a cada identificador.
   - `tabla_funciones`: definiciones de funciones disponibles.
   - `tabla_procedimientos`: definiciones de procedimientos disponibles.

La interpretación se realiza en memoria: cada sentencia produce efectos sobre
estas estructuras y las llamadas a funciones/procedimientos crean contextos
locales que se guardan y restauran automáticamente.
"""

from scanner import lexer
from scanner.addons.parser import parser
import scanner.addons.builtins as builtins

def ejecutar(ast):
    """Despacha la ejecución de cada nodo del AST según su tipo."""
    if not ast:
        return
    # Un nodo siempre es una tupla (tipo, datos...), por ejemplo:
    # ("asignar", "variable", ("num", 10)).
    tipo_nodo = ast[0]

    if tipo_nodo == "programa":
        # El nodo raíz contiene la secuencia completa de sentencias.
        for sentencia in ast[1]:
            ejecutar(sentencia)

    elif tipo_nodo == "asignar":
        _, identificador, expresion = ast
        valor = evaluar(expresion)
        variables_globales[identificador] = valor

    elif tipo_nodo == "declarar_asignar":
        _, tipo_variable, identificador, expresion = ast
        valor = evaluar(expresion)
        variables_globales[identificador] = valor
        tipos_de_variables[identificador] = tipo_variable

    elif tipo_nodo == "declarar_lista_vacia":
        _, tipo_base, identificador = ast
        variables_globales[identificador] = []
        tipos_de_variables[identificador] = ("lista", tipo_base)

    elif tipo_nodo == "mostrar":
        # Evalúa la expresión y la imprime en consola.
        _, expresion = ast
        valor = evaluar(expresion)
        print(valor)

    elif tipo_nodo == "evaluar":
        _, condicion, bloque_si, bloque_no = ast
        if evaluar_condicion(condicion):
            for sentencia in bloque_si:
                ejecutar(sentencia)
        elif bloque_no:
            for sentencia in bloque_no:
                ejecutar(sentencia)

    elif tipo_nodo == "mientras":
        _, condicion, bloque = ast
        while evaluar_condicion(condicion):
            for sentencia in bloque:
                ejecutar(sentencia)

    elif tipo_nodo == "agregar":
        _, expresion_valor, nombre_lista = ast
        valor = evaluar(expresion_valor)
        if nombre_lista in variables_globales and isinstance(variables_globales[nombre_lista], list):
            variables_globales[nombre_lista].append(valor)
        else:
            print(f"Error: '{nombre_lista}' no es una lista")

    elif tipo_nodo == "quitar":
        _, nombre_lista, expresion_indice = ast
        indice = evaluar(expresion_indice)
        if nombre_lista in variables_globales and isinstance(variables_globales[nombre_lista], list):
            if 0 <= indice < len(variables_globales[nombre_lista]):
                variables_globales[nombre_lista].pop(indice)
            else:
                print(f"Error: Índice {indice} fuera de rango en lista '{nombre_lista}'")
        else:
            print(f"Error: '{nombre_lista}' no es una lista")

    elif tipo_nodo == "limpiar":
        _, nombre_lista = ast
        if nombre_lista in variables_globales and isinstance(variables_globales[nombre_lista], list):
            variables_globales[nombre_lista].clear()
        else:
            print(f"Error: '{nombre_lista}' no es una lista")

    elif tipo_nodo == "definir_funcion":
        _, tipo_retorno, nombre, parametros, cuerpo, expresion_retorno = ast
        # Se almacena la firma completa para resolver llamadas posteriores.
        tabla_funciones[nombre] = ("funcion", tipo_retorno, parametros, cuerpo, expresion_retorno)

    elif tipo_nodo == "definir_procedimiento":
        _, nombre, parametros, cuerpo = ast
        tabla_procedimientos[nombre] = ("procedimiento", parametros, cuerpo)

    elif tipo_nodo == "llamada_procedimiento":
        _, nombre, argumentos = ast
        if nombre in tabla_procedimientos:
            # Los procedimientos no devuelven valor; solo generan efectos.
            ejecutar_procedimiento(nombre, argumentos)
        else:
            print(f"Error: Procedimiento '{nombre}' no definido")

def evaluar(expr):
    """Evalúa una expresión y devuelve su resultado en tiempo de ejecución."""
    etiqueta = expr[0]

    if etiqueta == "num": return expr[1]
    if etiqueta == "texto": return expr[1]
    if etiqueta == "var": return variables_globales.get(expr[1], None)
    if etiqueta == "bool": return expr[1]

    if etiqueta == "acceso_lista":
        _, nombre_lista, expresion_indice = expr
        indice = evaluar(expresion_indice)
        if nombre_lista in variables_globales and isinstance(variables_globales[nombre_lista], list):
            if 0 <= indice < len(variables_globales[nombre_lista]):
                return variables_globales[nombre_lista][indice]
            else:
                print(f"Error: Índice {indice} fuera de rango en lista '{nombre_lista}'")
                return None
        else:
            print(f"Error: '{nombre_lista}' no es una lista")
            return None

    if etiqueta == "binop":
        _, operador, expresion_izquierda, expresion_derecha = expr
        operando_izquierdo = evaluar(expresion_izquierda)
        operando_derecho = evaluar(expresion_derecha)
        if operador == "+": 
            # Concatenación de texto o suma numérica
            if isinstance(operando_izquierdo, str) or isinstance(operando_derecho, str):
                return str(operando_izquierdo) + str(operando_derecho)
            return operando_izquierdo + operando_derecho
        if operador == "-": return operando_izquierdo - operando_derecho
        if operador == "*": return operando_izquierdo * operando_derecho
        if operador == "/": 
            if operando_derecho == 0:
                print("Error: División por cero")
                return 0
            return operando_izquierdo / operando_derecho
        # Nota: si llega hasta aquí la operación no está soportada.

    if etiqueta == "probar":
        _, url, tipo, payload = expr
        # Builtin que simula una prueba de seguridad y devuelve un bool.
        return builtins.fn_probar(evaluar(url), evaluar(tipo), evaluar(payload))

    if etiqueta == "reportar":
        _, msg = expr
        # Builtin que genera un reporte; se mantiene para efectos secundarios.
        return builtins.fn_reportar(evaluar(msg))

    if etiqueta == "llamada_funcion":
        _, nombre, argumentos = expr
        if nombre in tabla_funciones:
            return ejecutar_funcion(nombre, argumentos)
        else:
            print(f"Error: Función '{nombre}' no definida")
            return None

def evaluar_condicion(condicion):
    """Evalúa una condición lógica"""
    if not condicion:
        return False
    
    # Las condiciones comparten la misma convención que las expresiones:
    # en la primera posición se indica el tipo de operación a realizar.
    tipo = condicion[0]
    
    if tipo == "comparacion":
        _, op, izq, der = condicion
        l = evaluar(izq)
        r = evaluar(der)
        if op == "==": return l == r
        if op == "!=": return l != r
        if op == "<": return l < r
        if op == ">": return l > r
        if op == "<=": return l <= r
        if op == ">=": return l >= r
    
    elif tipo == "y":
        _, cond1, cond2 = condicion
        return evaluar_condicion(cond1) and evaluar_condicion(cond2)
    
    elif tipo == "o":
        _, cond1, cond2 = condicion
        return evaluar_condicion(cond1) or evaluar_condicion(cond2)
    
    elif tipo == "no":
        _, cond = condicion
        return not evaluar_condicion(cond)
    
    elif tipo == "bool":
        return condicion[1] == "vulnerable"
    
    else:
        # Si es una expresión simple (por ejemplo una variable), se evalúa
        # reutilizando la lógica general y se normaliza el resultado a bool.
        val = evaluar(condicion)
        if isinstance(val, str):
            return val == "vulnerable"
        return bool(val)

def ejecutar_funcion(nombre, argumentos):
    """Ejecuta una función definida por el usuario"""
    if nombre not in tabla_funciones:
        print(f"Error: Función '{nombre}' no definida")
        return None
    
    _, tipo_retorno, parametros, cuerpo, expresion_retorno = tabla_funciones[nombre]
    
    # Crear contexto local
    variables_locales = {}
    tipos_locales = {}
    
    # Asignar argumentos a parámetros
    if len(argumentos) != len(parametros):
        print(f"Error: Número incorrecto de argumentos para función '{nombre}'")
        return None
    
    for i, (tipo_param, nombre_param) in enumerate(parametros):
        valor_argumento = evaluar(argumentos[i])
        variables_locales[nombre_param] = valor_argumento
        tipos_locales[nombre_param] = tipo_param
    
    # Guardar contexto global
    variables_previas = variables_globales.copy()
    tipos_previos = tipos_de_variables.copy()
    
    # Establecer contexto local
    variables_globales.clear()
    variables_globales.update(variables_locales)
    tipos_de_variables.clear()
    tipos_de_variables.update(tipos_locales)
    # A partir de aquí todo acceso a variables se realiza sobre el contexto
    # recién creado hasta que la función finalice.
    
    # Ejecutar cuerpo de la función
    for sentencia in cuerpo:
        ejecutar(sentencia)
    
    # Evaluar expresión de retorno
    valor_retorno = evaluar(expresion_retorno)
    
    # Restaurar contexto global
    variables_globales.clear()
    variables_globales.update(variables_previas)
    tipos_de_variables.clear()
    tipos_de_variables.update(tipos_previos)
    # El retorno se realiza una vez restaurado el entorno anterior.
    
    return valor_retorno

def ejecutar_procedimiento(nombre, argumentos):
    """Ejecuta un procedimiento definido por el usuario"""
    if nombre not in tabla_procedimientos:
        print(f"Error: Procedimiento '{nombre}' no definido")
        return
    
    _, parametros, cuerpo = tabla_procedimientos[nombre]
    
    # Crear contexto local
    variables_locales = {}
    tipos_locales = {}
    
    # Asignar argumentos a parámetros
    if len(argumentos) != len(parametros):
        print(f"Error: Número incorrecto de argumentos para procedimiento '{nombre}'")
        return
    
    for i, (tipo_param, nombre_param) in enumerate(parametros):
        valor_argumento = evaluar(argumentos[i])
        variables_locales[nombre_param] = valor_argumento
        tipos_locales[nombre_param] = tipo_param
    
    # Guardar contexto global
    variables_previas = variables_globales.copy()
    tipos_previos = tipos_de_variables.copy()
    
    # Establecer contexto local
    variables_globales.clear()
    variables_globales.update(variables_locales)
    tipos_de_variables.clear()
    tipos_de_variables.update(tipos_locales)
    
    # Ejecutar cuerpo del procedimiento
    for sentencia in cuerpo:
        ejecutar(sentencia)
    
    # Restaurar contexto global
    variables_globales.clear()
    variables_globales.update(variables_previas)
    tipos_de_variables.clear()
    tipos_de_variables.update(tipos_previos)
    # No se devuelve valor alguno porque los procedimientos solo generan efectos.

# Variables globales
variables_globales = {}       # Almacén de variables y sus valores actuales
tipos_de_variables = {}       # Tipos declarados para cada identificador
tabla_funciones = {}          # Funciones definidas por el usuario
tabla_procedimientos = {}     # Procedimientos definidos por el usuario

if __name__ == "__main__":
    # Leer código desde archivo
    with open("test.bug", "r") as f:
        codigo = f.read()
    
    print(" Aplicando scanner...")
    lexer.input(codigo)
    
    # Mostrar tokens como en el ejemplo de PLY
    while True:
        tok = lexer.token()
        if not tok: 
            break
        print(tok)
    
    print("\n Analizando código...")
    ast = parser.parse(codigo, lexer=lexer)
    
    print(" Ejecutando programa...")
    ejecutar(ast)