# Lenguaje Educativo
---

[URL](https://github.com/AgusCuevas/Parseo_y_Generacion_de_Codigo)

## Descripción

Es un lenguaje de programación educativa, con palabras clave que se relacionan a situaciones del entorno académico. Está diseñado para ser simple, legible y didáctico, permitiendo representar conceptos comunes como alumnos, notas, aprobaciones, etc

## Especificaciones sintácticas

```
<programa> ::= INICIO <bloque> FIN.

<bloque> ::= <sentencia> <bloque> | λ

<sentencia> ::= <asignacion>
              | <impresion>
              | <condicional>
              | <repeticion>
              | <definicion_funcion>
              | <definicion_procedimiento>
              | <llamada_procedimiento>
              | <operacion_lista>

# -----------------------------
# Asignaciones y tipos
# -----------------------------
<asignacion> ::= anotar <tipo> <identificador> = <expresion>
               | anotar <identificador> = <expresion>
               | anotar lista<tipo_base> <identificador> = vacia
               | anotar <identificador> [ <expresion> ] = <expresion>

<tipo> ::= numero | nota | alumno | bool | lista<tipo_base>
<tipo_base> ::= numero | nota | alumno | bool

# -----------------------------
# Impresión (concatenación de texto)
# -----------------------------
<impresion> ::= mostrar <texto_concatenado>

<texto_concatenado> ::= <elemento_texto> <mas_texto>
<mas_texto> ::= + <elemento_texto> <mas_texto> | λ

<elemento_texto> ::= <texto>
                   | <numero>
                   | <booleano>
                   | <identificador> <uso_variable>
                   | "(" <expresion> ")"

# -----------------------------
# Condicional con precedencia (no > y > o) y 'entre'
# -----------------------------
<condicional> ::= evaluar <condicion> <bloque_condicional>

<bloque_condicional> ::= si pasa: <bloque> <opcional_sino>
<opcional_sino> ::= si no pasa: <bloque> | λ

<condicion> ::= <condicion_o>

<condicion_o> ::= <condicion_y> <mas_o>
<mas_o> ::= o <condicion_y> <mas_o> | λ

<condicion_y> ::= <condicion_no> <mas_y>
<mas_y> ::= y <condicion_no> <mas_y> | λ

<condicion_no> ::= no <condicion_no> | <comparacion>

# —— FACTORIZADA PARA LL(1) ——
<comparacion> ::= <expresion> <cola_comparacion>
<cola_comparacion> ::= <operador_relacional> <expresion>
                     | entre <expresion> y <expresion>
                     | λ
# (Semánticamente, en 'entre' podés exigir que la primera <expresion> sea un identificador.)

# -----------------------------
# Repetición (bucle mientras)
# -----------------------------
<repeticion> ::= mientras <condicion> hacer <bloque>

# -----------------------------
# Expresiones aritméticas (sin recursión izquierda)
# -----------------------------
<expresion> ::= <termino> <suma_opcional>
<suma_opcional> ::= <op_suma> <termino> <suma_opcional> | λ

<termino> ::= <factor> <producto_opcional>
<producto_opcional> ::= <op_mul> <factor> <producto_opcional> | λ

<factor> ::= <numero>
           | <texto>
           | <booleano>
           | "(" <expresion> ")"
           | <identificador> <uso_variable>

<uso_variable> ::= "(" <argumentos> ")"    # llamada a función
                 | "[" <expresion> "]"     # acceso a lista
                 | λ                       # variable simple

<op_suma> ::= + | -
<op_mul>  ::= * | /

# -----------------------------
# Listas
# -----------------------------
<operacion_lista> ::= agregar <expresion> a <identificador>
                    | quitar en <identificador> "[" <expresion> "]"
                    | limpiar <identificador>

# -----------------------------
# Funciones y procedimientos
# -----------------------------
<definicion_funcion> ::= funcion <tipo> <identificador> "(" <parametros> ")"
                         <bloque>
                         retornar <expresion>
                         finFuncion

<definicion_procedimiento> ::= procedimiento <identificador> "(" <parametros> ")"
                               <bloque>
                               finProcedimiento

<llamada_funcion> ::= <identificador> "(" <argumentos> ")"
<llamada_procedimiento> ::= <identificador> "(" <argumentos> ")"

<parametros> ::= <lista_parametros> | λ
<lista_parametros> ::= <parametro> <parametros_extra>
<parametros_extra> ::= , <parametro> <parametros_extra> | λ
<parametro> ::= <tipo> <identificador>

<argumentos> ::= <lista_argumentos> | λ
<lista_argumentos> ::= <expresion> <argumentos_extra>
<argumentos_extra> ::= , <expresion> <argumentos_extra> | λ

# -----------------------------
# Léxico y operadores
# -----------------------------
<booleano> ::= aprobado | desaprobado
<operador_relacional> ::= == | != | < | > | <= | >=

<numero> ::= <digito> { <digito> }
<texto> ::= '"' { <letra> | <digito> } '"'
<identificador> ::= <letra> { <letra> | <digito> | _ }

<letra> ::= a | b | ... | z | A | B | ... | Z
<digito> ::= 0 | 1 | ... | 9

<comentario_linea>  ::= "//" {cualquier_caracter_excepto_salto}
<comentario_bloque> ::= "/*" {cualquier_caracter} "*/"
```

## Especificaciones semánticas

| Operadores              | numero |  nota  |  bool  | alumno |
| ----------------------: | :----: | :----: | :----: | :----: |
|    `<`, `>`, `<=`, `>=` | `bool` | `bool` |    —   |    —   |
|              `==`, `!=` | `bool` | `bool` | `bool` | `bool` |


* **Reglas**:
    * Tratamos nota como numérico para aritmética y comparaciones, tipo compatible con numero
    * Igualdad/desigualdad válidas solo entre mismo tipo
    * No hay comparaciones ordenadas con alumno ni con bool
---

* **Asignación - compatibilidad de tipos**:

| Tipo             | numero | nota | bool | alumno | texto           |
| ---------------: | :----: | :--: | :--: | :----: | :-------------: |
|       **numero** |   OK   |  OK  |  -   |   -    |       -         |
|         **nota** |   OK   |  OK  |  -   |   -    |       -         |
|         **bool** |   -    |  -   |  OK  |   -    |       -         |
|       **alumno** |   -    |  -   |  -   |   OK   |        OK       |

## Ejemplo

```
INICIO

// Listas: alumnos y sus notas. Se inicializan vacías
anotar lista<alumno> alumnos = vacia
anotar lista<nota>   notas   = vacia

// Carga de listas con 'agregar'
agregar "Lucía"  a alumnos
agregar 8        a notas

agregar "Martín" a alumnos
agregar 5        a notas

agregar "Sofía"  a alumnos
agregar 10       a notas

// ["Lucía", "Martín", "Sofía"]
// [8, 5, 10]

// Cantidad de registros 
anotar numero cantidad = 3

// Corrección por índice (1-based): Martín pasa a 6
anotar notas[2] = 6
// ["Lucía", "Martín", "Sofía"]
// [8, 6, 10]

// Procedimiento: imprime un boletín simple
procedimiento mostrarBoletin(alumno nombre, nota n, bool estado)
    mostrar "Alumno: " + nombre + " | Nota: " + n + " | Estado: " + estado
finProcedimiento

// Función: estado según nota (bool)
funcion bool estadoSegunNota(nota n)
    evaluar n >= 6
        si pasa:
            retornar aprobado
        si no pasa:
            retornar desaprobado
finFuncion

// Función: promedio de n elementos de una lista de notas (listas 1-based)
funcion nota promedio(lista<nota> xs, numero n)
    anotar numero i = 1
    anotar numero s = 0
    mientras i <= n hacer
        anotar s = s + xs[i]
        anotar i = i + 1
    retornar s / n
finFuncion

// Recorrido con 'mientras' para imprimir boletines
mostrar "Boletines:"
anotar numero i = 1
mientras i <= cantidad hacer
    anotar alumno nombre = alumnos[i]
    anotar nota n = notas[i]
    anotar bool est = estadoSegunNota(n)
    mostrarBoletin(nombre, n, est)
    anotar i = i + 1

// Promedio del curso
anotar nota prom = promedio(notas, cantidad)
mostrar "Promedio del curso: " + prom

// Operaciones de lista: quitar y limpiar
mostrar "Quitando última entrada..."
quitar en alumnos[3]
quitar en notas[3]
anotar cantidad = 2

mostrar "Limpiando listas..."
limpiar alumnos
limpiar notas
FIN.
```

## Scanner

In [None]:
import ply.lex as lex

# =========================
# Palabras reservadas
# =========================
CASE_INSENSITIVE = True
reserved = {
    # estructura
    'inicio': 'KW_INICIO',
    'fin': 'KW_FIN',

    # tipos y listas
    'numero': 'KW_NUMERO',
    'nota': 'KW_NOTA',
    'alumno': 'KW_ALUMNO',
    'bool': 'KW_BOOL',
    'lista': 'KW_LISTA',
    'vacia': 'KW_VACIA',

    # booleanos
    'aprobado': 'KW_TRUE',
    'desaprobado': 'KW_FALSE',

    # control / condicional
    'evaluar': 'KW_EVALUAR',
    'si': 'KW_SI',
    'sino': 'KW_SINO',
    'pasa': 'KW_PASA',
    'no': 'KW_NOT',
    'y': 'KW_AND',
    'o': 'KW_OR',
    'entre': 'KW_ENTRE',

    # bucle
    'mientras': 'KW_MIENTRAS',
    'hacer': 'KW_HACER',

    # acciones
    'anotar': 'KW_ANOTAR',
    'mostrar': 'KW_MOSTRAR',

    # listas (ops)
    'agregar': 'KW_AGREGAR',
    'quitar': 'KW_QUITAR',
    'limpiar': 'KW_LIMPIAR',
    'a': 'KW_A',
    'en': 'KW_EN',

    # funciones y procedimientos
    'funcion': 'KW_FUNCION',
    'finfuncion': 'KW_FIN_FUNCION',
    'procedimiento': 'KW_PROCEDIMIENTO',
    'finprocedimiento': 'KW_FIN_PROCEDIMIENTO',
    'retornar': 'KW_RETORNAR',
}

# =========================
# Tokens
# =========================
tokens = (
    'ID', 'ENTERO', 'CADENA',
    # separadores / signos 
    'IGUAL',        # =
    'COMA',         # ,
    'PTCOMA',       # ;
    'PUNTO',        # .
    'PARIZQ', 'PARDER',         # ( )
    'CORIZQ', 'CORDER',         # [ ]
    'LLAVEIZQ', 'LLAVEDER',     # { }
    'DOSPUNTOS',                # :

    # operadores aritméticos
    'MAS', 'MENOS', 'POR', 'DIVIDIDO', 'MOD',   # + - * / %

    # operadores lógicos simbólicos
    'ANDOP', 'OROP', 'NOTOP',                   # && || !

    # comparadores
    'IGUALIGUAL', 'DISTINTO', 'MENORIGUAL', 'MAYORIGUAL', 'MENOR', 'MAYOR',

    # FIN.
    'KW_FIN_PUNTO',
) + tuple(set(reserved.values()))

# =========================
# Reglas
# =========================
# comparadores
t_IGUALIGUAL = r'=='
t_DISTINTO   = r'!='
t_MENORIGUAL = r'<='
t_MAYORIGUAL = r'>='

# simples
t_MENOR      = r'<'
t_MAYOR      = r'>'
t_IGUAL      = r'='
t_COMA       = r','
t_PTCOMA     = r';'
t_PUNTO      = r'\.'
t_DOSPUNTOS  = r':'
t_PARIZQ     = r'\('
t_PARDER     = r'\)'
t_CORIZQ     = r'\['
t_CORDER     = r'\]'
t_LLAVEIZQ   = r'\{'
t_LLAVEDER   = r'\}'
t_MAS        = r'\+'
t_MENOS      = r'-'
t_POR        = r'\*'
t_DIVIDIDO   = r'/'
t_MOD        = r'%'

# lógicos simbólicos
t_ANDOP      = r'&&'
t_OROP       = r'\|\|'
t_NOTOP      = r'!'

# espacios/tabs
t_ignore = ' \t\r'

# =========================
# Reglas por función
# =========================
# Comentarios /*...*/
def t_COMMENT_BLOCK(t):
    r'/\*([^*]|\*+[^*/])*\*+/'
    pass

#//
def t_COMMENT_LINE(t):
    r'//[^\n]*'
    pass

# Numeros
def t_ENTERO(t):
    r'\d+'
    t.value = int(t.value)
    return t

# String entre ""
def t_CADENA(t):
    r'"([^"\\]|\\.)*"'
    return t

# FIN.
def t_KW_FIN_PUNTO(t):
    r'(?:F|f)(?:I|i)(?:N|n)\.'
    return t

# Identidicadores
def t_ID(t):
    r'[A-Za-z_ÁÉÍÓÚáéíóúñÑ][A-Za-z_0-9ÁÉÍÓÚáéíóúñÑ]*'
    lex = t.value
    key = lex.lower() if CASE_INSENSITIVE else lex
    if key in reserved:
        t.type = reserved[key]
        if t.type == 'KW_TRUE':  t.value = True
        elif t.type == 'KW_FALSE': t.value = False
        else: t.value = lex
    else:
        t.type = 'ID'
        t.value = lex
    return t

#Errores
LEXER_HUBO_ERROR = False

def reset_lexer_error():
    global LEXER_HUBO_ERROR
    LEXER_HUBO_ERROR = False

def t_newline(t):
    r'\n+'
    t.lexer.lineno += t.value.count('\n')

def t_error(t):
    global LEXER_HUBO_ERROR
    LEXER_HUBO_ERROR = True
    print(f"[LEX] Caracter ilegal '{t.value[0]}' en línea {t.lexer.lineno}")
    t.lexer.skip(1)

# =========================
# Constructor
# =========================
def build_lexer():
    return lex.lex()

## Parser

In [None]:
import importlib
import ply.yacc as yacc
from Scanner import lexer_spec
importlib.reload(lexer_spec)

tokens = lexer_spec.tokens
get_lexer = lexer_spec.build_lexer

# ================= Estado de ejecución / reporte =================
HUBO_ERROR = False

def _fin_ok():
    if not HUBO_ERROR and not getattr(lexer_spec, "LEXER_HUBO_ERROR", False):
        print("La operación se completó correctamente.")

# ================= Precedencias (aritmética) =================
precedence = (
    ('left', 'MAS', 'MENOS'),
    ('left', 'POR', 'DIVIDIDO'),
)

# ================= Programa / bloque =================
def p_inicio_marca(p):
    'inicio_marca : KW_INICIO'

def p_programa(p):
    'programa : inicio_marca bloque fin_marca'
    _fin_ok()
    
def p_fin_marca(p):
    '''fin_marca : KW_FIN_PUNTO
                 | KW_FIN
                 | KW_FIN PUNTO'''

def p_bloque(p):
    '''bloque : sentencia bloque
              | '''
    pass

def p_sentencia(p):
    '''sentencia : asignacion
                 | impresion
                 | condicional
                 | repeticion
                 | operacion_lista
                 | definicion_funcion
                 | definicion_procedimiento
                 | llamada_procedimiento'''
    pass

# ================= Asignaciones =================
def p_asignacion_tipada(p):
    'asignacion : KW_ANOTAR tipo ID IGUAL expresion'  

def p_asignacion_inferida(p):
    'asignacion : KW_ANOTAR ID IGUAL expresion'

def p_asignacion_lista_ang(p):
    'asignacion : KW_ANOTAR KW_LISTA MENOR tipo_base MAYOR ID IGUAL KW_VACIA'

def p_asignacion_lista_simple(p):
    'asignacion : KW_ANOTAR KW_LISTA tipo_base ID IGUAL KW_VACIA'  

def p_asignacion_indexada(p):
    'asignacion : KW_ANOTAR ID CORIZQ expresion CORDER IGUAL expresion'

def p_tipo(p):
    '''tipo : KW_NUMERO
            | KW_NOTA
            | KW_ALUMNO
            | KW_BOOL
            | KW_LISTA tipo_base
            | KW_LISTA MENOR tipo_base MAYOR'''
    pass

def p_tipo_base(p):
    '''tipo_base : KW_NUMERO
                 | KW_NOTA
                 | KW_ALUMNO
                 | KW_BOOL'''
    pass

# ================= mostrar =================
def p_impresion(p):
    'impresion : KW_MOSTRAR texto_conc'  

def p_texto_conc(p):
    'texto_conc : elem_texto mas_texto'
    pass

def p_mas_texto(p):
    '''mas_texto : MAS elem_texto mas_texto
                 | '''
    pass

def p_elem_texto(p):
    '''elem_texto : CADENA
                  | ENTERO
                  | booleano
                  | PARIZQ expresion PARDER
                  | ID'''
    pass

# ================= Condicional =================
def p_condicional(p):
    'condicional : KW_EVALUAR condicion bloque_cond'

def p_bloque_cond(p):
    'bloque_cond : KW_SI KW_PASA DOSPUNTOS bloque opc_sino'

def p_opc_sino(p):
    '''opc_sino : KW_SI KW_NOT KW_PASA DOSPUNTOS bloque
                | KW_SINO KW_PASA DOSPUNTOS bloque
                | '''

# ----- Lógica: NOT > AND > OR -----
def p_condicion(p):
    'condicion : cond_o'
    pass

def p_cond_o(p):
    '''cond_o : cond_o KW_OR cond_y
              | cond_o OROP  cond_y
              | cond_y'''
    pass

def p_cond_y(p):
    '''cond_y : cond_y KW_AND cond_no
              | cond_y ANDOP  cond_no
              | cond_no'''
    pass

def p_cond_no(p):
    '''cond_no : KW_NOT cond_no
               | NOTOP  cond_no
               | comparacion'''
    pass

def p_comparacion_rel(p):
    '''comparacion : expresion IGUALIGUAL expresion
                   | expresion DISTINTO   expresion
                   | expresion MENOR      expresion
                   | expresion MENORIGUAL expresion
                   | expresion MAYOR      expresion
                   | expresion MAYORIGUAL expresion'''
    pass

def p_comparacion_entre(p):
    'comparacion : expresion KW_ENTRE expresion KW_AND expresion'
    pass

def p_comparacion_sola(p):
    'comparacion : expresion'
    pass

# ================= Repetición =================
def p_repeticion(p):
    'repeticion : KW_MIENTRAS PARIZQ condicion PARDER KW_HACER bloque'

# ================= Listas =================
def p_operacion_lista_agregar(p):
    'operacion_lista : KW_AGREGAR expresion KW_A ID'

def p_operacion_lista_quitar(p):
    'operacion_lista : KW_QUITAR KW_EN ID CORIZQ expresion CORDER'

def p_operacion_lista_limpiar(p):
    'operacion_lista : KW_LIMPIAR ID'

# ========== Funciones / Procedimientos ==========
def p_definicion_funcion(p):
    'definicion_funcion : KW_FUNCION tipo ID PARIZQ parametros PARDER bloque KW_RETORNAR expresion KW_FIN_FUNCION'

def p_definicion_procedimiento(p):
    'definicion_procedimiento : KW_PROCEDIMIENTO ID PARIZQ parametros PARDER bloque KW_FIN_PROCEDIMIENTO'

def p_llamada_procedimiento(p):
    'llamada_procedimiento : ID PARIZQ argumentos PARDER' 

def p_parametros(p):
    '''parametros : lista_parametros
                  | '''
    pass

def p_lista_parametros(p):
    'lista_parametros : parametro mas_parametros'
    pass

def p_mas_parametros(p):
    '''mas_parametros : COMA parametro mas_parametros
                      | '''
    pass

def p_parametro(p):
    'parametro : tipo ID'
    pass

def p_argumentos(p):
    '''argumentos : lista_argumentos
                  | '''
    pass

def p_lista_argumentos(p):
    'lista_argumentos : expresion mas_argumentos'
    pass

def p_mas_argumentos(p):
    '''mas_argumentos : COMA expresion mas_argumentos
                      | '''
    pass

# ================= Expresiones =================
def p_expresion(p):
    'expresion : termino suma_opt'
    pass

def p_suma_opt(p):
    '''suma_opt : op_suma termino suma_opt
                | '''
    pass

def p_termino(p):
    'termino : factor prod_opt'
    pass

def p_prod_opt(p):
    '''prod_opt : op_mul factor prod_opt
                | '''
    pass

def p_factor(p):
    '''factor : ENTERO
              | CADENA
              | booleano
              | PARIZQ expresion PARDER
              | ID'''
    pass

def p_op_suma(p):
    '''op_suma : MAS
               | MENOS'''
    pass

def p_op_mul(p):
    '''op_mul : POR
              | DIVIDIDO'''
    pass

def p_booleano(p):
    '''booleano : KW_TRUE
                | KW_FALSE'''
    pass

# ================== Errores ==================
def p_error(p):
    global HUBO_ERROR
    HUBO_ERROR = True
    if not p:
        msg = "Token: EOF - Error"
        print(msg)
    else:
        msg = f"Token: {p.value} - Error"
        print(msg)

# ============== Constructor ==============
def build_parser():

    return yacc.yacc(start='programa')

## Main

In [None]:
import os, sys
BASE = os.path.abspath(os.path.join(os.path.dirname(__file__), '..'))
if BASE not in sys.path:
    sys.path.insert(0, BASE)

from Scanner.lexer_spec import build_lexer
from Parser.parser_spec import build_parser

texto = """
INICIO
  anotar nota x = ( 2 + 3 ) * 2
  mostrar "OK"
FIN .
"""

def run(texto):
    # Scanner
    lexer = build_lexer()
    print("=== TOKENS ===")
    lexer.input(texto)
    while (tok := lexer.token()):
        print(f"{tok.type} -> {tok.value}")
    print()

    # Parser
    print("=== RESULTADO ===")
    parser = build_parser()
    parser.parse(texto, lexer)  

if __name__ == "__main__":
    print ('Inicio del procesamiento')
    print ()
    run(texto)
    print ()
    print ('Fin del procesamiento')