# Lenguaje LDR (Lenguaje de Rivas)
---

[URL](https://github.com/deRivasLeandro/Parseo---UNAHUR---de-Rivas-Leandro)

## Objetivo

LDR es un lenguaje educativo de propósito general, con sintaxis simple y de paradigma imperativo.

## Especificaciones léxicas

- Las variables se escriben con letras mayúsculas (A–Z) seguidas opcionalmente de uno o más números.  
  Ejemplos: `X`, `Z1`, `VAR99`.
- Las sentencias, incluyendo bloques de control de flujo, se escriben en mayúscula y finalizan con punto y coma ;.
- Un programa inicia con la palabra clave `INICIO` y finaliza con `FIN`.
- La identación no es obligatoria, pero se recomienda para mejorar la claridad del programa.

* Tipos de datos
    - **Primitivos:** `NUM` (número entero), `CAR` (carácter).
    - **Compuestos:** `ARR` (arreglo).

* Sentencias válidas:
    - **Declaración:**
      - `VAR tipo;`  
      - Ejemplo: `X NUM;`
      - También se permite declarar e inicializar: `VAR tipo = valor;`
    
    - **Asignación:**
      - `VAR = valor;`  
      - Ejemplo: `X = 10;`
      - La reasignación funciona de la misma manera
    
    - **Condicional:**
        ```ldr
        SI condición ENTONCES
          sentencias
        SINO
          sentencias
        FINSI;
        ```
    
    - **Iteración:**
        ```ldr
        MIENTRAS condición HACER
          sentencias
        FINMIENTRAS;
        ```
    
    - **Impresión:** (similar a `console.log()`)
         `IMPRIMIR VAR;`
    
    - **Funciones/Subprogramas:**
      - Se pueden invocar con `NOMBRE(ARGUMENTOS);`
    
        ```ldr
        FUNCION NOMBRE(PARAMS)
          sentencias
        FINFUNCION
        ```

## Especificaciones sintácticas

```bnf
<programa> ::= "INICIO" <bloque> "FIN"

<bloque> ::= <definiciones_funcion> <sentencias>

<definiciones_funcion> ::= <definicion_funcion> <definiciones_funcion> | λ

<definicion_funcion> ::= "FUNCION" <nombre> "(" <parametros>* ")" <sentencias> "FINFUNCION"

<parametros> ::= <parametro> ("," <parametro>)*

<parametro> ::= <variable> <tipo>

<sentencias> ::= <sentencia> <sentencias> | λ

<sentencia> ::= <declaracion> ";"
              | <asignacion> ";"
              | <impresion> ";"
              | <condicional> ";"
              | <iteracion> ";"
              | <llamado_funcion> ";"

<tipo> ::= "NUM" | "CAR" | "ARR"

<declaracion> ::= <variable> <tipo> | <variable> <tipo> "=" <valor>

<asignacion> ::= <variable> "=" <valor>

<impresion> ::= "IMPRIMIR" (<variable> | <valor>)

<condicional> ::= "SI" <condicion> "ENTONCES" <sentencias> "SINO" <sentencias> "FINSI"

<condicion> ::= <valor> <operador_comparacion> <valor> | "(" <condicion> ")" | <condicion> "&&" <condicion> | <condicion> "||" <condicion> | "!(" <condicion> ")"

<operador_comparacion> ::= "<" | ">" | "==" | "<=" | ">=" | "!="

<iteracion> ::= "MIENTRAS" <condicion> "HACER" <sentencias> "FINMIENTRAS"

<valor> ::= <numero> | <caracter> | <array> | <operacion> | <variable>

<operacion> ::= <valor> <operador> <valor>

<operador> ::= "+" | "-" | "*" | "/"

<llamado_funcion> ::= <nombre> "(" <argumentos>* ")"

<argumentos> ::= <valor> ("," <valor>)*

<array> ::= "[" <array-content> "]"

<array-content> ::= <item> "," <array-content> | <item>

<item> ::= <numero> | <caracter>

<numero> ::= [0-9]+ 

<caracter> ::= "'" <cualquier_caracter> "'"
<cualquier_caracter> ::= [A-Za-z0-9!@#$%^&*()_+-=\[\]{}|;:'",.<>/?`~] | " "

<variable> ::= [A-Z]+[0-9]*

<nombre> ::= [A-Z]+
```

## Especificaciones semánticas

* Los caracteres se interpretan como su código ASCII.
* **Operaciones permitidas:** `+`, `-`, `*`, `/` entre `CAR` y `NUM` (en cualquier orden).
* **Regla:** Convertir `CAR` a su valor ASCII (entero), luego operar.
* **Ejemplos:**
    
| Expresión | Resultado |
|-----------|-----------|
| `'A' + 1` | 66        |
| `1 + 'A'` | 66        |
| `'C' - 1` | 66        |
| `2 * 'B'` | 132       |
| `'D' / 2` | 34        |

* ARR con ARR y ARR con NUM. **Operaciones permitidas:**
    - `ARR + ARR`: concatenación.
    - `ARR * NUM`: repetición.

* **Ejemplos:**

| Expresión             | Resultado                |
|-----------------------|--------------------------|
| `[1] + ['A']`         | `[1, 'A']`               |
| `[1,2] + [3,4]`       | `[1,2,3,4]`              |
| `[1]*3`               | `[1,1,1]`                |
| `['X','Y']*2`         | `['X','Y','X','Y']`      |

* Semántica de Funciones
    - Más que funciones son procedimientos, puesto que no tienen un return.
    - Las funciones se definen con `FUNCION <nombre>(<parametros>)` y terminan con `FINFUNCION`.
    - No devuelven valores (procedimientos), pero pueden usar `IMPRIMIR`.
    - Los parámetros son **ligados posicionalmente**, y son **variables locales**.

* Reglas de Tipos:
                                           
| Situación                                     | Regla                            |
|-----------------------------------------------|----------------------------------|
| Llamado con cantidad incorrecta de argumentos | ❌ Error de aridad               |
| Tipos incompatibles                           | ❌ Error de tipo                 |
| Variables locales                             | ✔️ Solo accesibles en la función |
| Parámetros duplicados                         | ❌ Error de declaración          |

## Ejemplos

* **Ejemplo 1: Condicional simple**

```ldr
INICIO
  X NUM;
  X = 7;
  SI X > 0 ENTONCES
    IMPRIMIR X;
  SINO
    IMPRIMIR 'N';
  FINSI;
FIN
```
* **Ejemplo 2: Arrays, operaciones y sobrecarga**

```ldr
INICIO
  A NUM;
  B NUM;
  C CAR;
  D NUM;
  LISTA ARR;

  A = 5;
  B = 10;
  C = 'A';
  D = A + B;
  IMPRIMIR D;
  D = D + C;
  IMPRIMIR D;

  LISTA = [1, 2, 3, 4, 5];
  I NUM;
  I = 0;

  MIENTRAS I < 5 HACER
    IMPRIMIR LISTA[I];
    I = I + 1;
  FINMIENTRAS;

  SI D > 50 ENTONCES
    IMPRIMIR 'S';
  SINO
    IMPRIMIR 'N';
  FINSI;
FIN
```

* **Ejemplo 3: Uso de función SUMAR**

```ldr
INICIO
  FUNCION SUMAR(X NUM, Y NUM)
    RES NUM;
    RES = X + Y;
    IMPRIMIR RES;
  FINFUNCION

  A NUM;
  B NUM;
  A = 5;
  B = 7;
  SUMAR(A, B);
FIN
```

## Scanner

In [None]:
import ply.lex as lex

# Palabras reservadas del lenguaje (se reconocen en mayúsculas)
reserved = {
    'INICIO': 'INICIO',
    'FIN': 'FIN',
    'SI': 'SI',
    'ENTONCES': 'ENTONCES',
    'SINO': 'SINO',
    'FINSI': 'FINSI',
    'MIENTRAS': 'MIENTRAS',
    'HACER': 'HACER',
    'FINMIENTRAS': 'FINMIENTRAS',
    'IMPRIMIR': 'IMPRIMIR',
    'FUNCION': 'FUNCION',
    'FINFUNCION': 'FINFUNCION',
    'NUM': 'NUM',
    'CAR': 'CAR',
    'ARR': 'ARR',
}

# Lista de tokens
tokens = [
    'VARIABLE',         # Identificadores: [A-Z]+[0-9]*
    'NUMERO',           # [0-9]+
    'CARACTER',         # 'A' , 'x' , '1' , ' ' , etc.
    'IGUAL',            # =
    'MAS',              # +
    'MENOS',            # -
    'POR',              # *
    'DIVIDIR',          # /
    'MENOR_QUE',        # <
    'MAYOR_QUE',        # >
    'IGUAL_QUE',        # ==
    'MENOR_IGUAL',      # <=
    'MAYOR_IGUAL',      # >=
    'DISTINTO_QUE',     # !=
    'PARENTESIS_IZQ',   # (
    'PARENTESIS_DER',   # )
    'CORCHETE_IZQ',     # [
    'CORCHETE_DER',     # ]
    'COMA',             # ,
    'PUNTO_Y_COMA',     # ;
    'AMPERSAND',        # &&
    'PIPE',             # ||
    'EXCLAMACION',      # !
] + list(reserved.values())

# Tokens de un solo (o pocos) caracteres
t_IGUAL         = r'='
t_MAS           = r'\+'
t_MENOS         = r'-'
t_POR           = r'\*'
t_DIVIDIR       = r'/'
t_MENOR_QUE     = r'<'
t_MAYOR_QUE     = r'>'
t_IGUAL_QUE     = r'=='
t_MENOR_IGUAL   = r'<='
t_MAYOR_IGUAL   = r'>='
t_DISTINTO_QUE  = r'!='
t_PARENTESIS_IZQ= r'\('
t_PARENTESIS_DER= r'\)'
t_CORCHETE_IZQ  = r'\['
t_CORCHETE_DER  = r'\]'
t_COMA          = r','
t_PUNTO_Y_COMA  = r';'
t_AMPERSAND     = r'&&'
t_PIPE          = r'\|\|'
t_EXCLAMACION   = r'!'

# Números
def t_NUMERO(t):
    r'[0-9]+'
    t.value = int(t.value)
    return t

# Caracteres: un carácter entre comillas simples (incluye espacios y varios signos)
def t_CARACTER(t):
    r"'[A-Za-z0-9!@#$%^&*()_+\-=\[\]{}|;:'\",.<>/?`~ ]'"
    t.value = t.value[1:-1]
    return t

# Identificadores del lenguaje: [A-Z]+[0-9]*  (p.ej., X, VAR, ABC12)
def t_VARIABLE(t):
    r'[A-Z]+[0-9]*'
    # Si coincide con palabra reservada, tipificamos como reservada
    t.type = reserved.get(t.value, 'VARIABLE')
    return t

# Ignorar espacios y tabs
t_ignore = ' \t'

# Contador de líneas
def t_newline(t):
    r'\n+'
    t.lexer.lineno += len(t.value)

# Manejo de errores léxicos
def t_error(t):
    print(f"Carácter inválido: '{t.value[0]}' en línea {t.lexer.lineno}")
    t.lexer.skip(1)

# Construcción del analizador léxico
lexer = lex.lex()

if __name__ == '__main__':
    data = '''
    INICIO
      X NUM;
      X = 1;
      IMPRIMIR X;
    FIN
    '''
    lexer.input(data)
    for tok in iter(lexer.token, None):
        print(tok)

## Parser

In [None]:
import ply.yacc as yacc
from scanner import tokens

# ------------------------------------------------------------------
# Precedencias y asociatividades (para expresiones y condiciones)
# ------------------------------------------------------------------
precedence = (
    ('left', 'PIPE'),             # ||
    ('left', 'AMPERSAND'),        # &&
    ('right', 'EXCLAMACION'),     # !
    ('nonassoc', 'MENOR_QUE', 'MAYOR_QUE', 'MENOR_IGUAL', 'MAYOR_IGUAL', 'IGUAL_QUE', 'DISTINTO_QUE'),
    ('left', 'MAS', 'MENOS'),
    ('left', 'POR', 'DIVIDIR'),
)

# ------------------------------------------------------------------
# Programa
# ------------------------------------------------------------------
def p_programa(p):
    'programa : INICIO bloque FIN'
    p[0] = ('programa', p[2])

# ------------------------------------------------------------------
# Bloque: definiciones de función + sentencias
# ------------------------------------------------------------------
def p_bloque(p):
    'bloque : definiciones_funcion sentencias'
    p[0] = ('bloque', p[1], p[2])

# ------------------------------------------------------------------
# Definiciones de función (cero o más)
# ------------------------------------------------------------------
def p_definiciones_funcion_list(p):
    'definiciones_funcion : definicion_funcion definiciones_funcion'
    p[0] = [p[1]] + p[2]

def p_definiciones_funcion_empty(p):
    'definiciones_funcion : '
    p[0] = []

# ------------------------------------------------------------------
# Definición de función (procedimiento sin return en esta versión)
# FUNCION NOMBRE(PARAMS) <sentencias> FINFUNCION
# Nota: usamos VARIABLE como nombre de función (unificado)
# ------------------------------------------------------------------
def p_definicion_funcion(p):
    'definicion_funcion : FUNCION VARIABLE PARENTESIS_IZQ parametros_opt PARENTESIS_DER sentencias FINFUNCION'
    p[0] = ('funcion', p[2], p[4], p[6])  # (nombre, params, cuerpo)

# parámetros opcionales: lista o vacío
def p_parametros_opt(p):
    'parametros_opt : parametros'
    p[0] = p[1]

def p_parametros_opt_empty(p):
    'parametros_opt : '
    p[0] = []

def p_parametros(p):
    'parametros : parametro'
    p[0] = [p[1]]

def p_parametros_more(p):
    'parametros : parametro COMA parametros'
    p[0] = [p[1]] + p[3]

def p_parametro(p):
    'parametro : VARIABLE tipo'
    p[0] = ('param', p[1], p[2])

def p_tipo(p):
    '''tipo : NUM
            | CAR
            | ARR'''
    p[0] = p[1]

# ------------------------------------------------------------------
# Sentencias (cero o más)
# ------------------------------------------------------------------
def p_sentencias_list(p):
    'sentencias : sentencia sentencias'
    p[0] = [p[1]] + p[2]

def p_sentencias_empty(p):
    'sentencias : '
    p[0] = []

# ------------------------------------------------------------------
# Tipos de sentencia
# ------------------------------------------------------------------
def p_sentencia(p):
    '''sentencia : declaracion PUNTO_Y_COMA
                 | asignacion PUNTO_Y_COMA
                 | impresion PUNTO_Y_COMA
                 | condicional PUNTO_Y_COMA
                 | iteracion PUNTO_Y_COMA
                 | llamado_funcion PUNTO_Y_COMA'''
    p[0] = p[1]

# ------------------------------------------------------------------
# Declaración (con o sin inicialización)
# ------------------------------------------------------------------
def p_declaracion_simple(p):
    'declaracion : VARIABLE tipo'
    p[0] = ('decl', p[1], p[2], None)

def p_declaracion_init(p):
    'declaracion : VARIABLE tipo IGUAL valor'
    p[0] = ('decl', p[1], p[2], p[4])

# ------------------------------------------------------------------
# Asignación
# ------------------------------------------------------------------
def p_asignacion(p):
    'asignacion : VARIABLE IGUAL valor'
    p[0] = ('asig', p[1], p[3])

# ------------------------------------------------------------------
# Impresión
# ------------------------------------------------------------------
def p_impresion(p):
    'impresion : IMPRIMIR valor_o_variable'
    p[0] = ('print', p[2])

def p_valor_o_variable(p):
    '''valor_o_variable : valor
                        | VARIABLE'''
    p[0] = p[1]

# ------------------------------------------------------------------
# Condicional
# ------------------------------------------------------------------
def p_condicional(p):
    'condicional : SI condicion ENTONCES sentencias SINO sentencias FINSI'
    p[0] = ('if', p[2], p[4], p[6])

# ------------------------------------------------------------------
# Iteración
# ------------------------------------------------------------------
def p_iteracion(p):
    'iteracion : MIENTRAS condicion HACER sentencias FINMIENTRAS'
    p[0] = ('while', p[2], p[4])

# ------------------------------------------------------------------
# Condición booleana (con &&, ||, !, paréntesis y comparaciones)
# ------------------------------------------------------------------
def p_condicion_binaria(p):
    '''condicion : condicion AMPERSAND condicion
                 | condicion PIPE condicion'''
    op = '&&' if p[2] == '&&' else '||'
    p[0] = ('bool_bin', op, p[1], p[3])

def p_condicion_not(p):
    'condicion : EXCLAMACION condicion'
    p[0] = ('not', p[2])

def p_condicion_parentizada(p):
    'condicion : PARENTESIS_IZQ condicion PARENTESIS_DER'
    p[0] = p[2]

def p_condicion_cmp(p):
    '''condicion : valor MENOR_QUE valor
                 | valor MAYOR_QUE valor
                 | valor IGUAL_QUE valor
                 | valor MENOR_IGUAL valor
                 | valor MAYOR_IGUAL valor
                 | valor DISTINTO_QUE valor'''
    p[0] = ('cmp', p[2], p[1], p[3])

# ------------------------------------------------------------------
# Valores y expresiones aritméticas
# ------------------------------------------------------------------
def p_valor_num(p):
    'valor : NUMERO'
    p[0] = ('num', p[1])

def p_valor_char(p):
    'valor : CARACTER'
    p[0] = ('char', p[1])

def p_valor_var(p):
    'valor : VARIABLE'
    p[0] = ('var', p[1])

def p_valor_array(p):
    'valor : array'
    p[0] = p[1]

def p_valor_op(p):
    'valor : valor operador valor'
    p[0] = ('op', p[2], p[1], p[3])

def p_operador(p):
    '''operador : MAS
                | MENOS
                | POR
                | DIVIDIR'''
    p[0] = p[1]

# ------------------------------------------------------------------
# Arrays literales
# ------------------------------------------------------------------
def p_array(p):
    'array : CORCHETE_IZQ array_content_opt CORCHETE_DER'
    p[0] = ('arr', p[2])

def p_array_content_opt(p):
    'array_content_opt : array_content'
    p[0] = p[1]

def p_array_content_opt_empty(p):
    'array_content_opt : '
    p[0] = []

def p_array_content_one(p):
    'array_content : item'
    p[0] = [p[1]]

def p_array_content_more(p):
    'array_content : item COMA array_content'
    p[0] = [p[1]] + p[3]

def p_item_num(p):
    'item : NUMERO'
    p[0] = ('num', p[1])

def p_item_char(p):
    'item : CARACTER'
    p[0] = ('char', p[1])

# ------------------------------------------------------------------
# Llamado a función
# ------------------------------------------------------------------
def p_llamado_funcion(p):
    'llamado_funcion : VARIABLE PARENTESIS_IZQ argumentos_opt PARENTESIS_DER'
    p[0] = ('call', p[1], p[3])

def p_argumentos_opt(p):
    'argumentos_opt : argumentos'
    p[0] = p[1]

def p_argumentos_opt_empty(p):
    'argumentos_opt : '
    p[0] = []

def p_argumentos_one(p):
    'argumentos : valor'
    p[0] = [p[1]]

def p_argumentos_more(p):
    'argumentos : valor COMA argumentos'
    p[0] = [p[1]] + p[3]

# ------------------------------------------------------------------
# Errores
# ------------------------------------------------------------------
def p_error(p):
    if p:
        print(f"Error de sintaxis en '{p.value}' (línea {getattr(p, 'lineno', '?')})")
    else:
        print("Error de sintaxis: fin de entrada inesperado")

# Construcción del parser
parser = yacc.yacc(start='programa')

if __name__ == '__main__':
    data = '''
    INICIO
      X = 1;
      IMPRIMIR X;
    FIN
    '''
    result = parser.parse(data)
    print("PROGRAMA 1 - Parsing exitoso:", result is not None)
    print(result)

    data2 = '''
    INICIO
      X NUM NUM;
      X = 1;
      IMPRIMIR X;
    FIN
    '''
    result2 = parser.parse(data2)
    print("PROGRAMA 2 - Parsing exitoso:", result2 is not None)
    print(result2)

    data3 = '''
    INICIO
        FUNCION SUMAR(X NUM, Y NUM)
            RES NUM;
            RES = X + Y;
            IMPRIMIR RES;
        FINFUNCION
        A NUM;
        B NUM;
        A = 5;
        B = 7;
        SUMAR(A, B);
    FIN
    '''
    result3 = parser.parse(data3)
    print("PROGRAMA 3 - Parsing exitoso:", result3 is not None)
    print(result3)