# Beta
---

[URL](https://github.com/ClaudioMolinaUNAHUR/ParseoTps/)

## Objetivo

* El lenguaje Beta está diseñado con un fin didáctico: aprender las nociones fundamentales de los lenguajes de programación estructurados y fuertemente tipados, sin necesidad de enfrentarse a toda la complejidad de un lenguaje real como C, Java o Python
* Se eligió un dominio “matemático y de manejo de listas” porque es un terreno común en las primeras etapas de la enseñanza de algoritmos: trabajar con listas de datos (números, cadenas, valores lógicos) y aplicar sobre ellas operaciones de filtrado, recorridos con bucles, condiciones y funciones recursivas.
* De este modo, Beta está pensado como un lenguaje de laboratorio para:
    - Aprender estructuras de control (if, loop)
    - Modelar datos simples (num, str, bool)
    - Manipular colecciones (list<tipo>)
    - Abstraer soluciones en funciones propias o personalizadas
    - Familiarizarse con los conceptos de ámbitos, retorno de funciones y recursión

## Alcance

* Solo maneja listas, numeros reales, booleanos y cadenas de textos
* Puede hacer operaciones logicas, arimeticas y de comparacion
* Los condicionales manejan : if, else if, else
* Las funciones propias y funciones personalizadas
* Puede ser recursivo

## Especificaciones léxicas

- **Identificadores**
  - Solo letras `(a-z | A-Z)+`
  - Case sensitive (`Name` ≠ `name`)
- **Palabras reservadas**: str, num, bool, func, return, if, else, loop, in, range, console,
  true, false, #start, #end
- **Números**
    - Reales con o sin signo: `10.0`, `-5`, `3.558`
    - No se permiten decimales
- **Listas**
    - listas con tipos especificos: `[true, true, false]`, `["", "hola"]`, `[0]`
- **Cadenas (string)**
    - `"..."` o `'...'`
    - Admiten letras y espacios
    - Ejemplo: `"Hola mundo"`
- **Operadores**
    - Aritméticos: `+ - * /`
    - Lógicos: `& | !`
    - Comparación: `< > <= >= == !=`
    - Asignación: `:`
- **Delimitadores**
    - Paréntesis `()`, llaves `{}`, comas `,`

## Especificaciones sintácticas

```bnf
<prog> ::= #start <content> #end

<content> ::= <statement_list>
<statement_list> ::= <statement> <statement_list> | <empty>
<statement> ::= <content_no_return> | <exp>

<content_no_return> ::= <function> | <loop> | <conditional> | <var> | <assign> | <list_assign> | <comment> | <add_list_item> | <console>

<console> ::= console(<args>)
<error> ::= error(<string>)

<function> ::= func <id> ( <opt_param_list> ) { <content> }
<function_return> ::= func <id> ( <opt_param_list> ) : <type> { <content> return <exp> }

<opt_param_list> ::= <param_list> | <empty>
<param_list> ::= <param> | <param_list> , <param>
<param> ::= <type> <id> <opt_default>
<opt_default> ::= : <exp> | <empty>

<call_func> ::= <id>(<args>) | <id>()

<conditional> ::= if ( <exp> ) { <content> }
                | if ( <exp> ) { <content> } else { <content> }
                | if ( <exp> ) { <content> } else <conditional>

<loop> ::= loop ( <id> in <range> ) { <content> }


<exp> ::= <exp> <operator> <exp>
        | <op_bool_un> <exp>
        | <primary_exp>

<primary_exp> ::= <function_return>
                | <error>
                | <call_func>
                | <primitive>
                | <id>
                | <len_list_item>
                | <remove_list_item>
                | <read_list_item>
                | <has_list_item>
                | <list>
                | ( <exp> )
<empty>::= λ
<var> ::= <type> <id>: <exp>
<assign> ::= <id>: <exp>
<args> ::= <exp> | <exp> , <args>
<id> ::= <letter> <id> | <letter>

<comment> ::= //<str_content>-/
<string> ::= "<str_content>" | '<str_content>' | "" | ''
<str_content> ::= <number> <str_content> | <number> | <letter> <str_content> | <letter> | ` ` <str_content> | ` `

<list> ::= [ <list_content> ] | []
<list_content> ::= <exp> | <exp> , <list_content>
<add_list_item> ::= add( <id> | <list> , <exp> )
<len_list_item> ::= size( <id> | <list> )
<remove_list_item> ::= remove( <id> | <list> )
<has_list_item> ::= has( <id> | <list> , <primitive> )
<read_list_item> ::=  <id>[ <exp> ] | <list>[ <exp> ]
<list_assign> ::= <id>[ <exp> ] : <exp> | <list>[ <exp> ] : <exp>

<type> ::= str | num | bool | list< <type> >
<primitive> ::= <number> | <boolean> | <string>
<operator> ::= <op_arit> | <op_bool_bin> | <op_comp>
<number> ::= <number_content> | -<number_content>
<number_content> ::= <int> <number_content> | <int> | .<decimal>
<decimal> ::= <int> <decimal> | <int>
<op_arit> ::= + | - | * | /
<op_bool_bin>::= & | `|`
<op_bool_un>::= !
<op_comp>::= < | > | <= | >= | == | !=
<boolean>::= true | false
<letter>::= a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z
<int>::= 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9
```

## Especificaciones semánticas

* Operaciones posibles entre expresiónes:

| Operación     | Ejemplo            | Resultado                                                           | Tipo   |
| ------------- | ------------------ | ------------------------------------------------------------------- | ------ |
| `bool == num` | `true == 1`        | `true` (porque `true` ≡ 1, `false` ≡ 0)                             | `bool` |
| `str + num`   | `"hola" + 1`       | `"hola1"`                                                           | `str`  |
| `str + bool`  | `"hola" + true`    | `"holatrue"` o `"hola1"` (según si querés stringify o numeric cast) | `str`  |
| `num + str`   | `1 + "hola"`       | `"1hola"`                                                           | `str`  |
| `bool + str`  | `true + "hola"`    | `"truehola"` o `"1hola"`                                            | `str`  |
| `str * num`   | `"hi" * 3`         | `"hihihi"`                                                          | `str`  |
| `str * 0`     | `"hi" * 0`         | `""`                                                                | `str`  |
| `num * bool`  | `5 * true`         | `5`                                                                 | `num`  |
| `num * false` | `5 * false`        | `0`                                                                 | `num`  |
| `str / num`   | `"abc" / 2`        | ❌ Error (posible división dispareja)                               | -      |
| `num / bool`  | `5 / true`         | `5`                                                                 | `num`  |
| `num / false` | `5 / false`        | ❌ Error (división por cero)                                        | -      |
| `str == str`  | `"hola" == "hola"` | `true`                                                              | `bool` |
| `str == num`  | `"1" == 1`         | `false`                                                             | `bool` |

1. **Variables**
- Deben declararse con tipo explícito.
- Siempre deben inicializarse.
- No existe inferencia de tipos.

2. **Asignación**
- La expresión debe devolver un valor compatible con el tipo de la variable.
- Ejemplo válido:
  ```
  num x: 1 + 2
  ```
- Ejemplo inválido:
  ```
  name: funcionSinReturn()
  ```

3. **Tipos**
- Tipado estático y fuerte:
  - `num` → enteros o decimales
  - `str` → cadenas
  - `bool` → `true` o `false`

4. **Control de flujo**
- `if` evalúa expresiones y ejecuta bloques.
- `loop` itera sobre un rango ascendente o descendente.

5. **Funciones**
- Parámetros con valores por defecto opcionales.
- Pasaje de parámetros por valor.
- Si la función declara tipo de retorno, debe terminar con `return <expr>`.

## Ejemplos

```
#start

list<str> productos: []
list<num> precios: []
list<bool> comprado: []

// funcion de agregar un producto al carrito con precio determinado -/
func agregar(str nombre, num precio) {
  add(productos, nombre)
  add(precios, precio)
  add(comprado, false)
}

// Se agregan 2 productos al carrito -/
agregar("Pan", 120)
agregar("Leche", 250)

// funcion para realizar la compra de 1 producto -/
func comprar(num indice) {
  comprado[indice]: true
}

comprar(0)   // Marca Pan como comprado -/

func total(): num {
  num suma: 0
  loop(i in range(0, size(precios))) {
    suma: suma + precios[i]
  }
  return suma
}

console(total()) // Mostrar precio Total -/

// comprar todos los productos -/
loop(i in range(0, size(precios))) {
  comprar(i)
}

#end
```

## Regexs

In [None]:
# tokens que reconoce el lexer, luego el parser los usara como terminales (tokens)
# algunos tokens son palabras reservadas (reserved), que tienen un significado especial en el
# "COMO_SE_ESCRIBE_EN_CODIGO" : "NOMBRE_DEL_TOKEN"
reserved = {
    "str": "STR",
    "num": "NUM",
    "bool": "BOOL",
    "list": "LIST",
    "func": "FUNC",
    "return": "RETURN",
    "if": "IF",
    "else": "ELSE",
    "loop": "LOOP",
    "in": "IN",
    "range": "RANGE",
    "console": "CONSOLE",
    "true": "TRUE",
    "false": "FALSE",
    "#start": "START",
    "#end": "END",
     # TODO: implementar 
    "size": "SIZE",
    "add": "ADD",
    "remove": "REMOVE", 
    "has": "HAS",
}

#son todos los tokens, incluidos los reserved
#10, "hola", seran 1 token cada uno
#10 , "hola", seran token NUMBER, STRING
tokens = [
    "ID",
    "NUMBER",
    "STRING",
    # operadores
    "PLUS",
    "MINUS",
    "MULTIPLY",
    "DIVIDE",
    "NOT",
    "AND",
    "OR",    
    "LT",
    "GT",
    "LE",
    "GE",
    "EQ",
    "NE",
    # delimitadores
    "LPAREN",
    "RPAREN",
    "LBRACE",
    "RBRACE",
    "COMMA",
    "LBRACKET",
    "RBRACKET",
    "COLON",
    #otros
    "COMMENT",
] + list(reserved.values())

In [None]:
# Operadores
t_PLUS    = r"\+"
t_MINUS   = r"-"
t_MULTIPLY= r"\*"
t_DIVIDE  = r"/"

t_AND     = r"&"
t_OR      = r"\|"
t_NOT     = r"!"
t_LT      = r"<"
t_GT      = r">"
t_LE      = r"<="
t_GE      = r">="
t_EQ      = r"=="
t_NE      = r"!="

# Delimitadores
t_LPAREN   = r"\("
t_RPAREN   = r"\)"
t_LBRACE   = r"\{"
t_RBRACE   = r"\}"
t_LBRACKET = r"\["
t_RBRACKET = r"\]"
t_COMMA    = r","
t_COLON    = r':'


# Ignorar espacios y tabs
t_ignore = ' \t'

In [None]:
# estas expresiones regulares son para tokens compuestos por varios caracteres
# luego el parser, los usara como terminales (tokens)
#Ejemplo: ID es un token, que puede estar compuesto por varios caracteres (letras)
def t_HASH_RESERVED(t):
    r"\#start|\#end"
    t.type = reserved.get(t.value, "ID")  # devuelve START o END reserved
    return t


def t_ID(t):
    r"[a-zA-Z]+"
    t.type = reserved.get(t.value, "ID")
    return t


def t_STRING(t):
    r"\".*?\"|'.*?'"
    t.value = t.value[1:-1]  # quita comillas
    return t


def t_NUMBER(t):
    r"-?[0-9]+(\.[0-9]+)?"  # reconoce 123 o 123.45
    if "." in t.value:
        t.value = float(t.value)  # si tiene punto -> float
    else:
        t.value = int(t.value)  # si no -> int
    return t



t_ignore = " \t"


def t_newline(t):
    r"\n+"
    t.lexer.lineno += len(t.value)


def t_COMMENT(t):
    r"//(.|\n)*?-/"
    #t.value = t.value
    #return t
    pass


def t_error(t):
    print("Illegal character '%s'" % t.value[0])
    t.lexer.skip(1)

In [None]:
import ply.lex as lex

lexer = lex.lex()

## Parser

In [None]:
import ply.yacc as yacc
from ast_nodes import (
    RootNode,
    VarNode,
    AssignNode,
    BinaryOpNode,
    UnaryOpNode,
    PrimitiveNode,
    IdNode,
    ListNode,
    ConsoleNode,
    FunctionNode,
    FunctionReturnNode,
    ParamNode,
    CallFuncNode,
    ConditionalNode,
    LoopNode,
    RangeNode,
    ReadListItemNode,
    ListAssignNode,
    AddListItemNode,
    RemoveListItemNode,
    LenListItemNode,
    HasListItemNode,
)

precedence = (
    ("right", "ELSE"),
    ("left", "OR"),
    ("left", "AND"),
    ("right", "NOT"),
    ("nonassoc", "EQ", "NE", "LT", "LE", "GT", "GE"),
    ("left", "PLUS", "MINUS"),
    ("left", "MULTIPLY", "DIVIDE"),
)


# <prog> ::= #start <content> #end
def p_program(p):
    """program : START content END"""
    p[0] = RootNode(p[2])


# <content> ::= <statement_list>
def p_content(p):
    """content : statement_list"""
    p[0] = p[1]


# <statement_list> ::= <statement> <statement_list>
#                   | <empty>
def p_statement_list(p):
    """statement_list : statement_list statement
    | empty"""
    if len(p) == 2:
        p[0] = []
    else:
        p[0] = p[1] + [p[2]]


# <statement> ::= <content_no_return> | <exp>
def p_statement(p):
    """statement : content_no_return
    | exp"""
    p[0] = p[1]


# <content_no_return> ::= <function>
#                       | <loop>
#                       | <conditional>
#                       | <var>
#                       | <assign>
#                       | <list_assign>
#                       | <comment>
#                       | <add_list_item>
#                       | <console>
def p_content_no_return(p):
    """content_no_return : function
    | function_return
    | loop
    | conditional
    | var
    | assign
    | list_assign
    | add_list_item
    | console"""
    p[0] = p[1]


# <console> ::= console(<args>)
def p_console(p):
    """console : CONSOLE LPAREN args RPAREN"""
    p[0] = ConsoleNode(p[3])


# <error> ::= error(<string>)
def p_error(p):
    if p:
        message = f"Error de sintaxis en el token '{p.value}' (tipo: {p.type}) en la línea {p.lineno}"
        print(message)
    else:
        message = "Error de sintaxis al final del archivo (EOF)"
        print(message)
    raise SyntaxError(message)


# <function> ::= func <id> ( <opt_param_list> ) { <content> }
def p_function(p):
    """function : FUNC ID LPAREN opt_param_list RPAREN LBRACE content RBRACE"""
    p[0] = FunctionNode(name=p[2], params=p[4], body=p[7])


# <function_return> ::= func <id> ( <opt_param_list> ) : <type> { <content> return <exp> }
def p_function_return(p):
    """function_return : FUNC ID LPAREN opt_param_list RPAREN COLON type LBRACE content RETURN exp RBRACE"""
    p[0] = FunctionReturnNode(
        name=p[2], params=p[4], return_type=p[7], body=p[9], return_expr=p[11]
    )


# <opt_param_list> ::= <param_list>
#                   | <empty>
def p_opt_param_list(p):
    """opt_param_list : param_list
    | empty"""
    p[0] = p[1] or []


# <param_list> ::= <param>
#               | <param_list> , <param>
def p_param_list(p):
    """param_list : param_list COMMA param
    | param"""
    if len(p) == 2:
        p[0] = [p[1]]
    else:
        p[0] = p[1] + [p[3]]


# <param> ::= <type> <id> <opt_default>
def p_param(p):
    """param : type ID opt_default"""
    p[0] = ParamNode(param_type=p[1], name=p[2], default_value=p[3])


# <opt_default> ::= : <exp>
#                   | <empty>
def p_opt_default(p):
    """opt_default : COLON exp
    | empty"""
    p[0] = p[2] if len(p) == 3 else None


# <call_func> ::= <id>(<args>) | <id>()
def p_call_func(p):
    """call_func : ID LPAREN args RPAREN
    | ID LPAREN RPAREN"""
    if len(p) == 5:
        p[0] = CallFuncNode(name=p[1], args=p[3])
    else:
        p[0] = CallFuncNode(name=p[1], args=[])


# <conditional> ::= if ( <exp> ) { <content> }
#                | if ( <exp> ) { <content> } else { <content> }
#                | if ( <exp> ) { <content> } else <conditional>
def p_conditional(p):
    """conditional : IF LPAREN exp RPAREN LBRACE content RBRACE
    | IF LPAREN exp RPAREN LBRACE content RBRACE ELSE LBRACE content RBRACE
    | IF LPAREN exp RPAREN LBRACE content RBRACE ELSE conditional"""
    if len(p) == 8:
        p[0] = ConditionalNode(condition=p[3], if_block=RootNode(p[6]))
    else:
        # Handle both `else { ... }` and `else if ...`
        else_block = RootNode(p[10]) if len(p) == 12 else p[8]
        p[0] = ConditionalNode(
            condition=p[3], if_block=RootNode(p[6]), else_block=else_block
        )


# <loop> ::= loop ( <id> in <range> ) { <content> }
def p_loop(p):
    """loop : LOOP LPAREN ID IN range RPAREN LBRACE content RBRACE"""
    p[0] = LoopNode(var_name=p[3], range_node=p[5], body=RootNode(p[8]))


# <range> ::= range(<exp>) | range(<exp>, <exp>) | range(<exp>, <exp>, <exp>)
def p_range(p):
    """range : RANGE LPAREN exp COMMA exp RPAREN
    | RANGE LPAREN exp RPAREN
    | RANGE LPAREN exp COMMA exp COMMA exp RPAREN"""
    if len(p) == 5:
        p[0] = RangeNode(p[3])
    elif len(p) == 7:
        p[0] = RangeNode(p[3], p[5])
    else:
        p[0] = RangeNode(p[3], p[5], p[7])


# <exp> ::= <exp> <operator> <exp>
#        | <op_bool_un> <exp>
#        | <primary_exp>
def p_exp(p):
    """exp : exp operator exp
    | op_bool_un exp
    | primary_exp"""
    if len(p) == 2:
        p[0] = p[1]
    elif len(p) == 3:
        p[0] = UnaryOpNode(op=p[1], expr=p[2])
    else:
        p[0] = BinaryOpNode(left=p[1], op=p[2], right=p[3])


# <primary_exp> ::= <function_return>
#                 | <error>
#                 | <call_func>
#                 | <primitive>
#                 | <id>
#                 | <len_list_item>
#                 | <remove_list_item>
#                 | <read_list_item>
#                 | <has_list_item>
#                 | <list>
#                 | ( <exp> )
def p_primary_exp(p):
    """primary_exp : call_func
    | primitive
    | id
    | len_list_item
    | remove_list_item
    | read_list_item
    | has_list_item
    | list
    | LPAREN exp RPAREN"""
    if len(p) == 2:
        p[0] = p[1]
    else:  # Parentheses
        p[0] = p[2]


# <var> ::= <type> <id>: <exp>
def p_var(p):
    """var : type ID COLON exp"""
    p[0] = VarNode(var_type=p[1], name=p[2], value_expr=p[4])


# <assign> ::= <id>: <exp>
def p_assign(p):
    """assign : ID COLON exp"""
    p[0] = AssignNode(name=p[1], value_expr=p[3])


# <args> ::= <exp>
#           | <exp> , <args>
def p_args(p):
    """args : args COMMA exp
    | exp"""
    if len(p) == 2:
        p[0] = [p[1]]
    else:
        p[0] = p[1] + [p[3]]


# <id> ::= <letter> <id> | <letter>
def p_id(p):
    """id : ID"""
    p[0] = IdNode(p[1])


# <operator> ::= <op_arit>
#              | <op_bool_bin>
#              | <op_comp>
def p_operator(p):
    """operator : PLUS
    | MINUS
    | MULTIPLY
    | DIVIDE
    | AND
    | OR
    | LT
    | GT
    | LE
    | GE
    | EQ
    | NE"""
    p[0] = p[1]


# <op_bool_un>::= !
def p_op_bool_un(p):
    """op_bool_un : NOT"""
    p[0] = p[1]


# <type> ::= str
#           | num
#           | bool
#           | list< <type> >
def p_type(p):
    """type : STR
    | NUM
    | BOOL
    | LIST LT type GT"""
    if len(p) == 2:
        p[0] = p[1]
    else:
        p[0] = ("list_type", p[3])  # This can remain a tuple or become a simple class


# <list> ::= [ <list_content> ]
#           | []
def p_list(p):
    """list : LBRACKET list_content RBRACKET
    | LBRACKET RBRACKET"""
    if len(p) == 4:
        p[0] = ListNode(p[2])
    else:
        p[0] = ListNode([])


# <list_content> ::= <exp>
#                   | <exp> , <list_content>
def p_list_content(p):
    """list_content : list_content COMMA exp
    | exp"""
    if len(p) == 2:
        p[0] = [p[1]]
    else:
        p[0] = p[1] + [p[3]]


# <add_list_item> ::= add( <id> | <list> , <exp> )
def p_add_list_item(p):
    """add_list_item : ADD LPAREN exp COMMA exp RPAREN"""
    p[0] = AddListItemNode(list_expr=p[3], value_expr=p[5])


# <len_list_item> ::= size( <id> | <list> )
def p_len_list_item(p):
    """len_list_item : SIZE LPAREN exp RPAREN"""
    p[0] = LenListItemNode(p[3])


# <read_list_item> ::=  <id>[ <exp> ] | <list>[ <exp> ]
def p_read_list_item(p):
    """read_list_item : id LBRACKET exp RBRACKET"""
    p[0] = ReadListItemNode(list_node=p[1], index_expr=p[3])


# <remove_list_item> ::= remove( <id> | <list> )
def p_remove_list_item(p):
    """remove_list_item : REMOVE LPAREN exp RPAREN"""
    p[0] = RemoveListItemNode(p[3])


# <has_list_item> ::= has( <id> | <list> , <primitive> )
def p_has_list_item(p):
    """has_list_item : HAS LPAREN exp COMMA primitive RPAREN"""
    p[0] = HasListItemNode(list_expr=p[3], value_expr=p[5])


# <list_assign> ::= <id>[ <exp> ] : <exp> | <list>[ <exp> ] : <exp>
def p_list_assign(p):
    """list_assign : id LBRACKET exp RBRACKET COLON exp"""
    p[0] = ListAssignNode(list_node=p[1], index_expr=p[3], value_expr=p[6])


# <primitive> ::= <number>
#               | <boolean>
#               | <string>
def p_primitive(p):
    """primitive : NUMBER
    | STRING
    | TRUE
    | FALSE"""
    token_type = p.slice[1].type
    if token_type in ("TRUE", "FALSE"):
        p[0] = PrimitiveNode(p[1] == "true")
    else:
        p[0] = PrimitiveNode(p[1])


# <empty>::= λ
def p_empty(p):
    """empty :"""
    pass


# Build the parser
parser = yacc.yacc(debug=True)