# Lenguaje Caminante
---

[URL](https://github.com/SebaBranda/Parseo)

## Descripción

Los "Backrooms" son una creepypasta o leyenda urbana que describe un laberinto infinito de cuartos y pasillos de apariencia industrial, normalmente con paredes amarillentas, iluminación artificial y pisos de vinilo. Son descritos como un lugar al que se puede acceder erróneamente desde el mundo real, y que se caracteriza por su naturaleza inquietante y a menudo peligrosa. Este lenguaje está inspirado en esta "leyenda urbana" de las Backrooms, diseñado para simular exploración en un espacio infinito y surrealista mediante instrucciones minimalistas.

## Especificaciones sintácticas

```
<programa>      ::= <instrucciones>
<instrucciones> ::= <instruccion> | <instruccion> <instrucciones>
<instruccion>   ::= <movimiento> | <accion> | <control> | <operacion> | <numero> 
<movimiento>    ::= w | a | s | d
<accion>        ::= e | q
<control>       ::= '[' <instrucciones> ']' | '{' <instrucciones> '}'
<operacion>     ::= + | - | * | /
<numero>        ::= <digito> | <digito> <numero>
<digito>        ::= 0 | ... | 9
```

## Especificaciones semánticas

Interpretación
* [w a s d]: Bucle infinito de movimientos (caminar en círculo).

* {e q *}: Ejecuta e, luego q, y aplica una multiplicación al entorno.

3w (extensión propuesta): Avanza 3 veces.

## Ejemplo

```
w w [a d] e {q * 2}
```

* Avanza 2 veces (w w).
* Entra en un bucle [a d] (izquierda-derecha).
* Ejecuta e (interactúa).
* Bloque {q * 2}: Usa q y multiplica algo por 2.

## Scanner

In [None]:
"""Scanner (lex) para el lenguaje Caminante.

Alineado con los tokens/gramática de los documentos del repo (GICyDerivaciones.md, README.md).
Genera tokens en mayúscula que espera el parser (p. ej. MOVER, INICIO, FIN, IDENT, NUM, CADENA...).

Dependencia: ply (pip install ply)
"""

import ply.lex as lex

# Tokens básicos
tokens = [
    'IDENT',
    'NUM',
    'CADENA',
    'COLON',
]

# Palabras reservadas (lexema -> NOMBRE_DE_TOKEN)
reserved = {
    # Estructura / control
    'inicio': 'INICIO',
    'fin': 'FIN',
    'si': 'SI',
    'entonces': 'ENTONCES',
    'sino': 'SINO',
    'repite': 'REPETIR',
    'veces': 'VECES',
    'mientras': 'MIENTRAS',
    'hacer': 'HACER',
    'finmientras': 'FINMIENTRAS',

    # Acciones / palabras clave del lenguaje
    'mover': 'MOVER',
    'manifestar': 'MANIFESTAR',
    'interactuar_con': 'INTERACTUAR_CON',
    'transicionar_a': 'TRANSICIONAR_A',

    # Direcciones (se tratan como literales/tokens específicos)
    'norte': 'NORTE',
    'sur': 'SUR',
    'este': 'ESTE',
    'oeste': 'OESTE',

    # Operadores y comparadores
    'es_mayor_que': 'ES_MAYOR_QUE',
    'es_menor_que': 'ES_MENOR_QUE',
    'igual': 'IGUAL',
    'distinto': 'DISTINTO',
    'es': 'ES',

    # Otros (desde README / Scanner.md)
    'establece': 'ESTABLECE',
    'a': 'A',
    'y': 'Y',
    'mas': 'MAS',
    'menos': 'MENOS',
    'multiplicado_por': 'MULTIPLICADO_POR',
    'dividido_por': 'DIVIDIDO_POR',
    'esta_presente_en': 'ESTA_PRESENTE_EN',
}

# Añadir las palabras reservadas a la lista de tokens que reconoce PLY
tokens = tokens + list(set(reserved.values()))

# Reglas simples (expresiones regulares)
t_COLON = r':'

# Cadena entre comillas dobles (con escapes)
t_CADENA = r'"([^"\\]|\\.)*"'

# Ignorar espacios y tabs (newlines manejados aparte)
t_ignore = ' \t\r'


def t_NUM(t):
    r"\d+(\.\d+)?"
    # convertir a int cuando sea entero, float cuando tenga punto
    t.value = float(t.value) if '.' in t.value else int(t.value)
    return t


def t_IDENT(t):
    r'[a-zA-Z_][a-zA-Z0-9_]*'
    # Usar case-insensitive matching: las palabras reservadas en los docs están en minúsculas
    key = t.value.lower()
    if key in reserved:
        t.type = reserved[key]
    else:
        t.type = 'IDENT'
    return t


def t_newline(t):
    r'\n+'
    t.lexer.lineno += len(t.value)


# Comentarios de una línea con // o # (se ignoran)
def t_comment(t):
    r'(//.*)|(\#.*)'
    pass


# Manejo de errores
def t_error(t):
    print(f"Carácter ilegal '{t.value[0]}' en la línea {t.lineno}")
    t.lexer.skip(1)


# Analizador léxico
lexer = lex.lex()


if __name__ == '__main__':
    # Ejemplo tomado/ajustado de README/Scanner.md
    data = '''
inicio
mover norte
si obstaculo entonces mover este
fin
'''
    print('--- Entrada de prueba ---')
    print(data)
    lexer.input(data)
    print('\n--- Tokens generados ---')
    for tok in lexer:
        print(f'Token: {tok.type}, Valor: {tok.value}, Línea: {tok.lineno}')

## Parser

In [None]:
"""Parser para el lenguaje Caminante usando PLY (yacc).
Conecta con `caminante_lex.py` (lexer) y emplea la GIC encontrada en `GICyDerivaciones.md`.

Provee la función `parse(data)` que devuelve True si el parse tuvo éxito (sin errores sintácticos),
False en caso contrario.
"""

from __future__ import annotations
import sys
from typing import Any

# Importar el lexer y tokens
from caminante_lex import lexer as lex_lexer
from caminante_lex import tokens as lex_tokens

import ply.yacc as yacc

# PLY espera una variable global `tokens`
tokens = lex_tokens

# Parse result state
_parse_ok = True

# Gramática basada en GICyDerivaciones.md y README.md

def p_program(p):
    'program : INICIO bloque FIN'
    p[0] = ('program', p[2])

# Bloque: definimos una lista de instrucciones (left-recursive) para reducir ambigüedades
def p_bloque(p):
    'bloque : instrucciones'
    p[0] = p[1]


def p_instrucciones_recursive(p):
    'instrucciones : instrucciones instruccion'
    p[0] = p[1] + [p[2]]


def p_instrucciones_single(p):
    'instrucciones : instruccion'
    p[0] = [p[1]]


def p_instrucciones_empty(p):
    'instrucciones : '
    p[0] = []


def p_instruccion(p):
    '''instruccion : movimiento
                   | accion
                   | condicional
                   | bucle
                   | declaracion'''
    p[0] = p[1]


# movimiento: MOVER direccion
def p_movimiento(p):
    'movimiento : MOVER direccion'
    p[0] = ('mover', p[2])


def p_direccion(p):
    '''direccion : NORTE
                 | SUR
                 | ESTE
                 | OESTE'''
    p[0] = ('dir', p[1])


# accion: MANIFESTAR CADENA
def p_accion_manifestar(p):
    'accion : MANIFESTAR CADENA'
    # p[2] es la cadena lexeme con comillas; dejamos tal cual
    p[0] = ('manifestar', p[2])


# condicional: SI expresion ENTONCES bloque (SINO bloque)?
def p_condicional(p):
    'condicional : SI expresion ENTONCES bloque sino_opcional'
    # p: 1=SI 2=expresion 3=ENTONCES 4=bloque 5=sino_opcional
    p[0] = ('si', p[2], p[4], p[5])


def p_sino_opcional_sino(p):
    'sino_opcional : SINO bloque'
    p[0] = p[2]


def p_sino_opcional_empty(p):
    'sino_opcional : '
    p[0] = None


# bucle: MIENTRAS expresion HACER bloque FINMIENTRAS
# o: REPETIR NUM VECES COLON bloque  (soporte adicional)

def p_bucle_mientras(p):
    'bucle : MIENTRAS expresion HACER bloque FINMIENTRAS'
    p[0] = ('mientras', p[2], p[4])


def p_bucle_repite(p):
    'bucle : REPETIR NUM VECES COLON bloque'
    p[0] = ('repite', p[2], p[5])


# Declaracion/Asignacion simple: establece IDENT a valor
def p_declaracion(p):
    'declaracion : ESTABLECE IDENT A valor'
    p[0] = ('decl', p[2], p[4])


# expresion: IDENT operador valor
# operador: ES_MAYOR_QUE | ES_MENOR_QUE | IGUAL | DISTINTO | ES
# Para reducir conflictos, `valor` NO incluye IDENT; IDENT se trata en la produccion de expresion.
def p_expresion_compare(p):
    'expresion : IDENT operador valor'
    p[0] = ('expr', p[2], ('ident', p[1]), p[3])


def p_expresion_ident(p):
    'expresion : IDENT'
    p[0] = ('ident', p[1])


def p_expresion_valor(p):
    'expresion : valor'
    p[0] = p[1]


def p_operador(p):
    '''operador : ES_MAYOR_QUE
                 | ES_MENOR_QUE
                 | IGUAL
                 | DISTINTO
                 | ES'''
    p[0] = p[1]


def p_valor_num(p):
    'valor : NUM'
    p[0] = ('num', p[1])


def p_valor_cadena(p):
    'valor : CADENA'
    p[0] = ('cadena', p[1])


# Error handling
def p_error(p):
    global _parse_ok
    _parse_ok = False
    if p:
        print(f"Error de sintaxis en token {p.type} (valor={p.value!r}) línea {p.lineno}")
    else:
        print("Error de sintaxis: fin de archivo")


# Construir parser
parser = yacc.yacc()


def parse(data: str) -> bool:
    """Parsea la entrada `data`. Devuelve True si no hubo errores sintácticos."""
    global _parse_ok
    _parse_ok = True
    # resetear lexer linea
    lex_lexer.lineno = 1
    try:
        parser.parse(data, lexer=lex_lexer)
    except Exception as e:
        print('Excepción de parseo:', e)
        _parse_ok = False
    return _parse_ok


if __name__ == '__main__':
    sample = '''\ninicio\nmover norte\nsi obstaculo entonces\n    mover este\nfin\n'''
    print('Entrada de prueba:\n', sample)
    ok = parse(sample)
    print('\nParse correcto:', ok)

## Main

In [None]:
"""Ejecutor simple para scanner y parser dentro de la carpeta `Código`.

Uso:
  python main.py scan [archivo]
  python main.py parse [archivo]
  python main.py both [archivo]

Si no se proporciona `archivo`, se usa una muestra interna.
"""

import argparse
import os
import sys


SAMPLE = '''
inicio
mover norte
si obstaculo entonces
    mover este
fin
'''


def run_scanner(text):
    from caminante_lex import lexer
    lexer.lineno = 1
    lexer.input(text)
    for tok in lexer:
        print(f"Token: {tok.type}, Valor: {tok.value}, Línea: {tok.lineno}")


def run_parser(text):
    from caminante_yacc import parse
    # parse devuelve True/False según si hubo errores sintácticos
    ok = parse(text)
    print('\nParse correcto:' if ok else '\nParse con errores:')
    return ok


def main():
    ap = argparse.ArgumentParser(description='Ejecutar scanner y parser (Código)')
    sub = ap.add_subparsers(dest='cmd')

    p_scan = sub.add_parser('scan', help='Ejecutar sólo el scanner')
    p_scan.add_argument('file', nargs='?', help='Archivo a escanear')

    p_parse = sub.add_parser('parse', help='Ejecutar sólo el parser')
    p_parse.add_argument('file', nargs='?', help='Archivo a parsear')

    p_both = sub.add_parser('both', help='Ejecutar scanner y parser en secuencia')
    p_both.add_argument('file', nargs='?', help='Archivo de entrada')

    args = ap.parse_args()
    args = ap.parse_args()

    def get_text(path):
        if path:
            if not os.path.exists(path):
                print(f"No se encontró el archivo: {path}")
                return None
            with open(path, 'r', encoding='utf-8') as f:
                return f.read()
        return SAMPLE

    if args.cmd is not None:
        path = getattr(args, 'file', None)
        text = get_text(path)
        if text is None:
            sys.exit(1)
        if args.cmd == 'scan':
            run_scanner(text)
        elif args.cmd == 'parse':
            run_parser(text)
        elif args.cmd == 'both':
            print('--- Scanner ---')
            run_scanner(text)
            print('\n--- Parser ---')
            run_parser(text)
        return

    # Interfaz interactiva si no se pasaron argumentos: esperar selección del usuario
    def ask(prompt):
        try:
            return input(prompt)
        except EOFError:
            try:
                # Intentar leer directamente desde la consola en Windows
                with open('CON', 'r', encoding='utf-8', errors='ignore') as con:
                    print(prompt, end='', flush=True)
                    return con.readline()
            except Exception:
                print('\nEntrada no interactiva disponible. Usa los subcomandos: scan/parse/both <archivo>')
                return ''

    while True:
        print('\nSelecciona una opción:')
        print('  1) Scanner')
        print('  2) Parser')
        print('  3) Ambos (Scanner + Parser)')
        print('  4) Salir')
        choice = ask('Opción (1-4): ').strip()
        if choice == '4' or choice.lower() in ('q', 'quit', 'salir'):
            print('Saliendo.')
            break

        if choice not in ('1', '2', '3'):
            print('Opción no válida. Intenta de nuevo.')
            continue
        path = ask('Archivo (dejar vacío para usar la muestra interna): ').strip()
        text = get_text(path if path != '' else None)
        if text is None:
            continue

        if choice == '1':
            run_scanner(text)
        elif choice == '2':
            run_parser(text)
        elif choice == '3':
            print('--- Scanner ---')
            run_scanner(text)
            print('\n--- Parser ---')
            run_parser(text)


if __name__ == '__main__':
    main()