# Generación de Arboles Sintácticos para Lenguajes de Alto Nivel
Notas de clase sobre Teoría de la Compilación

**Juan David Velásquez Henao**   
jdvelasq@unal.edu.co  
Universidad Nacional de Colombia, Sede Medellín  
Facultad de Minas  
Medellín, Colombia  

[Licencia](https://github.com/jdvelasq/teoria-de-la-compilacion/blob/master/LICENCIA.txt)  
[Readme](https://github.com/jdvelasq/teoria-de-la-compilacion/blob/master/readme.md)

**Software utilizado**.

> Este es un documento interactivo escrito como un notebook de [Jupyter](http://jupyter.org), en el cual se presenta una introducción al diseño de lectores, generadores, traductores, interpretes y compiladores. Los notebooks de Jupyter permiten incoporar simultáneamente código, texto, gráficos y ecuaciones. El código presentado en este notebook puede ejecutarse en los sistemas operativos Windows, Linux y OS X.

> Haga click [aquí](https://github.com/jdvelasq/guias-de-instalacion) para obtener instrucciones detalladas sobre como instalar Jupyter en Windows y Mac OS X.

> Haga clic [aquí](http://nbviewer.jupyter.org/github/jdvelasq/teoria-de-la-compilacion/blob/master/tcc-07-generacion-arboles.ipynb) para ver la última versión de este documento en nbviewer.

> Descargue la última versión de este documento, los archivos de datos y los programas en Python a su disco duro; luego, carguelos y ejecutelos en línea en [Try Jupyter!](https://try.jupyter.org)

#### Contenido

> * [Gramática y árboles generados](#Gramática-y-árboles-generados)
* [Ejemplos](#Ejemplos)
    * [Ejemplo 1](#Ejemplo-1)
    * [Ejemplo 2](#Ejemplo-2)
    * [Ejemplo 3](#Ejemplo-3)
    * [Ejemplo 4](#Ejemplo-4)
* [Implementación de yyparse.py](#Implementación-de-yyparse.py)

# Gramática y árboles generados

[Contenido](#Contenido)

---

---

---

---

In [1]:
%%writefile example.txt

function @sq:num (x:num)
   {
   return x * x;
   }
   
write '2^2 -> ': @sq( 2 );
end

Overwriting example.txt


In [2]:
%%sh
python yylex.py example.txt

+-- TOKENTABLE
    +-- FUNCTION {lexeme: function, lineno: 1}
    +-- UFID {lexeme: @sq, lineno: 1}
    +-- : {lexeme: :, lineno: 1}
    +-- DATATYPE {lexeme: num, lineno: 1}
    +-- ( {lexeme: (, lineno: 1}
    +-- ID {lexeme: x, lineno: 1}
    +-- : {lexeme: :, lineno: 1}
    +-- DATATYPE {lexeme: num, lineno: 1}
    +-- ) {lexeme: ), lineno: 1}
    +-- { {lexeme: {, lineno: 2}
    +-- RETURN {lexeme: return, lineno: 3}
    +-- ID {lexeme: x, lineno: 3}
    +-- * {lexeme: *, lineno: 3}
    +-- ID {lexeme: x, lineno: 3}
    +-- ; {lexeme: ;, lineno: 3}
    +-- } {lexeme: }, lineno: 4}
    +-- WRITE {lexeme: write, lineno: 6}
    +-- STR {lexeme: '2^2 -> ', lineno: 6}
    +-- : {lexeme: :, lineno: 6}
    +-- UFID {lexeme: @sq, lineno: 6}
    +-- ( {lexeme: (, lineno: 6}
    +-- NUM {lexeme: 2, lineno: 6}
    +-- ) {lexeme: ), lineno: 6}
    +-- ; {lexeme: ;, lineno: 6}
    +-- END {lexeme: end, lineno: 7}
    +-- END {lexeme: end, lineno: 1}


In [3]:
%%sh 
python yyparse.py example.txt

+-- SYNTAXTREE
    +-- FUNCTIONDECL {lineno: 1}
    |   +-- FUNCTION {datatype: num, lineno: 1, scope: 1, value: @sq}
    |       +-- ARGS {lineno: 1}
    |       |   +-- ID {datatype: num, lineno: 1, scope: 1, value: x}
    |       +-- BLOCK {lineno: 3}
    |           +-- RETURN {datatype: num, lineno: 3, scope: 1, value: __return__}
    |               +-- * {datatype: num, lineno: 3}
    |                   +-- ID {lineno: 3, scope: 1, value: x}
    |                   +-- ID {lineno: 3, scope: 1, value: x}
    +-- MAINPROG {lineno: 6}
        +-- WRITE {lineno: 6}
        |   +-- STR {datatype: str, lineno: 6, value: '2^2 -> '}
        |   +-- UFCALL {lineno: 6, value: @sq}
        |       +-- NUM {datatype: num, lineno: 6, value: 2}
        +-- END {lineno: 7}


---

---

---

In [4]:
%%writefile example.txt

var i:num;
i := 1;

while (i < 5) do
    {
    write 'i = ': i;
    i := i + 1;
    }

end

Overwriting example.txt


In [5]:
%%sh
python yylex.py example.txt

+-- TOKENTABLE
    +-- VAR {lexeme: var, lineno: 1}
    +-- ID {lexeme: i, lineno: 1}
    +-- : {lexeme: :, lineno: 1}
    +-- DATATYPE {lexeme: num, lineno: 1}
    +-- ; {lexeme: ;, lineno: 1}
    +-- ID {lexeme: i, lineno: 2}
    +-- := {lexeme: :=, lineno: 2}
    +-- NUM {lexeme: 1, lineno: 2}
    +-- ; {lexeme: ;, lineno: 2}
    +-- WHILE {lexeme: while, lineno: 4}
    +-- ( {lexeme: (, lineno: 4}
    +-- ID {lexeme: i, lineno: 4}
    +-- < {lexeme: <, lineno: 4}
    +-- NUM {lexeme: 5, lineno: 4}
    +-- ) {lexeme: ), lineno: 4}
    +-- DO {lexeme: do, lineno: 4}
    +-- { {lexeme: {, lineno: 5}
    +-- WRITE {lexeme: write, lineno: 6}
    +-- STR {lexeme: 'i = ', lineno: 6}
    +-- : {lexeme: :, lineno: 6}
    +-- ID {lexeme: i, lineno: 6}
    +-- ; {lexeme: ;, lineno: 6}
    +-- ID {lexeme: i, lineno: 7}
    +-- := {lexeme: :=, lineno: 7}
    +-- ID {lexeme: i, lineno: 7}
    +-- + {lexeme: +, lineno: 7}
    +-- NUM {lexeme: 1, lineno: 7}
    +-- ; {lexeme: ;, lineno: 7}
    +--

In [6]:
%%sh
python yyparse.py example.txt

+-- SYNTAXTREE
    +-- FUNCTIONDECL {lineno: 1}
    +-- MAINPROG {lineno: 1}
        +-- VAR {lineno: 1}
        |   +-- ID {datatype: num, lineno: 1, scope: 0, value: i}
        +-- ASSIGN {lineno: 2, scope: 0, value: i}
        |   +-- NUM {datatype: num, lineno: 2, value: 1}
        +-- WHILE {lineno: 4}
        |   +-- < {datatype: bool, lineno: 4}
        |   |   +-- ID {lineno: 4, scope: 0, value: i}
        |   |   +-- NUM {datatype: num, lineno: 4, value: 5}
        |   +-- BLOCK {lineno: 6}
        |       +-- WRITE {lineno: 6}
        |       |   +-- STR {datatype: str, lineno: 6, value: 'i = '}
        |       |   +-- ID {lineno: 6, scope: 0, value: i}
        |       +-- ASSIGN {lineno: 7, scope: 0, value: i}
        |           +-- + {datatype: num, lineno: 7}
        |               +-- ID {lineno: 7, scope: 0, value: i}
        |               +-- NUM {datatype: num, lineno: 7, value: 1}
        +-- END {lineno: 10}


---

---

---

---

---

---

---

---

# Ejemplos

[Contenido](#Contenido)

## Ejemplo 1

[Contenido](#Contenido)

In [7]:
%%writefile example.txt

var n:num, i:num, j:num;

n := 5;
i := 1;

while (true) do
  {
  j := 1;
  while (true) do
    {
    write 'i = ': i;
    write 'j = ': j;
    j := j + 1;
    }
  i := i + 1;
  }

end

Overwriting example.txt


In [8]:
%%sh 
python yylex.py example.txt
python yyparse.py example.txt

+-- TOKENTABLE
    +-- VAR {lexeme: var, lineno: 1}
    +-- ID {lexeme: n, lineno: 1}
    +-- : {lexeme: :, lineno: 1}
    +-- DATATYPE {lexeme: num, lineno: 1}
    +-- , {lexeme: ,, lineno: 1}
    +-- ID {lexeme: i, lineno: 1}
    +-- : {lexeme: :, lineno: 1}
    +-- DATATYPE {lexeme: num, lineno: 1}
    +-- , {lexeme: ,, lineno: 1}
    +-- ID {lexeme: j, lineno: 1}
    +-- : {lexeme: :, lineno: 1}
    +-- DATATYPE {lexeme: num, lineno: 1}
    +-- ; {lexeme: ;, lineno: 1}
    +-- ID {lexeme: n, lineno: 3}
    +-- := {lexeme: :=, lineno: 3}
    +-- NUM {lexeme: 5, lineno: 3}
    +-- ; {lexeme: ;, lineno: 3}
    +-- ID {lexeme: i, lineno: 4}
    +-- := {lexeme: :=, lineno: 4}
    +-- NUM {lexeme: 1, lineno: 4}
    +-- ; {lexeme: ;, lineno: 4}
    +-- WHILE {lexeme: while, lineno: 6}
    +-- ( {lexeme: (, lineno: 6}
    +-- BOOL {lexeme: true, lineno: 6}
    +-- ) {lexeme: ), lineno: 6}
    +-- DO {lexeme: do, lineno: 6}
    +-- { {lexeme: {, lineno: 7}
    +-- ID {lexeme: j, lineno: 8}


---

## Ejemplo 2

[Contenido](#Contenido)

In [9]:
%%writefile example.txt

var z:num;
z := 0;    
while (z < 10) do 
  {
  z := z + 1;
  write 'do while (1 a 10) ==> ':  z;
  } 
  
end

Overwriting example.txt


In [10]:
%%sh 
python yylex.py example.txt

+-- TOKENTABLE
    +-- VAR {lexeme: var, lineno: 1}
    +-- ID {lexeme: z, lineno: 1}
    +-- : {lexeme: :, lineno: 1}
    +-- DATATYPE {lexeme: num, lineno: 1}
    +-- ; {lexeme: ;, lineno: 1}
    +-- ID {lexeme: z, lineno: 2}
    +-- := {lexeme: :=, lineno: 2}
    +-- NUM {lexeme: 0, lineno: 2}
    +-- ; {lexeme: ;, lineno: 2}
    +-- WHILE {lexeme: while, lineno: 3}
    +-- ( {lexeme: (, lineno: 3}
    +-- ID {lexeme: z, lineno: 3}
    +-- < {lexeme: <, lineno: 3}
    +-- NUM {lexeme: 10, lineno: 3}
    +-- ) {lexeme: ), lineno: 3}
    +-- DO {lexeme: do, lineno: 3}
    +-- { {lexeme: {, lineno: 4}
    +-- ID {lexeme: z, lineno: 5}
    +-- := {lexeme: :=, lineno: 5}
    +-- ID {lexeme: z, lineno: 5}
    +-- + {lexeme: +, lineno: 5}
    +-- NUM {lexeme: 1, lineno: 5}
    +-- ; {lexeme: ;, lineno: 5}
    +-- WRITE {lexeme: write, lineno: 6}
    +-- STR {lexeme: 'do while (1 a 10) ==> ', lineno: 6}
    +-- : {lexeme: :, lineno: 6}
    +-- ID {lexeme: z, lineno: 6}
    +-- ; {lexeme: ;,

In [11]:
%%sh
python yyparse.py example.txt

+-- SYNTAXTREE
    +-- FUNCTIONDECL {lineno: 1}
    +-- MAINPROG {lineno: 1}
        +-- VAR {lineno: 1}
        |   +-- ID {datatype: num, lineno: 1, scope: 0, value: z}
        +-- ASSIGN {lineno: 2, scope: 0, value: z}
        |   +-- NUM {datatype: num, lineno: 2, value: 0}
        +-- WHILE {lineno: 3}
        |   +-- < {datatype: bool, lineno: 3}
        |   |   +-- ID {lineno: 3, scope: 0, value: z}
        |   |   +-- NUM {datatype: num, lineno: 3, value: 10}
        |   +-- BLOCK {lineno: 5}
        |       +-- ASSIGN {lineno: 5, scope: 0, value: z}
        |       |   +-- + {datatype: num, lineno: 5}
        |       |       +-- ID {lineno: 5, scope: 0, value: z}
        |       |       +-- NUM {datatype: num, lineno: 5, value: 1}
        |       +-- WRITE {lineno: 6}
        |           +-- STR {datatype: str, lineno: 6, value: 'do while (1 a 10) ==> '}
        |           +-- ID {lineno: 6, scope: 0, value: z}
        +-- END {lineno: 9}


---

## Ejemplo 3

[Contenido](#Contenido)

In [12]:
%%writefile example.txt
write '$chs( 1 ) ==> ':  \$chs( 1 );
write '$abs( 1 ) ==> ':  \$abs( 1 );
write '$sgn( 0 ) ==> ':  \$sgn( 0 );
write '$sgn( 1 ) ==> ':  \$sgn( 1 );
end 

Overwriting example.txt


In [13]:
%%sh 
python yylex.py example.txt

example.txt:Lexical error at line <0>: Unexpected symbol <\>


In [14]:
%%sh
python yyparse.py example.txt

+-- SYNTAXTREE
    +-- FUNCTIONDECL {lineno: 1}
    +-- MAINPROG {lineno: 1}
    |   +-- VAR {lineno: 1}
    |   |   +-- ID {datatype: num, lineno: 1, scope: 0, value: z}
    |   +-- ASSIGN {lineno: 2, scope: 0, value: z}
    |   |   +-- NUM {datatype: num, lineno: 2, value: 0}
    |   +-- WHILE {lineno: 3}
    |   |   +-- < {datatype: bool, lineno: 3}
    |   |   |   +-- ID {lineno: 3, scope: 0, value: z}
    |   |   |   +-- NUM {datatype: num, lineno: 3, value: 10}
    |   |   +-- BLOCK {lineno: 5}
    |   |       +-- ASSIGN {lineno: 5, scope: 0, value: z}
    |   |       |   +-- + {datatype: num, lineno: 5}
    |   |       |       +-- ID {lineno: 5, scope: 0, value: z}
    |   |       |       +-- NUM {datatype: num, lineno: 5, value: 1}
    |   |       +-- WRITE {lineno: 6}
    |   |           +-- STR {datatype: str, lineno: 6, value: 'do while (1 a 10) ==> '}
    |   |           +-- ID {lineno: 6, scope: 0, value: z}
    |   +-- END {lineno: 9}
    +-- FUNCTIONDECL {lineno: 1}
    

---

## Ejemplo 4

[Contenido](#Contenido)

In [15]:
%%writefile example.txt
function @min:num (x:num, y:num)
   {
   when ((x < y) == true) do return x;
   return y;
   }
   
## funcion max(x, y)
function @max:num (x:num, y:num)   
   {
   if ((x < y) == false) do
       {
       return x;
       }
   else
      {                 
      return y;
      }
   }

write 'min 1 -> ': @min(1,2);
write 'max 2 -> ': @max(1,2);

end

Overwriting example.txt


In [16]:
%%sh 
python yylex.py example.txt

+-- TOKENTABLE
    +-- FUNCTION {lexeme: function, lineno: 0}
    +-- UFID {lexeme: @min, lineno: 0}
    +-- : {lexeme: :, lineno: 0}
    +-- DATATYPE {lexeme: num, lineno: 0}
    +-- ( {lexeme: (, lineno: 0}
    +-- ID {lexeme: x, lineno: 0}
    +-- : {lexeme: :, lineno: 0}
    +-- DATATYPE {lexeme: num, lineno: 0}
    +-- , {lexeme: ,, lineno: 0}
    +-- ID {lexeme: y, lineno: 0}
    +-- : {lexeme: :, lineno: 0}
    +-- DATATYPE {lexeme: num, lineno: 0}
    +-- ) {lexeme: ), lineno: 0}
    +-- { {lexeme: {, lineno: 1}
    +-- WHEN {lexeme: when, lineno: 2}
    +-- ( {lexeme: (, lineno: 2}
    +-- ( {lexeme: (, lineno: 2}
    +-- ID {lexeme: x, lineno: 2}
    +-- < {lexeme: <, lineno: 2}
    +-- ID {lexeme: y, lineno: 2}
    +-- ) {lexeme: ), lineno: 2}
    +-- == {lexeme: ==, lineno: 2}
    +-- BOOL {lexeme: true, lineno: 2}
    +-- ) {lexeme: ), lineno: 2}
    +-- DO {lexeme: do, lineno: 2}
    +-- RETURN {lexeme: return, lineno: 2}
    +-- ID {lexeme: x, lineno: 2}
    +-- ; {lexem

In [17]:
%%sh
python yyparse.py example.txt

example.txt:Syntax error at line 2: Unexpected symbol <token := ')', symbol := '=='>


---

# Implementación de yyparse.py

[Contenido](#Contenido)

In [18]:
%%sh
pygmentize -O linenos=1 -g yyparse.py

0001: [37m###< 2016-08-28 17:04:40.182903 >###[39;49;00m
0002: 
0003: [37m#[39;49;00m
0004: [37m#  yyparse.py[39;49;00m
0005: [37m#    analizador sintactico para el lenguaje bcc[39;49;00m
0006: [37m#[39;49;00m
0007: 
0008: [34mimport[39;49;00m [04m[36mshlex[39;49;00m, [04m[36msys[39;49;00m, [04m[36mpickle[39;49;00m
0009: [34mimport[39;49;00m [04m[36mdataTree[39;49;00m [34mas[39;49;00m [04m[36mdt[39;49;00m
0010: 
0011: 
0012: [37m## analizador sintactico[39;49;00m
0013: [34mdef[39;49;00m [32myyparse[39;49;00m(filename, quiet = [36mFalse[39;49;00m):
0014: 
0015:     [37m## lee la estructura de datos generada por yylex()[39;49;00m
0016:     [34mwith[39;49;00m [36mopen[39;49;00m(filename + [33m'[39;49;00m[33m.dataTree[39;49;00m[33m'[39;49;00m, [33m'[39;49;00m[33mrb[39;49;00m[33m'[39;49;00m) [34mas[39;49;00m f:
0017:         DATA = pickle.load(f)
0018: 
0019:     SOURCECODE  = DATA.find([33m'[39;49;00m[33mSOURCECODE[39;49;00m[3

---

[Contenido](#Contenido)