# Lenguajes Regulares (LR)
---

## Definición

* Es un tipo de lenguaje formal
* Son los más simples
* Técnicas de reconocimiento de patrones (manejada por el scanner del compilador)
* Importancia en el diseño de los LENGUAJES DE PROGRAMACIÓN: identificadores, palabras reservadas, constantes numéricas, operadores y caracteres de puntuación

## Un LENGUAJE es REGULAR si ...

|                                                     |
| --                                                  |
| el lenguaje formal es FINITO                        |
| existe una GRAMÁTICA REGULAR que lo genere          |
| se puede representar mediante una EXPRESIÓN REGULAR |
| puede ser reconocido por un AUTÓMATA FINITO         |

## Ejemplos de LR

| Lenguaje                                        | ¿Es regular? |
| --                                              | --           |
| $\{a^nb^n / 1 ≤ n ≤ 4\}$                        | **SI**       |
| $\{a^n / n ≥ 1\}$                               | **SI**       |
| $\{a^nb^n / n ≥ 1\}$                            | **NO**       |
| $\{a^n / 1 ≤ n ≤ 1000\}$                        | **SI**       |
| $\{a^nb^t / n ≥ 1, t ≥ 1\}$                     | **SI**       |
| $\{(ab)^n (cde)^t a^z / n ≥ 1, t ≥ 1, z ≥ 1\}$  | **SI**       |
| $\{1^{2n+1} 0 / n ≥ 0\}$                        | **SI**       |

# Expresiones Regulares (ER)

## Concepto

* Es la forma más precisa y útil (metalenguaje) de representar o describir a los LR
* Es un mecanismo alternativo al igual que las GR para definir los LR
* Es una cadena de texto que describe un patrón de búsqueda

## Componentes

|                       |
| --                    |
| Símbolos del alfabeto |
| Símbolo $\lambda$     |
| Operadores            |
| ()                    |

## Operadores

|    |               |
| -- | --            |
| .  | concatenación |
| \| | unión         |
| *  | clausura      |

## ER sobre un $\Sigma$

| ER                        | Es una ER que denota ...                                                      |
| --                        | --                                                                            |
| $\emptyset$               | lenguaje vacío                                                                |
| $\lambda$                 | lenguaje que contiene únicamente a la palabra vacía $\{\lambda\}$             |
| $\forall a \in \Sigma, a$ | lenguaje que contiene únicamente la palabra a, $\{a\}$                        |
| $r$                       | lenguaje $L(r)$, entonces $r$ es también una ER para el mismo lenguaje        |
| $r \mid s$                | unión de los lenguajes denotados por $r$ y $s$; es decir, $L(r) \cup L(s)$    |
| $r.s$                     | concatenación de los lenguajes denotados por $r$ y $s$; es decir, $L(r).L(s)$ |
| $r^*$                     | clausura del lenguaje denotado por $r$; es decir, $L(r)^*$                    |

## Precedencia de operadores

1. Clausura (*)
1. Concatenación (.)
1. Unión (|)

## Ejemplos

| ER                             | Describe el lenguaje ...                                                           |
| --                             | --                                                                                 |
| $(aa)^*$                       | $L = \{(aa)^n / n ≥ 0\}$                                                           |
| $aa^*$                         | $L = \{aa^n / n ≥ 0\}$                                                             |
| $a^*b$                         | $L = \{a^n b / n ≥ 0\}$                                                            |
| $01^*$                         | $L = \{01^n / n ≥ 0\}$                                                             |
| $(0 \mid 1)^*$                 | $L = \{w / w \in \{0, 1\}^*\}$                                                     |
| $(0 \mid 1)^* 00 (0 \mid 1)^*$ | $L = \{v00w / v, w \in \{0, 1\}^*\}$                                               |
| $(1 \mid 10)^*$                | $L = \{w / w \in \{1, 10\}^*\}$                                                    |
| $abbb^*c^+ \mid ab^+c(cc)^*$   | $L = \{abbb^nc^m / n ≥ 0 \wedge m ≥ 1\} \cup \{ab^nc(cc)^m / n ≥ 1 \wedge m ≥ 0\}$ |

## Lenguaje representado por una ER

* Cada ER $\varphi$ define recursivamente un lenguaje $L$, utilizando las siguientes reglas de cálculo:

| Si ...                      | Entonces ...                                       |
| --                          | --                                                 |
| $\varphi = \emptyset$       | $L(\varphi) = \emptyset$                           |
| $\varphi = \lambda$         | $L(\varphi) = \{\lambda\}$                         |
| $\varphi = a, a \in \Sigma$ | $L(\varphi) = \{a\}$                               |
| $\varphi \, y \, \beta$ son ER    | $L(\varphi \mid \beta) = L(\varphi) \cup L(\beta)$ |
| $\varphi \, y \, \beta$ son ER    | $L(\varphi . \beta) = L(\varphi) . L(\beta)$       |
| $\varphi$ es ER             | $L(\varphi^*) = L(\varphi)^*$                      |
| $\varphi$ es ER             | $L((\varphi)) = L(\varphi)$ |

* Ejemplos:

| ER             | LR                                                                                                      |
| --             | --                                                                                                      |
| $01^*$         | $L(01^*) = L(0) L(1^*) = \{0\} L(1^*) = \{0\} \{\lambda, 1, 11, 111, ...\} = \{0, 01, 011, 0111, ...\}$ |
| $(0 \mid 1)^*$ | $L((0 \mid 1)^*) = (L(0 \mid 1))^* = (\{0, 1\})^* = \{\lambda, 0, 1, 00, 01, 10, 11, ...\}$             |

## Propiedades de equivalencia

* Sean $a$,$b$,$c$ ER sobre $\Sigma$

| Propiedad                                                    | Ejemplo                                   |
| --                                                           | --                                        |
| **asociatividad de la unión**                                | $a \mid (b \mid c) = (a \mid b) \mid c$   |
| **conmutatividad de la unión**                               | $a \mid b = b \mid a$                     |
| **asociatividad de la concatenación**                        | $(ab)c = a(bc)$                           |
| **distributividad de la concatenación respecto de la unión** | $a(b \mid c) = ab \mid ac$                |
| **elemento neutro de la concatenación**                      | $a \lambda = \lambda a = a$               |
| **elemento neutro de la unión**                              | $a \mid \emptyset = \emptyset \mid a = a$ |

## ER equivalentes

* Dos ER son equivalentes si representan el mismo LR
* Ejemplo: $a \mid b = b \mid a$  ==> ambas representan al LR $L = \{a, b\}$

* Ejemplos:
  * $\lambda^* = \lambda$
  * $\emptyset a = a \emptyset = \emptyset$
  * $\emptyset^* = \lambda$
  * $a^*a^* = a^*$
  * $aa^* = a^*a$
  * $(a^*)^* = a^*$
  * $a^* = \lambda \mid a \mid aa \mid ...\mid a^n \mid a^{n+1}a^*$
  * $a^+ = aa^* = a^*a$
  * $a^* = \lambda \mid aa^*$
  * $a^* = (\lambda \mid a)^{n-1} \mid a^na^*$
  * $(a^* \mid b^*)^* = (a^*b^*)^* = (a \mid b)^*$
  * $(ab)^*a = a (ba)^*$
  * $(a^*b)^*a^* = (a \mid b)^*$
  * $(a^*b)^* = (a \mid b)^*b \mid \lambda$

## ER no equivalentes

* Dos ER son diferentes si representan a diferentes LR
* Ejemplo:  $a(a \mid b) \neq (a \mid b)a$

## Expresión Regular Universal (ERU)

* Es la ER que representa al Lenguaje Universal sobre un alfabeto dado
* Representa al LR que contiene la palabra vacía ($\lambda$) y todas las palabras que se pueden formar con los símbolos del alfabeto dado
* Ejemplo: $\Sigma = \{a, b\}$, la ERU es $(a \mid b)^*$

## Operaciones sobre LR

|                        | |
| --                     | -- |
| **unión**              | Si $L_1$ es representado por la ER $a^*b$ y $L_2$ es representado por la ER $ba \mid b^*$, $L_1 \cup L_2$ es representado por la ER = $(a^*b) \mid (ba \mid b^*) = a^*b \mid ba \mid b^*$ |
| **concatenación**      | Si $L_1$ es representado por la ER $a^*b$ y $L_2$ es representado por la ER $a \mid b^*$, el LR concatenación $L_1L_2$ es representado por la ER = $a^*b(a \mid b^*)$ |
| **clausura de Klenne** | Si $L$ es representado por la ER $a^*b$, $L^*$ es representado por la ER = $(a^*b)^*$ |
| **clausura positiva**  | Si $L$ es representado por la ER $a^*b$, $L^+$ es representado por la ER = $(a^*b)^+$ |
| **complemento**        | Si $L$ es representado por la ER $a(a \mid b)^*$, $L^c$ es representado por la ER = $b(a \mid b)^* \mid \lambda$ |
| **intersección**       | Si $L_1$ es representado por la ER $a(a \mid b)^*$ y $L_2$ es representado por la ER $(a \mid b)^*b$, $L_1 \cap L_2$ es representado por la ER = $a(a \mid b)^*b$ |

## ER y Lenguajes de Programación

* Los componentes léxicos de un Lenguaje de Programación – identificadores, palabras reservadas, constantes, operadores – constituyen diferentes LR
* Ejemplos:

|                           |                         |
| --                        | --                      |
| $L(L \mid D)^*$           | **identificadores**     |
| $D^+.D^*$                 | **constantes reales**   |
| $if \mid else \mid while$ | **palabras reservadas** |