# Autómatas finitos y expresiones regulares

In [None]:
class Puerta:
    def __init__(self):
        self._estado = 'Cerrada'
    
    def abrir(self):
        self._estado = 'Abierta'
    
    def cerrar(self):
        self._estado = 'Cerrada'
    
    @property
    def estado(self):
        return self._estado

In [None]:
obj = Puerta()
obj.estado

In [None]:
obj.abrir()
obj.estado

In [None]:
obj.cerrar()
obj.estado

In [None]:
obj.cerrar()
obj.estado

- Costal de maíz
- Gallina
- Perro

In [None]:
class AcertijoRio:
    def __init__(self):
        self.costal = False
        self.gallina = False
        self.perro = False
        self.persona = False
    
    @property
    def estado_invalido(self):
        return (self.gallina == self.costal != self.persona
                or self.perro == self.gallina != self.persona)
    
    def cruzar_costal(self):
        if self.estado_invalido: return
        if self.persona != self.costal: return
        self.persona = self.costal = not self.persona
    
    def cruzar_gallina(self):
        if self.estado_invalido: return
        if self.persona != self.gallina: return
        self.persona = self.gallina = not self.persona
    
    def cruzar_perro(self):
        if self.estado_invalido: return
        if self.persona != self.perro: return
        self.persona = self.perro = not self.persona
    
    def cruzar_persona(self):
        if self.estado_invalido: return
        self.persona = not self.persona
    
    def __repr__(self):
        letras = 'CGPH'
        estados = [self.costal, self.gallina, self.perro, self.persona]
        izquierda = [letra for (letra, estado) in zip(letras, estados)
                     if not estado]
        derecha = [letra for (letra, estado) in zip(letras, estados) if estado]
        return f"{''.join(izquierda)}-{''.join(derecha)}"

In [None]:
acertijo = AcertijoRio()
acertijo

In [None]:
acertijo.estado_invalido

In [None]:
acertijo.cruzar_gallina()
acertijo

In [None]:
acertijo.cruzar_persona()
acertijo

In [None]:
acertijo.cruzar_costal()
acertijo

In [None]:
acertijo.cruzar_persona()
acertijo

In [None]:
acertijo.estado_invalido

In [None]:
acertijo.cruzar_persona()
acertijo

## Implementación de un intérprete de autómatas finitos en general

CGHP

In [None]:
: {'C': '', 'G': '', 'P': '', 'H': ''}

δ = {
    'CGHP-': {'G': 'CP-GH', 'H': 'CGP-H', 'P': 'CG-HP', 'C': 'GP-CH'},
    'CGP-H': {'C': 'CGP-H', 'G': 'CGP-H', 'P': 'CGP-H', 'H': 'CGP-H'},
    'CG-HP': {'C': 'CG-HP', 'G': 'CG-HP', 'P': 'CG-HP', 'H': 'CG-HP'},
    'GP-CH': {'C': 'GP-CH', 'G': 'GP-CH', 'P': 'GP-CH', 'H': 'GP-CH'},
    
    'CP-GH': {'C': 'CP-GH', 'H': 'CHP-G', 'G': 'CGHP-', 'P': 'CP-GH'},
    'CP-GH': {'C': '', 'G': '', 'P': '', 'H': ''}
    'CHP-G': {'C': '', 'G': '', 'P': '', 'H': ''}
    'CGHP-': {'C': '', 'G': '', 'P': '', 'H': ''}
    'CP-GH': {'C': '', 'G': '', 'P': '', 'H': ''}
    
    'CHP-G': {'C': 'P-CGH', 'G': 'CHP-G', 'H': 'CHP-G', 'P': 'C-GHP'},
    'CHP-G': {'C': 'P-CGH', 'G': 'CHP-G', 'H': 'CHP-G', 'P': 'C-GHP'}
}
q0 = 'CGHP-'
F = ['-CGHP']

In [None]:
estado = q0

In [None]:
entrada = 'GHPGCHG'

In [None]:
for simbolo in entrada:
    estado = δ[estado][simbolo]

In [None]:
class AutomataFinito:
    def __init__(datos_de_entrada):
        pass
    
    def un_paso(simbolo):
        pass
    
    def consumir(cadena) -> bool:
        ...
        return True # Si el autómata termina en estado final

## Definición formal de un Autómata Finito (Determinista)

Un **autómata finito** es una 5-ada $(Q, \Sigma, \delta, q_0, F)$
- $Q$ es un conjunto finito llamado conjunto de **estados**.
- $\Sigma$ es un conjunto finito llamado **alfabeto**.
- $\delta: Q \times \Sigma \to Q$ es la **función de transición**.
- $q_0 \in Q$ es el **estado inicial**.
- $F \subseteq Q$ es el conjunto de **estados de aceptación**.

**Ejemplo** (tal como se vio en el WhiteBoard de Office):
$M_1 = (Q, \Sigma, q_1, F)$
- $Q = \lbrace q_1, q_2, q_3 \rbrace$
- $\Sigma = \{ 0, 1 \}$
- $\delta$ está dada por
| $\delta$ | 0     | 1     |
|----------|-------|-------|
| $q_1$    | $q_1$ | $q_2$ |
| $q_2$    | $q_3$ | $q_2$ |
| $q_3$    | $q_2$ | $q_2$ |
- $q_1$ es el estado inicial
- $F = \{ q_2 \}$

**Definición** Si $M$ es un AFD, el **lenguaje de la máquina $M$**, denotado 
por $L(M)$ es el conjunto de todas las cadenas $w$ sobre $\Sigma$ que acepta el
autómata $M$, es decir que dada la cadena 
$w = w_1w_2w_3\cdots w_n \in \Sigma^\star$ existe una sucesión finita de
estados $r_0, r_1, r_2, \dots, r_n$ en $Q$ que cumple las siguientes
condiciones:
1. $r_0 = q_0$
2. $\delta(r_i, w_{i + 1}) = r_{i + 1}$
3. $r_n \in F$

**Ejemplo** Una máquina $M_2$ cuyo lenguaje son las cadenas que tienen un par
de unos:
$M_2 = (Q, \Sigma, \mathit{par}, F)$
- $Q = \{ \mathit{par}, \mathit{impar} \}$
- $\Sigma = \{0, 1\}$
- $\delta$ está dada por
| $\delta$         | 0                | 1                |
|------------------|------------------|------------------|
| $\mathit{par}$   | $\mathit{par}$   | $\mathit{impar}$ |
| $\mathit{impar}$ | $\mathit{impar}$ | $\mathit{par}$   |
- $\mathit{par}$ es el estado inicial
- $F = \{ \mathit{par} \}$

**Ejemplo** Una máquina $M_3$ cuyo lenguaje son las cadenas que tienen un par
de unos y de ceros:
$M_3 = (Q, \Sigma, \mathit{PP}, F)$
- $Q = \{ \mathit{PP}, \mathit{PI}, \mathit{IP}, \mathit{II} \}$
- $\Sigma = \{0, 1\}$
- $\delta$ está dada por
| $\delta$      | 0             | 1             |
|---------------|---------------|---------------|
| $\mathit{PP}$ | $\mathit{IP}$ | $\mathit{PI}$ |
| $\mathit{IP}$ | $\mathit{PP}$ | $\mathit{II}$ |
| $\mathit{PI}$ | $\mathit{II}$ | $\mathit{PP}$ |
| $\mathit{II}$ | $\mathit{PI}$ | $\mathit{IP}$ |
- $\mathit{PP}$ es el estado inicial
- $F = \{ \mathit{PP} \}$

**Ejemplo** Una máquina $B_m$ que acepta las cadenas con un múltiplo de $m$
bits 1.
- $Q = \{q_0, q_1, q_2, \ldots, q_m\}$
- $\Sigma = \{0, 1\}$
- $\delta$ está dada por
  - $\delta(q_{m - 1}, 1) = q_0$
  - $\delta(q_j, 0) = q_j$
  - $\delta(q_j, 1) = q_{j + 1}$
- $q_0$ es el estado inicial
- $F = \{ q_0 \}$

### Uso de la implementación

Un autómata finito determinista se puede representar mediante un **programa**
que consiste en un conjunto finito de tripletas $(q, s, r) \in Q \times \Sigma
\times Q$.
El programa se puede convertir a una función de transición asociando la
tripleta $(q, s, r)$ con $\delta(q, s) = r$.
Note que el programa para poder definir una función de trancisión requiere dos
condiciones:
1. No pueden existir dos o más tripletas $(q, s, r)$ y $(q^\prime, s^\prime, t)$
   con $(q, s) = (q^\prime, s^\prime)$ porque $\delta$ entonces ya no es una
   función.
2. Para cada pareja $(q, s) \in Q \times \Sigma$ existe una y exactamente una
   tripleta $(q^\prime, s^\prime, r)$ con $(q, s) = (q^\prime, s^\prime)$

In [1]:
from curso import automatasfinitos as af

In [2]:
programa = [
    af.Transicion("q1", "0", "q1"),
    af.Transicion("q1", "1", "q2"),
    af.Transicion("q2", "0", "q3"),
    af.Transicion("q2", "1", "q2"),
    af.Transicion("q3", "0", "q2"),
    af.Transicion("q3", "1", "q2"),
]
M = af.AFD(programa, 'q1', ['q2'])

In [3]:
M('00100011101')

True

In [4]:
M('00100011100')

True

In [5]:
M('0010001110000')

True

In [6]:
M('00111010000')

True

## Lenguajes regulares y sus operaciones

**Definición** Un lenguaje es **regular** si es reconocido por un autómata
finito. Dados $A$ y $B$ lenguajes regulares, las operaciones regularesson
estas:
- $A \cup B = \{x | x \in A \text{ o } x \in B\}$
- $A \circ B = \{xy | x \in A \text{ y } y \in B\}$
- $A^\star = \{x_1x_2\cdots x_k | \text{cada } x_i \in A \text{ para cualquier 
  } k \ge 0\}$

**Ejemplos**
Sean $A = \{\texttt{cara}, \texttt{cola}\}$,
$B = \{\texttt{col}, \texttt{chones}\}$.
- $A \cup B = \{\texttt{cara}, \texttt{cola}, \texttt{col}, \texttt{chones}\}$.
- $A \circ B = \{ \texttt{caracol}, \texttt{carachones}, \texttt{colacol},
  \texttt{colachones}\}$
- $A^\star$ contiene elementos como $\epsilon$, $\texttt{cara}$,
  $\texttt{cola}$, $\texttt{caracola}$, $\texttt{colacara}$,
  $\texttt{caracara}$, $\texttt{colacola}$, $\texttt{caracaracara}$,
  $\texttt{caracolacara}$,...

#### Autómatas finitos no deterministas (AFN)

En un autómata finito no determinista permitimos que el programa no defina una
función, sino una relación arbitraria $Q \times \Sigma_\epsilon \times Q$ donde
$\Sigma_\epsilon = \Sigma \cup \{\epsilon\}$.

Esto nos permitirá hacer un programa no determinista donde en cada estado:
1. Podemos pasar a algún otro estado sin consumir ningún símbolo de entrada
   mediante una transición $\epsilon$.
2. Podemos consumir un símbolo de la entrada para pasar a cero, uno o más
   estados siguientes.

**Definición** Un autómata finito no determinista es una 5-ada $(Q, \Sigma,
q_0, F)$ donde
1. $Q$ es un conjunto finito de *estados*
2. $\Sigma$ es un *alfabeto* finito
3. $\delta: Q\times \Sigma_{\epsilon} \to \mathcal{P}(Q)$ es una función
   parcial *de trancisión*.
4. $q_0$ el *estado inicial*.
5. $F \subseteq Q$ es el conjunto de *estados de aceptación*.

**Definición** Si $N$ es un AFN, el **lenguaje de la máquina $N$**, denotado 
por $L(N)$ es el conjunto de todas las cadenas $w$ sobre $\Sigma$ que acepta el
autómata $N$, es decir que dada la cadena 
$w = y_1y_2y_3\cdots y_m \in \Sigma_{\epsilon}^\star$ existe una sucesión
finita de estados $r_0, r_1, r_2, \dots, r_m$ en $Q$ que cumple las siguientes
condiciones:
1. $r_0 = q_0$
2. $r_{i + 1} \in \delta(r_i, y_{i + 1})$
3. $r_m \in F$

In [40]:
from typing import Collection

def calcular_alfabeto(N: af.AFN) -> Collection[af.Simbolo]:
    programa = N.programa()
    return {simbolo
            for estado, simbolo, siguiente in programa
            if simbolo}

In [41]:
calcular_alfabeto(N)

{'0', '1'}

In [8]:
import collections

In [9]:
def afn_a_afd(N: af.AFN) -> af.AFD:
    alfabeto = calcular_alfabeto(N)
    
    # Calcular metaestado inicial
    metaestado_inicial = frozenset(N.cerradura_epsilon([N.estado_inicial]))

    # Calcular el metaprograma
    metaestados = {metaestado_inicial}
    metaprograma = set()
    cola = collections.deque([metaestado_inicial])
    while cola:
        metaestado = cola.popleft()
        for simbolo in alfabeto:
            siguientes = {N.transicion(estado, simbolo)
                          for estado in metaestado}
            siguientes.update(N.cerradura_epsilon(siguientes))
            metaestado_siguiente = frozenset(siguientes)
            metaprograma.add(
                af.Transicion(metaestado, simbolo, metaestado_siguiente))
            if metaestado_siguiente not in metaestados:
                metaestados.add(metaestado_siguiente)
                cola.append(metaestado_siguiente)
    
    # Calcular metaestados finales
    metaestados_finales = {metaestado
                           for metaestado in metaestados
                           if any(N.es_de_aceptacion(estado)
                                  for estado in metaestado)}
    
    return af.AFD(metaprograma, metaestado_inicial, metaestados_finales)

In [10]:
programa = [
    af.Transicion('q1', '0', 'q1'),
    af.Transicion('q1', '1', 'q1'),
    af.Transicion('q1', '1', 'q2'),
    af.Transicion('q2', '0', 'q3'),
    af.Transicion('q2', '',  'q3'),
    af.Transicion('q3', '1', 'q4'),
    af.Transicion('q4', '0', 'q4'),
    af.Transicion('q4', '1', 'q4'),
]
estado_inicial = 'q1'
estados_de_aceptacion = ['q4']
N = af.AFN(programa, estado_inicial, estados_de_aceptacion)

In [11]:
N('0110110')

{'q1'}
{'q1'}
{'q3', 'q1', 'q2'}
{'q4', 'q3', 'q1', 'q2'}
{'q4', 'q3', 'q1'}
{'q4', 'q3', 'q1', 'q2'}
{'q4', 'q3', 'q1', 'q2'}
{'q4', 'q3', 'q1'}


True

In [15]:
N.programa()

[Transicion(estado='q1', simbolo='0', siguiente='q1'),
 Transicion(estado='q1', simbolo='1', siguiente='q1'),
 Transicion(estado='q1', simbolo='1', siguiente='q2'),
 Transicion(estado='q2', simbolo='0', siguiente='q3'),
 Transicion(estado='q2', simbolo='', siguiente='q3'),
 Transicion(estado='q3', simbolo='1', siguiente='q4'),
 Transicion(estado='q4', simbolo='0', siguiente='q4'),
 Transicion(estado='q4', simbolo='1', siguiente='q4')]

In [42]:
M = afn_a_afd(N)
M

<curso.automatasfinitos.AFD at 0x7fd44c831970>

In [43]:
M.programa()

[Transicion(estado=frozenset({frozenset({'q1'})}), simbolo='1', siguiente=frozenset({frozenset()})),
 Transicion(estado=frozenset({frozenset()}), simbolo='0', siguiente=frozenset({frozenset()})),
 Transicion(estado=frozenset({frozenset()}), simbolo='1', siguiente=frozenset({frozenset()})),
 Transicion(estado=frozenset({'q1'}), simbolo='1', siguiente=frozenset({frozenset({'q1', 'q2'})})),
 Transicion(estado=frozenset({frozenset({'q1', 'q2'})}), simbolo='0', siguiente=frozenset({frozenset()})),
 Transicion(estado=frozenset({'q1'}), simbolo='0', siguiente=frozenset({frozenset({'q1'})})),
 Transicion(estado=frozenset({frozenset({'q1'})}), simbolo='0', siguiente=frozenset({frozenset()})),
 Transicion(estado=frozenset({frozenset({'q1', 'q2'})}), simbolo='1', siguiente=frozenset({frozenset()}))]