**Implementación de un Autómata Finito (FA) Interactivo** 

Este programa implementa un reconocedor de entradas de un usuario basado en un FA (*Finite-State Automaton*) predefinido. Requiere que el diseñador especifique la *tabla de transición* del FA. La entrada se reconoce mediante un ASR y la salida se genera mediante la reutilización de un TTS.

Primero, necesitamos instalar algunos paquetes para ASR, TTS y manejo de audio:

In [None]:
!apt install libasound2-dev portaudio19-dev libportaudio2 libportaudiocpp0 ffmpeg
!pip install speechrecognition
!pip install PyAudio
!pip -q install pydub
!pip install gtts
!pip install pygobject
!pip install spacy
!python -m spacy download es_core_news_sm

Luego importamos algunas bibliotecas que necesitaremos:

In [None]:
import speech_recognition as sr 
from pydub import AudioSegment
from IPython.display import Javascript, Audio
from google.colab import output
from base64 import b64decode
from io import BytesIO
import subprocess
import re
from gtts import gTTS 
import time
import es_core_news_sm

Luego, re-utilizamos algunos métodos definidos previamente para ASR y TTS:

In [None]:
RECORD = """
const sleep  = time => new Promise(resolve => setTimeout(resolve, time))
const b2text = blob => new Promise(resolve => {
  const reader = new FileReader()
  reader.onloadend = e => resolve(e.srcElement.result)
  reader.readAsDataURL(blob)
})
var record = time => new Promise(async resolve => {
  stream = await navigator.mediaDevices.getUserMedia({ audio: true })
  recorder = new MediaRecorder(stream)
  chunks = []
  recorder.ondataavailable = e => chunks.push(e.data)
  recorder.start()
  await sleep(time)
  recorder.onstop = async ()=>{
    blob = new Blob(chunks)
    text = await b2text(blob)
    resolve(text)
  }
  recorder.stop()
})
"""

def Grabar(sec=5):
  display(Javascript(RECORD))
  s = output.eval_js('record(%d)' % (sec*1000))
  b = b64decode(s.split(',')[1])
  with open('audio.webm','wb') as f:
    f.write(b)
  command = ['ffmpeg', '-i', 'audio.webm', '-f', 'segment', '-segment_time', '100', 'out%02d.wav']
  subprocess.run(command,stdout=subprocess.PIPE,stdin=subprocess.PIPE)
  return('out00.wav')

def ASR():
    texto_reconocido=""
    print("Comenzar..")
    WAV = Grabar()
    fuente = sr.AudioFile(WAV)
    r = sr.Recognizer()
    with fuente as source:
         audio = r.record(source)                                 
    try:
         texto_reconocido = r.recognize_google(audio, language='es-es')
    except sr.UnknownValueError:
       print("No entendi el audio")
    return(texto_reconocido)

def TTS(texto):
  sound_file = '1.wav'
  tts = gTTS(texto, lang="es")
  tts.save(sound_file) 
  display(Audio(sound_file,autoplay=True)) 

Además, re-utilizamos nuestra función para lematizar una oración:

In [None]:
def Lematizar(oracion):
   doc = nlp(oracion)
   lemas = [token.lemma_ for token in doc]
   return(" ".join(lemas))  

Ahora, definimos el método **LeerRespuesta(pregunta, patron)**, que lee una respuesta hablada del usuario a partir de una **pregunta** dada por el FA. En el caso de que la respuesta "calce" con algunos de los símbolos permitidos en **patron** (i.e., símbolos de *Sigma*), se retorna el calce:

In [None]:
def LeerRespuesta(pregunta,patron):
        # Sintetizar voz de la pregunta
        TTS(pregunta)
        time.sleep(4)
        # Reconocer respuesta hablada
        texto = ASR()
        # Probar que la frase hablada contenga alguno de los símbolos del patron
        calce = re.search(patron,texto)
        if calce != None:
           return(calce.group(0))
        else:
           return("nada")

Luego, definimos el reconocedor basado en el FA con la función **FA(q0,F,Sigma,Preguntas,TablaTrans)**. Esta recibe el estado inicial (**Q0**) y final (**F**), el vocabulario **Sigma**, la lista de **Preguntas** para cada estado, y la tabla de transición **TablaTrans** que el FA debe recorrer. La función retorna *True* si la entrada completa se reconoce, o *False*, en caso contrario.

Recuerde que el lenguaje a reconocer es el dado por el siguiente autómata de control de flujo:

<img src="https://drive.google.com/uc?id=1C-0X7inkaOesCbNqZFbYb50qY3ZNF38k" width="500" > 

In [None]:
def FA(Q0,F,Sigma,Preguntas,TablaTrans):
    q=Q0    # Estado inicial
    patron = "|".join(Sigma)
    # Repita mientras no sea un estado final o de error
    while ( not(q in F)   and  (q != _ERROR)):
        # En el caso de que desee leer la respuesta solamente desde teclado,
        # reemplace la línea de abajo por: Sym = input(Preguntas[q])
        Simbolo  = LeerRespuesta(Preguntas[q],patron)
        try:
           TablaTrans[q][Simbolo]
        except KeyError:
           q = _ERROR
           break
        # Asigne el siguiente estado de la tabla o bien ERROR si no existe
        q = (_ERROR if (not(Simbolo in Sigma)) else TablaTrans[q][Simbolo])
    return(q in F)

Necesitamos, una función que inicialice y defina los estados del FA, por lo que definimos la función **InicializarFA(nQ,Sigma)**, que toma el número de estados **nQ** de la máquina y el vocabulario **Sigma**, e inicializa los estados de la tabla de transición, según el grafo de interacción especificado en clases. La función retorna la tabla de transición llena (por defecto, los estados inválidos se llenan con un valor de **ERROR**):

In [None]:
def InicializarFA(nQ,Sigma):
   tt = {}
   # Crear tabla de transición vacia (con valor de error)
   for numQ in range (nQ):
      tt[numQ] = {}
      for Simb in Sigma:
         tt[numQ][Simb] = _ERROR
   # LLenar transiciones no vacias
   tt[0]['internet']   = 1
   tt[0]['teléfono']   = 2
   tt[1]['tarjeta'] = 1
   tt[1]['subscripción']   = 3
   tt[2]['casa']   = 3
   tt[2]['departamento']    = 1
   return(tt)

Ahora definimos la función **EspecificarPreguntas()**, que simplemente especifica las preguntas que el FA realizará al usuario, retornando la lista de preguntas posibles: 

In [None]:
def EspecificarPreguntas():
   Preguntas = ["Qué tipo de servicio requiere? ",
                "Que tipo de Cliente? ",
                "Que tipo de residencia? "
            ]
   return(Preguntas)

Ahora, invocamos el programa principal:

In [None]:
nlp       = es_core_news_sm.load()
# Estado de error
_ERROR=(-1)
# Numero de estados   
nQ=4    
# Vocabulario o alfabeto de la máquina (FA):
Sigma = {'internet','teléfono','tarjeta','subscripción','casa','departamento'}
q0=0    # Estado inicial
F={3}   # Estados finales
TablaTransicion = InicializarFA(nQ,Sigma)
TTS("Bienvenido a MasterPlop Comunicaciones..")
time.sleep(5)
Preguntas  = EspecificarPreguntas()
status = FA(q0,F,Sigma,Preguntas,TablaTransicion)
if (status):
    TTS("Transacción aceptada!")
else:
    TTS("Error, no se entendió la consulta!")