# LENGUAJES FORMALES

## Resumen basico con aplicaciones de codigo de lo que vamos estudiando

Un lenguaje esta basado en un `alfabeto`, un alfabeto es un conjunto de simbolos `finitos`

Por ejemplo, si pensamos en el alfabeto en ingles, tenemos este conjunto de `simbolos`:


$$
 \{ a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z \}
$$

Con un alfabeto estamos listos para generar `cadenas` o `palabras`.

una cadena es una secuencia finita y ordenada de simbolos de un alfabeto:

```
{cadena}
```

En todos los `Lenguajes Formales` Existen las `cadenas vacias`, usualmente se presentan con estos simbolos:
$$
\{\lambda\} , \{\epsilon\}
$$


Las cadenas tienen algunas propiedades importantes:

***1. longitud.***

si `x` es una palabra, su longitud se denota como
$$
|x|
$$

y podemos definirla recursivamente:

$$
\begin{equation*}
|x| = \begin{cases}
0 & x=\lambda \\
1 + |y| & x=ay
\end{cases}
\end{equation*}
$$


In [2]:
x = "palabra"
def longitud(cadena):
    if cadena == "":
        return 0
    return 1 + longitud(cadena[1:])

print(longitud("palabra"))

7


***2. Apareciones***
numero de veces que aprece un simbolo en una cadena, y se representa de esta forma:
$$
|x|_a
$$

donde `x` es una palabra y `a` es un simbolo del alfabeto

In [3]:
def apariciones(cadena, caracter):
    if cadena == "":
        return 0
    count = 1 if cadena[0] == caracter else 0
    return count + apariciones(cadena[1:], caracter)
print(apariciones("palabra", "a"))

3


***3. concatenacion***

Si tentemos dos palabras, sus concatenacion es el resultado de juntar dos palabras o mas

$$
\{monta\}, \{puercos\}
$$
$$
\{montapuercos\}
$$

La concatenacion dadas las palabras `x1` y `x2` tal que:
$$
x_1 = a_1 a_2 a_3 ... a_m
$$
$$
x_2 = b_1 b_2 b_3 ... b_m
$$

$$
x_1x_2 = a_1 a_2 a_3 ... a_m b_1 b_2 b_3 ... b_m
$$

El elemento neutro de esta operacion es el elemento vacio
$$
x_1\lambda = x_1
$$


In [10]:
def concatenacion_recursiva(cadena1, cadena2):
    if cadena1 == "":
        return cadena2
    return cadena1[0] + concatenacion_recursiva(cadena1[1:], cadena2)

def concatenacion_python(cadena1, cadena2):
    return cadena1+cadena2

print(concatenacion_recursiva("hola", "mundo"))
print(concatenacion_python("hola", "tito"))

holamundo
holatito


***4. potencia***

La potencia `n-esima` de una palabra es el resultado de concatenar esta palabra consigo misma n veces

$$
\begin{equation*}
|x| = \begin{cases}
\lambda & n=0 \\
x^{n-1}x & n>0
\end{cases}
\end{equation*}
$$


In [None]:
def potencia(base, exponente):
    if exponente == 0:
        return ""
    return base + potencia(base, exponente - 1)
print(potencia("tito",5))

titotitotitotitotito


***5. prefijos, sufijos y segmentos***

Esta propiedad sera muy util para cuando trabajemos con automatas

dados `x` e `y`, palabras de 
$$
\sum^{*}
$$

donde `y` es un segmento de x si existen `u` y `v` tales que 
$$
x=uyv
$$

si
$$
u=\lambda
$$
entonces y es un `prefijo` de x

si 
$$
v=\lambda
$$

entonces y es un `sufijo` de x

In [52]:
def prefijos(cadena):
    if cadena == "":
        return ['λ']
    else:
        prefijos_cadena_menor = prefijos(cadena[:-1])
        return prefijos_cadena_menor + [cadena]
    
def sufijos(cadena):
    if cadena == "":
        return ['λ']
    else:
        sufijos_cadena_menor = sufijos(cadena[1:])
        return sufijos_cadena_menor + [cadena]


def segmentos_recursivos(cadena):
    if cadena == "":
        return ['λ']
    segmentos_lista = []
    for i in range(len(cadena)):
        segmentos_lista.append(cadena[i:])
    return segmentos_lista+segmentos_recursivos(cadena[:-1])

def segmentos_iterativos(cadena):
    segmentos_lista = []
    for i in range(len(cadena)):
        for j in range(i+1, len(cadena)+1):
            segmentos_lista.append(cadena[i:j])
    return segmentos_lista + ['λ']

print(sufijos("tito"))
print(prefijos("prefijos"))
print(segmentos_recursivos("abc"))
print(segmentos_iterativos("abc"))

['λ', 'o', 'to', 'ito', 'tito']
['λ', 'p', 'pr', 'pre', 'pref', 'prefi', 'prefij', 'prefijo', 'prefijos']
['abc', 'bc', 'c', 'ab', 'b', 'a', 'λ']
['a', 'ab', 'abc', 'b', 'bc', 'c', 'λ']


***6. reverso***

La palabra escrita en "sentido contrario"

matematicamente:
$$
\lambda^r =\lambda
$$

$$
a^r =a
$$

donde `a` es un simbolo de algun abecedario

para definirlo recursivamente usamos:
$$
(xa)^r = ax^r
$$

In [33]:
def reverso(cadena):
    if cadena == "":
        return ""
    else:
        return cadena[-1] + reverso(cadena[:-1])
    
print(reverso("tito"))

otit


con esta operacion podemos definir las palabras `capicua`, que son todas esas palabras que cumplen:
$$
{palabra}^r=palabra
$$

por ejemplo, en el idioma ingles, tenemos:
$$
\sum_{ingles} = \{dad,mom,eye\}
$$

## Conceptos Basicos

***1. Ordenacion***

cuando una palabra es menor o mayor que otra?
si tenemos dos palabras, la menor es la que tiene una menor longitud

si pensamos en `hola` y `mundo`, la palabra hola se presentara antes en un conjunto ordenado que la palabra mundo, ya que tiene una menor longitud.

Si dos palabras tienen la misma longitud, tomamos simbolo por simbolo y eligiremos antes la palabra que contenga el simbolo que aparezca primero en la definicion del abecedario:
$$
sol,sal
$$

en ambos casos las palabras empiezan por s, asi que miramos el segundo simbolo, 'o' y 'a', a aparece primero en nuestro abecedario, asi que el orden sera:
$$
\{sol,sal\}
$$

$$
\begin{equation*}
x<y = \begin{cases}
|x| < |y| \\
(x=uav,y=ubw,a<\Sigma b)
\end{cases}
\end{equation*}
$$

***2. Combinaciones***

si queremos representar las palabras de longitud uno, lo hariamos de la siguiente manera:
$$
\sum_{abecedario}^{1}
$$
hagamos un ejemplo con el abecedario `binario`:
$$
\sum_{binario}^{2} = \{00,01,10,11\}
$$

combinacion cero:

$$
\sum_{binario}^{0} = \{\lambda\}
$$

El numero de combinaciones posibles en un abecedario es:
$$
|abecedario|^{longitud}
$$


podemos englobar todos estos numeros en la clausura de kleene, que recoge todas las palabras de cuqlueir longitud sobre cualquier alfabeto.
$$
\sum_{alfabeto}^{*}
$$

tambien tenemos otra definicion comun:
$$
\sum_{alfabeto}^{+}=\sum_{alfabeto}^{*}- \{\lambda\}
$$

Con todo esto, podemos ver la definicion de lenguaje.

### Lenguaje

Un lenguaje `L` es un subconjunto de
$$
\sum^*
$$

sobre un alfabeto, que puede ser `finito` si contiene un numero finito de palabras o `infinito` si no tiene un numero finito de palabras

un lenguaje infinito, por ejemplo, todas las palabras que empiecen por `a` en nuestro idioma:

$$
L = \{ax\ |\ x \in \sum^*_{español}\}
$$

Un lenguaje finito, por ejemplo, todas las palabras con una longitud menor a 5

$$
L = \{x \in \sum^*_{español}:|x|<5\}
$$

Otros dos lenguajes formales, serian:

**El conjunto vacio**
$$
L=\emptyset
$$

**La calusura de Kleene** (contiene todas las palabras posibles)
$$
L=\sum^*
$$

hablemos nuevamente de lenguaje

un lenguaje `L` es un subconjunto de $$ \sum^* $$

Como son conjuntos, podemos aplicar operaciones de conjuntos

por ejemplo:

$$
L_1 = \{ax: x \in \sum_{esp}^8\} \space (palabras \space que \space inician \space por \space a)

\newline

L_2 = \{xa: x \in \sum_{esp}^8\} \space (palabras\space que \space acaban \space por \space a)
$$

***Union***

su union son todas las palabras que empiezan `o` terminan en a, o ambas.

***Interseccion***

su interseccion son todas las palabras que empiezan `y` terminan en a.


***en realidad podemos aplicar cualquier operacion entre conjuntos, complementario, diferencia, diferencia simetrica***

Una de las operaciones definidas en lenguajes es el 

***producto***

reescribamos los lenguajes:

$$
L_1 = \{a,aa,ab,aaa,aab...\}
\newline
L_2 = \{a,aa,ba,aaa,aba...\}

\newline
L_1*L_2\{aa,aaa,aba,aaaa,aaba...\}
$$
su producto es concatener todas sus palabras entre si

como muchas veces operamos sobre lenguajes infinitos, debemos tener la capacidad para predecir las caracteristicas que tendra el lenguaje resultante, por ejemplo, en este caso obtendremos todas las palabras que comiencen por a y acaben por a

$$
L_1*L_2=\{axa:x\in \sum_{esp}^*\}
$$

In [2]:
def producto(lenguaje1, lenguaje2):
    resultado = []
    for cadena1 in lenguaje1:
        for cadena2 in lenguaje2:
            resultado.append(cadena1 + cadena2)
    return resultado
print(producto(["a","b"],["c","d"]))

['ac', 'ad', 'bc', 'bd']


***Potencia sobre lenguajes***
$$
\begin{equation*}
L^n = \begin{cases}
\{\lambda\}, n=0 \\ 
L^{-1}*L, n>0
\end{cases}
\end{equation*}
$$

In [3]:
def potencia_sobre_lenguaje(lenguaje, n):
    if n == 0:
        return ['λ']
    else:
        lenguaje_menor = potencia_sobre_lenguaje(lenguaje, n-1)
        resultado = []
        for palabra in lenguaje:
            for palabra_menor in lenguaje_menor:
                resultado.append(palabra + palabra_menor)
        return resultado
    
print(potencia_sobre_lenguaje(['a','b'],2))

['aaλ', 'abλ', 'baλ', 'bbλ']


***cierre***

$$
L^* = \cup L^i
$$

por decirlo de una forma sencilla, es la union de todas sus potencias!

$$
L^* = L^0 \cup L^1 \cup L^2 \cup L^3 ...
$$

In [4]:
def cierre(lenguaje,n):
    if n == 0:
        return ['λ']
    else:
        return cierre(lenguaje,n-1) + potencia_sobre_lenguaje(lenguaje,n)
print(cierre(['a','b'],3))

['λ', 'aλ', 'bλ', 'aaλ', 'abλ', 'baλ', 'bbλ', 'aaaλ', 'aabλ', 'abaλ', 'abbλ', 'baaλ', 'babλ', 'bbaλ', 'bbbλ']
