# Test Técnico Consorcio

<h2> Autor: Pablo Calcumil Alarcón </h2>
<h4> Fecha: 11 de Marzo de 2024 </h4>

<hr>

## ___Parte 1___

### Enunciado

Después de años de estudio, los científicos han descubierto una lengua extraterrestre transmitida desde un planeta lejano. El lenguaje alienígena es único en el sentido en que cada palabra es única ya que consta exactatemente de __L__ letras minúsculas. Además, hay exactamente __D__ palabras en este idioma.

Una vez que se construyó el diccionario de todas las palabras en el idioma alienígena, el siguiente avance fue descubrir que los alienígenas han estado transmitiendo mensajes a la Tierra durante la última decada. Desafortunadamente, estas señales se debilitan debido a la distancia entre nuestros dos planetas y algunas de las palabras pueden malinterpretarse. Para ayudarlos a descifrar estos mensajes, los científicos te han pedido que diseñes un algoritmo que determinará el número de posibles interpretaciones para un patrón dado.

Un patrón consta de __L__ tokens. Cada token es una sola letra minúscula (los científicos están seguros de que esta es la letra) o un grupo de letras únicas. Por ejemplo: __(ab)d(dc)__ significa que la primera letra es la __a__ o __b__, la segunda letra es definitivamente la __d__ y la última letra es __d__ o __c__. Por lo tanto, el patrón __(ab)d(dc)__ puede representar cualquiera de estas 4 posibilidades: __add__, __adc__, __bdd__ y __bdc__.

<br>

### Entrada

La primera línea de entrada contiene 3 números enteros __L__, __D__ y __N__ separados por un espacio. Siguen __D__ líneas, cada una con una palabra de longitud __L__. Estas son palabras que se sabe que existen en lengua alienígena, luego siguen __N__ casos de prueba, cada uno en su propia línea y cada uno consiste en un patrón descrito anteriormente. ___Puede suponer que que todas las palabras conocidas proporcionadas son únicas___.

<br>

### Salida

Para cada caso de prueba, la salida

Case #X: K

donde X es el número del caso de prueba, empezando por 1 y K indica cuántas palabras en el lenguaje alien cumplen con el patrón:

<div align="center" style="font-size: 150%">
<table>
  <thead>
    <tr>
      <td rowspan=4 align="center"><strong> Entrada </strong></td>
      <td rowspan=4 align="center"><strong> Salida </strong></td>
    </tr>
  </thead>
  <tbody>
    <tr>
      <td rowspan=4>3 5 4</td>
      <td rowspan=4>Case #1: 2</td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>abc</td>
      <td rowspan=4>Case #2: 1</td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>bca</td>
      <td rowspan=4>Case #3: 3</td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>dac</td>
      <td rowspan=4>Case #4: 0</td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>dbc</td>
      <td rowspan=4></td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>cba</td>
      <td rowspan=4></td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>(ab)(bc)(ca)</td>
      <td rowspan=4></td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>abc</td>
      <td rowspan=4></td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>(abc)(abc)(abc)</td>
      <td rowspan=4></td>
    </tr>
  </tbody>
  <tbody>
    <tr>
      <td rowspan=4>(xyz)(bc)</td>
      <td rowspan=4></td>
    </tr>
  </tbody>
</table>
</div>

<br>
<br>

### Entregables

* Programa en Python que cumpla con el algoritmo que determinará el número de posibles interpretaciones para un patrón dado. ___(No utilizar librerías de ningún tipo)___.

* Código fuente documentado y autodescriptivo (En repositorio Github). El repositorio debe incluir un archivo README con toda la información que se estime relevante.

<br>

### Pista:

En la entrada la primera línea "3 4 5" indica lo que viene a continuación, lo que constituye toda la entrada. Entonces el 3 dice que las palabras son de largo 3, el siguiente significa  que solo existen 5 palabras, y finalmente que en la entrada vienen 4 casos de prueba.




### Funciones

Las siguientes funciones forman el algoritmo que determina el número de posibles interpretaciones.

In [1]:
def possible_words(lista):
  '''
  Esta funcion forma una lista con todas las palabras que se puedan formar con los patrones entregados.

  Inputs:
      lista (list): Lista con un patron seccionado por la funcion break_patterns, es decir, la lista
                    contiene los tokens unicos separados, mientras que el grupo de posibles tokens
                    los tiene juntos para poder formar las distintas combinaciones con ellos.

  Outputs:
      list_final (list): Lista con todas las posibles combinaciones formadas por los tokens posibles
                         y los tokens seguros.
  '''
  #Lista final con las combinaciones de las posibles palabras
  list_final = []
  #Se recorren las diferentes letras de la palabra
  for char in lista:
    #Lista auxiliar para no mezclar la lista final
    list_aux = list_final.copy()
    #Caso donde las letras van si o si en la palabra
    if len(char) == 1:
      #Por si el patron empieza con una letra que si o si va en la palabra
      if len(list_aux) == 0:
        list_aux.append(char)
      #Por si la letra segura va despues del comienzo
      else:
        list_aux = [character + char for character in list_aux]
    #Caso de las posibles letras (Combinaciones)
    else:
      #Lista con ramificaciones de las combinaciones de las palabras para cada posible letra (Se trabaja como matriz)
      list_aux2 = [list_aux.copy() for i in range(len(char))]
      #Se recorre cada lista para formar las ramificaciones con las distintas letras
      for i in range(0, len(char)):
        #Por si el patron comienza con una combinacion de letras
        if len(list_aux2[i]) == 0:
          list_aux2[i].append(char[i])
        #Por si la combinacion de letras es despues del comienzo
        else:
          list_aux2[i] = [element + char[i] for element in list_aux2[i]]
      #Cambiamos dimension de matriz a vector (para tener solo una lista de las combinaciones)
      list_aux = [element for sublist in list_aux2 for element in sublist]
    #Copiamos para entregar a la lista final
    list_final = list_aux.copy()
  return list_final

#---------------------------------------------------------------------------------------------------------------------------

def break_patterns(string):
  '''
  Esta funcion agrega a una lista todas los tokens del patron, pero hace la distincion entre el grupo de posibles tokens
  y los tokens que seguro van en el patron. Cuando se topa con el grupo de tokens (presencia de parentesis), esta los
  agrega a la lista unidas, para diferenciar cuando se agrega una combinacion de posibles tokens en el patron, en cambio
  si los tokens van seguras, los agrega solos.

  Inputs:
      string (str): Patron de prueba para el idioma alienigena.

  Outputs:
      final_list (list): Lista de strings, donde cada string es un token de las palabras, o una combinacion de posibles
                         tokens.
  '''
  #Lista final y contador para el while
  final_list, count = [], 0
  #Nos mantenemos en el while hasta que el contador sea mayor al largo del string
  while count < len(string):
    #Tomamos el string por su posicion para trabajar
    sub_string = string[count]
    #Si nos topamos con un abrir parentesis, es por el grupo de posibles letras en el patron
    if sub_string == '(':
      #Empezamos a capturar el grupo de posibles letras en el patron
      str_aux = string[count + 1]
      for str_aux2 in string[count + 2 :]:
        #Si nos encontramos con el cierre de parentesis ya capturamos todo el grupo de posibles letras
        if str_aux2 == ')':
          break
        #Caso contrario lo unimos al grupo
        else:
          str_aux = str_aux + str_aux2
      #Capturamos el grupo completo de posibles letras del patron y agregamos a la lista final
      final_list.append(str_aux)
      #Sumamos sus posiciones para no encontrarnos nuevamente con el grupo (+2 por las posiciones de los parentesis)
      count = count + len(str_aux) + 2
    #Caso donde las letras son 100% seguras de que van en la palabra, agregamos directamente a la lista final
    else:
      final_list.append(sub_string)
      #Sumamos posicion
      count = count + 1
  return final_list

#---------------------------------------------------------------------------------------------------------------------------

def pattern_interpreter(texto):
  '''
  Esta funcion entrega el número de posibles interpretaciones de un patrón dado, para el idioma alienigena captado por
  los cientificos.

  Inputs:
      texto (str): Texto con primera linea los numeros L, D y N, donde L es el largo de las palabras, D es la cantidad
                   de palabras que tiene el idioma y L es la cantidad de patrones de prueba.

  Outputs:
      Sin outputs. Esta funcion printeara la cantidad de posibles interpretaciones de las pruebas de patrones realizadas.
  '''
  #Lineas del texto
  lines_text = texto.splitlines()
  #Capturando informacion (L: largo palabras del idioma, D: idioma, N: patrones)
  L, D, N = lines_text[0].split()
  L, D, N = int(L), int(D), int(N)
  #------------------------ Capturando el idioma ------------------------
  #Se pensaba usar compresion, pero si la palabra no cumple el largo se sale de la funcion
  list_languaje = []
  for i in range(1, D + 1):
    #Si no se cumple largo, OUT
    if len(lines_text[i]) != L:
      return f'Largo equivocado de la palabra "{lines_text[i]}" en el idioma alienigena!'
    #Si se cumple el largo agregamos la palabra a la lista conformada por el idioma
    else:
      list_languaje.append(lines_text[i])
  #------------------------- Capturando patrones ------------------------
  list_pattern = [lines_text[i] for i in range(D + 1, D + 1 + N)]
  #----------------- Contando posibles interpretaciones -----------------
  #Se realiza el conteo de las posibles interpretaciones
  for i, patron in enumerate(list_pattern):
    #Se secciona el patron en partes indicando tokens seguros y combinacion de posibles tokens
    list_break_patterns = break_patterns(patron)
    #Se forma lista con todas las posibles combinaciones formadas por el patron entregado
    list_possible_words = possible_words(list_break_patterns)
    #Se realiza una interseccion de conjuntos para sumar las posibles interpretaciones
    count_possible_interp = len(set(list_possible_words).intersection(set(list_languaje)))
    #Printeamos como se debe
    print(f'Case {i + 1}#: {count_possible_interp}')

#---------------------------------------------------------------------------------------------------------------------------

### Pruebas

Se desarrollan algunas pruebas.

In [2]:
text = '''3 5 4
abc
bca
dac
dbc
cba
(ab)(bc)(ca)
abc
(abc)(abc)(abc)
(xyz)(bc)'''

pattern_interpreter(text)

Case 1#: 2
Case 2#: 1
Case 3#: 3
Case 4#: 0


In [3]:
text2 = '''5 6 4
abcde
edabc
dabbe
bcdeb
aaaaa
bdabd
(abcde)(abcde)(abcde)(abcde)(abcde)
dabbe
(abcde)dab(abc)
(ab)(bcd)(acd)(xyt)a
'''
pattern_interpreter(text2)

Case 1#: 6
Case 2#: 1
Case 3#: 1
Case 4#: 0


In [4]:
text3 = '''3 5 4
abc
bca
ddd
xyd
xya
x(ad)y
(abd)(bcd)(acd)
xy(abc)
(dxy)y(ad)
'''

pattern_interpreter(text3)

Case 1#: 0
Case 2#: 3
Case 3#: 1
Case 4#: 2


<hr>

El largo de las palabras del idioma pareciera ser importante, mientras que para el patrón no (hay un ejemplo donde el largo es de 2 para el patrón, y para el idioma es de 3). Es por ello que se agrega un condicional en el largo del lenguaje y si este no se cumple la funcion retorna sin contar.

Ejemplo:

In [5]:
text4 = '''2 3 2
ab
ad
acv
(ab)(cd)
ac
'''

pattern_interpreter(text4)

'Largo equivocado de la palabra "acv" en el idioma alienigena!'

<hr>

### ___Anotaciones y Dudas___

1. Para la conformación de la lengua alienígena el parámetro ___L___ determina el largo de las palabras (cantidad de tokens), es por ello que se le da un rol importante a la hora de ingresar las palabras. Si este largo no se cumple, el programa no sigue con el conteo. Por otro lado, para los patrones es distinto, pues hay un ejemplo en el documento donde se indica que el largo de las palabras es de 3, mientras que el patrón sugiere palabras de largo 2 `(xyz)(bc)`, por lo que se puede ver que el largo del patrón no tiene importancia, así que se omite.

2. Qué ocurre si en la conformación del idioma se entrega una palabra repetida? Se suma como posible interpretación o no?

> En el documento se indica que se puede asumir la no repetición de las palabras en el idioma, pero si esto no se debe asumir el código no cambia mucho. Solo se debe ver si se suma como posible interpretación o no, pues para entregar este número se uso la intersección de conjuntos de Python, pero se trabajó mayoritariamente con listas, por lo que se debe cambiar la forma de sumar estas intersecciones en caso de que haya palabras repetidas y estas si contasen como otra posible interpretación.

3. Durante el desarrollo se asumió que la entrega del algoritmo sería solo un string, pero si la entrega al algoritmo es un archivo, solo se agrega `with open(file_name, "r") as file:` a la función `pattern_interpreter()`, y se sigue leyendo con el `.splitlines()`. Por otro lado, utilizando la función `input()`, se puede entregar por consola los números, las palabras del idioma y los patrones.