### 3.1. (Reconstruint text)
Es donen una cadena de $n$ caràcters $s[1..n]$, que pot ser un text on totes les separacions entre mots ha desaparegut, per exemple *aquestafrasequepodiaserunexemple*. Volem reconstruir el text original amb ajut d'un diccionari $D(\cdot)$, tal que per a tot mot possible $w$$$D(w) =
\begin{cases}
  \text{cert} & \text{si } w \text{ és un mot vàlid} \\
  \text{fals} & \text{altrament}
\end{cases}$$

$(a)$ Doneu un algorisme de programació dinàmica que determini si la cadena $s[\cdot]$ es pot reconstruir com a una seqüència de mots vàlids. Si assumim que les crides a $D$ es poden fer en temps $\Theta(1)$. Quina és la complexitat del vostre algorisme?

$(b)$ Si la cadena és vàlida, fes que el teu algorisme escrigui la frase correcta, amb separacions entre mots.

#### Apartat a:
##### Caracterització del problema
Tenim un diccionari $D$ que ens diu si una seqüència de caracters es reconeix com una paraula o no. També ens donen una seqüència $s$ de caracters. La idea del problema es intentar dividir $s$ en paraules reconegudes pel diccionari $D$. Per fer-ho utilitzaré un array tal que $DP[k]$ --> *La secuencia de caracters composada desde $s[k...n]$ es pot dividir en paraules del diccionari $D$*.

##### Trovar una recurrencia
*Cas base:* k > n
$$\text{Es la paraula buida, per tant, }DP[k] = cert$$

*Cas recursiu:* k <= n
$$DP[k] = \bigvee_{k \le j \le n} ( D(s[k..j]) \land DP[j+1] )$$

##### Algoritme topdown

In [6]:
def existe_segmentacion_topdown(s, D, i=0, memo=None):
    """
    Verifica si la cadena s puede ser segmentada en palabras del diccionario D
    comenzando desde el índice i utilizando memoización. Es la versión top-down
    """
    if memo is None:
        memo = {}
    if i == len(s):
        return True
    if i in memo:
        return memo[i]
    
    for j in range(i + 1, len(s) + 1):
        palabra = s[i:j]
        if palabra in D and existe_segmentacion_topdown(s, D, j, memo):
            memo[i] = True
            return True
    memo[i] = False
    return False

##### Algoritme bottomup:

In [7]:
def existe_segmentacion_bottomup(s, D):
    """
    Verifica si la cadena s puede ser segmentada en palabras del diccionario D
    utilizando programación dinámica bottom-up.
    """
    n = len(s)
    dp = [False] * (n + 1)
    dp[0] = True  # cadena vacía = válida
    
    for i in range(1, n + 1):
        for j in range(i):
            if dp[j] and s[j:i] in D:
                dp[i] = True
                break
    return dp[n]

Com es pot observar en la solució ``topdown``, estem **memoïtzant** per a quins **sufixos** de la cadena $s$ original tenim una descomposició en paraules vàlides a base de crides **recursives** per anar als subproblemes. En canvi, en la solució ``bottomup`` comencem des dels subproblemes (els prefixes o sufixos més petits) fins a arribar al problema a solucionar.

##### Cost de cada solució
Totes dugues solucions tenen cost:
- Cost temporal: $O(n^2)$
- Cost en memoria: $O(n)$

#### Apartat b:
Per la reconstrucció de la solució he creat el següent codi pel cas de ``topdown``:

In [8]:
def reconstruir_frase_topdown(s, D, i=0, memo=None):
    """
    Reconstruye una frase segmentada de la cadena s utilizando palabras del
    diccionario D comenzando desde el índice i utilizando memoización. Es la
    versión top-down
    """
    if memo is None:
        memo = {}
    if i == len(s):
        return ""
    if i in memo:
        return memo[i]
    
    for j in range(i + 1, len(s) + 1):
        palabra = s[i:j]
        if palabra in D:
            resto = reconstruir_frase_topdown(s, D, j, memo)
            if resto is not None:
                if resto == "":
                    memo[i] = palabra
                else:
                    memo[i] = palabra + " " + resto
                return memo[i]
    memo[i] = None
    return None

Si us fixeu l'únic que canvia es el fet de que en comptes de guardar *true* o *false* lo que guardem es les *paraules* que fan la descomposición des de cada index $k$ fins a $n$ en la seqüència $s$ original. 

Aquesta es la versió ``bottomup``:

In [9]:
def reconstruir_frase_bottomup(s, D):
    """
    Reconstruye una frase segmentada de la cadena s utilizando palabras del
    diccionario D utilizando programación dinámica bottom-up.
    """
    n = len(s)
    dp = [False] * (n + 1)
    prev = [-1] * (n + 1)
    dp[0] = True
    
    for i in range(1, n + 1):
        for j in range(i):
            if dp[j] and s[j:i] in D:
                dp[i] = True
                prev[i] = j
                break
    
    if not dp[n]:
        return None
    
    # reconstruir frase hacia atrás
    palabras = []
    i = n
    while i > 0:
        j = prev[i]
        palabras.append(s[j:i])
        i = j
    palabras.reverse()
    return " ".join(palabras)

##### Correctessa
Aquest problema es fonamenta en la propietat de la subestructura òptima. Per tant, com la nostra recurrència es correcta pel cas base, i també pels subproblemes, llavors es correcta per la versió completa del problema.