
# ðŸ§  String Interview Playbook â€” do bÃ¡sico ao avanÃ§ado

Este notebook reÃºne **problemas clÃ¡ssicos e alguns avanÃ§ados de strings**, cada um com **3 versÃµes**:

- **Newbie**: direta, didÃ¡tica â€” Ã s vezes menos eficiente.
- **Fodona**: soluÃ§Ã£o Ã³tima/algorÃ­tmica (janela deslizante, DP, KMP, Manacher, etc.).
- **PythÃ´nica apelona**: usando o poder da linguagem (ex.: `Counter`, `sorted`, `re`) â€” *quando a entrevista permitir*.

Para cada problema hÃ¡ **explicaÃ§Ã£o**, **complexidade** e **perguntas tÃ­picas** de entrevista.


In [62]:

def run_tests(func, cases):
    for i, (args, expected) in enumerate(cases, 1):
        if not isinstance(args, tuple):
            args = (args,)
        got = func(*args)
        assert got == expected, f"case {i} failed: got={got}, expected={expected}, args={args}"
    "âœ“ all tests passed"


## 1) Reverter string

Reverter uma string significa produzir uma nova sequÃªncia com os caracteres na ordem inversa. Ã‰ uma operaÃ§Ã£o essencial para validar palÃ­ndromos, implementar pilhas manuais, fazer parsing de nÃºmeros escritos ao contrÃ¡rio e aparece como aquecimento em entrevistas.
**Exemplo:** se `s = "algoritmo"`, a resposta esperada Ã© `"omtirogla"`.

O detalhe sutil Ã© que, em Python, `str` Ã© imutÃ¡vel: nÃ£o conseguimos trocar caracteres in-place. Por isso todas as abordagens aqui trabalham sobre uma estrutura auxiliar (lista) ou devolvem uma nova string. Todas custam tempo linear `O(n)`, porque cada caractere precisa ser visitado ao menos uma vez.


### Newbie

Esta versÃ£o expÃµe a mecÃ¢nica bÃ¡sica de inverter uma string, ideal para explicar dois ponteiros.

**Passos principais**
1. Converter a string imutÃ¡vel em lista (`list(s)`) para permitir trocas.
2. Iniciar dois Ã­ndices, um no comeÃ§o (`i`) e outro no fim (`j`).
3. Trocar `a[i]` com `a[j]`, avanÃ§ar `i += 1` e recuar `j -= 1` repetindo atÃ© que `i >= j`.
4. Reconstruir a string com `"".join(a)`.

**Exemplo rÃ¡pido:** `"abcd"` vira `['a','b','c','d']` â†’ troca `(0,3)` â†’ troca `(1,2)` â†’ `"dcba"`.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` para a lista temporÃ¡ria.


In [35]:

def reverse_string_newbie(s: str) -> str:
    a = list(s)
    i, j = 0, len(a) - 1
    while i < j:
        a[i], a[j] = a[j], a[i]
        i += 1; j -= 1
    return "".join(a)

# quick tests
assert reverse_string_newbie("abc") == "cba"


### Fodona

A versÃ£o "fodona" assume a mesma estratÃ©gia dos dois ponteiros, porÃ©m com foco em invariantes e clareza de variÃ¡veis, como pediriam em uma entrevista presencial.

**RaciocÃ­nio:** enquanto `l < r`, os elementos `a[l]` e `a[r]` estÃ£o fora do lugar. Ao trocÃ¡-los garantimos que as posiÃ§Ãµes exteriores jÃ¡ ficam corretas. O algoritmo termina quando a janela se fecha, garantindo que todos os pares foram permutados exatamente uma vez.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` por causa da conversÃ£o da string em lista mutÃ¡vel.


In [36]:

def reverse_string_fodona(s: str) -> str:
    a = list(s)
    l, r = 0, len(a) - 1
    while l < r:
        a[l], a[r] = a[r], a[l]
        l += 1; r -= 1
    return "".join(a)


### PythÃ´nica apelona

Quando a entrevista permite usar recursos de linguagem, `s[::-1]` Ã© a forma mais sucinta e rÃ¡pida em Python para reverter strings.

**Por que funciona:** o slicing com passo `-1` instrui o interpretador a percorrer a sequÃªncia do fim para o comeÃ§o, alocando uma nova string com os caracteres na ordem inversa.

**Complexidade:** tempo `O(n)` (cada caractere Ã© copiado uma vez); espaÃ§o `O(n)` (a nova string).


In [37]:

def reverse_string_pythonica(s: str) -> str:
    return s[::-1]


## 2) Verificar anagramas sem `sorted`

Um anagrama Ã© uma permutaÃ§Ã£o das letras de outra palavra ou frase. "Roma" e "Amor", por exemplo, sÃ£o anagramas porque usam as mesmas letras com a mesma multiplicidade. Entrevistadores gostam da pergunta porque ela exige raciocinar sobre contagem de frequÃªncias e domÃ­nio de caracteres, alÃ©m de evitar a soluÃ§Ã£o fÃ¡cil `sorted(a) == sorted(b)`.

Analisar anagramas revela diferentes trade-offs: dicionÃ¡rios funcionam para qualquer conjunto de sÃ­mbolos, enquanto arrays fixos sÃ£o ultra rÃ¡pidos quando o alfabeto Ã© conhecido (apenas `a..z`). Todas as versÃµes aqui executam em tempo linear `O(n)`, mas o espaÃ§o varia conforme a estrutura auxiliar.


### Newbie

Primeiro construÃ­mos um contador de frequÃªncias com `dict` para `a` e depois "descontamos" os caracteres de `b`.

**Passos principais**
1. Se tamanhos divergem, nÃ£o sÃ£o anagramas.
2. Contar cada letra de `a` usando `cnt[ch] = cnt.get(ch, 0) + 1`.
3. Para cada letra em `b`, decrementar. Se alguma contagem ficar negativa ou inexistente, falha.
4. Se terminamos sem inconsistÃªncias, as duas strings usam os mesmos caracteres com a mesma multiplicidade.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` onde `k` Ã© a quantidade de sÃ­mbolos distintos.


In [38]:

def is_anagram_newbie(a: str, b: str) -> bool:
    if len(a) != len(b): return False
    cnt = {}
    for ch in a:
        cnt[ch] = cnt.get(ch, 0) + 1
    for ch in b:
        if cnt.get(ch, 0) == 0:
            return False
        cnt[ch] -= 1
    return True


### Fodona (array 26)

Quando sabemos que o alfabeto Ã© apenas `a..z`, substituÃ­mos o `dict` por um vetor de tamanho fixo, o que economiza constante e evita hashing.

**Passos principais**
1. Mapear cada caractere para `idx = ord(ch) - ord('a')`.
2. Incrementar contagens para `a`, decrementar para `b`.
3. Se algum caractere sair do intervalo `0..25`, voltamos para a versÃ£o genÃ©rica.
4. No final, verificar se todas as contagens zeraram.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(1)` (o vetor tem tamanho constante).


In [39]:

def is_anagram_fodona(a: str, b: str) -> bool:
    if len(a) != len(b): return False
    base = ord('a')
    freq = [0]*26
    for ch in a:
        idx = ord(ch)-base
        if 0 <= idx < 26:
            freq[idx]+=1
        else:
            return is_anagram_newbie(a,b)
    for ch in b:
        idx = ord(ch)-base
        if 0 <= idx < 26:
            freq[idx]-=1
            if freq[idx]<0: return False
        else:
            return is_anagram_newbie(a,b)
    return all(v==0 for v in freq)


### PythÃ´nica apelona

`collections.Counter` encapsula a lÃ³gica de contagem em C e Ã© ideal quando a entrevista aceita bibliotecas da stdlib.

**Uso:** `Counter(a) == Counter(b)` compara dicionÃ¡rios de contagem, respeitando multiplicidades e ignorando ordem.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para armazenar as frequÃªncias.


In [40]:

from collections import Counter
def is_anagram_pythonica(a: str, b: str) -> bool:
    return Counter(a) == Counter(b)


## 3) Primeiro caractere nÃ£o repetido

O objetivo Ã© encontrar o Ã­ndice da primeira letra que aparece exatamente uma vez na string. O problema testa se vocÃª sabe combinar contagem de frequÃªncias com uma segunda passada para encontrar a resposta.

Use casos reais: identificar o primeiro caractere Ãºnico em identificadores, encontrar o primeiro usuÃ¡rio nÃ£o duplicado em uma lista, detectar sinais de ruÃ­do em streams. O algoritmo clÃ¡ssico faz duas passadas e usa memÃ³ria proporcional ao nÃºmero de caracteres distintos.


### Newbie

A estratÃ©gia clÃ¡ssica faz duas passadas: contar e depois encontrar o Ã­ndice do primeiro caractere Ãºnico.

**Passos principais**
1. Construir `cnt[ch]` com o nÃºmero de ocorrÃªncias de cada caractere.
2. Percorrer novamente `s` e retornar o primeiro Ã­ndice `i` tal que `cnt[s[i]] == 1`.
3. Se nenhum caractere atender ao critÃ©rio, devolvemos `-1`.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o mapa de frequÃªncias.


In [41]:

def first_unique_index_newbie(s: str) -> int:
    cnt = {}
    for ch in s:
        cnt[ch] = cnt.get(ch, 0) + 1
    for i, ch in enumerate(s):
        if cnt[ch] == 1:
            return i
    return -1


### Fodona (26)

Restringindo para letras minÃºsculas, guardamos duas informaÃ§Ãµes em vetores: a posiÃ§Ã£o da primeira ocorrÃªncia e o nÃºmero de ocorrÃªncias.

**RaciocÃ­nio:** ao percorrer `s`, atualizamos `first[idx]` (se ainda nÃ£o definido) e incrementamos `count[idx]`. No fim, basta olhar qual Ã­ndice aparece exatamente uma vez e tem menor posiÃ§Ã£o.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(1)` por manter vetores de tamanho constante.


In [42]:

def first_unique_index_fodona(s: str) -> int:
    first = [-1]*26
    count = [0]*26
    base = ord('a')
    for i, ch in enumerate(s):
        idx = ord(ch)-base
        if 0 <= idx < 26:
            if first[idx] == -1: first[idx] = i
            count[idx] += 1
        else:
            return first_unique_index_newbie(s)
    ans = 10**9
    for k in range(26):
        if count[k]==1: ans = min(ans, first[k])
    return -1 if ans==10**9 else ans


### PythÃ´nica apelona

Com `Counter` podemos esconder a contagem de frequÃªncias e focar na segunda passada.

**Uso tÃ­pico:**
```python
cnt = Counter(s)
for i, ch in enumerate(s):
    if cnt[ch] == 1:
        return i
```

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o contador.


In [43]:

from collections import Counter
def first_unique_index_pythonica(s: str) -> int:
    cnt = Counter(s)
    for i,ch in enumerate(s):
        if cnt[ch]==1: return i
    return -1


## 4) PalÃ­ndromo vÃ¡lido (ignora nÃ£o-alfaNum; case-insensitive)

PalÃ­ndromos sÃ£o palavras ou frases que lidas de trÃ¡s para frente produzem a mesma sequÃªncia. Quando ignoramos acentuaÃ§Ã£o, pontuaÃ§Ã£o e caixa, "Socorram-me subi no Ã´nibus em Marrocos" continua sendo palÃ­ndromo.

Na entrevista, o desafio estÃ¡ em filtrar apenas caracteres alfanumÃ©ricos e normalizar para caixa Ãºnica antes de comparar. As abordagens variam entre usar dois ponteiros e construir uma nova sequÃªncia filtrada.


### Duas pontas

O truque Ã© ignorar tudo o que nÃ£o for alfanumÃ©rico e comparar caracteres jÃ¡ normalizados em caixa baixa.

**Passos principais**
1. Iniciar `i` no comeÃ§o e `j` no fim.
2. AvanÃ§ar `i` enquanto `s[i]` nÃ£o for alfanumÃ©rico; o mesmo para `j`.
3. Quando ambos apontarem para letras ou dÃ­gitos, comparar `s[i].lower()` com `s[j].lower()`.
4. Repetir atÃ© que `i >= j`.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(1)` (apenas Ã­ndices).


In [44]:

def is_palindrome_valid(s: str) -> bool:
    i, j = 0, len(s)-1
    while i < j:
        while i < j and not s[i].isalnum(): i+=1
        while i < j and not s[j].isalnum(): j-=1
        if s[i].lower() != s[j].lower(): return False
        i+=1; j-=1
    return True


### PythÃ´nica apelona

Podemos escrever a mesma ideia de forma declarativa montando uma lista filtrada.

**Passos:**
1. Construir `t = [c.lower() for c in s if c.isalnum()]`.
2. Verificar se `t == t[::-1]`.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` devido Ã  lista filtrada.


In [45]:

def is_palindrome_pythonica(s: str) -> bool:
    t = [c.lower() for c in s if c.isalnum()]
    return t == t[::-1]


## 5) Maior substring sem repetir caracteres

Dada uma string, queremos o comprimento da maior substring (contÃ­gua) sem caracteres repetidos. Esse problema Ã© o cartÃ£o de visitas da tÃ©cnica de janela deslizante.

Exemplo clÃ¡ssico: para `"abcabcbb"`, a resposta Ã© `3` ("abc"). Esse tipo de lÃ³gica aparece em sistemas de stream, buffers de rede e validaÃ§Ã£o de tokens. A dificuldade estÃ¡ em manter o estado da janela sem reprocessar tudo a cada passo.


### Newbie (set + move)

Ã‰ a versÃ£o pedagÃ³gica da janela deslizante. Mantemos um `set` com os caracteres atuais e dois ponteiros que delimitam a janela sem repetiÃ§Ã£o.

**Passos principais**
1. Expandir `j` enquanto `s[j]` nÃ£o estiver no conjunto.
2. Se encontrarmos repetiÃ§Ã£o, remover `s[i]` e avanÃ§ar `i` atÃ© que o conflito desapareÃ§a.
3. Atualizar `best` com `j - i`.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o conjunto (onde `k` Ã© o tamanho da maior janela Ãºnica).


In [46]:

def length_longest_substring_newbie(s: str) -> int:
    seen = set(); i=j=best=0
    while i<len(s) and j<len(s):
        if s[j] not in seen:
            seen.add(s[j]); j+=1; best=max(best, j-i)
        else:
            seen.remove(s[i]); i+=1
    return best


### Fodona (Ãºltimo Ã­ndice)

OtimizaÃ§Ã£o importante: em vez de remover um a um, guardamos a Ãºltima posiÃ§Ã£o onde cada caractere apareceu.

**RaciocÃ­nio:** quando `ch` reaparece dentro da janela atual (isto Ã©, `last[ch] >= start`), pulamos direto para `last[ch] + 1`. Isso garante que cada Ã­ndice move-se no mÃ¡ximo uma vez.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o dicionÃ¡rio de Ãºltimas posiÃ§Ãµes.


In [47]:

def length_longest_substring_fodona(s: str) -> int:
    last = {}; start = best = 0
    for i,ch in enumerate(s):
        if ch in last and last[ch] >= start:
            start = last[ch]+1
        last[ch] = i
        if i-start+1 > best: best = i-start+1
    return best


### PythÃ´nica apelona (compacta)

A mesma lÃ³gica da versÃ£o fodona, mas condensada usando `dict.get` e atualizaÃ§Ãµes inline. Ãštil para mostrar domÃ­nio da linguagem sem perder clareza algorÃ­tmica.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` (mapa de Ãºltimas apariÃ§Ãµes).


In [48]:

def length_longest_substring_pythonica(s: str) -> int:
    last = {}; start = best = 0
    for i,ch in enumerate(s):
        start = max(start, last.get(ch,-1)+1)
        last[ch] = i
        best = max(best, i-start+1)
    return best


## 6) Substring search (KMP) â€” sem `find`

Encontrar um padrÃ£o `pat` dentro de um texto maior `text` Ã© um dos problemas fundadores de algoritmos de string. A versÃ£o ingÃªnua compara o padrÃ£o em cada deslocamento possÃ­vel e custa `O(nÂ·m)` no pior caso.

Knuthâ€“Morrisâ€“Pratt (KMP) muda o jogo: ao prÃ©-processar o padrÃ£o para saber o maior prefixo que tambÃ©m Ã© sufixo (array `lps`), evitamos recomeÃ§ar a busca do zero quando ocorre um mismatch. Assim, ambos os ponteiros avanÃ§am monotonicamente e o algoritmo roda em tempo `O(n + m)` com espaÃ§o `O(m)` para o `lps`.


### Fodona (KMP)

O KMP comeÃ§a com o prÃ©-processamento do padrÃ£o para gerar o vetor `lps` (longest prefix suffix). Para cada posiÃ§Ã£o `i`, `lps[i]` guarda o tamanho do maior prefixo de `pat` que tambÃ©m Ã© sufixo de `pat[:i+1]`.

**IntuiÃ§Ã£o do `lps`:** ao falhar uma comparaÃ§Ã£o em `pat[i]`, sabemos qual prÃ³ximo caractere tentar sem voltar o ponteiro do texto. Exemplo com `pat = "ababaca"`: o prefixo `"aba"` coincide com o sufixo que termina em `i = 4`, por isso `lps[4] = 3`.

**Busca:** percorremos o texto com Ã­ndice `i` e o padrÃ£o com `j`. Quando `text[i] != pat[j]`, reduzimos `j = lps[j-1]`. Como `i` nunca recua, visitamos cada caractere de `text` no mÃ¡ximo uma vez.

**Complexidade:** prÃ©-processamento `O(m)` e busca `O(n)`; espaÃ§o `O(m)` para o vetor `lps`.


In [49]:

def kmp_search(text: str, pat: str) -> int:
    if pat=="": return 0
    lps = [0]*len(pat)
    i=j=1; j=0
    while i < len(pat):
        if pat[i]==pat[j]:
            j+=1; lps[i]=j; i+=1
        elif j:
            j=lps[j-1]
        else:
            lps[i]=0; i+=1
    i=j=0
    while i < len(text):
        if text[i]==pat[j]:
            i+=1; j+=1
            if j==len(pat): return i-j
        elif j:
            j=lps[j-1]
        else:
            i+=1
    return -1


### Newbie (forÃ§a bruta)

Antes de aprender KMP, vale revisar o algoritmo ingÃªnuo. Ele testa o padrÃ£o em cada deslocamento possÃ­vel e compara caractere a caractere.

**Complexidade:** tempo `O(nÂ·m)` no pior caso; espaÃ§o `O(1)`.


In [50]:

def find_bruteforce(text: str, pat: str) -> int:
    if pat=="": return 0
    n,m=len(text),len(pat)
    for i in range(n-m+1):
        k=0
        while k<m and text[i+k]==pat[k]:
            k+=1
        if k==m: return i
    return -1


### PythÃ´nica apelona

A versÃ£o pythonizada delega o trabalho para `text.find(pat)`. Por baixo dos panos o CPython usa uma implementaÃ§Ã£o em C baseada em algoritmos como Two-Way/FASTSEARCH, que Ã© bem mais otimizada que o brute force puro escrito em Python.

**Quando usar:** em entrevistas que aceitam chamadas Ã  biblioteca padrÃ£o, reforÃ§ando que vocÃª entende a teoria (KMP) mas prefere um atalho seguro e testado.

**Complexidade:** no pior caso ainda Ã© `O(nÂ·m)`, porÃ©m com constantes muito menores e alguns cenÃ¡rios amortizados quase lineares. EspaÃ§o `O(1)`.


In [51]:

def find_pythonica(text: str, pat: str) -> int:
    return text.find(pat)


## 7) Maior substring palindrÃ´mica

Aqui buscamos a substring contÃ­gua mais longa que seja palÃ­ndroma. O problema aparece em compressÃ£o, bioinformÃ¡tica e validaÃ§Ã£o de entradas.

HÃ¡ trÃªs famÃ­lias de soluÃ§Ãµes: forÃ§a bruta (`O(n^3)`), expansÃ£o em torno de centros (`O(n^2)`), e Manacher (`O(n)`). Este notebook mostra a expansÃ£o de centros como baseline, a implementaÃ§Ã£o completa de Manacher e uma versÃ£o pythonizada para quem prioriza legibilidade.


### Newbie (expandir centros)

Cada palÃ­ndromo pode ser visto como expandindo a partir de um centro (um caractere para Ã­mpares ou o meio de dois caracteres para pares).

**Passos principais**
1. Para cada Ã­ndice `i`, expandir em torno de `(i, i)` e `(i, i+1)`.
2. A funÃ§Ã£o `expand` desce Ã  esquerda e sobe Ã  direita enquanto os caracteres coincidirem.
3. Guardar a melhor janela vista.

**Complexidade:** tempo `O(n^2)`; espaÃ§o `O(1)`.


In [52]:

def longest_pal_substring_newbie(s: str) -> str:
    if not s: return ""
    def expand(l,r):
        while l>=0 and r<len(s) and s[l]==s[r]:
            l-=1; r+=1
        return l+1, r
    best=(0,1)
    for i in range(len(s)):
        l1,r1=expand(i,i)
        l2,r2=expand(i,i+1)
        if r1-l1>r2-l2 and r1-l1>best[1]-best[0]: best=(l1,r1)
        elif r2-l2>best[1]-best[0]: best=(l2,r2)
    return s[best[0]:best[1]]


### Fodona (Manacher)

Manacher transforma a string em outra com sentinelas (`^`, `#`, `$`) para tratar palÃ­ndromos pares e Ã­mpares de forma uniforme. O vetor `p[i]` guarda o raio mÃ¡ximo do palÃ­ndromo centrado em `i` na string transformada.

**IntuiÃ§Ã£o:** ao processar `i`, usamos simetria em torno do centro atual `c`. Se jÃ¡ conhecemos um palÃ­ndromo que se estende atÃ© `r`, podemos copiar o valor espelhado `p[mir]` (onde `mir = 2*c - i`) como ponto de partida. DaÃ­ seguimos expandindo apenas quando necessÃ¡rio.

O resultado final Ã© o palÃ­ndromo de maior raio encontrado. Ã‰ o Ãºnico algoritmo conhecido que resolve o problema em tempo linear `O(n)` com espaÃ§o `O(n)`.


In [53]:

def longest_pal_substring_manacher(s: str) -> str:
    if not s: return ""
    t=['^']
    for ch in s: t+=['#',ch]
    t+=['#','$']
    n=len(t); p=[0]*n; c=r=0
    for i in range(1,n-1):
        mir=2*c-i
        if i<r: p[i]=min(r-i,p[mir])
        while t[i+1+p[i]]==t[i-1-p[i]]: p[i]+=1
        if i+p[i]>r: c,r=i,i+p[i]
    max_len=center=max((p[i],i) for i in range(1,n-1))
    start=(center-max_len)//2
    return s[start:start+max_len]


### PythÃ´nica apelona (compacta de centros)

VersÃ£o reduzida da expansÃ£o de centros, priorizando clareza: iteramos pelos Ã­ndices, tentamos os dois tipos de centro e atualizamos uma substring candidata.

**Complexidade:** tempo `O(n^2)`; espaÃ§o `O(1)`.


In [54]:

def longest_pal_substring_pythonica(s: str) -> str:
    best=""
    for i in range(len(s)):
        for a,b in ((i,i),(i,i+1)):
            l,r=a,b
            while l>=0 and r<len(s) and s[l]==s[r]:
                if r-l+1>len(best): best=s[l:r+1]
                l-=1; r+=1
    return best


## 8) Menor janela contendo `t` em `s`

Dadas duas strings `s` e `t`, queremos a menor janela em `s` que contenha todos os caracteres de `t` (respeitando multiplicidades). Ã‰ outra aplicaÃ§Ã£o prototÃ­pica de janela deslizante com mapa de frequÃªncias.

Exemplo: `s = "ADOBECODEBANC"` e `t = "ABC"` produzem "BANC". Essa tÃ©cnica aparece em buscas por padrÃµes, anÃ¡lise de logs e problemas de DNA.


### Fodona (janela)

A soluÃ§Ã£o Ã³tima usa janela deslizante com mapa de contagem. Mantemos `need[ch]` positivo enquanto ainda falta consumir aquele caractere.

**DinÃ¢mica:** expandimos `j` e diminuÃ­mos `missing` quando um caractere ainda Ã© necessÃ¡rio. Assim que `missing == 0`, tentamos contrair `i` para encurtar a janela, atualizando a melhor resposta.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` onde `k` Ã© o nÃºmero de caracteres distintos de `t`.


In [55]:

def min_window(s: str, t: str) -> str:
    if not s or not t: return ""
    need={}
    for ch in t: need[ch]=need.get(ch,0)+1
    missing=len(t); i=start=end=0
    for j,ch in enumerate(s,1):
        if need.get(ch,0)>0: missing-=1
        need[ch]=need.get(ch,0)-1
        while missing==0:
            if end==0 or j-i<end-start: start,end=i,j
            need[s[i]]=need.get(s[i],0)+1
            if need[s[i]]>0: missing+=1
            i+=1
    return s[start:end]


### Newbie (brute force educativo)

Ã“tima para explicar por que a janela deslizante Ã© necessÃ¡ria. Enumeramos todas as substrings e verificamos se cobrem `t`.

**Complexidade:** tempo `O(n^2Â·k)` (hÃ¡ `O(n^2)` substrings e cada verificaÃ§Ã£o custa `O(k)`); espaÃ§o `O(k)` para o mapa auxiliar.


In [56]:

def min_window_newbie(s: str, t: str) -> str:
    if not s or not t: return ""
    def covers(a: str, t: str) -> bool:
        need={}
        for ch in t: need[ch]=need.get(ch,0)+1
        for ch in a:
            if need.get(ch,0)>0: need[ch]-=1
        return all(v==0 for v in need.values())
    best=""
    for i in range(len(s)):
        for j in range(i+1,len(s)+1):
            sub=s[i:j]
            if (not best or len(sub)<len(best)) and covers(sub,t):
                best=sub
    return best


### PythÃ´nica apelona (Counter)

Mesma lÃ³gica da janela otimizando a legibilidade com `Counter`. `need = Counter(t)` inicializa a demanda e o restante do algoritmo espelha a versÃ£o fodona.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(k)`.


In [57]:

from collections import Counter
def min_window_pythonica(s: str, t: str) -> str:
    need=Counter(t); missing=len(t)
    i=start=end=0
    for j,ch in enumerate(s,1):
        if need[ch]>0: missing-=1
        need[ch]-=1
        while missing==0:
            if end==0 or j-i<end-start: start,end=i,j
            need[s[i]]+=1
            if need[s[i]]>0: missing+=1
            i+=1
    return s[start:end]


## 9) Decodificar `"3[a2[c]]"`

A string de entrada usa uma gramÃ¡tica do tipo `k[substring]`, possivelmente aninhada, significando "repita `substring` `k` vezes". Precisamos reconstruir a string decodificada.

Ã‰ um Ã³timo exercÃ­cio de pilhas: cada `[` empilha o estado atual e cada `]` desempilha, combinando contagem e fragmentos parciais. A soluÃ§Ã£o correta lida com nÃºmeros de vÃ¡rios dÃ­gitos, recursÃ£o implÃ­cita via pilha e concatenaÃ§Ã£o eficiente.


### Fodona (pilhas)

Usamos duas pilhas: uma para contagens (`num_st`) e outra para strings parciais (`str_st`). Sempre que aparece um dÃ­gito, acumulamos em `k`. Ao ver `[` empilhamos `k` e o prefixo atual; ao ver `]` repetimos o bloco corrente `rep` vezes e concatenamos com o prefixo anterior.

**Exemplo:** `"3[a2[c]]"` â†’ empilha `3` e `""`, processa `a`, empilha `2` ao encontrar `[`, monta `"cc"`, desempilha e concatena resultando em `"accaccacc"`.

**Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` para armazenar estados intermediÃ¡rios em entradas muito aninhadas.


In [58]:

def decode_string(s: str) -> str:
    num_st, str_st = [], []
    cur=[]; k=0
    for ch in s:
        if ch.isdigit():
            k=k*10+(ord(ch)-48)
        elif ch=='[':
            num_st.append(k); str_st.append(cur); k=0; cur=[]
        elif ch==']':
            rep=num_st.pop(); prev=str_st.pop()
            cur = prev + cur*rep
        else:
            cur.append(ch)
    return "".join(cur)


## 10) DistÃ¢ncia de ediÃ§Ã£o (Levenshtein)

Levenshtein mede o menor nÃºmero de operaÃ§Ãµes para transformar uma string em outra usando inserÃ§Ã£o, deleÃ§Ã£o e substituiÃ§Ã£o. Ã‰ pilar em autocorretores, comparaÃ§Ã£o de DNA e anÃ¡lise dif.

A forma iterativa mais conhecida usa programaÃ§Ã£o dinÃ¢mica: montamos uma tabela onde `dp[i][j]` representa a distÃ¢ncia entre os prefixos `a[:i]` e `b[:j]`. A tabela pode ser comprimida para duas linhas, reduzindo o uso de memÃ³ria sem perder tempo assintÃ³tico (`O(nÂ·m)`).


### Newbie (tabela completa)

ConstruÃ­mos uma matriz `(n+1) x (m+1)` onde cada cÃ©lula `dp[i][j]` guarda a menor distÃ¢ncia entre os prefixos `a[:i]` e `b[:j]`. Os casos base representam converter string vazia em prefixos via inserÃ§Ãµes ou deleÃ§Ãµes.

**RecorrÃªncia:**
- InserÃ§Ã£o: `dp[i][j-1] + 1`
- RemoÃ§Ã£o: `dp[i-1][j] + 1`
- SubstituiÃ§Ã£o ou match: `dp[i-1][j-1] + (a[i-1] != b[j-1])`

O valor final estÃ¡ em `dp[n][m]`.

**Complexidade:** tempo `O(nÂ·m)`; espaÃ§o `O(nÂ·m)`.


In [59]:

def edit_distance_newbie(a: str, b: str) -> int:
    n,m=len(a),len(b)
    dp=[[0]*(m+1) for _ in range(n+1)]
    for i in range(n+1): dp[i][0]=i
    for j in range(m+1): dp[0][j]=j
    for i in range(1,n+1):
        for j in range(1,m+1):
            cost=0 if a[i-1]==b[j-1] else 1
            dp[i][j]=min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i-1][j-1]+cost)
    return dp[n][m]


### Fodona (duas linhas)

ObservaÃ§Ã£o central: para preencher a linha `i` da tabela sÃ³ precisamos da linha `i-1` e da linha atual. Assim, armazenamos apenas dois vetores, reaproveitando memÃ³ria.

**Complexidade:** tempo `O(nÂ·m)`; espaÃ§o `O(min(n, m))`, pois sempre iteramos pela string mais curta na dimensÃ£o de colunas.


In [60]:

def edit_distance_fodona(a: str, b: str) -> int:
    if len(a) < len(b): a,b=b,a
    prev=list(range(len(b)+1))
    for i,ca in enumerate(a,1):
        cur=[i]
        for j,cb in enumerate(b,1):
            cost=0 if ca==cb else 1
            cur.append(min(prev[j]+1, cur[j-1]+1, prev[j-1]+cost))
        prev=cur
    return prev[-1]


### PythÃ´nica apelona

NÃ£o hÃ¡ builtin de Levenshtein no Python padrÃ£o. O que podemos fazer durante uma entrevista Ã© negociar o uso de bibliotecas externas (por exemplo, `python-Levenshtein`) ou reaproveitar a versÃ£o otimizada de duas linhas mostrada aqui. Reforce o raciocÃ­nio: se o avaliador pede algo "idiomÃ¡tico", mostre que jÃ¡ chegamos ao limite teÃ³rico com a implementaÃ§Ã£o anterior.


In [61]:

# NÃ£o hÃ¡ builtin â€” a versÃ£o 'fodona' jÃ¡ Ã© ideal em Python puro.



---
## Perguntas tÃ­picas e como responder

- **Por que sua soluÃ§Ã£o Ã© `O(n)`?**  
  Explico que percorro cada caractere no mÃ¡ximo `k` vezes e mantenho mapas de tamanho limitado.

- **Pode otimizar espaÃ§o?**  
  Sim â€” duas pontas (O(1)) ou DP em duas linhas para Levenshtein.

- **E Unicode?**  
  Trocar array fixo por `dict` e considerar `casefold()`. Para remoÃ§Ã£o de acentos, normalizar com `unicodedata` (se permitido).

- **Edge cases?**  
  Strings vazias, um caractere, todos iguais, padrÃ£o no inÃ­cio/fim, entradas grandes.
