
# ðŸ§  String Interview Playbook â€” do bÃ¡sico ao avanÃ§ado

Este notebook reÃºne **problemas clÃ¡ssicos e alguns avanÃ§ados de strings**, cada um com **3 versÃµes**:

- **Newbie**: direta, didÃ¡tica â€” Ã s vezes menos eficiente.
- **Fodona**: soluÃ§Ã£o Ã³tima/algorÃ­tmica (janela deslizante, DP, KMP, Manacher, etc.).
- **PythÃ´nica apelona**: usando o poder da linguagem (ex.: `Counter`, `sorted`, `re`) â€” *quando a entrevista permitir*.

Para cada problema hÃ¡ **explicaÃ§Ã£o**, **complexidade** e **perguntas tÃ­picas** de entrevista.


In [62]:

def run_tests(func, cases):
    for i, (args, expected) in enumerate(cases, 1):
        if not isinstance(args, tuple):
            args = (args,)
        got = func(*args)
        assert got == expected, f"case {i} failed: got={got}, expected={expected}, args={args}"
    "âœ“ all tests passed"



## 1) Reverter string

**Tarefa**: dado `s`, retorne `s` invertida.

**DiscussÃ£o**  
- Strings sÃ£o imutÃ¡veis â†’ converta para lista e troque extremidades.
- Entrevistador pode pedir in-place: em `str` nÃ£o dÃ¡; em `list` dÃ¡.

**Complexidade**: `O(n)` tempo.


### Newbie

- **O que Ã©:** implementaÃ§Ã£o didÃ¡tica para mostrar como inverter caractere a caractere.
- **Ideia:** copiar a string para uma lista mutÃ¡vel e trocar os extremos com dois ponteiros atÃ© eles se cruzarem.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` pela cÃ³pia da lista antes de juntar de volta.


In [35]:

def reverse_string_newbie(s: str) -> str:
    a = list(s)
    i, j = 0, len(a) - 1
    while i < j:
        a[i], a[j] = a[j], a[i]
        i += 1; j -= 1
    return "".join(a)

# quick tests
assert reverse_string_newbie("abc") == "cba"


### Fodona

- **O que Ã©:** variaÃ§Ã£o em estilo de entrevista usando os mesmos dois ponteiros com nomenclatura mais padrÃ£o.
- **Ideia:** mover `l` e `r` em direÃ§Ã£o ao centro trocando posiÃ§Ãµes simetricamente, sem criar estruturas extras alÃ©m da lista temporÃ¡ria.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` por causa da lista criada a partir da string imutÃ¡vel.


In [36]:

def reverse_string_fodona(s: str) -> str:
    a = list(s)
    l, r = 0, len(a) - 1
    while l < r:
        a[l], a[r] = a[r], a[l]
        l += 1; r -= 1
    return "".join(a)


### PythÃ´nica apelona

- **O que Ã©:** usar slicing com passo negativo para delegar o trabalho ao runtime.
- **Ideia:** `s[::-1]` percorre a string uma vez em ordem reversa e constrÃ³i a cÃ³pia diretamente.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` porque uma nova string Ã© criada.


In [37]:

def reverse_string_pythonica(s: str) -> str:
    return s[::-1]



## 2) Verificar anagramas sem `sorted`


### Newbie

- **O que Ã©:** comparaÃ§Ã£o de anagramas contando frequÃªncias com um `dict`.
- **Ideia:** incrementar a contagem de cada caractere de `a` e decrementar com `b`, falhando se alguma contagem fica negativa.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` onde `k` Ã© o nÃºmero de caracteres distintos na string.


In [38]:

def is_anagram_newbie(a: str, b: str) -> bool:
    if len(a) != len(b): return False
    cnt = {}
    for ch in a:
        cnt[ch] = cnt.get(ch, 0) + 1
    for ch in b:
        if cnt.get(ch, 0) == 0:
            return False
        cnt[ch] -= 1
    return True


### Fodona (array 26)

- **O que Ã©:** otimizaÃ§Ã£o para letras minÃºsculas usando um vetor fixo de 26 posiÃ§Ãµes.
- **Ideia:** mapear `a..z` para Ã­ndices do array, atualizando contagens e abortando se aparecer caractere fora desse domÃ­nio.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(1)` porque o array tem tamanho fixo.


In [39]:

def is_anagram_fodona(a: str, b: str) -> bool:
    if len(a) != len(b): return False
    base = ord('a')
    freq = [0]*26
    for ch in a:
        idx = ord(ch)-base
        if 0 <= idx < 26:
            freq[idx]+=1
        else:
            return is_anagram_newbie(a,b)
    for ch in b:
        idx = ord(ch)-base
        if 0 <= idx < 26:
            freq[idx]-=1
            if freq[idx]<0: return False
        else:
            return is_anagram_newbie(a,b)
    return all(v==0 for v in freq)


### PythÃ´nica apelona

- **O que Ã©:** soluÃ§Ã£o de alto nÃ­vel com `collections.Counter`.
- **Ideia:** construir dois contadores e comparar objetos, deixando o C otimizar o loop interno.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para armazenar as contagens de cada caractere.


In [40]:

from collections import Counter
def is_anagram_pythonica(a: str, b: str) -> bool:
    return Counter(a) == Counter(b)



## 3) Primeiro caractere nÃ£o repetido


### Newbie

- **O que Ã©:** localizar o primeiro caractere Ãºnico com duas passadas e um `dict`.
- **Ideia:** primeira passada soma frequÃªncias; segunda encontra o primeiro Ã­ndice com contagem igual a 1.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para guardar as contagens.


In [41]:

def first_unique_index_newbie(s: str) -> int:
    cnt = {}
    for ch in s:
        cnt[ch] = cnt.get(ch, 0) + 1
    for i, ch in enumerate(s):
        if cnt[ch] == 1:
            return i
    return -1


### Fodona (26)

- **O que Ã©:** mesma ideia restrita a letras minÃºsculas, evitando dicionÃ¡rios dinÃ¢micos.
- **Ideia:** registrar posiÃ§Ã£o e frequÃªncia em dois arrays de 26 elementos e no fim buscar o menor Ã­ndice com contagem 1.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(1)` ao manter arrays de tamanho fixo.


In [42]:

def first_unique_index_fodona(s: str) -> int:
    first = [-1]*26
    count = [0]*26
    base = ord('a')
    for i, ch in enumerate(s):
        idx = ord(ch)-base
        if 0 <= idx < 26:
            if first[idx] == -1: first[idx] = i
            count[idx] += 1
        else:
            return first_unique_index_newbie(s)
    ans = 10**9
    for k in range(26):
        if count[k]==1: ans = min(ans, first[k])
    return -1 if ans==10**9 else ans


### PythÃ´nica apelona

- **O que Ã©:** abordagem expressiva usando `Counter`.
- **Ideia:** contar tudo de uma vez e fazer o segundo laÃ§o lendo do contador prÃ©-computado.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o dicionÃ¡rio de frequÃªncias.


In [43]:

from collections import Counter
def first_unique_index_pythonica(s: str) -> int:
    cnt = Counter(s)
    for i,ch in enumerate(s):
        if cnt[ch]==1: return i
    return -1



## 4) PalÃ­ndromo vÃ¡lido (ignora nÃ£o-alfaNum; case-insensitive)


### Duas pontas

- **O que Ã©:** checagem de palÃ­ndromo realista ignorando sÃ­mbolos e capitalizaÃ§Ã£o.
- **Ideia:** ponteiros `i` e `j` avanÃ§am enquanto pulam caracteres nÃ£o alfanumÃ©ricos; quando ambos param, comparam versÃµes minÃºsculas.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(1)` porque sÃ³ usamos Ã­ndices.


In [44]:

def is_palindrome_valid(s: str) -> bool:
    i, j = 0, len(s)-1
    while i < j:
        while i < j and not s[i].isalnum(): i+=1
        while i < j and not s[j].isalnum(): j-=1
        if s[i].lower() != s[j].lower(): return False
        i+=1; j-=1
    return True


### PythÃ´nica apelona

- **O que Ã©:** soluÃ§Ã£o declarativa baseada em compreensÃµes.
- **Ideia:** filtrar apenas caracteres alfanumÃ©ricos minÃºsculos, gerar uma lista e comparÃ¡-la com sua reversa.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` para armazenar a lista filtrada.


In [45]:

def is_palindrome_pythonica(s: str) -> bool:
    t = [c.lower() for c in s if c.isalnum()]
    return t == t[::-1]



## 5) Maior substring sem repetir caracteres


### Newbie (set + move)

- **O que Ã©:** implementaÃ§Ã£o direta da janela deslizante com um `set`.
- **Ideia:** expandir `j` enquanto os caracteres sÃ£o Ãºnicos; quando repete, remover `s[i]` e avanÃ§ar `i`.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` onde `k` Ã© o tamanho da janela sem repetiÃ§Ã£o.


In [46]:

def length_longest_substring_newbie(s: str) -> int:
    seen = set(); i=j=best=0
    while i<len(s) and j<len(s):
        if s[j] not in seen:
            seen.add(s[j]); j+=1; best=max(best, j-i)
        else:
            seen.remove(s[i]); i+=1
    return best


### Fodona (Ãºltimo Ã­ndice)

- **O que Ã©:** janela deslizante mais eficiente rastreando a Ãºltima posiÃ§Ã£o de cada caractere.
- **Ideia:** se `ch` reaparece dentro da janela atual, movemos o inÃ­cio para `last[ch] + 1` e atualizamos o melhor comprimento.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o mapa de Ãºltimo Ã­ndice.


In [47]:

def length_longest_substring_fodona(s: str) -> int:
    last = {}; start = best = 0
    for i,ch in enumerate(s):
        if ch in last and last[ch] >= start:
            start = last[ch]+1
        last[ch] = i
        if i-start+1 > best: best = i-start+1
    return best


### PythÃ´nica apelona (compacta)

- **O que Ã©:** versÃ£o pythonizada da estratÃ©gia de Ãºltimo Ã­ndice.
- **Ideia:** usar `dict.get` com sentinela para condensar o update do inÃ­cio em uma Ãºnica linha.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o dicionÃ¡rio de posiÃ§Ãµes.


In [48]:

def length_longest_substring_pythonica(s: str) -> int:
    last = {}; start = best = 0
    for i,ch in enumerate(s):
        start = max(start, last.get(ch,-1)+1)
        last[ch] = i
        best = max(best, i-start+1)
    return best



## 6) Substring search (KMP) â€” sem `find`


### Fodona (KMP)

- **O que Ã©:** Knuthâ€“Morrisâ€“Pratt, o algoritmo linear clÃ¡ssico para busca de padrÃµes.
- **Ideia:** prÃ©-calcular o array `lps` com o maior prefixo tambÃ©m sufixo e usar esse conhecimento para nÃ£o voltar `i` ao tratar mismatches.
- **Complexidade:** tempo `O(n + m)`; espaÃ§o `O(m)` para armazenar o vetor `lps`.


In [49]:

def kmp_search(text: str, pat: str) -> int:
    if pat=="": return 0
    lps = [0]*len(pat)
    i=j=1; j=0
    while i < len(pat):
        if pat[i]==pat[j]:
            j+=1; lps[i]=j; i+=1
        elif j:
            j=lps[j-1]
        else:
            lps[i]=0; i+=1
    i=j=0
    while i < len(text):
        if text[i]==pat[j]:
            i+=1; j+=1
            if j==len(pat): return i-j
        elif j:
            j=lps[j-1]
        else:
            i+=1
    return -1


### Newbie (forÃ§a bruta)

- **O que Ã©:** comparaÃ§Ã£o direta de cada janela possÃ­vel no texto.
- **Ideia:** alinhar o padrÃ£o em todas as posiÃ§Ãµes e avanÃ§ar caracter por caracter atÃ© falhar ou encontrar o match completo.
- **Complexidade:** tempo `O(nÂ·m)`; espaÃ§o `O(1)` sem estruturas auxiliares.


In [50]:

def find_bruteforce(text: str, pat: str) -> int:
    if pat=="": return 0
    n,m=len(text),len(pat)
    for i in range(n-m+1):
        k=0
        while k<m and text[i+k]==pat[k]:
            k+=1
        if k==m: return i
    return -1


### PythÃ´nica apelona

- **O que Ã©:** delegar a busca ao mÃ©todo `str.find`.
- **Ideia:** confiar na implementaÃ§Ã£o otimizada em C do Python para realizar a busca.
- **Complexidade:** tempo `O(nÂ·m)` no pior caso; espaÃ§o `O(1)` alÃ©m da string original.


In [51]:

def find_pythonica(text: str, pat: str) -> int:
    return text.find(pat)



## 7) Maior substring palindrÃ´mica


### Newbie (expandir centros)

- **O que Ã©:** estratÃ©gia clÃ¡ssica de expandir palÃ­ndromos a partir de cada posiÃ§Ã£o.
- **Ideia:** tentar centros Ã­mpares e pares via funÃ§Ã£o `expand`, guardando a melhor faixa encontrada.
- **Complexidade:** tempo `O(n^2)`; espaÃ§o `O(1)` porque usamos apenas Ã­ndices.


In [52]:

def longest_pal_substring_newbie(s: str) -> str:
    if not s: return ""
    def expand(l,r):
        while l>=0 and r<len(s) and s[l]==s[r]:
            l-=1; r+=1
        return l+1, r
    best=(0,1)
    for i in range(len(s)):
        l1,r1=expand(i,i)
        l2,r2=expand(i,i+1)
        if r1-l1>r2-l2 and r1-l1>best[1]-best[0]: best=(l1,r1)
        elif r2-l2>best[1]-best[0]: best=(l2,r2)
    return s[best[0]:best[1]]


### Fodona (Manacher)

- **O que Ã©:** algoritmo Manacher para encontrar o maior palÃ­ndromo em tempo linear.
- **Ideia:** inserir separadores, espelhar raios jÃ¡ conhecidos e expandir quando possÃ­vel para cada posiÃ§Ã£o.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` para o array auxiliar de raios.


In [53]:

def longest_pal_substring_manacher(s: str) -> str:
    if not s: return ""
    t=['^']
    for ch in s: t+=['#',ch]
    t+=['#','$']
    n=len(t); p=[0]*n; c=r=0
    for i in range(1,n-1):
        mir=2*c-i
        if i<r: p[i]=min(r-i,p[mir])
        while t[i+1+p[i]]==t[i-1-p[i]]: p[i]+=1
        if i+p[i]>r: c,r=i,i+p[i]
    max_len=center=max((p[i],i) for i in range(1,n-1))
    start=(center-max_len)//2
    return s[start:start+max_len]


### PythÃ´nica apelona (compacta de centros)

- **O que Ã©:** versÃ£o enxuta da expansÃ£o de centros, privilegiando legibilidade.
- **Ideia:** iterar sobre centros possÃ­veis com dupla atribuiÃ§Ã£o `(i,i)` e `(i,i+1)` e atualizar a melhor substring em linha.
- **Complexidade:** tempo `O(n^2)`; espaÃ§o `O(1)` alÃ©m das variÃ¡veis de apoio.


In [54]:

def longest_pal_substring_pythonica(s: str) -> str:
    best=""
    for i in range(len(s)):
        for a,b in ((i,i),(i,i+1)):
            l,r=a,b
            while l>=0 and r<len(s) and s[l]==s[r]:
                if r-l+1>len(best): best=s[l:r+1]
                l-=1; r+=1
    return best



## 8) Menor janela contendo `t` em `s`


### Fodona (janela)

- **O que Ã©:** soluÃ§Ã£o Ã³tima para a menor janela que cobre `t`.
- **Ideia:** manter contagens em `need`, expandir `j` atÃ© cobrir tudo e depois contrair `i` enquanto possÃ­vel para minimizar.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o mapa de caracteres necessÃ¡rios.


In [55]:

def min_window(s: str, t: str) -> str:
    if not s or not t: return ""
    need={}
    for ch in t: need[ch]=need.get(ch,0)+1
    missing=len(t); i=start=end=0
    for j,ch in enumerate(s,1):
        if need.get(ch,0)>0: missing-=1
        need[ch]=need.get(ch,0)-1
        while missing==0:
            if end==0 or j-i<end-start: start,end=i,j
            need[s[i]]=need.get(s[i],0)+1
            if need[s[i]]>0: missing+=1
            i+=1
    return s[start:end]


### Newbie (brute force educativo)

- **O que Ã©:** abordagem exaustiva Ãºtil para entender o problema antes da otimizaÃ§Ã£o.
- **Ideia:** testar todas as substrings de `s` e verificar com um contador auxiliar se cobrem `t`.
- **Complexidade:** tempo `O(n^2Â·k)`; espaÃ§o `O(k)` para o mapa temporÃ¡rio usado em cada checagem.


In [56]:

def min_window_newbie(s: str, t: str) -> str:
    if not s or not t: return ""
    def covers(a: str, t: str) -> bool:
        need={}
        for ch in t: need[ch]=need.get(ch,0)+1
        for ch in a:
            if need.get(ch,0)>0: need[ch]-=1
        return all(v==0 for v in need.values())
    best=""
    for i in range(len(s)):
        for j in range(i+1,len(s)+1):
            sub=s[i:j]
            if (not best or len(sub)<len(best)) and covers(sub,t):
                best=sub
    return best


### PythÃ´nica apelona (Counter)

- **O que Ã©:** variante pythonizada da janela deslizante usando `Counter`.
- **Ideia:** `Counter(t)` inicializa as necessidades; o loop principal decrementa/ incrementa contagens enquanto move a janela.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(k)` para o contador.


In [57]:

from collections import Counter
def min_window_pythonica(s: str, t: str) -> str:
    need=Counter(t); missing=len(t)
    i=start=end=0
    for j,ch in enumerate(s,1):
        if need[ch]>0: missing-=1
        need[ch]-=1
        while missing==0:
            if end==0 or j-i<end-start: start,end=i,j
            need[s[i]]+=1
            if need[s[i]]>0: missing+=1
            i+=1
    return s[start:end]



## 9) Decodificar `"3[a2[c]]"`


### Fodona (pilhas)

- **O que Ã©:** decodificador iterativo para strings com padrÃµes `k[substr]`.
- **Ideia:** empilhar contagens e prefixos toda vez que encontramos um `[` e, ao fechar `]`, repetir o trecho atual `k` vezes e concatenar com o prefixo anterior.
- **Complexidade:** tempo `O(n)`; espaÃ§o `O(n)` no pior caso para as pilhas quando hÃ¡ muitos blocos aninhados.


In [58]:

def decode_string(s: str) -> str:
    num_st, str_st = [], []
    cur=[]; k=0
    for ch in s:
        if ch.isdigit():
            k=k*10+(ord(ch)-48)
        elif ch=='[':
            num_st.append(k); str_st.append(cur); k=0; cur=[]
        elif ch==']':
            rep=num_st.pop(); prev=str_st.pop()
            cur = prev + cur*rep
        else:
            cur.append(ch)
    return "".join(cur)



## 10) DistÃ¢ncia de ediÃ§Ã£o (Levenshtein)


### Newbie (tabela completa)

- **O que Ã©:** implementaÃ§Ã£o clÃ¡ssica da distÃ¢ncia de ediÃ§Ã£o usando matriz cheia.
- **Ideia:** preencher tabela `dp` de `(n+1)Ã—(m+1)` aplicando inserÃ§Ã£o, remoÃ§Ã£o e substituiÃ§Ã£o com recursÃ£o dinÃ¢mica.
- **Complexidade:** tempo `O(nÂ·m)`; espaÃ§o `O(nÂ·m)` para a matriz completa.


In [59]:

def edit_distance_newbie(a: str, b: str) -> int:
    n,m=len(a),len(b)
    dp=[[0]*(m+1) for _ in range(n+1)]
    for i in range(n+1): dp[i][0]=i
    for j in range(m+1): dp[0][j]=j
    for i in range(1,n+1):
        for j in range(1,m+1):
            cost=0 if a[i-1]==b[j-1] else 1
            dp[i][j]=min(dp[i-1][j]+1, dp[i][j-1]+1, dp[i-1][j-1]+cost)
    return dp[n][m]


### Fodona (duas linhas)

- **O que Ã©:** otimizaÃ§Ã£o de espaÃ§o da DP mantendo apenas a linha anterior.
- **Ideia:** iterar sobre `a` e `b`, atualizando um vetor corrente e reaproveitando o vetor anterior para calcular o custo mÃ­nimo.
- **Complexidade:** tempo `O(nÂ·m)`; espaÃ§o `O(min(n, m))` graÃ§as Ã s duas linhas.


In [60]:

def edit_distance_fodona(a: str, b: str) -> int:
    if len(a) < len(b): a,b=b,a
    prev=list(range(len(b)+1))
    for i,ca in enumerate(a,1):
        cur=[i]
        for j,cb in enumerate(b,1):
            cost=0 if ca==cb else 1
            cur.append(min(prev[j]+1, cur[j-1]+1, prev[j-1]+cost))
        prev=cur
    return prev[-1]


### PythÃ´nica apelona

- **O que Ã©:** lembrete de que nÃ£o existe atalho builtin para Levenshtein em Python puro.
- **Ideia:** reutilizar a versÃ£o `fodona` ou bibliotecas externas; o truque aqui Ã© explicar ao entrevistador a limitaÃ§Ã£o.
- **Complexidade:** tempo `O(nÂ·m)`; espaÃ§o `O(min(n, m))` se reaproveitarmos a DP otimizada.


In [61]:

# NÃ£o hÃ¡ builtin â€” a versÃ£o 'fodona' jÃ¡ Ã© ideal em Python puro.



---
## Perguntas tÃ­picas e como responder

- **Por que sua soluÃ§Ã£o Ã© `O(n)`?**  
  Explico que percorro cada caractere no mÃ¡ximo `k` vezes e mantenho mapas de tamanho limitado.

- **Pode otimizar espaÃ§o?**  
  Sim â€” duas pontas (O(1)) ou DP em duas linhas para Levenshtein.

- **E Unicode?**  
  Trocar array fixo por `dict` e considerar `casefold()`. Para remoÃ§Ã£o de acentos, normalizar com `unicodedata` (se permitido).

- **Edge cases?**  
  Strings vazias, um caractere, todos iguais, padrÃ£o no inÃ­cio/fim, entradas grandes.
