# üß† Atividade: Como Aprimorar os Resultados de Busca em Python

### üéØ Objetivo
Aprender t√©cnicas para melhorar buscas de texto em Python, utilizando estrat√©gias como:
- Normaliza√ß√£o de texto
- Tokeniza√ß√£o
- Similaridade de strings (`difflib`)
- Express√µes regulares (`re`)
- Busca aproximada e fuzzy matching

### üì¶ Prepara√ß√£o do ambiente

In [None]:
import re
import difflib
import unicodedata

### üìå Parte 1: Normaliza√ß√£o de Texto

In [None]:
def normalize(text):
    text = text.lower()
    text = unicodedata.normalize('NFKD', text).encode('ASCII', 'ignore').decode('utf-8')
    text = re.sub(r'[^\w\s]', '', text)
    return text

# Teste
textos = ["Ol√°, mundo!", "Caf√© com Leite", "Python √© incr√≠vel!"]
[normalize(t) for t in textos]


### üìå Parte 2: Busca simples com normaliza√ß√£o

In [None]:
def busca_simples(query, base):
    query_norm = normalize(query)
    return [item for item in base if query_norm in normalize(item)]

produtos = [
    "Caf√© Preto", "Ch√° Verde", "Caf√© com Leite", "Suco de Laranja", "√Ågua Mineral"
]

busca_simples("cafe", produtos)


### üìå Parte 3: Busca por similaridade com `difflib.get_close_matches`

In [None]:
def busca_similar(query, base, n=3, cutoff=0.6):
    return difflib.get_close_matches(query, base, n=n, cutoff=cutoff)

busca_similar("cafe com leite", produtos)


### üìå Parte 4: Express√µes regulares para busca flex√≠vel

In [None]:
def busca_regex(query, base):
    pattern = re.compile(query, re.IGNORECASE)
    return [item for item in base if re.search(pattern, item)]

busca_regex("caf√©|suco", produtos)


### üìå Parte 5: Exerc√≠cios

#### üìù Exerc√≠cio 1: Busca aprimorada combinando normaliza√ß√£o e similaridade

In [None]:
def busca_aprimorada(query, base):
    norm_base = [normalize(item) for item in base]
    norm_query = normalize(query)
    correspondencias = difflib.get_close_matches(norm_query, norm_base, n=3, cutoff=0.6)
    return [base[norm_base.index(m)] for m in correspondencias]

busca_aprimorada("cafe leite", produtos)


#### üìù Exerc√≠cio 2: Nova base de cidades e aplica√ß√£o das buscas

In [None]:
cidades = ["S√£o Paulo", "Salvador", "Santos", "Santa Catarina", "Rio de Janeiro", "Curitiba", "Bras√≠lia", "Belo Horizonte"]

print(busca_simples("sao", cidades))
print(busca_aprimorada("santos", cidades))
print(busca_regex("^S", cidades))


### ‚úÖ Conclus√£o
Nesta atividade, voc√™ aprendeu:
- A import√¢ncia da normaliza√ß√£o textual
- Como realizar buscas simples, por similaridade e com regex
- T√©cnicas para aumentar a robustez da busca textual em sistemas com entrada vari√°vel