# 🧠 Atividade: Como Aprimorar os Resultados de Busca em Python

### 🎯 Objetivo
Aprender técnicas para melhorar buscas de texto em Python, utilizando estratégias como:
- Normalização de texto
- Tokenização
- Similaridade de strings (`difflib`)
- Expressões regulares (`re`)
- Busca aproximada e fuzzy matching

### 📦 Preparação do ambiente

In [None]:
import re
import difflib
import unicodedata

### 📌 Parte 1: Normalização de Texto

In [None]:
def normalize(text):
    text = text.lower()
    text = unicodedata.normalize('NFKD', text).encode('ASCII', 'ignore').decode('utf-8')
    text = re.sub(r'[^\w\s]', '', text)
    return text

# Teste
textos = ["Olá, mundo!", "Café com Leite", "Python é incrível!"]
[normalize(t) for t in textos]


### 📌 Parte 2: Busca simples com normalização

In [None]:
def busca_simples(query, base):
    query_norm = normalize(query)
    return [item for item in base if query_norm in normalize(item)]

produtos = [
    "Café Preto", "Chá Verde", "Café com Leite", "Suco de Laranja", "Água Mineral"
]

busca_simples("cafe", produtos)


### 📌 Parte 3: Busca por similaridade com `difflib.get_close_matches`

In [None]:
def busca_similar(query, base, n=3, cutoff=0.6):
    return difflib.get_close_matches(query, base, n=n, cutoff=cutoff)

busca_similar("cafe com leite", produtos)


### 📌 Parte 4: Expressões regulares para busca flexível

In [None]:
def busca_regex(query, base):
    pattern = re.compile(query, re.IGNORECASE)
    return [item for item in base if re.search(pattern, item)]

busca_regex("café|suco", produtos)


### 📌 Parte 5: Exercícios

#### 📝 Exercício 1: Busca aprimorada combinando normalização e similaridade

In [None]:
def busca_aprimorada(query, base):
    norm_base = [normalize(item) for item in base]
    norm_query = normalize(query)
    correspondencias = difflib.get_close_matches(norm_query, norm_base, n=3, cutoff=0.6)
    return [base[norm_base.index(m)] for m in correspondencias]

busca_aprimorada("cafe leite", produtos)


#### 📝 Exercício 2: Nova base de cidades e aplicação das buscas

In [None]:
cidades = ["São Paulo", "Salvador", "Santos", "Santa Catarina", "Rio de Janeiro", "Curitiba", "Brasília", "Belo Horizonte"]

print(busca_simples("sao", cidades))
print(busca_aprimorada("santos", cidades))
print(busca_regex("^S", cidades))


### ✅ Conclusão
Nesta atividade, você aprendeu:
- A importância da normalização textual
- Como realizar buscas simples, por similaridade e com regex
- Técnicas para aumentar a robustez da busca textual em sistemas com entrada variável