<a href="https://colab.research.google.com/github/BrunoStrufaldi/Automa-o-GoogleColab/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [16]:
# Instala a biblioteca necessária para o pandas ler arquivos .xlsx
!pip install openpyxl

import pandas as pd
import re

def extrair_informacoes(nome, descricao):
    """
    Extrai informações chave do nome e da descrição do produto.
    """
    info = {}
    nome = str(nome)
    descricao = str(descricao)
    info['modelo'] = '' # Garante que a chave 'modelo' sempre exista

    # 1. Extrair Marca
    marcas = ['Atlas', 'Electrolux', 'Mueller', 'Esmaltec', 'Realce', 'Clarice', 'Dako']
    for marca in marcas:
        if re.search(r'\b' + marca + r'\b', nome, re.IGNORECASE):
            info['marca'] = marca
            break
    if not info.get('marca'):
         for marca in marcas:
            if re.search(r'\b' + marca + r'\b', descricao, re.IGNORECASE):
                info['marca'] = marca
                break

    # 2. Extrair Peças (SEMPRE NO PLURAL)
    pecas = []
    if 'grelha' in nome.lower() or 'grelhas' in nome.lower(): pecas.append('Grelhas')
    if 'espalhador' in nome.lower() or 'espalhadores' in nome.lower(): pecas.append('Espalhadores')
    if 'queimador' in nome.lower() or 'queimadores' in nome.lower(): pecas.append('Queimadores')
    info['pecas'] = pecas

    # 3. Extrair Número de Bocas (Genérico)
    bocas_match = re.search(r'(\d)\s?(bcs|bc|bocas|b\b)', nome, re.IGNORECASE)
    if bocas_match:
        info['bocas'] = f"{bocas_match.group(1)} Bocas"

    # 4. Extrair Modelo
    modelo_str = nome
    noise_words = [
        'KIT', 'JOGO', 'PEÇAS', 'GRELHA', 'GRELHAS', 'ESMALTADA', 'ESMALTADO',
        'ESPALHADOR', 'ESPALHADORES', 'QUEIMADOR', 'QUEIMADORES',
        'PARA', 'FOGÃO', 'FOGÕES', 'ORIGINAL'
    ]
    if info.get('marca'):
        modelo_str = re.sub(r'\b' + info['marca'] + r'\b', '', modelo_str, flags=re.IGNORECASE)
    modelo_str = re.sub(r'\b(\d[GTPMC].*?)\b', '', modelo_str, flags=re.IGNORECASE)
    bocas_pattern_match = re.search(r'(\d+\s?(?:bcs|bc|bocas|b\b))', modelo_str, re.IGNORECASE)
    if bocas_pattern_match:
        modelo_str = modelo_str.replace(bocas_pattern_match.group(1), '')
    for word in noise_words:
        modelo_str = re.sub(r'\b' + word + r'\b', '', modelo_str, flags=re.IGNORECASE)
    modelo_str = re.sub(r'[^\w\s.]', '', modelo_str)
    modelo_limpo = ' '.join(modelo_str.split())
    if modelo_limpo:
        if info.get('marca') and info['marca'].lower() == 'electrolux':
            info['modelo'] = modelo_limpo.upper()
        else:
            info['modelo'] = modelo_limpo.title()

    # 5. Extrair configuração das bocas
    config = {}
    for line in descricao.split('\n'):
        line = line.strip()
        match = re.search(r'^(\d+)\s*-', line)
        if not match: continue
        count = match.group(1)
        line_upper = line.upper()
        if 'TRIPLA CHAMA' in line_upper: config['TC'] = f"{count}TC"
        elif 'GIGANTE' in line_upper: config['GT'] = f"{count}GT"
        elif 'GRANDES' in line_upper or 'GRANDE' in line_upper: config['G'] = f"{count}G"
        elif 'MÉDIOS' in line_upper or 'MÉDIO' in line_upper: config['M'] = f"{count}M"
        elif 'PEQUENOS' in line_upper or 'PEQUENO' in line_upper: config['P'] = f"{count}P"
    config_list = []
    order = ['TC', 'GT', 'G', 'M', 'P']
    for key in order:
        if key in config: config_list.append(config[key])
    info['config_bocas'] = " ".join(config_list)

    # 6. Extrair lista de compatibilidade
    info['compatibilidade'] = ''
    compat_match = re.search(r'(compat[ií]ve(?:l|is)\s+com.*)', descricao, re.IGNORECASE)
    if compat_match:
        full_phrase = compat_match.group(1).strip()
        if ':' in full_phrase:
            lista_modelos = full_phrase.split(':', 1)[1]
        else:
            lista_modelos = re.sub(r'.*compat[ií]ve(?:l|is)\s+com\s+(?:os\s)?modelos\s*', '', full_phrase, flags=re.IGNORECASE)

        cleaned_models = lista_modelos.strip()
        if cleaned_models:
            info['compatibilidade'] = ' '.join(cleaned_models.split())

    # 7. Keywords Adicionais
    info['sabaf'] = 'Sabaf' if 'sabaf' in descricao.lower() else ''
    return info

def criar_titulo_ml(info):
    pecas_str = '+'.join(info.get('pecas', []))
    if not pecas_str: pecas_str = "Peças"
    marca = info.get('marca', '')
    modelo = info.get('modelo', '')
    compatibilidade = info.get('compatibilidade', '')

    # LÓGICA DE REDUNDÂNCIA INVERTIDA
    if modelo and compatibilidade:
        for part in modelo.split():
            if f' {part.upper()} ' in f' {compatibilidade.upper()} ':
                compatibilidade = re.sub(r'\b' + re.escape(part) + r'\b', '', compatibilidade, flags=re.IGNORECASE)
                compatibilidade = ' '.join(compatibilidade.split()) # Limpa espaços extras

    detalhe_boca = info.get('bocas', '').replace(" ", "")
    templates = [
        f"Kit {pecas_str} Fogão {marca} {modelo} {detalhe_boca}",
        f"{pecas_str} Fogão {marca} {modelo} {detalhe_boca}",
        f"Kit {marca} {modelo} {detalhe_boca}",
        f"Kit {pecas_str} {marca} {detalhe_boca}"
    ]
    for t in templates:
        titulo_final = ' '.join(t.split())
        if len(titulo_final) <= 59:
            titulo_com_espaco = re.sub(r'(\d)Bocas', r'\1 Bocas', titulo_final)
            if len(titulo_com_espaco) <= 59: return titulo_com_espaco
            else: return titulo_final
    return f"Kit {pecas_str} {marca} {modelo}".strip()[:59]


def criar_titulo_shopee(info, index):
    pecas_str = '+'.join(info.get('pecas', []))
    pecas_com_espaco = ' + '.join(info.get('pecas', []))
    marca = info.get('marca', '')
    modelo = info.get('modelo', '')
    bocas = info.get('bocas', '')
    config_bocas = info.get('config_bocas', '')
    sabaf = info.get('sabaf', '')
    compatibilidade = info.get('compatibilidade', '')

    # LÓGICA DE REDUNDÂNCIA INVERTIDA
    if modelo and compatibilidade:
        for part in modelo.split():
            if f' {part.upper()} ' in f' {compatibilidade.upper()} ':
                compatibilidade = re.sub(r'\b' + re.escape(part) + r'\b', '', compatibilidade, flags=re.IGNORECASE)
                compatibilidade = ' '.join(compatibilidade.split()).strip(' -')

    prefixo = f"Kit {pecas_str}" if pecas_str else "Kit Peças Reposição"
    titulo_base = f"{prefixo} Fogão {marca} {modelo} {bocas} {sabaf} {config_bocas}"
    titulo_limpo = ' '.join(titulo_base.split())
    titulo_com_emoji = f"{titulo_limpo} 🔥"
    info_adicional = ''
    beneficio_fixo = "Alta Resistência e Encaixe perfeito"

    if compatibilidade:
        delimiter = ',' if ',' in compatibilidade else ' - '
        modelos = [m.strip() for m in re.split(r',| - ', compatibilidade) if m.strip()]
        texto_compat_full = f"Compatível com {compatibilidade.replace(',', ' -')}"
        if len(titulo_com_emoji) + 1 + len(texto_compat_full) <= 119:
            info_adicional = texto_compat_full
        else:
            for i in range(min(len(modelos), 4), 0, -1):
                modelos_a_mostrar = modelos[:i]
                lista_curta_str = ", ".join(modelos_a_mostrar)
                sufixo = " e mais" if len(modelos) > i else ""
                texto_curto = f"Compatível com {lista_curta_str}{sufixo}"
                if len(titulo_com_emoji) + 1 + len(texto_curto) <= 119:
                    info_adicional = texto_curto
                    break
    else:
        if len(titulo_com_emoji) + 1 + len(beneficio_fixo) <= 119:
            info_adicional = beneficio_fixo

    titulo_final = f"{titulo_com_emoji} {info_adicional}"
    return ' '.join(titulo_final.split())[:119]

# --- BLOCO PRINCIPAL ---
nome_arquivo_entrada = '/Titulo.xlsx'
nome_arquivo_saida = 'titulos_gerados.xlsx'
try:
    if nome_arquivo_entrada.endswith('.xlsx'):
        df = pd.read_excel(nome_arquivo_entrada)
        print(f"Arquivo Excel '{nome_arquivo_entrada}' lido com sucesso!")
    else:
        df = pd.read_csv(nome_arquivo_entrada)
        print(f"Arquivo CSV '{nome_arquivo_entrada}' lido com sucesso!")
except FileNotFoundError:
    print(f"ERRO: Arquivo '{nome_arquivo_entrada}' não encontrado.")
    df = None
except Exception as e:
    print(f"Ocorreu um erro ao ler o arquivo: {e}")
    df = None
if df is not None:
    titulos_ml = []
    titulos_shopee = []
    for index, row in df.iterrows():
        informacoes = extrair_informacoes(row['Nome do Produto'], row['Descrição do Produto'])
        titulos_ml.append(criar_titulo_ml(informacoes))
        titulos_shopee.append(criar_titulo_shopee(informacoes, index))
        if (index + 1) % 100 == 0:
            print(f"Processando linha {index+1}/{len(df)}...")
    df_saida = pd.DataFrame({
        'Titulo Mercado Livre (60 caracteres)': titulos_ml,
        'Titulo Shopee (120 caracteres)': titulos_shopee
    })
    df_saida.to_excel(nome_arquivo_saida, index=False)
    print(f"\nProcesso finalizado! O arquivo '{nome_arquivo_saida}' foi gerado com sucesso.")

Arquivo Excel '/Titulo.xlsx' lido com sucesso!
Processando linha 100/1179...
Processando linha 200/1179...
Processando linha 300/1179...
Processando linha 400/1179...
Processando linha 500/1179...
Processando linha 600/1179...
Processando linha 700/1179...
Processando linha 800/1179...
Processando linha 900/1179...
Processando linha 1000/1179...
Processando linha 1100/1179...

Processo finalizado! O arquivo 'titulos_gerados.xlsx' foi gerado com sucesso.
