Verificação Duplicatas

In [None]:
import pandas as pd

ARQUIVO_EXCEL = "links_chaves_na_mao_motos.xlsx"
ARQUIVO_SAIDA = "links_sem_duplicatas.xlsx"

def remover_duplicatas(arquivo_excel):
    df = pd.read_excel(arquivo_excel)

    if "Link" not in df.columns:
        print("A coluna 'Link' não foi encontrada no arquivo.")
        print("Colunas disponíveis:", df.columns)
        return

    antes = len(df)
    df_sem_duplicatas = df.drop_duplicates(subset=["Link"], keep="first")
    depois = len(df_sem_duplicatas)

    if antes == depois:
        print("✅ Nenhuma duplicata encontrada. O arquivo já está limpo.")
    else:
        print(f"⚠️ Removidas {antes - depois} duplicatas.")
        df_sem_duplicatas.to_excel(ARQUIVO_SAIDA, index=False)
        print(f"✅ Arquivo salvo como '{ARQUIVO_SAIDA}'.")

remover_duplicatas(ARQUIVO_EXCEL)


Combinar varios arquivos

In [None]:
import pandas as pd

df1 = pd.read_excel("ChavesnaMão.xlsx")
df2 = pd.read_excel("dados_carros.xlsx")
df3 = pd.read_excel("dados_anunciantes.xlsx")

coluna1 = df3["Link"]
coluna2 = df3["Anunciantes"]

df_coluna = df3[~df3['Coluna1'].isin(df3['Coluna2'])] 

df3["Link"] = df3["Link"].drop_duplicates()
df3["Anunciantes"] = df3["Anunciantes"].drop_duplicates()

df_combined = pd.concat([df1, df2], ignore_index=True)

df_unique = df_combined.drop_duplicates(subset=["Modelo", "Preço", "Kilometragem", "Link", "Versão"])

df_unique.to_excel("dados_sem_duplicatas.xlsx", index=False)

df_coluna.to_excel('resultado_sem_duplicatas.xlsx', index=False)

print("Arquivo salvo como 'resultado_sem_duplicatas.xlsx'")

print("Arquivo salvo como 'dados_sem_duplicatas_.xlsx'!")


COMBINAR ARQUIVOS

In [None]:
import pandas as pd

df1 = pd.read_excel("ChavesnaMão.xlsx")
df2 = pd.read_excel("dados_carros.xlsx")

df3 = pd.concat([df1, df2], ignore_index=True)  
df3.to_excel("dados_combinados.xlsx", index=False)

SEPARA INFORMAÇÕES

In [None]:
import pandas as pd

def detectar_combustivel(descricao):
    descricao = str(descricao).lower()
    if "flex" in descricao:
        return "Flex"
    elif "gasolina" in descricao:
        return "Gasolina"
    elif "diesel" in descricao:
        return "Diesel"
    elif "híbrido" in descricao:
        return "Híbrido"
    elif "elétrico" in descricao:
        return "Elétrico"
    elif "álcool" in descricao:
        return "Álcool"
    else:
        return "Indefinido"

def processar_planilha(arquivo_entrada, arquivo_saida):
    df = pd.read_excel(arquivo_entrada)
    
    # Supondo que a coluna de descrição do veículo seja "Descrição"
    df["Combustível"] = df["Versão"].apply(detectar_combustivel)
    
    df.to_excel(arquivo_saida, index=False)
    print(f"Processamento concluído. Arquivo salvo como {arquivo_saida}")

# Exemplo de uso
processar_planilha("Versão.xlsx", "veiculos_processados.xlsx")

Pegar informações corretas

In [None]:
import pandas as pd
import re

file_path = "dados_chaves_na_mao.xlsx"

df = pd.read_excel(file_path)

coluna_fipe = "Fipe"
coluna_modelo = "Modelo"
coluna_anunciante = "Anunciante"

def extrair_codigo(texto):
    match = re.search(r"(\d{6}-\d)", str(texto))
    return match.group(1) if match else None

def extrair_preco(texto):
    match = re.search(r"(R\$[\s]*[\d,.]+)", str(texto))
    return match.group(1) if match else None

def extrair_marca(texto):
    return str(texto).split()[0] if pd.notna(texto) else None 

def extrair_modelo(texto):
    partes = str(texto).split()
    return " ".join(partes[1:]) if len(partes) > 1 else None

def ajustar_tipo_anunciante(texto):
    texto = str(texto).lower()

    texto_limpo = re.sub(r"\(\d{2}\)\s?\d{4,5}-\d{4}|ver|whatsapp|anunciante|desde.*?chaves na mão", "", texto, flags=re.IGNORECASE).strip()

    if 'multimarcas' in texto_limpo:
        return 'Concessionária'
    elif 'automoveis' in texto_limpo or 'veiculos' in texto_limpo:
        return 'Loja'
    
    return texto_limpo

df["Anunciante"] = df["Anunciante"].apply(ajustar_tipo_anunciante)

df["Marca"] = df[coluna_modelo].apply(extrair_marca)
df["Modelo"] = df[coluna_modelo].apply(extrair_modelo)
df["Código"] = df[coluna_fipe].apply(extrair_codigo)
df["Preço Fipe"] = df[coluna_fipe].apply(extrair_preco)
df["Anunciante"] = df[coluna_anunciante].apply(ajustar_tipo_anunciante)

output_path = "chaves_na_mao_motos.xlsx"
df.to_excel(output_path, index=False)

print(f"Processo concluído! Resultado salvo em {output_path}")


Tranformar pkl em excel

In [None]:
import pandas as pd
import pickle

ARQUIVO_PICKLE = "dados_progresso.pkl"
ARQUIVO_EXCEL = "dados_chaves_na_mao.xlsx"

# Carregar os dados do arquivo pickle
with open(ARQUIVO_PICKLE, "rb") as f:
    dados = pickle.load(f)

# Converter os dados em um DataFrame e salvar como Excel
df = pd.DataFrame(dados)
df.to_excel(ARQUIVO_EXCEL, index=False)

print(f"✅ Dados exportados para '{ARQUIVO_EXCEL}'.")


In [6]:
import pandas as pd

# Nome do arquivo Excel de entrada
ARQUIVO_EXCEL = "links_sem_duplicatas_motos.xlsx"  # Substitua pelo nome do seu arquivo Excel

# Nome do arquivo PKL de saída
ARQUIVO_PKL = "links_sem_duplicatas_motos.pkl"  # Substitua pelo nome do arquivo PKL desejado

def excel_para_pkl(excel_file, pkl_file):
    try:
        # Carrega o arquivo Excel
        df = pd.read_excel(excel_file)

        # Converte o DataFrame para Pickle
        df.to_pickle(pkl_file)
        
        print(f"Arquivo Excel '{excel_file}' convertido para PKL com sucesso!")
        print(f"Arquivo salvo como '{pkl_file}'.")
    
    except Exception as e:
        print(f"Erro ao converter Excel para PKL: {e}")
        
excel_para_pkl(ARQUIVO_EXCEL, ARQUIVO_PKL)

Arquivo Excel 'links_sem_duplicatas_motos.xlsx' convertido para PKL com sucesso!
Arquivo salvo como 'links_sem_duplicatas_motos.pkl'.
