## 0.0 imports

In [None]:
import re
import time
import pandas as pd
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import NoSuchElementException

## 1.0 api

In [None]:
# CONFIGURAÇÃO DO DRIVER
service = Service('./chromedriver') 
options = webdriver.ChromeOptions()
driver = webdriver.Chrome(service=service, options=options)

# ACESSAR O SITE
driver.get("https://localize.assertivasolucoes.com.br")
input("🟡 Faça login e vá para a tela de CONSULTA POR CNPJ. Depois pressione ENTER aqui...")

# LER CNPJs DO EXCEL
df = pd.read_excel("Listagem.Xlsx", sheet_name="Listagem Total")
cnpjs_unicos = df.iloc[:, 1].dropna().astype(str).str.replace(r'\D', '', regex=True).unique().tolist()

# DICT DE RESULTADOS
resultados = {}

# LOOP DE CONSULTAS
for cnpj in cnpjs_unicos:
    try:
        print(f"\n🔍 Consultando CNPJ: {cnpj}")

        if cnpj in resultados:
            print(f"⏭️ CNPJ {cnpj} já processado, pulando...")
            continue

        # INSERE O CNPJ NO CAMPO
        campo = WebDriverWait(driver, 15).until(
            EC.presence_of_element_located((By.NAME, "currentSimpleFilterValue")))
        campo.clear()
        campo.send_keys(cnpj)

        # CLICA EM CONSULTAR
        WebDriverWait(driver, 15).until(
            EC.element_to_be_clickable((By.XPATH, '//button[@type="submit"]'))
        ).click()

        # AGUARDA O RESULTADO APARECER
        WebDriverWait(driver, 20).until(
            EC.presence_of_element_located((By.XPATH, "//div[contains(@class, 'MuiGrid-item') and contains(., 'CNPJ:')]"))
        )
        time.sleep(1.5) 

        # COLETAR DADOS
        dados = {}

        # Nome Fantasia
        try:
            full_text = driver.find_element(
                By.XPATH, "//strong[text()='Nome fantasia:']/parent::div").text
            nome_fantasia = full_text.replace("Nome fantasia:", "").strip()
            dados["Nome Fantasia"] = nome_fantasia
        except:
            dados["Nome Fantasia"] = "Dado não localizado"

        # Situação
        try:
            dados["Situação"] = driver.find_element(
                By.XPATH, "//div[contains(@class, 'MuiChip-root')]//span[contains(@class, 'MuiChip-label')]"
            ).text.strip()
        except:
            dados["Situação"] = "Dado não localizado"

        # Telefones
        try:
            telefones = []
            if "Não localizamos nenhum telefone" not in driver.page_source:
                elementos = driver.find_elements(
                    By.XPATH, "//div[contains(@class, 'phone')]//h6[contains(@class, 'number')]"
                )
                telefones = [tel.text.strip() for tel in elementos if tel.text.strip()]
            dados["Telefones"] = ', '.join(telefones) if telefones else "Não encontrado"
        except:
            dados["Telefones"] = "Erro na captura"

        # Endereço
        try:
            endereco = driver.find_element(
                By.XPATH, "//h6[contains(@class,'MuiTypography-subtitle1')]"
            ).text.strip()
            dados["Endereço"] = endereco
        except:
            dados["Endereço"] = "Endereço não localizado"

        # Sócios
        try:
            socios_elementos = driver.find_elements(
                By.XPATH, "//div[span and p[contains(text(),'Data de entrada:')]]/span"
            )
            socios = [el.text.strip() for el in socios_elementos]
            dados["Sócios"] = ', '.join(socios) if socios else "Nenhum sócio encontrado"
        except NoSuchElementException:
            dados["Sócios"] = "Nenhum sócio encontrado"
        except Exception as e:
            dados["Sócios"] = f"Erro na captura: {e}"
            
        # Email
        try:
            element = driver.find_element(
                By.XPATH, "//div[contains(@class, 'MuiBox-root') and contains(., '@')]"
            )
            texto = element.text
            email_match = re.search(r"[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}", texto)
            dados["E-mail"] = email_match.group(0) if email_match else "E-mail não localizado"
        except NoSuchElementException:
            dados["E-mail"] = "E-mail não localizado"
        except Exception as e:
            dados["E-mail"] = f"Erro na captura: {e}"

        # ARMAZENAR RESULTADO
        resultados[cnpj] = dados
        print(f"✅ Dados capturados: {dados}")

        # VOLTAR PARA TELA DE CONSULTA
        driver.get("https://localize.assertivasolucoes.com.br/consulta/cnpj")
        time.sleep(3)

    except Exception as e:
        print(f"❌ Erro ao processar {cnpj}: {e}")
        resultados[cnpj] = {"Erro": str(e)}
        driver.get("https://localize.assertivasolucoes.com.br/consulta/cnpj")
        time.sleep(3)

# EXPORTAR PARA EXCEL 
pd.DataFrame.from_dict(resultados, orient='index').to_excel("resultados_assertiva_final.xlsx")
print(f"\n✅ Processo finalizado! Total de CNPJs processados: {len(resultados)}")
driver.quit()

## 2.0 organizando planilha

In [None]:
dfnew = pd.read_excel('resultados_assertiva_final.xlsx')

### 2.1 split telefones

In [None]:
telefones_split = dfnew['Telefones'].str.split(', ', expand=True)
telefones_split.columns = [f"Telefone_{i+1}" for i in range(telefones_split.shape[1])]

### 2.3 concat final

In [None]:
df_final = pd.concat([dfnew.drop(columns=["Telefones"]), telefones_split], axis=1)
df_final.to_excel("telefones_separados.xlsx", index=False)