In [1]:
### Célula 1 - Funções

import os
import time
import requests
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from webdriver_manager.chrome import ChromeDriverManager

def setup_driver_with_profile(profile_path):
    """Configura o driver do Chrome com um perfil específico"""
    chrome_options = Options()
    
    # Adiciona o perfil do Chrome
    chrome_options.add_argument(f"user-data-dir={profile_path}") 
    chrome_options.add_argument("--profile-directory=Default")  # Usa o perfil padrão
    
    # Configurações adicionais
    chrome_options.add_argument("--no-sandbox")
    chrome_options.add_argument("--disable-dev-shm-usage")
    
    # Instala automaticamente o ChromeDriver
    service = Service(ChromeDriverManager().install())
    
    # Cria o driver com as opções configuradas
    driver = webdriver.Chrome(service=service, options=chrome_options)
    return driver

def get_profile_image_url(driver, profile_url):
    """Obtém a URL da imagem de perfil usando Selenium"""
    try:
        driver.get(profile_url)
        time.sleep(3)  # Espera a página carregar
        
        # Localiza a tag de imagem do perfil
        xpath_a = '/html/body/div[1]/div/div/div[2]/div/div/div[1]/div[2]/div/div[1]/section/main/div/header/section[1]/div/span/div/div/a/img'
        xpath_span = '/html/body/div[1]/div/div/div[2]/div/div/div[1]/div[2]/div/div[1]/section/main/div/header/section[1]/div/span/div/div/span/img'
        
        img_element = ''

        if len(driver.find_elements(By.XPATH, xpath_a)) > 0:
            img_element = driver.find_element(By.XPATH, xpath_a)
        
        if len(driver.find_elements(By.XPATH, xpath_span)) > 0:    
            img_element = driver.find_element(By.XPATH, xpath_span)
                
        img_url = img_element.get_attribute('src')

        return img_url
    except Exception as e:
        print(f"Erro ao acessar {profile_url}: {str(e)}")
        return None

def download_image(img_url, profile_username, output_dir='perfis'):
    """Baixa a imagem e salva no diretório especificado"""
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)
    
    try:
        response = requests.get(img_url, stream=True)
        if response.status_code == 200:
            file_path = os.path.join(output_dir, f"{profile_username}.jpg")
            with open(file_path, 'wb') as f:
                for chunk in response.iter_content(1024):
                    f.write(chunk)
            print(f"Imagem salva: {file_path}")
        else:
            print(f"Falha ao baixar imagem de {profile_username}")
    except Exception as e:
        print(f"Erro ao baixar imagem de {profile_username}: {str(e)}")

import csv

def extrair_coluna_instagram(caminho_arquivo):
    lista_instagram = []
    
    try:
        with open(caminho_arquivo, mode='r', encoding='utf-8') as arquivo_csv:
            leitor = csv.DictReader(arquivo_csv)
            
            for linha in leitor:
                lista_instagram.append(linha['link'])
                
    except FileNotFoundError:
        print(f"Erro: Arquivo não encontrado - {caminho_arquivo}")
    except Exception as e:
        print(f"Erro ao processar o arquivo: {e}")
    
    return lista_instagram

In [7]:
### Célula 2 - ### Lista de URLs

profile_path = "C:/Users/mmmar_cz7ohi4/AppData/Local/Google/Chrome/User Data"
caminho = 'dados_perfis.csv' 
profile_urls = extrair_coluna_instagram(caminho)
print(f"\nTotal de contas encontradas: {len(profile_urls)}")



Total de contas encontradas: 43


In [4]:
### Célula 3 - Inicia o driver com perfil
driver = setup_driver_with_profile(profile_path)

In [8]:
### Célula 4 - Processar URLs

for url in profile_urls:
    
    # Extrai o nome de usuário da URL
    username = url.split('/')[-2] if url.endswith('/') else url.split('/')[-1]
    if os.path.exists(f'perfis/{username}.jpg'):
        print(f"Imagem de {username} já existe. Pulando...")
        continue

    time.sleep(5)

    print(f"Processando perfil: {username}")
    img_url = get_profile_image_url(driver, url)
    
    if img_url:
        download_image(img_url, username)
    else:
        print(f"Não foi possível obter a imagem de {username}")

Imagem de acaolivresoccer já existe. Pulando...
Processando perfil: afterburguermcz
Imagem salva: perfis\afterburguermcz.jpg
Imagem de agencia_lighthouse já existe. Pulando...
Imagem de alltrac.autotrac já existe. Pulando...
Imagem de apehouseimobiliaria já existe. Pulando...
Imagem de arenamaceio já existe. Pulando...
Imagem de benditococo.mcz já existe. Pulando...
Imagem de cas.imoveis já existe. Pulando...
Imagem de cheirinbao.shoppingpatiomaceio já existe. Pulando...
Imagem de claraandradeadv já existe. Pulando...
Imagem de clinicadiversos já existe. Pulando...
Imagem de conectauto já existe. Pulando...
Imagem de crecheescolaclarice já existe. Pulando...
Imagem de depilbynanda já existe. Pulando...
Imagem de diangelisbuffet já existe. Pulando...
Imagem de elioliveira.fisio já existe. Pulando...
Imagem de escolasaberkidsmcz já existe. Pulando...
Imagem de feijoadadanaza já existe. Pulando...
Imagem de gilmaraconfeccoes já existe. Pulando...
Imagem de haircare.mcz já existe. Pulando.