In [2]:
import time
import random
import csv
import os
from datetime import datetime, timedelta
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support.ui import Select, WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException, NoSuchElementException

# Fonction de pause al√©atoire pour simuler un comportement humain
def human_pause(min_sec=2, max_sec=5):
    time.sleep(random.uniform(min_sec, max_sec))

# Initialisation des fichiers de log
log_date = datetime.now().strftime("%Y-%m-%d")
log_filename = f"log_consultations_{log_date}.csv"
error_log_filename = f"error_log_{log_date}.log"

with open(log_filename, mode='w', newline='', encoding='utf-8') as log_file:
    writer = csv.writer(log_file)
    writer.writerow(["Date", "URL Consultation", "Titre", "Acheteur", "Statut", "Erreur"])

# Fonction pour enregistrer les erreurs dans un fichier .log
def log_error(message):
    with open(error_log_filename, mode='a', encoding='utf-8') as f:
        timestamp = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        f.write(f"[{timestamp}] {message}\n")
    print(f"ERREUR: {message}")

# Fonction pour enregistrer les activit√©s
def log_activity(url, titre="", acheteur="", statut="", erreur=""):
    with open(log_filename, mode='a', newline='', encoding='utf-8') as log_file:
        writer = csv.writer(log_file)
        writer.writerow([datetime.now().strftime("%Y-%m-%d %H:%M:%S"), url, titre, acheteur, statut, erreur])

# Fonction pour cr√©er un rapport d√©taill√© des t√©l√©chargements
def create_download_report():
    try:
        report_filename = f"rapport_telechargements_{log_date}.txt"
        with open(report_filename, 'w', encoding='utf-8') as f:
            f.write("=" * 60 + "\n")
            f.write("RAPPORT DE T√âL√âCHARGEMENT - MARCH√âS PUBLICS MAROC\n")
            f.write("=" * 60 + "\n")
            f.write(f"Date d'ex√©cution : {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}\n")
            f.write(f"R√©pertoire de t√©l√©chargement : {download_dir}\n")
            f.write("\n")
            
            if os.path.exists(download_dir):
                files = os.listdir(download_dir)
                f.write(f"Nombre de fichiers t√©l√©charg√©s : {len(files)}\n")
                f.write("\nListe des fichiers :\n")
                for file_name in files: # Renamed 'file' to 'file_name' to avoid conflict
                    file_path = os.path.join(download_dir, file_name)
                    if os.path.isfile(file_path):
                        file_size = os.path.getsize(file_path)
                        f.write(f"- {file_name} ({file_size} octets)\n")
            else:
                f.write("Aucun fichier t√©l√©charg√©\n")
                
        print(f"üìÑ Rapport cr√©√© : {report_filename}")
        return report_filename
    except Exception as e:
        print(f"Erreur cr√©ation rapport : {e}")
        return None

# Configuration furtive de Selenium
options = Options()
options.add_argument("--start-maximized")
options.add_argument("--disable-blink-features=AutomationControlled")
options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/123.0 Safari/537.36")

# Configuration du r√©pertoire de t√©l√©chargement
download_dir = os.path.join(os.getcwd(), "downloads")
if not os.path.exists(download_dir):
    os.makedirs(download_dir)

prefs = {
    "download.default_directory": download_dir,
    "download.prompt_for_download": False,
    "download.directory_upgrade": True,
    "safeBrowse.enabled": True
}
options.add_experimental_option("prefs", prefs)

# Initialisation du navigateur
driver = webdriver.Chrome(options=options)
driver.execute_script("Object.defineProperty(navigator, 'webdriver', {get: () => undefined})")

print("üöÄ D√©marrage du scraper de march√©s publics")

# Acc√®s au site via Google
try:
    print("üîç Recherche du site via Google...")
    driver.get("https://www.google.com")
    human_pause()
    
    try:
        # Essayer d'accepter les cookies sur Google
        accept_buttons = driver.find_elements(By.XPATH, '//button[div[contains(text(), "Accept all")]] | //button[div[contains(text(), "Tout accepter")]] | //button[contains(text(), "J\'accepte")] | //button[contains(text(), "Accept all")]')
        if accept_buttons:
            accept_buttons[0].click()
            print("Cookies Google accept√©s.")
            human_pause()
    except Exception as e:
        print(f"Pas de bouton cookies Google ou erreur lors de l'acceptation : {e}")

    search_box = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.NAME, "q")))
    search_box.send_keys("march√©s publics maroc")
    human_pause(1, 2)
    search_box.send_keys(Keys.RETURN)
    human_pause(3, 5)

    link = WebDriverWait(driver, 15).until(
        EC.element_to_be_clickable((By.XPATH, "//a[contains(@href, 'marchespublics.gov.ma')][h3]"))
    )
    print(f"üîó Lien trouv√©: {link.get_attribute('href')}")
    link.click()
    human_pause(5, 7)
    print("‚úÖ Acc√®s au site marchespublics.gov.ma r√©ussi")
    
    try:
        WebDriverWait(driver, 5).until(EC.frame_to_be_available_and_switch_to_it((By.ID, 'iframeconsent')))
        accept_button_site = WebDriverWait(driver, 5).until(EC.element_to_be_clickable((By.ID, 'axeptio_btn_acceptAll')))
        accept_button_site.click()
        driver.switch_to.default_content()
        print("üç™ Cookies du site des march√©s publics accept√©s.")
        human_pause(2,3)
    except TimeoutException:
        print("Pas de pop-up/cookies g√©r√© sur le site des march√©s publics ou d√©j√† accept√©.")
        driver.switch_to.default_content()
    except Exception as e:
        print(f"Erreur lors de la gestion des cookies/pop-ups du site : {e}")
        driver.switch_to.default_content()

except Exception as e:
    log_error(f"Erreur acc√®s site march√©s publics : {e}")
    driver.quit()
    exit()

# Acc√®s √† la recherche avanc√©e de consultations en cours
try:
    print("üìã Acc√®s aux consultations en cours...")
    consultations_link = WebDriverWait(driver, 20).until(EC.element_to_be_clickable((By.LINK_TEXT, "Consultations en cours")))
    consultations_link.click()
    human_pause(5, 6)
    print("‚úÖ Page consultations en cours charg√©e")
except Exception as e:
    log_error(f"Erreur lien 'Consultations en cours' : {e}")
    driver.quit()
    exit()

# S√©lection cat√©gorie "Services"
try:
    print("üè∑Ô∏è S√©lection de la cat√©gorie Services...")
    select_cat_element = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_AdvancedSearch_categorie"))
    )
    Select(select_cat_element).select_by_visible_text("Services")
    print("‚úÖ Cat√©gorie 'Services' s√©lectionn√©e.")
    human_pause(2, 3)
except Exception as e:
    log_error(f"Erreur s√©lection cat√©gorie : {e}")

# Configuration des dates
print("üìÖ Configuration des dates...")

aujourd_hui = datetime.now()
date_2mois_plus_tard = (aujourd_hui + timedelta(days=60)).strftime('%d/%m/%Y') # Au moins 2 mois
delai_maximum = (aujourd_hui + timedelta(days=210)).strftime('%d/%m/%Y') # Au moins 9 mois
hier = (aujourd_hui - timedelta(days=1)).strftime('%d/%m/%Y')
aujourd_hui_str = aujourd_hui.strftime('%d/%m/%Y')

try:
    # Mise en ligne : d'hier √† aujourd'hui
    champ_debut_pub = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_AdvancedSearch_dateMiseEnLigneCalculeStart"))
    )
    champ_debut_pub.clear()
    champ_debut_pub.send_keys(hier)

    champ_fin_pub = driver.find_element(By.ID, "ctl0_CONTENU_PAGE_AdvancedSearch_dateMiseEnLigneCalculeEnd")
    champ_fin_pub.clear()
    champ_fin_pub.send_keys(aujourd_hui_str)

    # Remise des plis : d'aujourd'hui √† aujourd'hui + 2 mois
    champ_debut_plis = driver.find_element(By.ID, "ctl0_CONTENU_PAGE_AdvancedSearch_dateRemisePlisStart")
    champ_debut_plis.clear()
    champ_debut_plis.send_keys(aujourd_hui_str)

    champ_fin_plis = driver.find_element(By.ID, "ctl0_CONTENU_PAGE_AdvancedSearch_dateRemisePlisEnd")
    champ_fin_plis.clear()
    champ_fin_plis.send_keys(date_2mois_plus_tard)
    
    print(f"‚úÖ Dates configur√©es : Publication {hier}-{aujourd_hui_str}, Remise des plis {date_2mois_plus_tard}-{delai_maximum}")
    human_pause(1, 2)
    
except Exception as e:
    log_error(f"Erreur dans les champs de date : {e}")

# Lancer la recherche
try:
    print("üöÄ Lancement de la recherche...")
    search_button = driver.find_element(By.ID, "ctl0_CONTENU_PAGE_AdvancedSearch_lancerRecherche")
    driver.execute_script("arguments[0].click();", search_button)
    print("‚úÖ Recherche lanc√©e via JavaScript")
    
    wait_conditions = [
        EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_resultSearch_listePageSizeTop")),
        EC.presence_of_element_located((By.CLASS_NAME, "table-results")),
        EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_resultSearch_panelElementsFound"))
    ]
    
    element_found = False
    for condition in wait_conditions:
        try:
            WebDriverWait(driver, 15).until(condition)
            print("‚úÖ Page de r√©sultats charg√©e")
            element_found = True
            break
        except TimeoutException:
            continue
    
    if not element_found:
        raise TimeoutException("Aucun √©l√©ment de r√©sultat de recherche (table, pagination) trouv√© apr√®s clic sur 'Lancer la recherche'")
        
    human_pause(3, 5)
    
except Exception as e:
    log_error(f"Erreur lancement recherche : {e}")
    print("‚ö†Ô∏è Tentative de continuation malgr√© l'erreur de chargement des r√©sultats...")

# Configuration de la pagination
try:
    print("üìÑ Configuration de la pagination...")
    pagination_element = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_resultSearch_listePageSizeTop"))
    )
    select_pagination = Select(pagination_element)
    
    # Choisir la valeur la plus √©lev√©e (500 si disponible, sinon la derni√®re option)
    highest_value_option = select_pagination.options[-1].get_attribute('value')
    if "500" in [opt.get_attribute('value') for opt in select_pagination.options]:
        select_pagination.select_by_value("500")
        print("‚úÖ Pagination configur√©e √† 500 r√©sultats par page")
    else:
        select_pagination.select_by_value(highest_value_option)
        print(f"‚úÖ Pagination configur√©e √† {highest_value_option} r√©sultats par page (valeur la plus √©lev√©e disponible)")

    human_pause(5, 7) # Attendre le rechargement
    WebDriverWait(driver, 20).until(EC.presence_of_element_located((By.CLASS_NAME, "table-results")))
    print("‚úÖ Page recharg√©e avec nouvelle pagination")
    
except Exception as e:
    log_error(f"Erreur configuration pagination : {e}")
    print("‚ö†Ô∏è Continuation avec pagination par d√©faut")

# Parcours des consultations et t√©l√©chargement
try:
    print("üìä Extraction des consultations...")
    soup = BeautifulSoup(driver.page_source, 'html.parser')
    table_results = soup.find("table", class_="table-results")
    
    if not table_results:
        log_error("Tableau des r√©sultats non trouv√© apr√®s configuration pagination.")
        print("‚ùå Aucun tableau de r√©sultats trouv√© pour l'extraction.")
    else:
        rows = table_results.find("tbody").find_all("tr") if table_results.find("tbody") else table_results.find_all("tr")
        print(f"üìã {len(rows)} lignes trouv√©es dans le tableau")
        
        consultations_traitees = 0
        consultations_telechargees = 0
        
        for i, row in enumerate(rows):
            status = "√âchec"
            error_msg = ""
            titre_consultation = "Titre non disponible"
            current_consultation_url_for_log = "URL non accessible"

            try:
                actions_cell = row.find("td", class_="actions")
                if not actions_cell:
                    continue
                
                consultation_link_tag = actions_cell.find("a", href=True, title="Acc√©der √† la consultation")
                if not consultation_link_tag: # Fallback si title n'est pas l√†
                    consultation_link_tag = actions_cell.find("a", href=True) 
                if not consultation_link_tag:
                    continue
                
                href = consultation_link_tag.get('href')
                if not href or href == "":
                    continue
                
                if href.startswith('/'):
                    consultation_url = "https://www.marchespublics.gov.ma" + href
                elif not href.startswith('http'):
                    consultation_url = "https://www.marchespublics.gov.ma/" + href # Assumer que c'est relatif au domaine
                else:
                    consultation_url = href
                
                current_consultation_url_for_log = consultation_url
                consultations_traitees += 1
                print(f"\nüìã [{consultations_traitees}/{len(rows)}] Traitement consultation: {consultation_url}")
                
                driver.get(consultation_url)
                human_pause(3, 5)
                
                try:
                    titre_consultation = driver.title or "Titre non disponible"
                except:
                    pass # titre_consultation reste "Titre non disponible"

                # --- PROCESSUS DE T√âL√âCHARGEMENT EN PLUSIEURS √âTAPES ---
                try:
                    print("üîó Recherche du lien 'Dossier de consultation' (vers formulaire)...")
                    dossier_consultation_link_to_form = WebDriverWait(driver, 15).until(
                        EC.element_to_be_clickable((By.ID, "ctl0_CONTENU_PAGE_linkDownloadDce")) #
                    )
                    print("üìÑ Lien 'Dossier de consultation' (vers formulaire) trouv√©.")
                    driver.execute_script("arguments[0].scrollIntoView({behavior: 'smooth', block: 'center'});", dossier_consultation_link_to_form)
                    human_pause(1,2)
                    dossier_consultation_link_to_form.click()
                    print("‚úÖ Clic sur 'Dossier de consultation', navigation vers formulaire.")
                    human_pause(4, 6)

                    print("üìù Remplissage du formulaire de t√©l√©chargement...")

                    # Attendre que la page soit compl√®tement charg√©e
                    time.sleep(3)

                    # Attendre que le formulaire principal soit pr√©sent
                    try:
                        WebDriverWait(driver, 20).until(
                            EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_panelEntrepriseFormulaireDemande"))
                        )
                        print("‚úÖ Formulaire d√©tect√©")
                    except Exception as e:
                        print(f"‚ùå Formulaire non trouv√© : {e}")
                        raise

                    # Attendre sp√©cifiquement que le bloc des coordonn√©es soit pr√©sent
                    try:
                        WebDriverWait(driver, 15).until(
                            EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_EntrepriseFormulaireDemande__blocMesCoordonnees"))
                        )
                        print("‚úÖ Bloc coordonn√©es d√©tect√©")
                    except Exception as e:
                        print(f"‚ùå Bloc coordonn√©es non trouv√© : {e}")

                    # Donn√©es √† remplir
                    form_data = {
                        "nom": "YONLI",
                        "prenom": "Fid√®le", 
                        "email": "Fidele@immersion.ma"
                    }

                    # 1. Remplir le champ NOM
                    try:
                        print("üîç Recherche du champ NOM...")
                        nom_field = WebDriverWait(driver, 15).until(
                            EC.element_to_be_clickable((By.ID, "ctl0_CONTENU_PAGE_EntrepriseFormulaireDemande_nom"))
                        )
    
                        # Scroll et focus sur l'√©l√©ment
                        driver.execute_script("arguments[0].scrollIntoView({behavior: 'smooth', block: 'center'});", nom_field)
                        driver.execute_script("arguments[0].focus();", nom_field)
                        time.sleep(1)
    
                        # Effacer et remplir
                        nom_field.clear()
                        time.sleep(0.5)
                        nom_field.send_keys(form_data["nom"])
                        print(f"‚úÖ Champ NOM rempli avec : {form_data['nom']}")
    
                    except Exception as e:
                        print(f"‚ùå Erreur champ NOM : {e}")

                    # 2. Remplir le champ PR√âNOM
                    try:
                        print("üîç Recherche du champ PR√âNOM...")
                        prenom_field = WebDriverWait(driver, 15).until(
                            EC.element_to_be_clickable((By.ID, "ctl0_CONTENU_PAGE_EntrepriseFormulaireDemande_prenom"))
                        )
    
                        # Scroll et focus sur l'√©l√©ment
                        driver.execute_script("arguments[0].scrollIntoView({behavior: 'smooth', block: 'center'});", prenom_field)
                        driver.execute_script("arguments[0].focus();", prenom_field)
                        time.sleep(1)
    
                        # Effacer et remplir
                        prenom_field.clear()
                        time.sleep(0.5)
                        prenom_field.send_keys(form_data["prenom"])
                        print(f"‚úÖ Champ PR√âNOM rempli avec : {form_data['prenom']}")
    
                    except Exception as e:
                        print(f"‚ùå Erreur champ PR√âNOM : {e}")
                        # Essayer avec un s√©lecteur CSS alternatif
                        try:
                            print("üîç Tentative alternative pour PR√âNOM...")
                            prenom_field_alt = driver.find_element(By.CSS_SELECTOR, "input[id*='prenomValidator']")
                            driver.execute_script("arguments[0].scrollIntoView(true);", prenom_field_alt)
                            driver.execute_script("arguments[0].focus();", prenom_field_alt)
                            time.sleep(1)
                            prenom_field_alt.clear()
                            prenom_field_alt.send_keys(form_data["prenom"])
                            print(f"‚úÖ Champ PR√âNOM rempli (m√©thode alternative) avec : {form_data['prenom']}")
                        except Exception as e2:
                            print(f"‚ùå Erreur alternative PR√âNOM : {e2}")

                    # 3. Remplir le champ EMAIL
                    try:
                        print("üîç Recherche du champ EMAIL...")
                        email_field = WebDriverWait(driver, 15).until(
                            EC.element_to_be_clickable((By.ID, "ctl0_CONTENU_PAGE_EntrepriseFormulaireDemande_email"))
                        )
    
                        # Scroll et focus sur l'√©l√©ment
                        driver.execute_script("arguments[0].scrollIntoView({behavior: 'smooth', block: 'center'});", email_field)
                        driver.execute_script("arguments[0].focus();", email_field)
                        time.sleep(1)
    
                        # Effacer et remplir
                        email_field.clear()
                        time.sleep(0.5)
                        email_field.send_keys(form_data["email"])
                        print(f"‚úÖ Champ EMAIL rempli avec : {form_data['email']}")
    
                    except Exception as e:
                        print(f"‚ùå Erreur champ EMAIL : {e}")

                    # 4. Cocher la case des conditions g√©n√©rales
                    try:
                        print("üîç Recherche de la case √† cocher...")
                        checkbox = WebDriverWait(driver, 15).until(
                            EC.element_to_be_clickable((By.ID, "ctl0_CONTENU_PAGE_EntrepriseFormulaireDemande_accepterConditions"))
                        )
    
                        # Scroll vers la checkbox
                        driver.execute_script("arguments[0].scrollIntoView({behavior: 'smooth', block: 'center'});", checkbox)
                        time.sleep(1)
    
                        # V√©rifier si d√©j√† coch√©e
                        if not checkbox.is_selected():
                            # Essayer le clic JavaScript
                            driver.execute_script("arguments[0].checked = true;", checkbox)
                            time.sleep(0.5)
        
                            # V√©rifier si cela a fonctionn√©
                            if not checkbox.is_selected():
                                # Essayer le clic classique
                                checkbox.click()
    
                        print("‚úÖ Case des conditions g√©n√©rales coch√©e")
    
                    except Exception as e:
                        print(f"‚ùå Erreur case √† cocher : {e}")

                    # Pause avant validation
                    print("‚è≥ Pause avant validation...")
                    human_pause(2, 3)

                    # 5. Cliquer sur le bouton Valider
                    try:
                        print("üîç Recherche du bouton Valider...")
                        validate_btn = WebDriverWait(driver, 15).until(
                            EC.element_to_be_clickable((By.ID, "ctl0_CONTENU_PAGE_validateButton"))
                        )
    
                        # Scroll vers le bouton
                        driver.execute_script("arguments[0].scrollIntoView({behavior: 'smooth', block: 'center'});", validate_btn)
                        time.sleep(2)
    
                        # V√©rifier que le bouton est bien visible et activ√©
                        if validate_btn.is_displayed() and validate_btn.is_enabled():
                            print("‚úÖ Bouton trouv√© et pr√™t")
        
                            # Essayer plusieurs m√©thodes de clic
                            try:
                                # M√©thode 1: Clic JavaScript
                                driver.execute_script("arguments[0].click();", validate_btn)
                                print("‚úÖ Bouton 'Valider' cliqu√© (JavaScript)")
            
                            except Exception as click_e:
                                try:
                                    # M√©thode 2: Clic classique
                                    validate_btn.click()
                                    print("‚úÖ Bouton 'Valider' cliqu√© (classique)")
                
                                except Exception as click_e2:
                                    # M√©thode 3: Submit du formulaire directement
                                    form = driver.find_element(By.ID, "ctl0_ctl2")
                                    form.submit()
                                    print("‚úÖ Formulaire soumis directement")
                        else:
                            print("‚ö†Ô∏è  Bouton trouv√© mais pas interactif")
        
                        # Pause pour le traitement
                        print("‚è≥ Attente du traitement...")
                        human_pause(5, 8)
    
                    except Exception as e:
                        print(f"‚ùå Erreur bouton valider : {e}")
    
                        # Derni√®re tentative: soumission JavaScript
                        try:
                            print("üîÑ Tentative de soumission JavaScript...")
                            driver.execute_script("document.getElementById('ctl0_ctl2').submit();")
                            print("‚úÖ Formulaire soumis via JavaScript")
                            human_pause(5, 8)
                        except Exception as final_e:
                            print(f"‚ùå √âchec final : {final_e}")

                    print("‚úÖ Processus de remplissage du formulaire termin√©")
                    
                    print("‚¨áÔ∏è Recherche du lien de t√©l√©chargement final...")
                    
                    # Attendre que la page se charge compl√®tement apr√®s soumission du formulaire
                    try:
                        # Premi√®re v√©rification : attendre que le div contenant le lien soit pr√©sent
                        print("üîç V√©rification de la pr√©sence du conteneur de t√©l√©chargement...")
                        download_container = WebDriverWait(driver, 30).until(
                            EC.presence_of_element_located((By.ID, "ctl0_CONTENU_PAGE_panelEntrepriseDownloadDce"))
                        )
                        print("‚úÖ Conteneur de t√©l√©chargement d√©tect√©")
                        
                        # Attendre un peu plus pour que le contenu se charge
                        human_pause(3, 5)
                        
                        # M√©thodes multiples pour trouver le lien de t√©l√©chargement
                        final_download_link = None
                        link_text_final = ""
                        
                        # M√©thode 1 : Par ID direct
                        try:
                            print("üîç M√©thode 1 : Recherche par ID direct...")
                            final_download_link = WebDriverWait(driver, 15).until(
                                EC.element_to_be_clickable((By.ID, "ctl0_CONTENU_PAGE_EntrepriseDowloadDce_nomDce"))
                            )
                            link_text_final = final_download_link.text.strip()
                            if link_text_final:
                                print(f"‚úÖ Lien trouv√© par ID : '{link_text_final}'")
                            else:
                                # Si le texte est vide, v√©rifier l'attribut href
                                href = final_download_link.get_attribute('href')
                                if href and href != "":
                                    print(f"‚úÖ Lien trouv√© par ID avec href : {href}")
                                else:
                                    final_download_link = None
                                    print("‚ùå Lien trouv√© par ID mais sans contenu")
                        except Exception as e1:
                            print(f"‚ùå M√©thode 1 √©chou√©e : {str(e1)[:100]}...")
                            final_download_link = None
                        
                        # M√©thode 2 : Recherche dans le conteneur par tag 'a'
                        if final_download_link is None:
                            try:
                                print("üîç M√©thode 2 : Recherche de liens dans le conteneur...")
                                links_in_container = download_container.find_elements(By.TAG_NAME, "a")
                                for link in links_in_container:
                                    href = link.get_attribute('href')
                                    text = link.text.strip()
                                    if href and href != "" and href != driver.current_url:
                                        final_download_link = link
                                        link_text_final = text if text else "T√©l√©charger"
                                        print(f"‚úÖ Lien trouv√© dans conteneur : '{link_text_final}' - {href}")
                                        break
                            except Exception as e2:
                                print(f"‚ùå M√©thode 2 √©chou√©e : {str(e2)[:100]}...")
                        
                        # M√©thode 3 : Recherche par XPath plus g√©n√©rique
                        if final_download_link is None:
                            try:
                                print("üîç M√©thode 3 : Recherche par XPath...")
                                xpath_selectors = [
                                    "//div[@id='ctl0_CONTENU_PAGE_panelEntrepriseDownloadDce']//a[@href and @href!='']",
                                    "//a[contains(@id, 'nomDce')]",
                                    "//a[contains(@href, 'download') or contains(@href, 'telecharger') or contains(@href, 'dce')]"
                                ]
                                
                                for xpath in xpath_selectors:
                                    try:
                                        elements = driver.find_elements(By.XPATH, xpath)
                                        for element in elements:
                                            href = element.get_attribute('href')
                                            if href and href != "" and href != driver.current_url:
                                                final_download_link = element
                                                link_text_final = element.text.strip() if element.text.strip() else "T√©l√©charger"
                                                print(f"‚úÖ Lien trouv√© par XPath : '{link_text_final}' - {href}")
                                                break
                                        if final_download_link:
                                            break
                                    except Exception as xpath_e:
                                        continue
                            except Exception as e3:
                                print(f"‚ùå M√©thode 3 √©chou√©e : {str(e3)[:100]}...")
                        
                        # Si aucun lien trouv√©, sauvegarder la page pour debug
                        if final_download_link is None:
                            print("‚ùå Aucun lien de t√©l√©chargement trouv√©")
                            # Afficher le contenu du conteneur pour debug
                            try:
                                container_html = download_container.get_attribute('innerHTML')
                                print(f"üîç Contenu du conteneur de t√©l√©chargement :")
                                print(container_html[:500] + "..." if len(container_html) > 500 else container_html)
                            except:
                                pass
                            
                            # Sauvegarder la page compl√®te
                            debug_filename_no_link = f"debug_no_download_link_{consultations_traitees}.html"
                            with open(os.path.join(download_dir, debug_filename_no_link), 'w', encoding='utf-8') as f_debug:
                                f_debug.write(driver.page_source)
                            print(f"üîç Page sauvegard√©e pour debug : {debug_filename_no_link}")
                            
                            raise Exception("Aucun lien de t√©l√©chargement valide trouv√©")
                        
                        # Effectuer le t√©l√©chargement
                        print(f"üîó Lien de t√©l√©chargement final trouv√© : '{link_text_final}'")
                        
                        # Scroll vers l'√©l√©ment
                        driver.execute_script("arguments[0].scrollIntoView({behavior: 'smooth', block: 'center'});", final_download_link)
                        human_pause(1, 2)
                        
                        # V√©rifier si l'√©l√©ment est toujours cliquable
                        try:
                            WebDriverWait(driver, 10).until(EC.element_to_be_clickable(final_download_link))
                        except:
                            print("‚ö†Ô∏è √âl√©ment peut-√™tre pas compl√®tement cliquable, tentative quand m√™me...")
                        
                        # Tentative de clic (m√©thodes multiples)
                        click_success = False
                        
                        # M√©thode 1 : Clic normal
                        try:
                            final_download_link.click()
                            click_success = True
                            print("‚úÖ Clic normal r√©ussi")
                        except Exception as click_e1:
                            print(f"‚ùå Clic normal √©chou√© : {str(click_e1)[:100]}...")
                        
                        # M√©thode 2 : Clic JavaScript
                        if not click_success:
                            try:
                                driver.execute_script("arguments[0].click();", final_download_link)
                                click_success = True
                                print("‚úÖ Clic JavaScript r√©ussi")
                            except Exception as click_e2:
                                print(f"‚ùå Clic JavaScript √©chou√© : {str(click_e2)[:100]}...")
                        
                        # M√©thode 3 : Navigation directe vers l'URL
                        if not click_success:
                            try:
                                href = final_download_link.get_attribute('href')
                                if href and href != "":
                                    driver.get(href)
                                    click_success = True
                                    print("‚úÖ Navigation directe r√©ussie")
                            except Exception as click_e3:
                                print(f"‚ùå Navigation directe √©chou√©e : {str(click_e3)[:100]}...")
                        
                        if not click_success:
                            raise Exception("Impossible de cliquer sur le lien de t√©l√©chargement")
                        
                        status = "T√©l√©charg√© (formulaire)"
                        consultations_telechargees += 1
                        print("‚úÖ‚úÖ Dossier t√©l√©charg√© avec succ√®s apr√®s formulaire.")
                        human_pause(6, 10)  # Pause plus longue pour le t√©l√©chargement
                    
                    except Exception as form_download_e:
                        status = "Erreur formulaire/t√©l√©chargement"
                        error_msg = str(form_download_e)
                        log_error(f"Erreur processus formulaire/t√©l√©chargement pour {consultation_url} : {form_download_e}")
                        debug_filename_form = f"debug_page_form_dl_error_{consultations_traitees}.html"
                        with open(os.path.join(download_dir, debug_filename_form), 'w', encoding='utf-8') as f_debug:
                            f_debug.write(driver.page_source)
                        print(f"üîç Page (erreur formulaire/DL) sauvegard√©e : {debug_filename_form}")
                        
                        # Informations suppl√©mentaires pour le debug
                        try:
                            print("üîç Informations de debug suppl√©mentaires :")
                            print(f"URL actuelle : {driver.current_url}")
                            
                            # V√©rifier si on est sur la bonne page
                            page_title = driver.title
                            print(f"Titre de la page : {page_title}")
                            
                            # Chercher tous les liens sur la page
                            all_links = driver.find_elements(By.TAG_NAME, "a")
                            download_related_links = []
                            for link in all_links:
                                href = link.get_attribute('href')
                                text = link.text.strip()
                                if href and any(keyword in href.lower() for keyword in ['download', 'telecharger', 'dce', '.pdf', '.zip', '.doc']):
                                    download_related_links.append(f"Texte: '{text}' - Href: {href}")
                            
                            if download_related_links:
                                print("üìé Liens potentiels de t√©l√©chargement trouv√©s :")
                                for link_info in download_related_links[:5]:  # Afficher les 5 premiers
                                    print(f"  - {link_info}")
                            else:
                                print("‚ùå Aucun lien de t√©l√©chargement potentiel trouv√©")
                                
                        except Exception as debug_e:
                            print(f"Erreur lors du debug : {debug_e}")
                    
                    # --- FIN DU NOUVEAU PROCESSUS ---

                except Exception as download_error:
                    status = "Erreur t√©l√©chargement"
                    error_msg = str(download_error)
                    log_error(f"Erreur lors du t√©l√©chargement pour {consultation_url} : {download_error}")
                    print(f"‚ùå Erreur t√©l√©chargement : {download_error}")

                # Enregistrer l'activit√© dans le log
                log_activity(consultation_url, titre_consultation, "", status, error_msg)
                human_pause(2, 4)
                
            except Exception as e_outer: # Erreur dans le traitement d'une consultation (avant le bloc de t√©l√©chargement)
                status = "Erreur traitement consultation"
                error_msg = str(e_outer)
                log_error(f"Erreur traitement consultation {current_consultation_url_for_log} (ligne {i}) : {e_outer}")
                log_activity(current_consultation_url_for_log, titre_consultation, "", status, error_msg)
                # Sauvegarder la page en cas d'erreur ici aussi
                debug_filename_outer = f"debug_page_consult_error_{consultations_traitees}.html"
                try:
                    with open(os.path.join(download_dir, debug_filename_outer), 'w', encoding='utf-8') as f_debug:
                        f_debug.write(driver.page_source)
                    print(f"üîç Page (erreur consultation) sauvegard√©e : {debug_filename_outer}")
                except Exception as e_save:
                    print(f"Impossible de sauvegarder la page de debug : {e_save}")
                continue # Passer √† la consultation suivante
        
        print("\n" + "=" * 60)
        print("‚úÖ SCRAPING TERMIN√â")
        print(f"üìä Consultations trait√©es : {consultations_traitees}")
        print(f"üì• T√©l√©chargements r√©ussis (via formulaire) : {consultations_telechargees}")
        print(f"üìã Log d√©taill√© : {log_filename}")
        print(f"üö® Log d'erreurs : {error_log_filename}")
        print(f"üìÇ Fichiers t√©l√©charg√©s dans : {download_dir}")
        
        rapport = create_download_report()
        if rapport:
            print(f"üìÑ Rapport d√©taill√© : {rapport}")
        print("=" * 60)

except Exception as e_main_loop:
    log_error(f"Erreur majeure dans la boucle principale de traitement des offres : {e_main_loop}")
    print(f"‚ùå Erreur critique lors du traitement des consultations : {e_main_loop}")

print("\nüîç Script termin√©.")
input("Appuyez sur Entr√©e pour fermer le navigateur...")
driver.quit()


üöÄ D√©marrage du scraper de march√©s publics
üîç Recherche du site via Google...
üîó Lien trouv√©: https://www.marchespublics.gov.ma/
‚úÖ Acc√®s au site marchespublics.gov.ma r√©ussi
Pas de pop-up/cookies g√©r√© sur le site des march√©s publics ou d√©j√† accept√©.
üìã Acc√®s aux consultations en cours...
‚úÖ Page consultations en cours charg√©e
üè∑Ô∏è S√©lection de la cat√©gorie Services...
‚úÖ Cat√©gorie 'Services' s√©lectionn√©e.
üìÖ Configuration des dates...
ERREUR: Erreur dans les champs de date : Message: no such element: Unable to locate element: {"method":"css selector","selector":"[id="ctl0_CONTENU_PAGE_AdvancedSearch_dateRemisePlisStart"]"}
  (Session info: chrome=138.0.7204.184); For documentation on this error, please visit: https://www.selenium.dev/documentation/webdriver/troubleshooting/errors#no-such-element-exception
Stacktrace:
	GetHandleVerifier [0x0x7ff66890e415+77285]
	GetHandleVerifier [0x0x7ff66890e470+77376]
	(No symbol) [0x0x7ff6686d9a6a]
	(No symbol) [0x

KeyboardInterrupt: 