In [2]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException
import os

# Specify the directory containing chromedriver.exe
chrome_driver_directory = r"chromedriver.exe"  

# Add the directory to the PATH environment variable
os.environ["PATH"] += os.pathsep + chrome_driver_directory

# Setup Chrome options
chrome_options = webdriver.ChromeOptions()

# Initialize ChromeDriver (no need to specify executable_path if chromedriver is in PATH)
driver = webdriver.Chrome(options=chrome_options)

# Set a page load timeout
driver.set_page_load_timeout(60)  # Augmentez ce timeout si nécessaire

# Open a file to write the contents
output_file = open("extracted_contents.txt", "w", encoding="utf-8")

base_url = "https://www.legifrance.gouv.fr/codes/texte_lc/LEGITEXT000006072050/2024-01-29/"  # Ensure this URL is correct

try:
    # Navigate to the base URL
    driver.get(base_url)
    
    # Wait for the titles starting with "Chapitre" to load and then store them
    chapters = WebDriverWait(driver, 30).until(
        EC.presence_of_all_elements_located((By.XPATH, "//a[starts-with(text(), 'Chapitre')]"))
    )

    # Iterate through the chapters
    for index, chapter in enumerate(chapters):
        try:
            # Click each chapter to open and gather the contents
            chapters[index].click()

            # Wait for the content div to load
            WebDriverWait(driver, 30).until(
                EC.presence_of_element_located((By.XPATH, "//div[contains(@class, 'content')]"))
            )
            
            # Find all the <p> elements within the content div
            content_paragraphs = driver.find_elements(By.XPATH, "//div[contains(@class, 'content')]/p")
            
            # Concatenate the text of each paragraph
            content = "\n".join(paragraph.text for paragraph in content_paragraphs)

            print(content)
            output_file.write(content + "\n\n")

        except TimeoutException:
            print(f"Timeout occurred for chapter {index + 1}. Skipping to the next chapter.")
            continue  # Skip to the next chapter on timeout

        # Navigate back to the base page to click the next chapter
        driver.get(base_url)
        chapters = WebDriverWait(driver, 30).until(
            EC.presence_of_all_elements_located((By.XPATH, "//a[starts-with(text(), 'Chapitre')]"))
        )

except Exception as e:
    print("An error occurred:", e)
finally:
    # Close the browser and the file
    driver.quit()
    output_file.close()

Tout projet de réforme envisagé par le Gouvernement qui porte sur les relations individuelles et collectives du travail, l'emploi et la formation professionnelle et qui relève du champ de la négociation nationale et interprofessionnelle fait l'objet d'une concertation préalable avec les organisations syndicales de salariés et d'employeurs représentatives au niveau national et interprofessionnel en vue de l'ouverture éventuelle d'une telle négociation.
A cet effet, le Gouvernement leur communique un document d'orientation présentant des éléments de diagnostic, les objectifs poursuivis et les principales options.
Lorsqu'elles font connaître leur intention d'engager une telle négociation, les organisations indiquent également au Gouvernement le délai qu'elles estiment nécessaire pour conduire la négociation.
Le présent article n'est pas applicable en cas d'urgence. Lorsque le Gouvernement décide de mettre en oeuvre un projet de réforme en l'absence de procédure de concertation, il fait co