In [26]:
import requests as rq
from bs4 import BeautifulSoup as bs
import pandas as pd
from time import sleep
from random import randint

In [27]:
# Define a dictionary headers to store the User-Agent string for the request
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0;Win64) AppleWebkit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Safari/537.36'}

In [28]:
# Read the player links from the csv file
df_links = pd.read_csv('output/jobs_links.csv')

# Convert the 'URL' column of the dataframe to a list
links = df_links['URL'].tolist()

In [29]:
list_of_row_dicts = []
for link in links:

    # Keep trying until the request is successful
    while True:
        try:
            # Make a GET request to the link
            request = rq.get(link,headers=headers)
        
            # Use BeautifulSoup to parse the HTML content of the page
            soup = bs(request.text, 'html.parser')

            # Find all <span> tags in the HTML
            title_spans = soup.find_all('span')
                       
            # Break out of the loop if the request is successful
            break
        except AttributeError:
            # Print error message and wait for 10 seconds before retrying
            print('Index Error : Sleeping for 10 seconds before retrying')
            sleep(10)

    try:
        title = ' '.join([word for word in soup.find('h1').text.split() if not any(i.isdigit() for i in word)]).strip()
    except IndexError:
        title = None
        print ('title not found')

    try:
        tjm = None
        date = None
        duration = None
        xp = None
        remote = None
        location = None
        
        for span in title_spans:
            svg = span.find('svg')
            if not svg:
                continue
            path = svg.find('path')
            if not path:
                continue
            d_attr = path.get('d', '')
            
            if 'M384 336a32 32' in d_attr:
                # Icone TJM
                value_span = span.find_next_sibling('span')
                if value_span:
                    tjm = value_span.get_text(strip=True)
            if 'M152 24c0-13.3' in d_attr:
                # Icone Date
                value_span = span.find_next_sibling('span')
                if value_span:
                    date = value_span.get_text(strip=True)
            if 'M464 256A208' in d_attr:
                # Icone Durée
                value_span = span.find_next_sibling('span')
                if value_span:
                    duration = value_span.get_text(strip=True)
            if 'M176 56V96H336V56c0-4.4-3.6-8-8-8H184c-4.4' in d_attr:
                # Icone XP 
                value_span = span.find_next_sibling('span')
                if value_span:
                    xp = value_span.get_text(strip=True)
            if 'M176 56V96H336V56c0-4.4-3.6-8-8-8H184c-4.4' in d_attr:
                # Icone Remote
                value_span = span.find_next_sibling('span')
                if value_span:
                    remote = value_span.get_text(strip=True)
            if 'M224.8 5.4c8.8-7.2 21.5-7.2' in d_attr:
                # Icone Remote
                value_span = span.find_next_sibling('span')
                if value_span:
                    remote = value_span.get_text(strip=True)
            if 'M320.7 249.2c-10.5' in d_attr:
                # Icone Remote
                value_span = span.find_next_sibling('span')
                if value_span:
                    location = value_span.get_text(strip=True)

    except IndexError:
        tjm = None
        print ('tjm not found')
    
    row_dic = {
    'JOB_URL' : link,
    'TITLE' : title,
    'DATE' : date,
    'DURATION' : duration,
    'TJM' : tjm,
    'EXPERIENCE' : xp,
    'REMOTE' : remote,
    'LOCATION' : location
    }
    list_of_row_dicts.append(row_dic)
            
    print(title,',',date,',',duration,',',tjm,',',xp,',',remote,',',location)
    sleep(randint(1,3))

Mission freelance Lead Architect: Initiative and Team Leadership, Microsoft, Azure, Office Remote Working (h/f) , 05/05/2025 , 9 mois , 750-850 €⁄j , > 10 ans d’expérience , Télétravail 100% , Paris, Île-de-France
Mission freelance Développeur Rust - Full remote - Anglais fluent , Dès que possible , 8 mois , 400-550 €⁄j , 5 à 10 ans d’expérience , Télétravail 100% , Paris, France
Offre d'emploi Développeur Java Sénior | Casabalanca Remote , Dès que possible , 2 ans , 19k-60k €⁄an, 100-300 €⁄j , 5 à 10 ans d’expérience , Télétravail 100% , France
Mission freelance Digital business Solution analyst , Dès que possible , 12 mois , 400-790 €⁄j , 5 à 10 ans d’expérience , Télétravail 100% , Lille, Hauts-de-France
Offre d'emploi Engineering Manager , Dès que possible , None , None , > 10 ans d’expérience , Télétravail 100% , Provence-Alpes-Côte d'Azur, France
Mission freelance Architecte Principal IAM (H/F) , Dès que possible , 2 ans , 400-600 €⁄j , 5 à 10 ans d’expérience , Télétravail 100% 

In [30]:
df = pd.DataFrame(list_of_row_dicts)
df.to_csv('output/jobs_infos.csv', na_rep='None')

In [31]:
df

Unnamed: 0,JOB_URL,TITLE,DATE,DURATION,TJM,EXPERIENCE,REMOTE,LOCATION
0,https://www.free-work.com/fr/tech-it/consultan...,Mission freelance Lead Architect: Initiative a...,05/05/2025,9 mois,750-850 €⁄j,> 10 ans d’expérience,Télétravail 100%,"Paris, Île-de-France"
1,https://www.free-work.com/fr/tech-it/developpe...,Mission freelance Développeur Rust - Full remo...,Dès que possible,8 mois,400-550 €⁄j,5 à 10 ans d’expérience,Télétravail 100%,"Paris, France"
2,https://www.free-work.com/fr/tech-it/developpe...,Offre d'emploi Développeur Java Sénior | Casab...,Dès que possible,2 ans,"19k-60k €⁄an, 100-300 €⁄j",5 à 10 ans d’expérience,Télétravail 100%,France
3,https://www.free-work.com/fr/tech-it/business-...,Mission freelance Digital business Solution an...,Dès que possible,12 mois,400-790 €⁄j,5 à 10 ans d’expérience,Télétravail 100%,"Lille, Hauts-de-France"
4,https://www.free-work.com/fr/tech-it/community...,Offre d'emploi Engineering Manager,Dès que possible,,,> 10 ans d’expérience,Télétravail 100%,"Provence-Alpes-Côte d'Azur, France"
...,...,...,...,...,...,...,...,...
59,https://www.free-work.com/fr/tech-it/administr...,Mission freelance DEVIENS #AUTEUR Services de ...,Dès que possible,8 mois,100-300 €⁄j,2 à 5 ans d’expérience,Télétravail 100%,"Saint-Herblain, Pays de la Loire"
60,https://www.free-work.com/fr/tech-it/consultan...,Mission freelance Consultant SAP ISH,Dès que possible,5 jours,,5 à 10 ans d’expérience,Télétravail 100%,"Lyon, Auvergne-Rhône-Alpes"
61,https://www.free-work.com/fr/tech-it/business-...,Mission freelance Business analyst SAP IBP / PP,Dès que possible,1 an,590-710 €⁄j,5 à 10 ans d’expérience,Télétravail 100%,"Nantes, Pays de la Loire"
62,https://www.free-work.com/fr/tech-it/consultan...,Mission freelance expert SAP BPC pour MICROSOFT,Dès que possible,3 mois,380-500 €⁄j,5 à 10 ans d’expérience,Télétravail 100%,"Paris, France"
