In [9]:
from bs4 import BeautifulSoup
import requests
import pandas as pd
url = "https://www.allocine.fr/film/fichefilm-114782/casting/"
html = requests.get(url)
soup = BeautifulSoup(html.text, 'html.parser')

soup_director = soup.find('div', {"class" : "meta-title"})

# Extraire les liens pour chaque conteneur trouvé
links = []
for director in soup_directors:
    link = director.find('a', {"class": "meta-title-link"})
    if link:
        links.append({"Nom": link.text.strip(), "Lien": link.get('href')})

# Afficher les résultats
for link in links:
    print(f"Nom : {link['Nom']}")
    print(f"Lien : {link['Lien']}")

Nom : Christopher Nolan
Lien : /personne/fichepersonne_gen_cpersonne=30367.html
Nom : Matthew McConaughey
Lien : /personne/fichepersonne_gen_cpersonne=19334.html
Nom : Anne Hathaway
Lien : /personne/fichepersonne_gen_cpersonne=65719.html
Nom : Michael Caine
Lien : /personne/fichepersonne_gen_cpersonne=2535.html
Nom : John Lithgow
Lien : /personne/fichepersonne_gen_cpersonne=5293.html
Nom : Jessica Chastain
Lien : /personne/fichepersonne_gen_cpersonne=117304.html
Nom : Casey Affleck
Lien : /personne/fichepersonne_gen_cpersonne=1196.html
Nom : Mackenzie Foy
Lien : /personne/fichepersonne_gen_cpersonne=487728.html
Nom : Wes Bentley
Lien : /personne/fichepersonne_gen_cpersonne=35000.html


In [15]:
# Transformation en DataFrame
df = pd.DataFrame(links, columns=["Nom", "Lien"])
df


Unnamed: 0,Nom,Lien
0,Christopher Nolan,/personne/fichepersonne_gen_cpersonne=30367.html
1,Matthew McConaughey,/personne/fichepersonne_gen_cpersonne=19334.html
2,Anne Hathaway,/personne/fichepersonne_gen_cpersonne=65719.html
3,Michael Caine,/personne/fichepersonne_gen_cpersonne=2535.html
4,John Lithgow,/personne/fichepersonne_gen_cpersonne=5293.html
5,Jessica Chastain,/personne/fichepersonne_gen_cpersonne=117304.html
6,Casey Affleck,/personne/fichepersonne_gen_cpersonne=1196.html
7,Mackenzie Foy,/personne/fichepersonne_gen_cpersonne=487728.html
8,Wes Bentley,/personne/fichepersonne_gen_cpersonne=35000.html


In [19]:
base_url = "https://www.allocine.fr"

# Fonction pour récupérer l'âge à partir d'une page Allociné
def get_age(url):
    full_url = base_url + url
    try:
        response = requests.get(full_url)
        if response.status_code != 200:
            print(f"Erreur lors de l'accès à {full_url}")
            return None

        soup = BeautifulSoup(response.text, 'html.parser')

        meta_items = soup.find_all('div', {"class": "meta-body-item"})
        for item in meta_items:
            span = item.find('span', {"class": "light"})
            if span and span.text.strip() == "Age":
                age_tag = item.find('div', {"class": "dark-grey"}).find('strong')
                if age_tag:
                    return age_tag.text.strip()

        print(f"Âge non trouvé pour {full_url}")
        return None
    except Exception as e:
        print(f"Erreur : {e} pour {full_url}")
        return None

df['Âge'] = df['Lien'].apply(get_age)
df


Unnamed: 0,Nom,Lien,Âge
0,Christopher Nolan,/personne/fichepersonne_gen_cpersonne=30367.html,54
1,Matthew McConaughey,/personne/fichepersonne_gen_cpersonne=19334.html,55
2,Anne Hathaway,/personne/fichepersonne_gen_cpersonne=65719.html,42
3,Michael Caine,/personne/fichepersonne_gen_cpersonne=2535.html,91
4,John Lithgow,/personne/fichepersonne_gen_cpersonne=5293.html,79
5,Jessica Chastain,/personne/fichepersonne_gen_cpersonne=117304.html,47
6,Casey Affleck,/personne/fichepersonne_gen_cpersonne=1196.html,49
7,Mackenzie Foy,/personne/fichepersonne_gen_cpersonne=487728.html,24
8,Wes Bentley,/personne/fichepersonne_gen_cpersonne=35000.html,46


In [22]:
# Convertir la colonne d'âge en numérique et pas en string
df['Âge'] = pd.to_numeric(df['Âge'], errors='coerce')
average_age = df['Âge'].mean()
print("La moyenne d'âge des acteurs et actrices dans le film Interstellar est de",average_age,"ans")

La moyenne d'âge des acteurs et actrices dans le film Interstellar est de 54.111111111111114 ans
