# Requête HTTP 

Un requête HTTP est une requête basée sur le protocole TCP, elle fait partie de la couche application de la couche OSI. Elle permet d'accéder aux données mise à disposition sur une adresse IP (ou url résolue par un DNS) et un port. 

Les deux ports les plus utilisés dans le web sont le 80 pour les sites en HTTP et le 443 pour les sites en HTTPS. HTTPS est une variable du protocole HTTP basé sur le protocole TLS.

Il existe de nombreux types de requêtes selon la convention `REST`: 
- GET
- POST
- PUT 
- DELETE
- UPDATE.

Dans notre cas, nous allons utiliser la plupart du temps des GET et potentiellement des POST. 
- Le GET permet comme son nom l'indique de récupérer des informations en fonction de certains paramètres. 
- Le POST nécessite un envoi de données pour récupérer des données. Le body du post est, la plupart du temps, envoyé sous la forme d'un objet JSON.

Ces requêtes encapsulent un certain nombre de paramètres qui permettent soient d'identifier une provenance et un utilisateur ou de réaliser différentes actions.

In [1]:
import requests

In [2]:
url = "https://www.esiee.fr/"
response = requests.get(url)
response.status_code

200

Il existe deux méthodes pour récupérer le contenu de la page :

- `response.text` qui permet de retourner le texte sous la forme d'une chaine de charactères.
- `response.content` qui permet de récupérer le contenu de la page sous la forme de bytes

In [3]:
type(response.content)

bytes

In [4]:
type(response.text)

str

Pour récupérer les 1000 premiers charactères de la page :

In [5]:
response.text[0:1000]

'<!DOCTYPE html>\n<html lang="fr-FR">\n<head>\n\n<meta charset="utf-8">\n<!-- \n\tThis website is powered by TYPO3 - inspiring people to share!\n\tTYPO3 is a free open source Content Management Framework initially created by Kasper Skaarhoj and licensed under GNU/GPL.\n\tTYPO3 is copyright 1998-2024 of Kasper Skaarhoj. Extensions are copyright of their respective owners.\n\tInformation and contribution at https://typo3.org/\n-->\n\n\n\n<title>ESIEE Paris, l&#039;école de l&#039;innovation technologique | ESIEE Paris</title>\n<meta name="generator" content="TYPO3 CMS" />\n<meta name="description" content="Rejoignez ESIEE Paris, grande école d&#039;ingénieur dans les domaines des transitions numérique, énergétique et environnementale. Classée dans le groupe A, parmi les meilleures écoles d&#039;ingénieur selon le classement de l&#039;Etudiant. Habilitée par la Commission des Titres d&#039;Ingénieur (CTI). Membre de la Conférence des Grandes Ecoles (CGE). " />\n<meta name="viewport" conte

Pour récupérer les headers HTTP de la réponse :

In [6]:
response.headers

{'Date': 'Sat, 23 Nov 2024 16:19:00 GMT', 'Server': 'Apache', 'Content-Language': 'fr', 'Vary': 'Accept-Encoding', 'Content-Encoding': 'gzip', 'X-UA-Compatible': 'IE=edge', 'X-Content-Type-Options': 'nosniff', 'Content-Length': '16453', 'Content-Type': 'text/html; charset=utf-8', 'X-Varnish': '124486999 120557560', 'Age': '2', 'Via': '1.1 varnish (Varnish/7.1)', 'Accept-Ranges': 'bytes', 'Connection': 'keep-alive'}

On peut modifier les paramètres de la requête et/ou ses headers. On peut par exemple ajouter un UserAgent (identifiant de l'initiateur de la requête) et un timeout de 10 secondes :

In [7]:
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
response = requests.get(url, headers=headers, timeout = 10)
response.content[0:1000]

b'<!DOCTYPE html>\n<html lang="fr-FR">\n<head>\n\n<meta charset="utf-8">\n<!-- \n\tThis website is powered by TYPO3 - inspiring people to share!\n\tTYPO3 is a free open source Content Management Framework initially created by Kasper Skaarhoj and licensed under GNU/GPL.\n\tTYPO3 is copyright 1998-2024 of Kasper Skaarhoj. Extensions are copyright of their respective owners.\n\tInformation and contribution at https://typo3.org/\n-->\n\n\n\n<title>ESIEE Paris, l&#039;\xc3\xa9cole de l&#039;innovation technologique | ESIEE Paris</title>\n<meta name="generator" content="TYPO3 CMS" />\n<meta name="description" content="Rejoignez ESIEE Paris, grande \xc3\xa9cole d&#039;ing\xc3\xa9nieur dans les domaines des transitions num\xc3\xa9rique, \xc3\xa9nerg\xc3\xa9tique et environnementale. Class\xc3\xa9e dans le groupe A, parmi les meilleures \xc3\xa9coles d&#039;ing\xc3\xa9nieur selon le classement de l&#039;Etudiant. Habilit\xc3\xa9e par la Commission des Titres d&#039;Ing\xc3\xa9nieur (CTI). Membr

## Exercice

## Exercice 1

- Créer une classe Python permettant de faire des requêtes HTTP.
- Cette classe doit utiliser toujours le même UserAgent.
- Le TimeOut sera spécifié à chaque appelle avec une valeur par défaut.
- Un mécanisme de retry sera mis en place de façon recursive.

## Exercice 2

- Faire une fonction permettant de supprimer tous les espaces supperflus d'une string
- Faire une fonction qui prend une string html et renvois une string intelligible (enlever les caractères spéciaux,
- Récupérer le domaine en fonction d'un url

In [8]:
from requests.exceptions import RequestException
class HTTPClient:

    def __init__(self):
        self.user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 ' \
                         '(KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'
    
    def get(self, url, timeout=10, retries=3):
        """
        Effectue une requête HTTP GET vers l'URL spécifiée.

        Args:
            url (str): L'URL cible.
            timeout (int): Temps maximal avant d'abandonner la requête (en secondes).
            retries (int): Nombre maximum de tentatives en cas d'échec.

        Returns:
            dict: Un dictionnaire contenant le code de statut, le texte et le contenu de la réponse.

        Raises:
            Exception: Si toutes les tentatives échouent.
        """
        headers = {'User-Agent': self.user_agent}

        try:
            reponse=requests.get(url, headers=headers, timeout = timeout)
            return{
                "status_code":reponse.status_code,
                "text": response.text,
                "content": response.content
            }

        except RequestException as e:
            if retries > 0:
                print(f"Requête échouée : {e}. Nouvelle tentative ({retries})...")
                return self.get(url, timeout, retries - 1)
            else:
                print(f"Toutes les tentatives ont échoué : {e}")
                raise Exception(f"Requête échouée après plusieurs tentatives : {e}")

In [9]:
import html 
from urllib.parse import urlparse
def suppSpace(html):
    mots=html.split()
    return ' '.join(mots)
# Exemple d'utilisation
if __name__ == "__main__":
    client = HTTPClient()
    

    try:
        result = client.get("https://www.esiee.fr", timeout=5, retries=3)
        print("Code de statut:", result["status_code"])
        print("Contenu:", result["text"][:1000])  # Affiche les 200 premiers caractères
        
    except Exception as e:
        print("Erreur lors de la requête:", e)

def textSimple(html_string):
    return html.unescape(html_string)

html_string = "Hello &amp; welcome to the world of &#60;HTML&#62;!"
print('Texte Sans caractère spé: ',textSimple(html_string))  # "Hello & welcome to the world of <HTML>!"


def domaine(url):
    parsed_url=urlparse(url)
    return parsed_url.netloc  

# Exemple d'URL
url = "https://www.example.com/path/to/page"
print('domaine du site: ',domaine(url))  # "www.example.com"
    


Code de statut: 200
Contenu: <!DOCTYPE html>
<html lang="fr-FR">
<head>

<meta charset="utf-8">
<!-- 
	This website is powered by TYPO3 - inspiring people to share!
	TYPO3 is a free open source Content Management Framework initially created by Kasper Skaarhoj and licensed under GNU/GPL.
	TYPO3 is copyright 1998-2024 of Kasper Skaarhoj. Extensions are copyright of their respective owners.
	Information and contribution at https://typo3.org/
-->



<title>ESIEE Paris, l&#039;école de l&#039;innovation technologique | ESIEE Paris</title>
<meta name="generator" content="TYPO3 CMS" />
<meta name="description" content="Rejoignez ESIEE Paris, grande école d&#039;ingénieur dans les domaines des transitions numérique, énergétique et environnementale. Classée dans le groupe A, parmi les meilleures écoles d&#039;ingénieur selon le classement de l&#039;Etudiant. Habilitée par la Commission des Titres d&#039;Ingénieur (CTI). Membre de la Conférence des Grandes Ecoles (CGE). " />
<meta name="viewport

Ici, il faut récupérer le code HTML d'un site web à partir d'une requête. Lorsque vous avez récupéré le texte d'un site il faut le parser. Pour cela, on utilise BeautifulSoup qui permet de transformer la structure HTML en objet Python. Cela permet de récupérer efficacement les données qui nous intéresse.

Pour les webmasters, le blocage le plus souvent mis en place et un blocage sur le User-Agent. Le User-Agent est un paramètre intégré dans la requête HTTP réalisé par le Navigateur pour envoyer au front des informations basiques :

- la version du Navigateur,
- la version de l'OS
- Le type de gestionnaire graphique (Gecko)
- le type de device utilisé

# Exploitation du HTML  

Exemple de User Agent :  

`Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.0`

Commençons à utiliser `BeautifulSoup`, il est normalement déjà installé, le cas échéant executez les lignes suivantes : 

In [10]:
import requests
from bs4 import BeautifulSoup

Pour transformer une requête (requests) en objet BeautifulSoup :

In [11]:
response = requests.get(url)
soup = BeautifulSoup(response.text)

Pour trouver tous les liens d'une page, on récupère la balise `a` qui permet de gérer les liens en HTML :

In [12]:
soup.find_all("a")[0:10]

[<a href="https://www.iana.org/domains/example">More information...</a>]

On peut aussi préciser la classe HTML qu'on veut récupérer :

```python
soup.find_all(class_="<CLASS_NAME>")[0:10]
```

Ici par exemple: 

In [13]:
soup.find_all(class_="toggler")[0:5]

[]

Pour récupérer le text sans les balises HTML :

In [14]:
soup.text[0:1000]

'\n\nExample Domain\n\n\n\n\n\n\n\nExample Domain\nThis domain is for use in illustrative examples in documents. You may use this\n    domain in literature without prior coordination or asking for permission.\nMore information...\n\n\n\n'

## Exercice
### Exercice 3

Améliorer la classe développé précédemment.

- Ajouter une méthode pour récupérer l'objet soup d'un url
- Récupérer une liste de User Agent et effectuer une rotation aléatoire sur celui à utiliser
- Utiliser cette classe pour parser une page HTML et récupérer : le titre, tous les H1 (si ils existent), les liens vers les images, les liens sortants vers d'autres sites, et le texte principal.

In [15]:
import requests
from requests.exceptions import RequestException
from bs4 import BeautifulSoup

class HTTPClient:

    def __init__(self):
        self.user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 ' \
                         '(KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'
    
    def get(self, url, timeout=10, retries=3):
        """
        Effectue une requête HTTP GET vers l'URL spécifiée.

        Args:
            url (str): L'URL cible.
            timeout (int): Temps maximal avant d'abandonner la requête (en secondes).
            retries (int): Nombre maximum de tentatives en cas d'échec.

        Returns:
            dict: Un dictionnaire contenant le code de statut, le texte et le contenu de la réponse.

        Raises:
            Exception: Si toutes les tentatives échouent.
        """
        headers = {'User-Agent': self.user_agent}

        try:
            response = requests.get(url, headers=headers, timeout=timeout)
            return {
                "status_code": response.status_code,
                "text": response.text,
                "content": response.content
            }

        except RequestException as e:
            if retries > 0:
                print(f"Requête échouée : {e}. Nouvelle tentative ({retries})...")
                return self.get(url, timeout, retries - 1)
            else:
                print(f"Toutes les tentatives ont échoué : {e}")
                raise Exception(f"Requête échouée après plusieurs tentatives : {e}")
    
    def get_soup_from_url(self, url):
        """
        Effectue une requête GET et retourne l'objet BeautifulSoup du contenu HTML.

        Args:
            url (str): L'URL cible.
            timeout (int): Temps maximal avant d'abandonner la requête (en secondes).
            retries (int): Nombre maximum de tentatives en cas d'échec.

        Returns:
            BeautifulSoup: L'objet BeautifulSoup contenant le contenu de la page HTML.

        Raises:
            Exception: Si toutes les tentatives échouent.
        """
        # Utiliser la méthode GET pour récupérer le contenu HTML
        soup = BeautifulSoup(url, 'html.parser')

        # Récupérer le titre de la page
        title=soup.title.string if soup.title else "Pas de titre"

        # Récupérer tous les H1
        h1_tags=[h1.text.strip() for h1 in soup.find_all('h1')]

        # Récupérer les liens vers les images (src de <img>)
        img_links=[img['src'] for img in soup.find_all('img',src=True)]

        # Récupérer le texte principal
        main_text = soup.get_text().strip()
        
        return {
            'title': title,
            'h1_tags': h1_tags,
            'img_links': img_links,
            'main_text': main_text
        }

In [16]:
# Exemple d'utilisation
if __name__ == "__main__":
    client = HTTPClient()

    url = "https://www.esiee.fr/"  # Remplacez par l'URL souhaitée
    try:
        response = client.get(url, timeout=5, retries=3)
        
        print("Code de statut:", response["status_code"])

        if response["status_code"] == 200:
            page_info = client.get_soup_from_url(response["text"])

            # Afficher les résultats récupérés
            print("Titre de la page:", page_info['title'])
            print("Balises H1:", page_info['h1_tags'])
            print("Liens vers les images:", page_info['img_links'])
            print("Texte principal:", page_info['main_text'][:500])  # Affiche les 500 premiers caractères

    except Exception as e:
        print("Erreur lors de la requête:", e)

Code de statut: 200
Titre de la page: ESIEE Paris, l'école de l'innovation technologique | ESIEE Paris
Balises H1: ['']
Liens vers les images: ['/typo3conf/ext/esiee_sitepackage/Resources/Public/imgs/svg/logo-esiee.svg', 'data:image/gif;base64,R0lGODlhAQABAIAAAP///wAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==', '/fileadmin/user_upload/Fichiers/image-home/ESIEE-Home-Main-Picture.webp', 'data:image/gif;base64,R0lGODlhAQABAIAAAP///wAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==', '/fileadmin/_processed_/9/5/csm_actu-jpo-1344x840_6889669208.jpg', 'data:image/gif;base64,R0lGODlhAQABAIAAAP///wAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==', '/fileadmin/_processed_/0/b/csm_photos-salons-1344x840_472aff3f3e.jpg', 'data:image/gif;base64,R0lGODlhAQABAIAAAP///wAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==', '/fileadmin/_processed_/0/3/csm_sandrine-wamy-trophees-des-femmes-de-l_industrie-2024-1344x840_7f464ae034.jpg', 'data:image/gif;base64,R0lGODlhAQABAIAAAP///wAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==', '/fileadmin/_processed_

# Exploitation des appels d'API



Losque le front du site récupère des données sur une API gérée par le back, un appel d'API est réalisé. Cet appel est recensé dans les appels réseaux. Il est alors possible de re-jouer cet appel pour récupérer à nouveau les données. Il est très facile de récupérer ces appels dans l'onglet Network de la console développeur de Chrome ou FireFox. La console vous permet de copier le code CURL de la requête et vous pouvez ensuite la transformer en code Python depuis le site https://curl.trillworks.com/.

Souvent les APIs sont bloquées avec certains paramètres. L'API vérifie que dans les headers de la requête HTTP ces paramètres sont présents :
* un token généré à la volée avec des protocoles OAuth2 (ou moins développés).
* un referer provenant du site web (la source de la requête), très facile à falsifier.



## Exercice 
### Exercice 4

- Utiliser les informations développées plus haut pour récupérer les premiers résultats d'une recherche d'une requête
sur Google. 

Tips : 

- Ouvrir les outils de développements de Chrome ou Firefox
- Onglet Network
- Fouiller dans les requêtes pour voir à quoi ressemble un appel API Google
- Utilisez beautiful soup pour convertir le contenu de la request en objet et accéder aux balises

In [17]:
import requests
from requests.exceptions import RequestException
from bs4 import BeautifulSoup

class HTTPClient:

    def __init__(self):
        self.user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 ' \
                         '(KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'
    
    def get(self, url, timeout=10, retries=3):
        """
        Effectue une requête HTTP GET vers l'URL spécifiée.

        Args:
            url (str): L'URL cible.
            timeout (int): Temps maximal avant d'abandonner la requête (en secondes).
            retries (int): Nombre maximum de tentatives en cas d'échec.

        Returns:
            dict: Un dictionnaire contenant le code de statut, le texte et le contenu de la réponse.

        Raises:
            Exception: Si toutes les tentatives échouent.
        """
        headers = {'User-Agent': self.user_agent}

        try:
            response = requests.get(url, headers=headers, timeout=timeout)
            return {
                "status_code": response.status_code,
                "text": response.text,
                "content": response.content
            }

        except RequestException as e:
            if retries > 0:
                print(f"Requête échouée : {e}. Nouvelle tentative ({retries})...")
                return self.get(url, timeout, retries - 1)
            else:
                print(f"Toutes les tentatives ont échoué : {e}")
                raise Exception(f"Requête échouée après plusieurs tentatives : {e}")
    
    def get_soup_from_url(self, url):
        """
        Effectue une requête GET et retourne l'objet BeautifulSoup du contenu HTML.

        Args:
            url (str): L'URL cible.
            timeout (int): Temps maximal avant d'abandonner la requête (en secondes).
            retries (int): Nombre maximum de tentatives en cas d'échec.

        Returns:
            BeautifulSoup: L'objet BeautifulSoup contenant le contenu de la page HTML.

        Raises:
            Exception: Si toutes les tentatives échouent.
        """
        # Utiliser la méthode GET pour récupérer le contenu HTML
        response = self.get(url)
        if response["status_code"] == 200:
            soup = BeautifulSoup(response["text"], 'html.parser')

            # Récupérer le titre de la page
            title = soup.title.string if soup.title else "Pas de titre"

            # Récupérer tous les H1
            h1_tags = [h1.text.strip() for h1 in soup.find_all('h1')]

            # Récupérer le texte principal
            main_text = soup.get_text().strip()

            return {
                'title': title,
                'h1_tags': h1_tags,
                'main_text': main_text
            }
        else:
            raise Exception(f"Erreur lors de la récupération de la page: {response['status_code']}")


In [18]:
# Exemple d'utilisation
if __name__ == "__main__":
    client = HTTPClient()

    url = "https://www.esiee.fr/"  # Remplacez par l'URL souhaitée
    try:
        response = client.get(url, timeout=5, retries=3)
        
        print("Code de statut:", response["status_code"])

        if response["status_code"] == 200:
            page_info = client.get_soup_from_url(response["text"])

            # Afficher les résultats récupérés
            print("Titre de la page:", page_info['title'])
            print("Balises H1:", page_info['h1_tags'])
            print("Liens vers les images:", page_info['img_links'])
            print("Texte principal:", page_info['main_text'][:500])  # Affiche les 500 premiers caractères

    except Exception as e:
        print("Erreur lors de la requête:", e)

Code de statut: 200
Requête échouée : No connection adapters were found for '<!DOCTYPE html>\n<html lang="fr-FR">\n<head>\n\n<meta charset="utf-8">\n<!-- \n\tThis website is powered by TYPO3 - inspiring people to share!\n\tTYPO3 is a free open source Content Management Framework initially created by Kasper Skaarhoj and licensed under GNU/GPL.\n\tTYPO3 is copyright 1998-2024 of Kasper Skaarhoj. Extensions are copyright of their respective owners.\n\tInformation and contribution at https://typo3.org/\n-->\n\n\n\n<title>ESIEE Paris, l&#039;école de l&#039;innovation technologique | ESIEE Paris</title>\n<meta name="generator" content="TYPO3 CMS" />\n<meta name="description" content="Rejoignez ESIEE Paris, grande école d&#039;ingénieur dans les domaines des transitions numérique, énergétique et environnementale. Classée dans le groupe A, parmi les meilleures écoles d&#039;ingénieur selon le classement de l&#039;Etudiant. Habilitée par la Commission des Titres d&#039;Ingénieur (CTI). Membre 

# Exercice Final  

Exercice Final
Utilisez tout ce que vous avez appris pour récupérer des articles de News avec une catégorie. Il est souvent intéressant de partir des flux RSS pour commencer :

Les données doivent comprendre :
- Le texte important propre
- L'url
- Le domaine
- la catégorie
- Le titre de l'article
- Le titre de la page
- (Facultatif) : les images

Tips : 

- Taper le nom de votre média favoris + RSS (par exemple : https://www.lemonde.fr/rss/)
- Aller dans le DOM de la page 
- Trouver les catégories et les liens vers les articles

In [161]:
import requests
from bs4 import BeautifulSoup

def fetch_rss_feed(url):
    try:
        # Effectuer la requête HTTP pour récupérer le contenu du flux RSS
        headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36",
        "referer": "https://www.google.com/",
        }

        response = requests.get(url, headers=headers)

        soup=BeautifulSoup(response.text,'xml')


        # Extraire tous les éléments <item> du flux RSS
        items = soup.find_all(["item",'article'])
        
        articles = []  # Liste pour stocker les articles

        titrePage=soup.find('title').get_text(strip=True)
        # Parcourir chaque élément <item> du flux
        for item in items:
            # Récupérer l'URL de l'article (balise <link>)
            article_url = item.find('link').get_text(strip=True) if item.find('link') else None
            
            # Récupérer le titre de l'article (balise <title>)
            titre = item.find('title').get_text(strip=True) if item.find("title") else None

            if article_url:
                domaine=article_url.split("/")[2] if article_url else None
            
            

                # Recherche de toutes les balises <a>
            category_element = item.find('a', href=lambda x: x and "lemonde.fr" in x)

            # Extraire le texte de la balise si elle existe
            category = category_element.get_text(strip=True) if category_element else None

            #Balise pour le contenu des articles
            text_article=" ".join(tag.get_text(strip=True) for tag in item)

            # Ajouter l'article à la liste
            articles.append({
                'titrePage':titrePage,
                'url': article_url,
                'titre': titre,
                'domaine': domaine,
                'category':category,
                'text_article':text_article
            })
            

        return articles

    except Exception as e:
        print(f"Erreur lors de la récupération du flux RSS : {e}")
        return []


def main():
    # Exemple de flux RSS (Le Monde)
    rss_url = "https://www.lemonde.fr/rss/une.xml"  # URL spécifique pour "à la une"
    
  
    articles = fetch_rss_feed(rss_url)
    if articles:
        print(f"Titre de la page : {articles[0]['titrePage']}")
        print('\n' + '-' * 40)

    # Afficher les résultats
    for article in articles[1:10]:
        
        print('\n\n')
        print(f"Titre de l'article : {article['titre']}")
        print(f"URL : {article['url']}")
        print(f"Domaine : {article['domaine']}")
        print(f"Categorie : {article['category']}")
        print(f"Contenu de l'article : {article['text_article']}")
        print("-" * 40)


if __name__ == "__main__":
    main()


Titre de la page : Le Monde.fr - Actualités et Infos en France et dans le monde

----------------------------------------



Titre de l'article : La guerre de Marc Bloch, « rare rescapé » des lois antijuives de Vichy mais rattrapé par la Gestapo
URL : https://www.lemonde.fr/societe/article/2024/11/23/la-guerre-de-marc-bloch-rare-rescape-des-lois-antijuives-de-vichy-mais-rattrape-par-la-gestapo_6215364_3225.html
Domaine : www.lemonde.fr
Categorie : None
Contenu de l'article : La guerre de Marc Bloch, « rare rescapé » des lois antijuives de Vichy mais rattrapé par la Gestapo Sat, 23 Nov 2024 15:25:05 +0100 Emmanuel Macron a annoncé, samedi 23 novembre, sa volonté de faire entrer Marc Bloch au Panthéon. A cette occasion, nous republions cet article consacré le 8 février au grand médiéviste, dans le cadre de la série « Le Conseil d’Etat et le “statut des juifs” ». https://www.lemonde.fr/societe/article/2024/11/23/la-guerre-de-marc-bloch-rare-rescape-des-lois-antijuives-de-vichy-mais-rattra