In [4]:
import requests
import json

In [5]:
url = "https://data.culture.gouv.fr/api/explore/v2.1/catalog/datasets/etablissements-cinematographiques/exports/csv"

In [6]:
response = requests.get(url)

In [7]:
# Ici on va d'abord mettre en place la gestion d'erreur, si code = 200 alors √ßa marche, sinon il nous affiche le code erreur, ex 404 pour not found
if response.status_code == 200:

    # D√©finition du nom du fichier
    filename = f"etablissements_cinematographiques"


    # On ouvre (ou cr√©er si inexistant) un fichier pour √©crire le contenu
    with open(filename, "w", encoding="utf-8") as f:
        # Et on √©crit directement dans le fichier le contenu de la var response
        f.write(response.text)

    # On affiche que la proc√©dure a aboutie
    print(f"Donn√©es t√©l√©charg√©es et enregistr√©es dans {filename}")

else:
    # On affiche qu'une erreur s'est produite, et on pr√©cise laquelle
    print(f"Erreur lors de la requ√™te : {response.status_code}")

Donn√©es t√©l√©charg√©es et enregistr√©es dans etablissements_cinematographiques


In [8]:

import csv

# --- Cas 1 : Depuis le fichier texte (data.txt) ---
# On lit le fichier ligne par ligne
data_json_txt = []
with open("data.txt", "r", encoding="utf-8") as f:
    lines = f.readlines()
    # La premi√®re ligne contient les en-t√™tes (noms des colonnes)
    headers = lines[0].strip().split(";")
    
    # On parcourt les lignes suivantes (les donn√©es)
    for line in lines[1:]:
        values = line.strip().split(";")
        # On cr√©e un dictionnaire pour chaque ligne en associant cl√© et valeur
        entry = {}
        for i in range(len(headers)):
            # On fait attention si des lignes sont incompl√®tes
            if i < len(values):
                entry[headers[i]] = values[i]
            else:
                entry[headers[i]] = ""
        data_json_txt.append(entry)

# Sauvegarde en JSON
with open("data.json", "w", encoding="utf-8") as f:
    json.dump(data_json_txt, f, indent=4, ensure_ascii=False)

print("Conversion data.txt -> data.json termin√©e.")


# --- Cas 2 : Depuis le fichier CSV (data-etablissements-cinematographiques.csv) ---
# Utilisation du module csv qui facilite la lecture
data_json_csv = []
with open("data-etablissements-cinematographiques.csv", "r", encoding="utf-8") as f:
    # DictReader lit automatiquement l'en-t√™te et cr√©e des dictionnaires
    reader = csv.DictReader(f, delimiter=";") 
    for row in reader:
        data_json_csv.append(row)

# Sauvegarde en JSON
with open("data-etablissements-cinematographiques.json", "w", encoding="utf-8") as f:
    json.dump(data_json_csv, f, indent=4, ensure_ascii=False)

print("Conversion data-etablissements-cinematographiques.csv -> data-etablissements-cinematographiques.json termin√©e.")

FileNotFoundError: [Errno 2] No such file or directory: 'data.txt'

In [9]:
# Dictionnaire pour stocker le nombre de salles par r√©gion
salles_par_region = {}

with open("data-etablissements-cinematographiques.csv", "r", encoding="utf-8") as f:
    reader = csv.DictReader(f, delimiter=";")
    for row in reader:
        region = row["region_administrative"]
        # On r√©cup√®re le nombre d'√©crans (salles) pour cet √©tablissement
        # On convertit en float puis en int car le csv peut contenir des d√©cimales comme '4.0'
        nb_ecrans = int(float(row["ecrans"]))
        
        if region in salles_par_region:
            salles_par_region[region] += nb_ecrans
        else:
            salles_par_region[region] = nb_ecrans

# Affichage des r√©sultats
print("Nombre de salles de cin√©ma par r√©gion :")
for region, total_salles in salles_par_region.items():
    print(f"- {region} : {total_salles} salles")

# Save to data-filtered.json
with open("data-filtered.json", "w", encoding="utf-8") as f:
    json.dump(salles_par_region, f, indent=4, ensure_ascii=False)

print("data-filtered.json created/updated.")

# Check content
with open("data-filtered.json", "r", encoding="utf-8") as f:
    content = json.load(f)
    print("Content of data-filtered.json:")
    print(content)
        

FileNotFoundError: [Errno 2] No such file or directory: 'data-etablissements-cinematographiques.csv'

In [None]:
import webbrowser
import os

In [None]:

try: # on g√®re la gestion d'erreur, on essaie d'ouvrir le fichier et de r√©cup√©rer ces donn√©es dans la var data
    with open("data-filtered.json", "r", encoding="utf-8") as f:
        data = json.load(f)
except FileNotFoundError: # si le fichier n'est pas trouv√©, alors on nous le dit
    print("Le fichier data-filtered.json n'a pas √©t√© trouv√©.")


In [None]:
# pr√©paration des donn√©es pourle graphique
regions = list(data.keys())
counts = list(data.values())

In [None]:
# Cr√©ation du contenu HTML
html_content = f"""
<!DOCTYPE html>
<html lang="fr">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <title>Visualisation des Salles de Cin√©ma</title>
    <script src="https://cdn.jsdelivr.net/npm/chart.js"></script>
    <style>
        body {{ font-family: sans-serif; padding: 20px; }}
        .container {{ width: 80%; margin: auto; }}
        h1 {{ text-align: center; }}
    </style>
</head>
<body>
    <div class="container">
        <h1>Nombre de Salles de Cin√©ma par R√©gion</h1>
        <canvas id="myChart"></canvas>
    </div>

    <script>
        const ctx = document.getElementById('myChart').getContext('2d');
        const myChart = new Chart(ctx, {{
            type: 'bar',
            data: {{
                labels: {json.dumps(regions)},
                datasets: [{{
                    label: 'Nombre de salles',
                    data: {json.dumps(counts)},
                    backgroundColor: 'rgba(54, 162, 235, 0.6)',
                    borderColor: 'rgba(54, 162, 235, 1)',
                    borderWidth: 1
                }}]
            }},
            options: {{
                scales: {{
                    y: {{
                        beginAtZero: true
                    }}
                }}
            }}
        }});
    </script>
</body>
</html>
"""

In [None]:
# Sauvegarde du fichier HTML
html_filename = "visualisation.html"
with open(html_filename, "w", encoding="utf-8") as f:
    f.write(html_content)

In [None]:
print(f"Page web g√©n√©r√©e : {html_filename}")

# Ouverture automatique dans le navigateur
webbrowser.open('file://' + os.path.realpath(html_filename))

In [None]:
# On importe le module http.server qui permet de cr√©er un serveur web simple
import http.server
# On importe socketserver pour g√©rer les connexions TCP (r√©seau)
import socketserver
# On importe le module json pour manipuler les donn√©es au format JSON
import subprocess
# On importe webbrowser pour ouvrir automatiquement la page dans le navigateur
import webbrowser
# On importe threading pour ex√©cuter le traitement en parall√®le sans bloquer le serveur
import threading
# On importe sys pour acc√©der aux informations sur l'interpr√©teur Python actuel
import sys

# On d√©finit le port sur lequel le serveur va √©couter (8000 est standard pour le d√©v)
PORT = 8000
# On d√©finit le nom du fichier qui contiendra les statistiques finales g√©n√©r√©es par process_data.py
STATS_FILE = "cinemas_stats.json"
# On d√©finit le nom du fichier qui sert √† suivre la progression du traitement
PROGRESS_FILE = "progress.json"

# --- Nettoyage initial ---
# Le script doit s'assurer de d√©marrer avec un √©tat propre
# On v√©rifie si un fichier de progression existe d√©j√† d'une ex√©cution pr√©c√©dente
if os.path.exists(PROGRESS_FILE):
    # Si le fichier existe, on le supprime pour √©viter d'afficher des donn√©es obsol√®tes
    os.remove(PROGRESS_FILE)


# --- D√©finition de la fonction de traitement en arri√®re-plan ---
def run_process_async():
    """Lance process_data.py en arri√®re-plan."""
    # Cette fonction sera ex√©cut√©e dans un fil d'ex√©cution s√©par√© (thread)
    # On utilise subprocess.run pour ex√©cuter le script process_data.py comme si on le tapait dans le terminal
    # sys.executable est le chemin vers l'interpr√©teur Python actuel, assure qu'on utilise le m√™me environnement
    subprocess.run([sys.executable, "process_data.py"])


# --- D√©finition de la classe de gestion des requ√™tes HTTP ---
# Cette classe h√©rite de http.server.SimpleHTTPRequestHandler pour g√©rer les fichiers statiques de base
class VizHandler(http.server.SimpleHTTPRequestHandler):
    
    # Cette m√©thode est appel√©e automatiquement quand le serveur re√ßoit une requ√™te POST
    # Les requ√™tes POST sont utilis√©es ici pour envoyer des commandes au serveur (comme "d√©marrer")
    def do_POST(self):
        # On v√©rifie l'URL demand√©e par le navigateur
        if self.path == "/api/start":
            # Si l'URL est "/api/start", cela signifie que l'utilisateur a cliqu√© sur le bouton
            
            # On pr√©pare un nouveau thread (processus l√©ger) qui ex√©cutera la fonction run_process_async
            t = threading.Thread(target=run_process_async)
            # On d√©marre ce thread. Cela permet au serveur de r√©pondre imm√©diatement sans attendre la fin du traitement
            t.start()
            
            # On pr√©pare la r√©ponse HTTP pour dire au navigateur que c'est bon (code 200 = OK)
            self.send_response(200)
            # On sp√©cifie que le contenu de la r√©ponse est du JSON
            self.send_header("Content-type", "application/json")
            # On termine l'√©criture des en-t√™tes
            self.end_headers()
            # On envoie le corps de la r√©ponse : un petit JSON confirmant le d√©marrage
            self.wfile.write(json.dumps({"status": "started"}).encode("utf-8"))
        else:
            # Si l'adresse n'est pas reconnue, on renvoie une erreur 404 (Non trouv√©)
            self.send_error(404)

    # Cette m√©thode est appel√©e automatiquement quand le serveur re√ßoit une requ√™te GET
    # Les requ√™tes GET sont utilis√©es pour demander des pages ou des donn√©es
    def do_GET(self):
        # Cas 1 : Le navigateur demande l'√©tat d'avancement du traitement
        if self.path == "/api/progress":
            # On pr√©pare une r√©ponse OK (200)
            self.send_response(200)
            self.send_header("Content-type", "application/json")
            self.end_headers()
            
            # On initialise les donn√©es par d√©faut (si le fichier n'existe pas encore)
            data = {"step": "En attente...", "percentage": 0}
            
            # On regarde si le fichier de progression a √©t√© cr√©√© par process_data.py
            if os.path.exists(PROGRESS_FILE):
                try:
                    # On ouvre le fichier en lecture
                    with open(PROGRESS_FILE, "r", encoding="utf-8") as f:
                        # On charge le contenu JSON dans la variable data
                        data = json.load(f)
                except:
                    # Si on n'arrive pas √† lire (ex: fichier en cours d'√©criture), on garde les valeurs par d√©faut
                    pass
            
            # On envoie les donn√©es au navigateur
            self.wfile.write(json.dumps(data).encode("utf-8"))
            
        # Cas 2 : Le navigateur demande le tableau de bord final (les r√©sultats)
        elif self.path == "/api/dashboard":
            # On v√©rifie si le fichier de statistiques final existe
            if os.path.exists(STATS_FILE):
                # On ouvre le fichier de stats
                with open(STATS_FILE, "r", encoding="utf-8") as f:
                    stats_json = json.load(f)
                
                # On appelle notre m√©thode interne pour g√©n√©rer le HTML √† partir de ces donnn√©es
                html = self.generate_dashboard_html(stats_json)
                
                # On envoie la r√©ponse HTML
                self.send_response(200)
                # Notez le charset utf-8 pour bien g√©rer les accents
                self.send_header("Content-type", "text/html; charset=utf-8")
                self.end_headers()
                self.wfile.write(html.encode("utf-8"))
            else:
                # Si le fichier de stats n'existe pas, on renvoie une erreur 404
                self.send_error(404)

        # Cas 3 : Le navigateur demande la page d'accueil (l'URL racine "/")
        elif self.path == "/":
            self.send_response(200)
            self.send_header("Content-type", "text/html; charset=utf-8")
            self.end_headers()
            # On g√©n√®re le code HTML complet de la page d'accueil
            html = self.generate_index_html()
            self.wfile.write(html.encode("utf-8"))
        
        # Cas par d√©faut : Pour tout autre fichier (CSS, JS externe, images...)
        else:
            # On laisse la classe parente (SimpleHTTPRequestHandler) essayer de trouver le fichier sur le disque
            super().do_GET()

    # --- M√©thode utilitaire pour cr√©er le HTML du tableau de bord ---
    def generate_dashboard_html(self, data):
        # On extrait les donn√©es utiles du dictionnaire
        stats = data.get("stats", {})
        chart_url = data.get("chart_url", "")
        
        # On formate les nombres pour avoir des espaces entre les milliers (ex: 1 000)
        total_cinemas = f"{stats.get('total_cinemas', 0):,}".replace(",", " ")
        total_ecrans = f"{stats.get('total_ecrans', 0):,}".replace(",", " ")
        total_fauteuils = f"{stats.get('total_fauteuils', 0):,}".replace(",", " ")
        source = stats.get("source", "Inconnue")
        
        # On construit dynamiquement la liste HTML des meilleures r√©gions
        top_regions_html = ""
        # La boucle parcourt la liste des r√©gions (nom, nombre)
        for reg, count in stats.get("top_regions", []):
            top_regions_html += f"<li><strong>{reg}</strong> : {count} cin√©mas</li>"

        # On retourne une cha√Æne de caract√®res contenant le HTML (f-string pour ins√©rer les variables)
        return f"""
            <div class="result-section fade-in">
                <div class="container">
                    <div class="card">
                        <h2>Total Cin√©mas</h2>
                        <p>{total_cinemas}</p>
                    </div>
                    <div class="card">
                        <h2>Total √âcrans</h2>
                        <p>{total_ecrans}</p>
                    </div>
                    <div class="card">
                        <h2>Total Fauteuils</h2>
                        <p>{total_fauteuils}</p>
                    </div>
                </div>

                <div class="chart-container">
                    <h2>Top 5 R√©gions (Nombre d'√©tablissements)</h2>
                    <img src="{chart_url}" alt="Graphique Top 5 R√©gions">
                </div>
                
                <div class="list-container">
                    <h2>D√©tail Top 5</h2>
                    <ul>
                        {top_regions_html}
                    </ul>
                </div>

                <div class="footer">
                    <p>Source : {source}</p>
                    <p><a href="https://data.culture.gouv.fr/explore/dataset/etablissements-cinematographiques/" target="_blank">Voir le jeu de donn√©es original</a></p>
                </div>
            </div>
        """

    # --- M√©thode utilitaire pour cr√©er la page d'accueil ---
    def generate_index_html(self):
        # Cette fonction retourne tout le code HTML, CSS et JS de la page principale
        # C'est une grosse cha√Æne multi-lignes
        return """
        <!DOCTYPE html>
        <html lang="fr">
        <head>
            <meta charset="UTF-8">
            <meta name="viewport" content="width=device-width, initial-scale=1.0">
            <title>SAE 15 - Analyse Cin√©mas</title>
            <style>
                /* CSS int√©gr√© pour ne pas d√©pendre de fichiers externes */
                body { font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; background-color: #f4f4f9; color: #333; margin: 0; padding: 0; min-height: 100vh; display: flex; flex-direction: column; align-items: center; justify-content: center; }
                .main-wrapper { width: 100%; max-width: 900px; padding: 20px; text-align: center; }
                h1 { color: #2c3e50; margin-bottom: 10px; font-size: 2.5em; }
                h3 { color: #7f8c8d; font-weight: normal; margin-top: 0; margin-bottom: 40px; font-size: 1.2em; }
                
                #start-section { margin-top: 20px; }
                button { background-color: #3498db; color: white; border: none; padding: 15px 40px; font-size: 1.3em; border-radius: 50px; cursor: pointer; transition: transform 0.2s, background 0.3s; box-shadow: 0 4px 6px rgba(0,0,0,0.1); }
                button:hover { background-color: #2980b9; transform: translateY(-2px); }
                
                #progress-section { display: none; width: 100%; max-width: 600px; margin: 0 auto; }
                .progress-bar-container { width: 100%; background-color: #e0e0e0; border-radius: 15px; overflow: hidden; height: 30px; margin-top: 15px; box-shadow: inset 0 1px 3px rgba(0,0,0,0.1); }
                .progress-bar { width: 0%; height: 100%; background-color: #27ae60; transition: width 0.5s ease; text-align: center; color: white; line-height: 30px; font-weight: bold; font-size: 0.9em; }
                #step-text { font-size: 1.1em; color: #555; margin-bottom: 5px; min-height: 1.2em; }
                
                .result-section { width: 100%; text-align: left; }
                .container { display: flex; flex-wrap: wrap; gap: 20px; margin-top: 30px; justify-content: center; }
                .card { background: white; padding: 20px; border-radius: 12px; box-shadow: 0 4px 15px rgba(0,0,0,0.05); flex: 1; min-width: 200px; text-align: center; }
                .card h2 { margin: 0; font-size: 1.1em; color: #95a5a6; text-transform: uppercase; letter-spacing: 1px; }
                .card p { font-size: 2.5em; font-weight: bold; margin: 10px 0 0; color: #2c3e50; }
                
                .chart-container { text-align: center; margin-top: 40px; background: white; padding: 30px; border-radius: 12px; box-shadow: 0 4px 15px rgba(0,0,0,0.05); }
                img { max-width: 100%; height: auto; border-radius: 8px; }
                
                .list-container { margin-top: 20px; background: white; padding: 30px; border-radius: 12px; box-shadow: 0 4px 15px rgba(0,0,0,0.05); }
                ul { list-style-type: none; padding: 0; }
                li { padding: 12px; border-bottom: 1px solid #f0f0f0; display: flex; justify-content: space-between; }
                li:last-child { border-bottom: none; }
                .footer { text-align: center; margin-top: 50px; color: #95a5a6; font-size: 0.85em; }
                
                .fade-in { animation: fadeIn 0.8s ease-out; }
                @keyframes fadeIn { from { opacity: 0; transform: translateY(20px); } to { opacity: 1; transform: translateY(0); } }
            </style>
        </head>
        <body>
            <div class="main-wrapper">
                <h1>SAE 15 - Briac Le Meillat & Yanni Delattre Balcer</h1>
                <h3>Analyse des donn√©es Data.Gouv - Cin√©mas</h3>
                
                <!-- Section D√©marrage -->
                <div id="start-section">
                    <button onclick="startProcess()">üöÄ Lancer l'analyse</button>
                </div>
                
                <!-- Section Progression -->
                <div id="progress-section">
                    <div id="step-text">Initialisation...</div>
                    <div class="progress-bar-container">
                        <div id="progress-bar" class="progress-bar">0%</div>
                    </div>
                </div>
                
                <!-- Section Dashboard (sera remplie par JS) -->
                <div id="dashboard-section"></div>
            </div>

            <script>
                // --- Javascript c√¥t√© client ---

                // Fonction appel√©e quand on clique sur le bouton start
                function startProcess() {
                    // On masque le bouton
                    document.getElementById('start-section').style.display = 'none';
                    // On affiche la barre de progression
                    document.getElementById('progress-section').style.display = 'block';
                    
                    // On envoie une requ√™te POST au serveur pour dire "vas-y lance !"
                    fetch('/api/start', { method: 'POST' })
                        .then(() => pollProgress()); // Si √ßa marche, on commence √† surveiller
                }
                
                // Fonction qui demande l'√©tat d'avancement toutes les 500ms
                function pollProgress() {
                    const interval = setInterval(() => {
                        fetch('/api/progress')
                            .then(res => res.json())
                            .then(data => {
                                // Mise √† jour de l'affichage (texte et largeur de la barre)
                                document.getElementById('step-text').innerText = data.step;
                                document.getElementById('progress-bar').style.width = data.percentage + '%';
                                document.getElementById('progress-bar').innerText = data.percentage + '%';
                                
                                // Si c'est fini (100%), on arr√™te et on charge la suite
                                if (data.percentage >= 100) {
                                    clearInterval(interval);
                                    setTimeout(loadDashboard, 1000);
                                }
                            });
                    }, 500);
                }
                
                // Fonction pour aller chercher le dashboard final g√©n√©r√© par le serveur
                function loadDashboard() {
                    fetch('/api/dashboard')
                        .then(res => res.text())
                        .then(html => {
                            // On cache la progression
                            document.getElementById('progress-section').style.display = 'none';
                            // On injecte le HTML re√ßu dans la page
                            document.getElementById('dashboard-section').innerHTML = html;
                        });
                }
            </script>
        </body>
        </html>
        """

# --- Ex√©cution du serveur ---

# On affiche un message dans la console pour dire que le serveur d√©marre
print(f"Serveur interactif d√©marr√© sur http://localhost:{PORT}")

# On tente d'ouvrir le navigateur par d√©faut automatiquement
try:
    webbrowser.open(f"http://localhost:{PORT}")
except:
    # Si l'ouverture √©choue, ce n'est pas grave, l'utilisateur peut y aller manuellement
    pass

# On cr√©e l'instance du serveur TCP
# ("" signifie √©couter sur toutes les interfaces locales, PORT est le port choisi)
# VizHandler est notre classe qui g√®re comment r√©pondre aux requ√™tes
try:
    with socketserver.TCPServer(("", PORT), VizHandler) as httpd:
        # On lance la boucle infinie qui attend les connexions
        # Le programme bloquera ici tant qu'on ne l'arr√™te pas (Ctrl+C)
        httpd.serve_forever()
except KeyboardInterrupt:
    # Si l'utilisateur appuie sur Ctrl+C, on capture l'interruption pour quitter proprement
    print("\nArr√™t du serveur.")
except Exception as e:
    # Si une autre erreur survient (port d√©j√† utilis√© par exemple)
    print(f"\nErreur lors du d√©marrage du serveur : {e}")



In [10]:
# On importe le module http.server qui permet de cr√©er un serveur web simple
import http.server
# On importe socketserver pour g√©rer les connexions TCP (r√©seau)
import socketserver
# On importe le module json pour manipuler les donn√©es au format JSON
import json
# On importe le module os pour les op√©rations syst√®me
import os
# On importe subprocess pour lancer des processus
import subprocess
# On importe webbrowser pour ouvrir automatiquement la page dans le navigateur
import webbrowser
# On importe threading pour ex√©cuter le traitement en parall√®le sans bloquer le serveur
import threading
# On importe sys pour acc√©der aux informations sur l'interpr√©teur Python actuel
import sys

# On d√©finit le port sur lequel le serveur va √©couter (8000 est standard pour le d√©v)
PORT = 8000
# On d√©finit le nom du fichier qui contiendra les statistiques finales g√©n√©r√©es par process_data.py
STATS_FILE = "formatted-etablissements-cinematographiques.json"
# On d√©finit le nom du fichier qui sert √† suivre la progression du traitement
PROGRESS_FILE = "progress.json"

# Le script doit s'assurer de d√©marrer avec un √©tat propre
# On v√©rifie si un fichier de progression existe d√©j√† d'une ex√©cution pr√©c√©dente
if os.path.exists(PROGRESS_FILE):
    # Si le fichier existe, on le supprime pour √©viter d'afficher des donn√©es obsol√®tes
    os.remove(PROGRESS_FILE)

# --- D√©finition de la fonction de traitement en arri√®re-plan ---
def run_process_async():
    """Lance la pipeline de donn√©es (scraper + formateur) en arri√®re-plan."""
    # On r√©cup√®re le dossier o√π se trouve ce script (dossier tests/)
    script_dir = os.path.dirname(os.path.abspath(__file__))
    
# --- D√©finition de la fonction de traitement en arri√®re-plan ---
def run_process_async():
    """Lance la pipeline de donn√©es (scraper + formateur) en arri√®re-plan."""
    # On r√©cup√®re le dossier o√π se trouve ce script (dossier tests/)
    script_dir = os.path.dirname(os.path.abspath(__file__))
    
    # Chemins absolus vers les scripts 'copy'
    scraper_script = os.path.join(script_dir, "scraper-data copy.py")
    formater_script = os.path.join(script_dir, "formater-data copy.py")
    
    # Fonction helper pour mettre √† jour le fichier de progression
    def update_progress(step, percentage):
        with open(PROGRESS_FILE, "w", encoding="utf-8") as f:
            json.dump({"step": step, "percentage": percentage}, f)

    try:
        # 1. D√©marrage
        update_progress("D√©marrage du t√©l√©chargement...", 10)
        
        # 2. Lancement du scraper
        print(f"Lancement de {scraper_script}...")
        subprocess.run([sys.executable, scraper_script], check=True)
        
        # 3. Transition
        update_progress("Formatage des donn√©es...", 50)
        
        # 4. Lancement du formateur
        print(f"Lancement de {formater_script}...")
        subprocess.run([sys.executable, formater_script], check=True)
        
        # 5. Fin
        update_progress("Traitement termin√© !", 100)
        
    except Exception as e:
        print(f"Erreur durant le traitement : {e}")
        update_progress(f"Erreur : {e}", 0)


In [11]:
# On importe le module http.server qui permet de cr√©er un serveur web simple
import http.server
# On importe socketserver pour g√©rer les connexions TCP (r√©seau)
import socketserver
# On importe le module json pour manipuler les donn√©es au format JSON
import json
# On importe le module os pour les op√©rations syst√®me
import os
# On importe subprocess pour lancer des processus
import subprocess
# On importe webbrowser pour ouvrir automatiquement la page dans le navigateur
import webbrowser
# On importe threading pour ex√©cuter le traitement en parall√®le sans bloquer le serveur
import threading
# On importe sys pour acc√©der aux informations sur l'interpr√©teur Python actuel
import sys

# On d√©finit le port sur lequel le serveur va √©couter (8000 est standard pour le d√©v)
PORT = 8000
# On d√©finit le nom du fichier qui contiendra les statistiques finales g√©n√©r√©es par process_data.py
STATS_FILE = "formatted-etablissements-cinematographiques.json"
# On d√©finit le nom du fichier qui sert √† suivre la progression du traitement
PROGRESS_FILE = "progress.json"

# Le script doit s'assurer de d√©marrer avec un √©tat propre
# On v√©rifie si un fichier de progression existe d√©j√† d'une ex√©cution pr√©c√©dente
if os.path.exists(PROGRESS_FILE):
    # Si le fichier existe, on le supprime pour √©viter d'afficher des donn√©es obsol√®tes
    os.remove(PROGRESS_FILE)


### 1. Gestion des processus en arri√®re-plan

La fonction `run_process_async` est charg√©e d'ex√©cuter la cha√Æne de traitement (scraping + formatage) sans bloquer le serveur web.

Elle effectue les actions suivantes :
1.  D√©termine le chemin des scripts √† ex√©cuter (dans le dossier `tests/`).
2.  Lance s√©quentiellement `scraper-data copy.py` et `formater-data copy.py`.
3.  Met √† jour un fichier `progress.json` pour informer le serveur de l'avancement.

In [12]:
# --- D√©finition de la fonction de traitement en arri√®re-plan ---
def run_process_async():
    """Lance la pipeline de donn√©es (scraper + formateur) en arri√®re-plan."""
    # CORRECTION : Utilisation de os.getcwd() au lieu de __file__ pour les notebooks
    current_dir = os.getcwd()
    # On suppose que le dossier tests est dans le dossier courant
    script_dir = os.path.join(current_dir, "tests")
    
    # Chemins absolus vers les scripts 'copy'
    scraper_script = os.path.join(script_dir, "scraper-data copy.py")
    formater_script = os.path.join(script_dir, "formater-data copy.py")
    
    # Fonction helper pour mettre √† jour le fichier de progression
    def update_progress(step, percentage):
        with open(PROGRESS_FILE, "w", encoding="utf-8") as f:
            json.dump({"step": step, "percentage": percentage}, f)

    try:
        # 1. D√©marrage
        update_progress("D√©marrage du t√©l√©chargement...", 10)
        
        # 2. Lancement du scraper
        print(f"Lancement de {scraper_script}...")
        # check=True l√®ve une exception si le script √©choue
        subprocess.run([sys.executable, scraper_script], check=True)
        
        # 3. Transition
        update_progress("Formatage des donn√©es...", 50)
        
        # 4. Lancement du formateur
        print(f"Lancement de {formater_script}...")
        subprocess.run([sys.executable, formater_script], check=True)
        
        # 5. Fin
        update_progress("Traitement termin√© !", 100)
        
    except Exception as e:
        print(f"Erreur durant le traitement : {e}")
        update_progress(f"Erreur : {e}", 0)


### 2. Le Serveur Web (Handler)

La classe `VizHandler` d√©finit comment le serveur r√©pond aux requ√™tes des navigateurs.
Elle g√®re :
- **GET /** : Affiche la page HTML d'accueil.
- **POST /api/start** : Lance le traitement en arri√®re-plan.
- **GET /api/progress** : Renvoie l'avancement (JSON).
- **GET /api/dashboard** : Renvoie le tableau de bord final (HTML g√©n√©r√© dynamiquement).

In [None]:

# Cette classe h√©rite de http.server.SimpleHTTPRequestHandler pour g√©rer les fichiers statiques de base
class VizHandler(http.server.SimpleHTTPRequestHandler):
    
    # Cette m√©thode est appel√©e automatiquement quand le serveur re√ßoit une requ√™te POST
    def do_POST(self):
        if self.path == "/api/start":
            # Lancement du thread en arri√®re-plan
            t = threading.Thread(target=run_process_async)
            t.start()
            
            self.send_response(200)
            self.send_header("Content-type", "application/json")
            self.end_headers()
            self.wfile.write(json.dumps({"status": "started"}).encode("utf-8"))
        else:
            self.send_error(404)

    # Cette m√©thode est appel√©e automatiquement quand le serveur re√ßoit une requ√™te GET
    def do_GET(self):
        if self.path == "/api/progress":
            self.send_response(200)
            self.send_header("Content-type", "application/json")
            self.end_headers()
            
            data = {"step": "En attente...", "percentage": 0}
            if os.path.exists(PROGRESS_FILE):
                try:
                    with open(PROGRESS_FILE, "r", encoding="utf-8") as f:
                        data = json.load(f)
                except:
                    pass
            self.wfile.write(json.dumps(data).encode("utf-8"))
            
        elif self.path == "/api/dashboard":
            if os.path.exists(STATS_FILE):
                with open(STATS_FILE, "r", encoding="utf-8") as f:
                    stats_json = json.load(f)
                html = self.generate_dashboard_html(stats_json)
                self.send_response(200)
                self.send_header("Content-type", "text/html; charset=utf-8")
                self.end_headers()
                self.wfile.write(html.encode("utf-8"))
            else:
                self.send_error(404)

        elif self.path == "/":
            self.send_response(200)
            self.send_header("Content-type", "text/html; charset=utf-8")
            self.end_headers()
            html = self.generate_index_html()
            self.wfile.write(html.encode("utf-8"))
        else:
            super().do_GET()

    def generate_dashboard_html(self, data):
        stats = data.get("stats", {})
        chart_url = data.get("chart_url", "")
        
        total_cinemas = f"{stats.get('total_cinemas', 0):,}".replace(",", " ")
        total_ecrans = f"{stats.get('total_ecrans', 0):,}".replace(",", " ")
        total_fauteuils = f"{stats.get('total_fauteuils', 0):,}".replace(",", " ")
        source = stats.get("source", "Inconnue")
        
        top_regions_html = ""
        for reg, count in stats.get("top_regions", []):
            top_regions_html += f"<li><strong>{reg}</strong> : {count} cin√©mas</li>"

        return f"""
            <div class="result-section fade-in">
                <div class="container">
                    <div class="card">
                        <h2>Total Cin√©mas</h2>
                        <p>{total_cinemas}</p>
                    </div>
                    <div class="card">
                        <h2>Total √âcrans</h2>
                        <p>{total_ecrans}</p>
                    </div>
                    <div class="card">
                        <h2>Total Fauteuils</h2>
                        <p>{total_fauteuils}</p>
                    </div>
                </div>

                <div class="chart-container">
                    <h2>Top 5 R√©gions</h2>
                    <img src="{chart_url}" alt="Graphique Top 5 R√©gions">
                </div>
                
                <div class="list-container">
                    <h2>D√©tail Top 5</h2>
                    <ul>
                        {top_regions_html}
                    </ul>
                </div>

                <div class="footer">
                    <p>Source : {source}</p>
                    <p><a href="https://data.culture.gouv.fr/explore/dataset/etablissements-cinematographiques/" target="_blank">Voir le jeu de donn√©es original</a></p>
                </div>
            </div>
        """

    def generate_index_html(self):
        return """
        <!DOCTYPE html>
        <html lang="fr">
        <head>
            <meta charset="UTF-8">
            <meta name="viewport" content="width=device-width, initial-scale=1.0">
            <title>SAE 15 - Analyse Cin√©mas</title>
            <style>
                body { font-family: 'Segoe UI', sans-serif; background-color: #f4f4f9; color: #333; margin: 0; padding: 20px; display: flex; flex-direction: column; align-items: center; justify-content: center; min-height: 100vh; }
                .main-wrapper { width: 100%; max-width: 900px; text-align: center; }
                h1 { color: #2c3e50; font-size: 2.5em; margin-bottom: 10px; }
                h3 { color: #7f8c8d; font-weight: normal; margin-bottom: 40px; }
                button { background-color: #3498db; color: white; border: none; padding: 15px 40px; font-size: 1.3em; border-radius: 50px; cursor: pointer; transition: 0.3s; box-shadow: 0 4px 6px rgba(0,0,0,0.1); }
                button:hover { background-color: #2980b9; transform: translateY(-2px); }
                .progress-bar-container { width: 100%; background-color: #e0e0e0; border-radius: 15px; overflow: hidden; height: 30px; margin-top: 20px; }
                .progress-bar { width: 0%; height: 100%; background-color: #27ae60; transition: width 0.5s; text-align: center; color: white; line-height: 30px; font-weight: bold; }
                .card { background: white; padding: 20px; border-radius: 12px; box-shadow: 0 4px 15px rgba(0,0,0,0.05); flex: 1; min-width: 200px; margin: 10px; }
                .container { display: flex; flex-wrap: wrap; justify-content: center; margin-top: 30px; }
                ul { list-style: none; padding: 0; text-align: left; }
                li { padding: 10px; border-bottom: 1px solid #eee; display: flex; justify-content: space-between; }
            </style>
        </head>
        <body>
            <div class="main-wrapper">
                <h1>SAE 15 - Briac Le Meillat & Yanni Delattre Balcer</h1>
                <h3>Analyse des donn√©es Data.Gouv - Cin√©mas</h3>
                
                <div id="start-section">
                    <button onclick="startProcess()">üöÄ Lancer l'analyse</button>
                </div>
                
                <div id="progress-section" style="display:none;">
                    <div id="step-text">Initialisation...</div>
                    <div class="progress-bar-container">
                        <div id="progress-bar" class="progress-bar">0%</div>
                    </div>
                </div>
                
                <div id="dashboard-section"></div>
            </div>

            <script>
                function startProcess() {
                    document.getElementById('start-section').style.display = 'none';
                    document.getElementById('progress-section').style.display = 'block';
                    fetch('/api/start', { method: 'POST' }).then(() => pollProgress());
                }
                
                function pollProgress() {
                    const interval = setInterval(() => {
                        fetch('/api/progress').then(res => res.json()).then(data => {
                            document.getElementById('step-text').innerText = data.step;
                            document.getElementById('progress-bar').style.width = data.percentage + '%';
                            document.getElementById('progress-bar').innerText = data.percentage + '%';
                            if (data.percentage >= 100) {
                                clearInterval(interval);
                                setTimeout(loadDashboard, 1000);
                            }
                        });
                    }, 500);
                }
                
                function loadDashboard() {
                    fetch('/api/dashboard').then(res => res.text()).then(html => {
                        document.getElementById('progress-section').style.display = 'none';
                        document.getElementById('dashboard-section').innerHTML = html;
                    });
                }
            </script>
        </body>
        </html>
        """


### 3. D√©marrage du Serveur

Enfin, on d√©marre le serveur.
Le lien s'ouvrira automatiquement dans votre navigateur.

In [None]:
print(f"Serveur interactif d√©marr√© sur http://localhost:{PORT}")

# On tente d'ouvrir le navigateur par d√©faut automatiquement
try:
    webbrowser.open(f"http://localhost:{PORT}")
except:
    pass

try:
    # allow_reuse_address √©vite le probl√®me du port bloqu√© si on relance vite
    socketserver.TCPServer.allow_reuse_address = True
    with socketserver.TCPServer(("", PORT), VizHandler) as httpd:
        # On lance la boucle infinie qui attend les connexions
        httpd.serve_forever()
except KeyboardInterrupt:
    print("\nArr√™t du serveur.")
except Exception as e:
    print(f"\nErreur lors du d√©marrage du serveur : {e}")


Serveur interactif d√©marr√© sur http://localhost:8000


127.0.0.1 - - [15/Jan/2026 11:38:20] "GET / HTTP/1.1" 200 -
127.0.0.1 - - [15/Jan/2026 11:38:20] code 404, message File not found
127.0.0.1 - - [15/Jan/2026 11:38:20] "GET /favicon.ico HTTP/1.1" 404 -
127.0.0.1 - - [15/Jan/2026 11:38:23] "POST /api/start HTTP/1.1" 200 -


Lancement de c:\hello-world-python\sae15-traitement-de-donnees\tests\scraper-data copy.py...


127.0.0.1 - - [15/Jan/2026 11:38:23] "GET /api/progress HTTP/1.1" 200 -
127.0.0.1 - - [15/Jan/2026 11:38:24] "GET /api/progress HTTP/1.1" 200 -
127.0.0.1 - - [15/Jan/2026 11:38:24] "GET /api/progress HTTP/1.1" 200 -
127.0.0.1 - - [15/Jan/2026 11:38:25] "GET /api/progress HTTP/1.1" 200 -
127.0.0.1 - - [15/Jan/2026 11:38:26] "GET /api/progress HTTP/1.1" 200 -


Lancement de c:\hello-world-python\sae15-traitement-de-donnees\tests\formater-data copy.py...


127.0.0.1 - - [15/Jan/2026 11:38:26] "GET /api/progress HTTP/1.1" 200 -
127.0.0.1 - - [15/Jan/2026 11:38:26] "GET /api/progress HTTP/1.1" 200 -
127.0.0.1 - - [15/Jan/2026 11:38:28] "GET /api/dashboard HTTP/1.1" 200 -



Arr√™t du serveur.
