Ce projet peut t’être utile pour plusieurs raisons, même en tant qu’économiste :  

### 1️⃣ **Renforcement des compétences en Data Science**  
- Tu travailles déjà sur des projets en **Machine Learning et Deep Learning**. L’analyse des données du boson de Higgs te permettra de manipuler des **datasets complexes**, d’optimiser des **modèles neuronaux**, et d’utiliser des outils avancés comme les **TPU**. Ces compétences sont transférables à des problématiques économiques.  

### 2️⃣ **Application aux données économiques et financières**  
- La méthodologie utilisée ici peut être appliquée à des **problèmes d’économétrie et de prévision** :  
  - Prédiction des comportements économiques (marchés financiers, consommation, inflation)  
  - Détection d’anomalies dans des séries temporelles économiques  
  - Optimisation de modèles de prévision pour la politique monétaire ou budgétaire  

### 3️⃣ **Exploration des modèles "Wide and Deep"**  
- Le modèle **Wide and Deep** est utilisé dans **l’analyse de données tabulaires**. Il pourrait être intéressant pour des analyses économiques complexes, notamment en **microéconomie** et en **analyse du risque** (ex. crédit bancaire, notation financière).  

### 4️⃣ **Expérience avec les TPU (Tensor Processing Units)**  
- Les TPU permettent d’entraîner rapidement des **modèles massifs**. En économie, cela pourrait servir pour :  
  - Des analyses **Big Data** (ex. analyse des flux financiers mondiaux)  
  - Des simulations économiques complexes  

### **Conclusion : Un projet technique, mais transférable**  
Même si ce projet porte sur la physique, il te permet de :  
✅ Te perfectionner en **Deep Learning**  
✅ Apprendre à travailler avec des **modèles avancés**  
✅ Expérimenter des **outils puissants** applicables à l’économie  

Si ton objectif est de **maîtriser des méthodes avancées d’analyse de données**, ce projet peut être un excellent exercice avant d’appliquer ces techniques à des sujets économiques et financiers. 🔥

---

# **Détection du Boson de Higgs avec les TPU**  

### À la recherche du Boson de Higgs  
Le **Modèle Standard** est une théorie de la physique des particules qui décrit certaines des forces fondamentales de la nature. L'une des particules essentielles de ce modèle, le **boson de Higgs**, est responsable de la masse de la matière. Théorisé pour la première fois en 1964, il est resté insaisissable pendant près de cinquante ans avant d'être finalement observé expérimentalement en 2012 au **Grand Collisionneur de Hadrons (LHC)**. Ces expériences ont généré des millions de gigaoctets de données.  

Les ensembles de données vastes et complexes comme ceux-ci sont parfaits pour l'apprentissage profond. Dans ce projet, nous allons construire un **réseau neuronal "Wide and Deep"** (Large et Profond) pour déterminer si une collision de particules a produit un boson de Higgs ou non.  

---

### Les données des collisions  
Lorsque des **protons entrent en collision à haute énergie**, ils peuvent produire de nouvelles particules comme le **boson de Higgs**. Cependant, ces particules ne peuvent pas être directement observées, car elles se désintègrent presque instantanément. Pour détecter la présence d'une nouvelle particule, on étudie donc le comportement des particules issues de cette désintégration, appelées **"produits de désintégration"**.  

L'ensemble de données **Higgs** contient :  
- **21 caractéristiques "basses" (low-level)** décrivant les produits de désintégration  
- **7 caractéristiques "élevées" (high-level)** dérivées des précédentes  

---

### Réseaux de neurones "Wide and Deep"  
Un réseau de neurones **Wide and Deep** entraîne une couche linéaire en parallèle avec une pile profonde de couches denses. Ces réseaux sont souvent efficaces pour analyser des **données tabulaires**.  

Dans ce projet, nous travaillons avec un ensemble de données et un modèle beaucoup plus grands que ceux du cours. Pour accélérer l'entraînement, nous allons utiliser les **Tensor Processing Units (TPU) de Kaggle**, qui sont des accélérateurs idéaux pour traiter de lourdes charges de travail.  

Nous avons rassemblé quelques **hyperparamètres** pour faciliter l'expérimentation. **Forkez ce notebook** en cliquant ici et essayez par vous-même ! 🚀


---

**Configuration du Modèle**  

In [11]:

UNITS = 2 ** 11  # 2048
ACTIVATION = 'relu'
DROPOUT = 0.1


 **Configuration de l'Entraînement**  

In [16]:

BATCH_SIZE_PER_REPLICA = 2 ** 11  # Les puissances de 128 sont les plus adaptées



Les sections suivantes configurent le calcul avec les **TPU**, le **pipeline** de données et le modèle de **réseau neuronal**.  
Si vous souhaitez uniquement voir les résultats, vous pouvez passer directement à la fin !  

---

## **Mise en Place (Setup)**  
En plus de nos imports, cette section contient du code permettant de connecter notre notebook au TPU et de créer une stratégie de distribution.  
Chaque TPU dispose de **huit cœurs de calcul** fonctionnant indépendamment. Grâce à une **stratégie de distribution**, nous définissons comment répartir le travail entre eux.  

**Importation des bibliothèques et Détection du TPU**  

In [19]:
# TensorFlow
import tensorflow as tf
print("Version de TensorFlow : " + tf.__version__)

# Détection et initialisation du TPU
try:  # Détection des TPU
    tpu = tf.distribute.cluster_resolver.TPUClusterResolver.connect()  # Détection du TPU
    strategy = tf.distribute.TPUStrategy(tpu)  # Stratégie de distribution
except ValueError:  # Si aucun TPU n'est trouvé, détecter le GPU
    strategy = tf.distribute.get_strategy()  # Stratégie par défaut pour CPU et GPU unique
print("Nombre d'accélérateurs détectés : ", strategy.num_replicas_in_sync)


Version de TensorFlow : 2.18.0
Nombre d'accélérateurs détectés :  1


**Visualisation des Données**  

In [23]:
# Importation des bibliothèques

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_style("whitegrid")     # Changer le style de la figure
plt.rc('figure', autolayout=True)  # Ajustement automatique des figures
plt.rc('axes', labelweight='bold', labelsize='large',
       titleweight='bold', titlesize=18, titlepad=10)
plt.rc('animation', html='html5')  # Configuration des animations

**Chargement des Données et Modèle** 

In [26]:
# Chargement des ensembles de données Kaggle
from kaggle_datasets import KaggleDatasets
from tensorflow.io import FixedLenFeature
AUTO = tf.data.experimental.AUTOTUNE

# Importation des modules de TensorFlow pour le modèle
from tensorflow import keras
from tensorflow.keras import layers
from tensorflow.keras import callbacks


ModuleNotFoundError: No module named 'kaggle_datasets'





### **Remarque :**  
TensorFlow détecte **huit accélérateurs**. Utiliser un TPU, c'est un peu comme utiliser **huit GPU en parallèle**. 🚀