<a href="https://colab.research.google.com/github/FYCodeLab/SweetSpot/blob/main/SweetSpot_NoteBook_fr.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ![SweetSpot Intro](https://github.com/FYCodeLab/SweetSpot/blob/main/assets/GoogleColab/introsweet4.png?raw=true)
*Un notebook facile qui vous apprendra à utiliser le langage de programmation R, utilisé dans tous les laboratoires de recherche pour faire des calculs et des graphiques. Modifiez le code et jouez avec, c'est la meileure façàn d'apprendre.*


### 📚 **CONTEXTE**

Le 25 mars 2025, dans le cadre de la conférence interprofessionnelle  
[« Intelligence Artificielle et Biotechnologies »](https://www.supbiotech.fr/venir-nous-rencontrer/conference-ia-biotechnologies/),  
un sondage a été effectué auprès des élèves.

---

**🧠 La question posée était :**  
*« Combien de bonbons y a-t-il dans ce bocal ? »*

---

🎯 **Objectif de l’activité :**  
Vérifier la théorie de la **sagesse des foules**, selon laquelle la **moyenne des estimations individuelles**  
peut se rapprocher étonnamment de la **valeur réelle**,  
même si chaque estimation prise isolément peut être très imprécise.

📊 Les résultats ont été analysés à l’aide du programme *SweetSpot* (en R)  
pour visualiser la distribution des réponses, détecter les valeurs aberrantes,  
et illustrer ce phénomène par une **approche interactive de la science des données**.

---

![Bocal de bonbons](https://raw.githubusercontent.com/FYCodeLab/SweetSpot/main/assets/GoogleColab/bocal6.jpg)


### 📌 **Mode d'emploi de Google Colab**



![Instructions pour l'exercice](https://raw.githubusercontent.com/FYCodeLab/SweetSpot/main/assets/GoogleColab/instructions4png.png) \
ㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤㅤ[💻 FYcodelab github](https://fycodelabs.github.io)




###‎
<p align="left">
  <img src="https://github.com/FYCodeLab/SweetSpot/blob/main/assets/GoogleColab/package.png?raw=true" alt="SweetSpot Intro" width="600">
</p>



### **1. Installation des packages nécessaires pour ce programme**
Cliquez sur **[▶]** pour exécuter le code.

In [None]:
# 📦 Installer les packages nécessaires:
# 📊 ggplot2 est un package excellent qui permet de créer des graphiques élégants et puissants en R
# 🧹 dplyr est une bibliothèque très pratique pour manipuler et filtrer des données facilement
install.packages("ggplot2")
install.packages("dplyr")

### **2. Charger les packages en mémoire**
Cliquez sur **[▶]** pour exécuter le code.

In [None]:
# 📚 Charger les bibliothèques pour pouvoir les utiliser
library(ggplot2)
library(dplyr)

##  <p align="left">
  <img src="https://github.com/FYCodeLab/SweetSpot/blob/main/assets/GoogleColab/data.png?raw=true" alt="SweetSpot Intro" width="500">
</p>


### **1. Télécharger le fichier de données**
Le fichier `DATASTUDENTS.TXT` contient les données collectées lors du sondage.
vous guide pour utiliser R pour analyser un tableau de données et pour faire un graphe.
Les données sont dans un fichier texte (txt) appelé DATASTUDENTS.TXT, séparées par une tabulation.\
Par exemple : \
```
Charles   145
Henri  123
```

Le fichier doit être importé dans Colab. Pour voir les fichiers, cliquez sur l'icone **🗀** situé dans la colonne à gauche. Vous pouvez mettre tous les fichiers que vous voulez (dans la limite de 70Gb ☺)
Pour vous éviter l'effort de glisser-déposer un fichier vous mêmes, on va le faire pour vous grace à la fonction R `wget` qui va télécharger le fichier automatiquement pour vous.



In [None]:
# 📥 Télécharge le fichier DATASTUDENTS.TXT depuis GitHub vers le dossier de travail de Colab
download.file("https://raw.githubusercontent.com/FYCodeLab/SweetSpot/main/assets/GoogleColab/DATASTUDENTS.TXT",
              destfile = "DATASTUDENTS.TXT")

# ✅ Message pour l'utilisateur
cat("✅ Le fichier DATASTUDENTS.TXT a été téléchargé.\n📁 Vérifiez dans le panneau 'Fichiers' (à gauche dans Colab) qu'il est bien présent.\n")


### **2. Lire le fichier**
Une fois le fichier `DATASTUDENTS.TXT` téléchargé : il faut maintenant le lire et le rentrer en mémoire grâce à la fonction `read`.


In [None]:
# 📥 On lit le fichier texte en précisant que la première ligne contient les noms de colonnes,
#    et que les colonnes sont séparées par des tabulations "\t"
data <- read.table("DATASTUDENTS.TXT", header = FALSE, sep = "\t")

# 🏷️ On renomme les deux premières colonnes pour qu'elles soient plus simples à utiliser : "Nom" et "Estimation"
colnames(data) <- c("Nom", "Estimation")

# 🔢 On convertit les valeurs de la colonne "Estimation" en nombres, au cas où elles auraient été lues comme du texte
data$Estimation <- as.numeric(data$Estimation)


# 🔍 Filtrage des données :
# - is.na(...) détecte les valeurs manquantes
# - !is.na(...) garde celles qui ne sont PAS manquantes (! signifie NON)
# - data$Estimation > 0 garde seulement les valeurs strictement positives
# 👉 Bref on ne garde que les lignes valides (pas NA et > 0)

data <- data[!is.na(data$Estimation) & data$Estimation > 0, ]

if (nrow(data) > 0) {
  cat("✅ Données chargées correctement avec", nrow(data), "lignes valides.\n")
}

#<p align="center">
  <img src="https://github.com/FYCodeLab/SweetSpot/blob/main/assets/GoogleColab/calcul2.png?raw=true" alt="SweetSpot Intro" width="500">
</p>


*Effectuons maintenant quelques calculs sur les données. Avec R, ce n'est pas trop difficile, c'est fait pour...*

### **1. Quelques calculs de base**

In [None]:
# 📊 On calcule les statistiques de base grace aux fonctions mean(), median(), min(), max()
nb_reponses <- nrow(data)
moyenne <- mean(data$Estimation)
mediane <- median(data$Estimation)
minimum <- min(data$Estimation)
maximum <- max(data$Estimation)

# ✨ On affiche les résultats :
cat("🧮 Nombre total de réponses :", nb_reponses, "\n\n")

cat("❓ Quelle est la moyenne des estimations ?\n")
cat("➡️ Moyenne :", round(moyenne, 0), "\n\n")

cat("❓ Quelle est la médiane des estimations ?\n")
cat("➡️ Médiane :", round(mediane, 0), "\n\n")

cat("❓ Quelle est la plus petite estimation donnée ?\n")
cat("➡️ Minimum :", minimum, "\n\n")

cat("❓ Quelle est la plus grande estimation donnée ?\n")
cat("➡️ Maximum :", maximum, "\n")



### **2. Analyse des données : qui a gagné ?**
Maintenant faisons un programmme très simple pour connaitre le nom des eleves qui ont devné le bon nombre de bonbons! Pour information, le  vrai nombre était **247**.

In [None]:
# 🧠 Objectif de ce script :
# - Demander à l'utilisateur d'entrer le vrai nombre de bonbons dans le bocal
# - Rechercher dans les données les élèves qui ont deviné ce nombre exactement
# - Afficher leur(s) nom(s), ou un message si personne n'a trouvé

# 🟢 1. Demander à l'utilisateur le bon nombre
# La fonction readline() affiche un message et attend que l'utilisateur tape une réponse
# On utilise as.numeric() pour convertir la réponse (qui est du texte) en un nombre
vrai_nombre <- as.numeric(readline(prompt = "🍬 Entrez le vrai nombre de bonbons dans le bocal : "))

# 🔍 2. Rechercher les élèves qui ont donné exactement cette estimation
# On filtre les lignes où la colonne "Estimation" est exactement égale au nombre entré
# Puis on extrait la colonne "Nom" des gagnants
gagnants <- data[data$Estimation == vrai_nombre, "Nom"]

# 🥳 3. Afficher le ou les gagnants
# Si on trouve au moins un nom, on les affiche tous avec un message de félicitations
# Sinon, on indique qu'aucun élève n'a deviné juste

if (length(gagnants) > 0) {
  cat("✅ Bravo aux élèves suivants qui ont trouvé exactement", vrai_nombre, "bonbons: !\n ")
  cat("🏆", paste(gagnants, collapse = ", "), "\n")  # Affiche tous les noms sur une ligne
} else {
  cat("😕 Aucun élève n'a donné exactement", vrai_nombre, "bonbons.\n")
}


#<p align="center">
  <img src="https://github.com/FYCodeLab/SweetSpot/blob/main/assets/GoogleColab/graphes.png?raw=true" alt="SweetSpot Intro" width="500">
</p>


*`ggplot` est le package idéal pour faire des graphes de qualité scientifique. Essayez ici de jouer avec (changez les couleurs, les échelles...)*

## **📊 Graphique 1 : Nuage de points avec moyenne et médiane**
 💡 Essayez de changer la couleur des points, le titre du graphique...

In [None]:
# 📊 On calcule la moyenne des estimations (la fameuse "moyenne arithmétique")
moyenne <- mean(data$Estimation)

# 📊 On calcule la médiane (la valeur du milieu : 50% en plus, 50% en moins)
mediane <- median(data$Estimation)

# 🟣 On crée une variable Y avec un léger "jitter" (brouillage) pour que les points ne se superposent pas complètement sur le graphique
data$Y <- jitter(rep(1, nrow(data)), amount = 0.2)

# 🖼️ On prépare un graphique avec ggplot2
# Chaque point représentera une personne et son estimation, placé aleatoirement sur le long de l'axe des ordonnées

# ➕ Important: Dans ggplot2, on construit un graphique en ajoutant des "couches"
#    Chaque couche est ajoutée avec un "+" à la fin de la ligne
ggplot(data, aes(x = Estimation, y = Y)) +  # Axe X = estimation, Axe Y = un peu de hasard (jitter) pour mieux voir les points

  # ➕ 1re couche : les points violets
  # Chaque point représente une estimation faite par un élève
  geom_point(color = "purple", size = 4) + # Changez la taille des points !

  # ➕ Vous pouvez si vous voulez ajouter les noms à coté (retirer le # ci dessous)
  # geom_text(aes(label = Nom), hjust = -0.1, size = 4, color = "black") +

  # ➕ 2e couche : ligne verticale rouge pour la moyenne
  geom_vline(xintercept = moyenne, color = "red", linetype = "dashed") +

  # ➕ 3e couche : ligne verticale bleue pour la médiane
  geom_vline(xintercept = mediane, color = "blue", linetype = "dashed") +

  # ➕ 4e couche : les titres et étiquettes
  # Titre général + nom de l’axe X (on laisse l’axe Y vide car il n’est pas informatif ici)
  labs(
    title = "Chaque point = une estimation",  # Titre du graphique
    subtitle = "rouge=moyenne, bleu=mediane",                              # Sous titre  du graphique
    x = "Estimation du nombre de bonbons",                                 # Nom de l’axe X
    y = NULL                                                               # Pas de nom pour l’axe Y
  )+
   # ➕ Ajoutons enfin un theme pour modifier l'apparence du graphe
  theme_minimal(base_size = 16)


## **📊 Graphique 2 :  Histogramme simple**
Les données sont "binned", c'est à dire regroupées par intervalle\
 💡 Essayez de changer la couleur des histogrammes, le titre du graphique et regardez le résultat. C'est la meileure manière d'apprendre à utiliser l'excellent outil GGPLOT!

In [None]:
# 📊 On commence la construction du graphique avec ggplot()
# On précise que la variable "Estimation" doit aller sur l’axe horizontal (X)
# 👉 Cette ligne seule ne trace rien : elle prépare le cadre du graphique.
ggplot(data, aes(x = Estimation)) +  # Base du graphique : axe X = donnée Estimation

  # ➕ Le symbole "+" signifie ici : "j'ajoute une couche au graphique"
  # 🧱 1ère couche : un histogramme
  # Chaque barre regroupe des estimations proches (par tranches de 50)
  # Cela nous permet de voir comment les réponses des élèves sont réparties
  geom_histogram(
    binwidth = 70,                   # ➡️ Jouez avec cette valeur : 10, 25, 100…
    fill = "gold",                   # ➡️ Changez la couleur de remplissage, il y en a plein : red, orange, orange, gold, orchid, tomato, deeppink, magenta, turquoise, cyan, hotpink, limegreen...
    color = "darkblue",              # ➡️ Couleur du contour des barres
    alpha = 0.7                      # ➡️ Transparence (0 = transparent, 1 = opaque)
  ) +

   # ➕ On ajoute une 2ème couche : une ligne verticale rouge pour la moyenne
   # Elle permet de situer visuellement la "tendance générale" des réponses
  geom_vline(xintercept = moyenne, color = "red", linetype = "solid", linewidth = 1.2) + #linetype peut être dashed, dotted ou solid

   # ➕ Encore une couche ! Cette fois pour la médiane (ligne bleue)
   # Elle montre la valeur "centrale" des réponses triées
  geom_vline(xintercept = mediane, color = "blue", linetype = "dotted", linewidth = 1.2) +

  # ➕ Dernière couche : on ajoute le titre et les étiquettes des axes
  # Cela rend le graphique lisible et compréhensible pour l'utilisateur
  labs(
    title = " Distribution des estimations",          # Titre
    subtitle = "Rouge = moyenne | Bleu = médiane",    # Sous-Titre
    x = "Estimation du nombre de bonbons",            # Légende de l’axe des X
    y = "Nombre de réponses",                         # Légende de l’axe des Y
    tag = "Figure A"                                  # Légende du graphe
  ) +

  # ➕ Ajoutons un theme pour modifier l'apparence du graphe
  theme_minimal(base_size = 14) +         # ➡️ Essayez aussi : theme_classic(), theme_light()

  # 🔧 Options supplémentaires (ex. : rotation des étiquettes, taille...)
  theme(
    plot.title = element_text(size = 20, face = "bold", color = "red", hjust = 0.5),
    plot.subtitle = element_text(size = 15, face = "bold", color = "darkblue", hjust = 0.5),
    axis.text.x = element_text(size = 15, angle = 0),    # ➡️ Mettez 45 ou 90 pour tester la rotation
    axis.text.y = element_text(size = 15),               # ➡️ Mettez 45 ou 90 pour tester la rotation
    axis.title.x = element_text(size = 20),              # ➡️ Mettez 16 ou 50 pour tester la taille
    axis.title.y = element_text(size = 20),              # ➡️ Mettez 16 ou 50 pour tester la taille
    panel.grid.major.y = element_line(color = "gray80")
  )


###![CHAPITRE 1](https://github.com/FYCodeLab/coding-intro/blob/main/assets/INTRO-Banner-Sondage.png?raw=true)


Ce notebook fait partie d'une série de notebooks adressés aux débutants biologistes : [💻 FYcodelab github](https://fycodelabs.github.io)  
SVP veuillez répondre au petit sondage anonyme ci dessous.

In [None]:
# @title Sondage anonyme
# @markdown **Petit sondage**\
# @markdown Remplissez les informations ci-dessous et cliquez sur Exécuter ▶ pour envoyer vos réponses.

CHAPITRE_COURANT <- "SweetSpot"
Prenom <- "frankr" # @param {type:"string"}
Nom <- "yatesr" # @param {type:"string"}
Diplome_actuel = 'Professionnel/Diplômé' # @param ["Professionnel/Diplômé", "Prepa Bac+1-2", "Inge Bac+3-5",  "Bachelor 1-3", "Université L1-L3", "Université M1-M2", "Doctorant"]
# @markdown **Ce format de cours vous convient-il ? [0=Pas du tout | 10 Parfait]**
Q2 <- 5 # @param {type:"slider", min:1, max:10, step:1}
# @markdown **Avez-vous bien saisi les bases  ? [0=Pas du tout | 10 Parfait]**
Q3 <- 5 # @param {type:"slider", min:1, max:10, step:1}
# @markdown **Avez-vous des commentaires**
commentaire <- "Ecrire ici" # @param {type:"string"}
# @markdown ---
# @markdown Cliquez sur Exécuter ▶ pour valider votre sondage. Merci!




# Charger les packages nécessaires
if (!require(httr)) install.packages("httr", repos = "http://cran.rstudio.com/")
if (!require(stringr)) install.packages("stringr", repos = "http://cran.rstudio.com/")

library(httr)
library(stringr)

# URL du Google Form
form_url <- "https://docs.google.com/forms/u/0/d/e/1FAIpQLScdlddezflctE_VwnY2hIJIbn1xhlBMoGaMqVcyV8IvCpa8Vw/formResponse"

# Correspondance des champs avec ceux du formulaire
answers <- list(
  "entry.1649154935" = CHAPITRE_COURANT,
  "entry.1030536647" = Prenom,
  "entry.869694598" = Nom,
  "entry.1554909193" = as.character(Diplome_actuel),
  "entry.563756531" = as.character(Q2),
  "entry.1963779262" = as.character(Q3),
  "entry.1918008284" = commentaire
)

# Envoyer les réponses
response <- POST(url = form_url, body = answers, encode = "form")

# Vérifier le statut de la soumission
if (status_code(response) == 200) {
  print("✅ Formulaire soumis avec succès !")
} else {
  print(paste("❌ Échec de la soumission :", status_code(response)))
}
