# Donn√©es ouvertes et standards d‚Äôorganisation BIDS
Cette s√©rie d'exercices vise √† tester votre compr√©hension de la librairie `pybids` pour explorer un jeu de donn√©es de neuroimagerie disponible publiquement sur la plateforme `openneuro`. 

Dans chaque exercice, vous devrez cr√©er des variables. **Ne pas changer le nom des variables, car ces noms seront utilis√©s pour la correction automatique**. 

Aussi, m√™me si cela n'est pas demand√©, nous vous encourageons √† afficher les variables avec la command `print` afin de v√©rifier que le contenu g√©n√©r√© dans la variable est bien le contenu attendu. 

Il faut ex√©cuter la cellule suivante afin d'utiliser les fonctions n√©cessaires pour cet exercise.

In [None]:
# Import libraries
from bids import BIDSLayout
from bids.reports import BIDSReport
import pandas as pd

print("Biblioth√®ques import√©es avec succ√®s.")

Il faut ex√©cuter cette cellule afin de cr√©er une copie locale d'un jeu de donn√©es ouvert √† partir de la plateforme OpenNeuro, en utilisant `datalad` (note: l'erreur de t√©l√©chargement du fichier `config` est normale):

In [None]:
import subprocess
from pathlib import Path

dataset_id = "ds005355"

dataset_url = f"https://github.com/OpenNeuroDatasets/{dataset_id}.git"

result = subprocess.run(f"datalad install {dataset_url}", shell=True)

In [None]:
import os 
dataset_dir = Path(f"./{dataset_id}").absolute()

if not dataset_dir.exists():
    raise FileNotFoundError(
        f"Dataset directory '{dataset_dir}' does not exist. "
        "Create it before running DataLad install."
    )
else:
    print(f"Dataset {dataset_id} fetched locally")
subprocess.run(f"datalad get -d {dataset_dir} {os.path.join(dataset_dir, 'sub-[12]','anat','*T1w*')}", shell=True)

‚ö†Ô∏è ATTENTION: Les points `...` dans les cellules de code sont indicatifs seulement. Vous devez les remplacder par du code.

# Question 1 : Initialiser PyBIDS et indexer le jeu de donn√©es (5 points)

Dans cette question, vous allez cr√©er un objet BIDSLayout pointant vers le dossier racine de votre jeu de donn√©es BIDS t√©l√©charg√©. Le chemin vers le jeu de donn√©es existe d√©j√† dans la variable `dataset_dir` initialis√©e pr√©c√©demment:
 - Cr√©ez un `BIDSLayout` dans une variable `layout`, associ√© au jeu de donn√©es


In [None]:
layout = ...

print(layout)

# Question 2: Lister les sujets, t√¢ches et types de fichiers (5 points)

√Ä l‚Äôaide de PyBIDS extraire:
1) la liste des **sujets** du dataset dans une variable `list_subjects` 
2) la liste des **t√¢ches** disponibles dans une variable `list_tasks`
3) la liste des **suffixes** disponibles dans une variable `list_suffixes`

‚ö†Ô∏è Ne r√©pondez pas ‚Äú√† la main‚Äù : les listes doivent √™tre obtenues par des requ√™tes PyBIDS (pas √©crites/copier-coller).
üí° Indice : cherchez dans la [documentation pybids](https://bids-standard.github.io/pybids/layout/index.html)

In [None]:
list_subjects = ...
list_tasks = ...
list_suffixes = ...

print(list_subjects)
print(list_tasks)
print(list_suffixes)

# Question 3: dataset description (5 points)

acc√©der au dictionaire `layout.description` et extraire:
 - la license du jeu de donn√©es dans la variable `license`
 - les auteurs du jeu de donn√©es dans la variable `auteurs`

In [None]:
license = ...
auteurs = ...

print(license)
print(auteurs)

# Question 4 : Lire des m√©tadonn√©es (TR) pour un fichier BOLD (5 points)

√Ä l‚Äôaide de PyBIDS, s√©lectionnez **un fichier BOLD** du jeu de donn√©es et lisez ses m√©tadonn√©es.
 - Dans la variable `file_bold` g√©n√©rer le nom du fichier BOLD correspondant √† `subject='10'`, `task='BSC'` et `run='3'`, `extension` √©gal √† `'.nii'` ou `'.nii.gz'`, en utilisant `layout.get` (üí° Note :  utiliser l'argument `return_type`).
 - Dans la variable `tr`, g√©n√©rer le **RepetitionTime (TR)** associ√© √† ce fichier en utilisant `layout.get_tr`.

üí° Note : les m√©tadonn√©es sont stock√©es dans les fichiers JSON associ√©s aux images. Ces informations sont disponibles sans avoir acc√®s aux donn√©es elles m√™me. 

In [None]:
# 1) Get any BOLD file
file_bold = ...
print(file_bold)

# 2) Get TR from metadata (seconds)
tr = ...

print(tr)

# Question 5: Lire `participants.tsv` (5 points)

 * Dans la variable `file_participants`, extraire le nom complet (avec chemin d'acc√®s du fichier) `participants.tsv` contenu dans le jeu de donn√©es, en utilisant `layout.get`
 * Dans la variable `participants_df`, extraire un pandas dataframe avec les informations de ce fichier, en utilisant la function `read_csv` de la librairie `pandas`.

üí° Note : il est n√©cessaire de sp√©cifier le s√©parateur `sep` √† `read_csv`.
üí° Note 2: les donn√©es ph√©notypiques `sex` et `age` sont manquantes dans ce jeu de donn√©es, et apparaissent comme `NaN` (not a number). 

In [None]:
participants_file = ...
participants_df = ...

participants_df.head(10)


# Question 6: Explorer un fichier `events.tsv` (5 points)

 - Dans la variable `file_events`, g√©n√©rer le nom du fichier d'√©v√©nement associ√© √† `subject='11'`, `task='BSC'` et `run='2'`, en utilisant `layout.get`.
 - Dans la variable `events_df`, lire le fichier d'√©v√©nement dans un pandas dataframe, en utilisant `read_csv` de la librairie `pandas`.
 - Dans la variable `task_name`, g√©n√©rer le nom de la t√¢che √† l'aide de `layout.parse_file_entities` (le r√©sultat attendu est `'BSC'`).


In [None]:
# Get one events.tsv file
events_file = ...

# Read it
events_df = ...

# Extract task name from BIDS entities
task_name = ...

# First 5 rows
print(task_name)
events_df.head(5)


### Question 7 : G√©n√©rer un rapport BIDS - BIDSReport (10 points)

 * Dans la variable `list_t1w`, cr√©er une liste d'objets correspondant √† `suffix='T1w'`, `subject` √©gal √† '1' ou '2', `extension` √©gal √† 'nii' ou 'nii.gz', en utilisant `layout.get` 
 * Dans la variable `report`, cr√©er un `BIDSreport` associ√© √† `layout`.
 * Dans la variable `counter`, g√©n√©rer un rapport concernant les objets `list_t1w` √† l'aide de `report.generate_from_files`.

In [None]:
# Initialize a report for the dataset
report = ...
list_t1w = ...
counter = ...


print(list(counter.keys())[0])