## Introduction

Le terme "communauté" fait référence à un groupe d'organismes occupant une niche écologique particulière et qui peut comprendre un nombre quelconque d'espèces. En biologie, de nombreuses études se focalisent sur l'étude des communautés bactériennes, ou microbiotes, tels qu'on en trouve dans le sol ou dans nos intestins. Dans ce TP nous allons utiliser un ensemble réduit de bactéries isolées du colon humain, qui vont former un petit microbiote intestinal dont nous allons explorer la synergie.

Ce TP a pour but de qualifier une ou plusieurs communautés minimales de bactéries capables de réaliser une fonction biologique en particuler, en se basant sur les métabolites que chaque communauté est capable de produire. Sélectionner des sous-communautées au sein d’un microbiote à de nombreuses applications, comme par exemple developper une communauté synthétique de bactéries pour des applications industrielle notamment. La recherche d’échanges entre organismes peut être un atout dans la reconstructions de réseaux métaboliques et dans l’annotation de génomes, afin d’élucider par exemple si un hôte est capable de réaliser une fonction spécifique par lui même ou si il repose sur un symbiote. Cela peut être réalisé grâce à l'outil Miscoto.

Miscoto (MIcrobiome Screening and Community selection using TOpology). C'est un outil utilisant la programmation logique (ASP) pour identifier des microbiotes de taille minimale capables de produire des métabolites d’intérets, indépendamment ou via une coopération. La coopération fait référence à des échanges de métabolites entre organismes afin de produire un métabolite d’intéret à partir des métabolites disponibles dans le mileu de culture. Miscoto met ainsi en commun toutes les capacités métaboliques de chaque organisme. Si plusieurs solutions sont disponibles il est aussi possible d’améliorer la sélection en introduisant la notion de nombre d’échanges minimum. En effet, les échanges de métabolites entre organismes étant couteux en énergie, il existe un fort sens biologique à les réduire au maximum. Les solutions générées par l’outil peuvent ensuite être filtrées par des critères biologiques.

## Procédure d'installation

1) Naviguez jusqu'au dossier contenant les fichiers d'environnement.

2) Editez le contenu du script bash `create_env.sh` en modifiant la version python, accordément à celle présente sur votre machine.
Vous devez avoir une version python >= à 3.6. Si ce n'est pas le cas, installez une distribution python remplissant cette condition. Si vous ne savez pas quelle version de python est installée sur votre machine, utilisez `python3 --version` ou par défaut `python --version`.

3) Pour lancer l'environnement, utilisez la commande `source .venv_miscoto/bin/activate` dans le terminal, en étant placé dans le dossier où vous avez créé l'enironnement.

4) A ce stade, vous devriez pouvoir vérifier la bonne installation de **miscoto** grâce à la commande `miscoto --version`. Vous pouvez désormais ouvrir le Jupyter Notebook qui contient le sujet du TP avec la commande `jupyter miscoto`.

Note : pour quitter l'environnement, utilisez la commande `deactivate` dans le terminal.

Vous pouvez par ailleurs retrouver le code source en suivant [ce lien](https://github.com/cfrioux/miscoto).

## Partie I - Les rocambolesques aventures de Biscotte, la Chaventurière

Dans cette première partie, nous vous proposons de vous familliariser avec les commandes de l'outil.

*Dans le village de Sô, champêtre bourgeade perdue parmi les monts, la jeune Biscotte se prépare pour partir à l'aventure. Depuis des semaines, elle entend à la chaverne où elle va se détendre tous les soirs après de dures journées de labeur que dangers et trésors attendent quiconque sera suffisament brave. Probablement enhardie par la boisson, elle s'est décidée à relever tous les défis que ses griffes rencontreraient. Prévoyante quant à son périple, elle a rassemblé de nombreuses victuailles et ressources nécessaires à sa survie, mais il lui manque un bien crucial : une arme pour se battre contre les nombreux dangers sur son chemin. Habile bretteuse, elle escompte bien obtenir une lame enchantée pour l'aider à affronter l'adversité. Bien qu'elle sache enchanter son épée, elle ignore comment la forger. Fort embarassée, elle va devoir requérir aux services d'autres chats de la ville pour obtenir sa rapière, et elle dispose de divers moyens. Plusieurs artisans sont installés en ville : Chachôff un forgeron en CDD, Chalumo l'expert forgeron et Chatastrophe son stagiaire. Par ailleurs, elle sait qu'elle pourrait aussi se procurer chez Chaltimbanque le marchand, qui a déplié son étal ce matin même. Un peu pressée et de nature timide, Biscotte souhaite avoir affaire au moins d'intermédiaires possible.*

Vous disposez du dossier `bac_a_chable` pour modéliser la situation. Il contient un certain nombre de fichiers, organisés comme suit :
```
bac_a_chable/
├─ Villageois/
│  ├─ CHATASTROPHE.xml
│  ├─ CHACHOFF.xml
│  ├─ CHALUMO.xml
│  ├─ CHALTIMBANQUE.xml
├─ BISCOTTE.xml
├─ EQUIPEMENTS.xml
├─ RESSOURCES.xml
```
Les **seeds** de votre système sont le fichier `RESSOURCES.xml`. Il contient ce qui est présent dans le milieu naturel.

Les **targets** de votre système se trouvent dans le fichier `EQUIPEMENTS.xml`. Il contient ce qui doit être produit.

Commencez par charger les packages nécessaires :

In [1]:
from miscoto import run_focus, run_scopes, run_instance, run_mincom
from json import load

Ouvrez le fichier `EQUIPEMENT.xml` avec un éditeur de texte.

##### Question 1.1 : Que cherche t'on à produire ?

Réponse : aller consulter le fichier de targets => une épée magique

Ouvrez le fichier `CHACHOFF.xml` avec un éditeur de texte.

##### Question 1.2 : Dans combien de réaction(s) Chachoff est-il impliqué ? Listez leur(s) nom(s).

Réponse : consulter Chachoff.xml et trouver les solutions, il est impliqué dans 3 réactions, R1, R4

##### Question 1.3 : Listez les réactifs et les produits de la ou des réactions identifiées précédemment.

Réponse : retrouver l'id de la réaction dans la liste des réactions de Chachoff.xml. Les réactifs sont les < species > contenues entre les balises < reactants > et les produits se trouvent entre les balises < products >

##### Question 1.4 : Il est possible de vérifier le rôle d'un individu au sein d'un système avec la commande `run_focus` de Miscoto. Exécutez le code ci-dessous. Retrouvez-vous bien ce que votre lecture du fichier XML vous avait permis de déterminer ?

Notez que l'option output_json permet d'exporter l'ensemble des résultats dans un fichier json.

In [7]:
run_focus(
    bacteria_dir='bac_a_chable/Villageois/',
    seeds_file='bac_a_chable/RESSOURCES.xml',
    focus_bact=['CHACHOFF'],
    output_json='CHACHOFF.json',
)

# Dans le terminal:
# miscoto focus -b 'bac_a_chable/Villageois/' -s 'bac_a_chable/RESSOURCES.xml' -f 'CHALUMO' --output 'CHALUMO.json'

{'CHACHOFF': {'produced_alone': ['CUIR'],
  'produced_in_community': ['EPEE', 'CUIR'],
  'community_metabolic_gain': ['EPEE']}}

Réponse : On retrouve le fait que Chalumo est capable de produire du CUIR, tout seul et une EPEE via une coopération avec d'autres individus.

La commande `instance` permet de combiner les fichiers xml des différents villageois, ressources et équipements afin d'obtenir un seul fichier combinant toutes les informations. Ce fichier est aussi reformatté afin d'être plus lisible qu'un fichier xml. Il est ainsi plus simple à éditer lorsqu'on souhaite réaliser des modifications sur le système. Vous pouvez lancer la commande suivante qui va générer un fichier "Village.lp".

In [5]:
run_instance(
    host_file='bac_a_chable/BISCOTTE.xml',
    bacteria_dir='bac_a_chable/Villageois',
    seeds_file='bac_a_chable/RESSOURCES.xml',
    targets_file='bac_a_chable/EQUIPEMENTS.xml',
    output='bac_a_chable/Village.lp'
    )
# Dans le terminal:
# miscoto instance -b 'bac_a_chable/Villageois' -m 'bac_a_chable/BISCOTTE.xml' -s 'bac_a_chable/RESSOURCES.xml' -t 'bac_a_chable/EQUIPEMENTS.xml' --out 'bac_a_chable/Village.lp'

'bac_a_chable/Village.lp'

##### Ce fichier regroupe les informations associées:
- au microbiome (les villageois)
- à l'hôte (Biscotte)
- aux seeds (les ressources)
- aux targets (l'épée magik qu'on souhaite produire)

##### Question 1.5 : Ouvrez le fichier et donner la liste des seeds du système:

Réponse : ARGENT, VACHE, MINERAIS

##### Question 1.6 : La commande 'scope' permet de se faire une première idée sur les capacités du système. Aidez vous en pour répondre aux questions ci dessous:

- Quel équipement (targets) peut produire BISCOTTE (l'hôte) toute seule ?
- Quelle est la liste des ressources auxquelles Biscotte a accès ? 
- Est ce qu'il est possible de produire une Epée en faisant appel aux différents villageois ?

In [8]:
run_scopes(
        lp_instance_file="bac_a_chable/Village.lp"
        )
# Dans le terminal:
# miscoto scopes -a 'bac_a_chable/Village.lp'

{'host_prodtargets': [],
 'host_unprodtargets': ['EPEE_MAGIK'],
 'host_scope': ['VACHE', 'MINERAIS', 'ARGENT'],
 'com_prodtargets': ['EPEE_MAGIK'],
 'com_unprodtargets': [],
 'comhost_scope': ['EPEE', 'EPEE_MAGIK'],
 'com_scope': ['ACIER', 'CUIR', 'EPEE', 'EPEE_MAGIK'],
 'targets_producers': {'EPEE_MAGIK': ['host_metab_mod']}}

Réponse 1: Les résultats sont listés dans la liste 'host_prodtargets'. La liste est vide, Biscotte ne peut rien produire toute seule.

Réponse 2: Les résultats sont listés dans la liste 'host_scope'. Biscotte à accès aux ressources VACHE, MINERAIS et ARGENT qui sont les seeds du système. Si elle avait pu produire quelque chose à partir des seeds, cela apparaitrait dans la liste 'host_scope' également.

Réponse 3: Les résultats sont listés dans la liste 'comhost_scope' ('com' fait référence à la 'communauté'). Oui il est possible de produire une EPEE (et une EPEE_MAGIK) via une coopération entre les individus du système.

##### Question 1.7 : La commande `run_mincom` de miscoto permet de récupérer les communautés minimales. L'option `soup` renvoie par défaut la première solution si plusieurs solutions existent. Lancez la commande. Qui peut aider Biscotte à récupérer une épée ?

In [11]:
run_mincom(
    option='soup',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=False
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o soup

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'one_model_targetsproducers': {'EPEE_MAGIK': ['host_metab_mod']},
 'one_model': {'chosen_bacteria': frozenset({('CHALUMO',)}),
  ('chosen_bacteria', 1): frozenset({('CHALUMO',)}),
  'chosen_bacteria/1': frozenset({('CHALUMO',)}),
  'producible_target': frozenset({('EPEE_MAGIK',)}),
  ('producible_target', 1): frozenset({('EPEE_MAGIK',)}),
  'producible_target/1': frozenset({('EPEE_MAGIK',)}),
  'target_producer_coop_selectedcom': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  ('target_producer_coop_selectedcom',
   2): frozenset({('host_metab_mod', 'EPEE_MAGIK')}),
  'target_producer_coop_selectedcom/2': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  'newly_producible_target': frozenset({('EPEE_MAGIK',)}),
  ('newly_producible_target', 1): frozenset({('EPEE_MAGIK',)}),
  'newly_producible_target/1': frozenset({('EPEE_MAGIK',)})},
 'exchanged': {},
 'bacteria': ['CHALUMO'],
 'still_unprod': [],
 'newly_prod': ['EPEE_MAGIK'],
 'producible': ['EPEE_MAGIK']

Réponse : La liste 'bacteria' contient 'CHALUMO', qui est une solution optimale du système. CHALUMO permet à Biscotte de récupérer une EPEE afin qu'elle puisse produire son EPEE_MAGIK

##### Question 1.8 : Pour énumérer toutes les solutions possibles, il faut rajouter l'option `--enumeration`. Modifiez la commande précédente afin de lister l'ensemble des choix s'offrant à Biscotte pour récupérer une épée.

In [12]:
# REPONSE
run_mincom(
    option='soup',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=True
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o soup --enumeration

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'enum_bacteria': {1: ['CHALUMO'], 2: ['CHALTIMBANQUE']},
 'enum_exchanged': {1: {}, 2: {}},
 'enum_targetsproducers': {1: {'EPEE_MAGIK': ['host_metab_mod']},
  2: {'EPEE_MAGIK': ['host_metab_mod']}}}

Réponse : Il existe deux individus qui peuvent aider Biscotte à récupérer une EPEE pour produire son EPEE_MAGIK, CHALUMO et CHALTIMBANQUE

##### Question 1.9 : Pour énumérer tous les individus impliqués dans la production d'une épée, il faut cette fois utiliser `--union` à la place d'`enumeration`. Modifiez la commande précédente afin de lister l'union des solutions.

In [13]:
# REPONSE
run_mincom(
    option='soup',
    lp_instance_file="bac_a_chable/Village.lp",
    union=True
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o soup --union

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'union_exchanged': {},
 'union_bacteria': ['CHALUMO', 'CHALTIMBANQUE'],
 'score_optimum_union': '1',
 'union_targetsproducers': {'EPEE_MAGIK': ['host_metab_mod']}}

Réponse : On retrouve nos deux individus identifiés précedemment, CHALUMO et CHALTIMBANQUE

##### Question 1.10 : Avec miscoto, il est possible de trouver la solution présentant le moins d'échanges grâce à l'option `minexch`. Un peu pressée par le temps, Biscotte cherche à récupérer une épée en passant par le minimum d'intermédiaires. Aidez-la à choisir la solution respectant cette contrainte en lançant la commande suivante.

In [15]:
run_mincom(
    option='minexch',
    lp_instance_file="bac_a_chable/Village.lp"
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o minexch

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch.lp


{'one_model_targetsproducers': {'EPEE_MAGIK': ['host_metab_mod']},
 'one_model': {'chosen_bacteria': frozenset({('CHALUMO',)}),
  ('chosen_bacteria', 1): frozenset({('CHALUMO',)}),
  'chosen_bacteria/1': frozenset({('CHALUMO',)}),
  'target_producer_coop_selectedcom': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  ('target_producer_coop_selectedcom',
   2): frozenset({('host_metab_mod', 'EPEE_MAGIK')}),
  'target_producer_coop_selectedcom/2': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  'newly_producible_target': frozenset({('EPEE_MAGIK',)}),
  ('newly_producible_target', 1): frozenset({('EPEE_MAGIK',)}),
  'newly_producible_target/1': frozenset({('EPEE_MAGIK',)}),
  'exchanged': frozenset({('EPEE', 'c', 'CHALUMO', 'host_metab_mod')}),
  ('exchanged', 4): frozenset({('EPEE', 'c', 'CHALUMO', 'host_metab_mod')}),
  'exchanged/4': frozenset({('EPEE', 'c', 'CHALUMO', 'host_metab_mod')})},
 'exchanged': {('CHALUMO', 'host_metab_mod'): ['EPEE']},
 'bacteria'

In [None]:
Réponse : CHALUMO est une solution optimale présentant le minimum d'échanges.

Notez qu'il est aussi possible d'utiliser l'option --enumeration avec minexch

##### Question 1.11 : Voici les graphes associés aux différents individus. Reconstituez le graphe métabolique du système, c'est à dire l'enchainement des réactions en combinant tous les individus.

<img src='recap_all.png' width="400" height="400">

##### Question 1.12 : Parmis les deux solutions données par l'option soup --enumeration, la solution donnée par l'option `minexch` est elle la meilleure des deux ? Pourquoi ? Aidez vous du graphe reconstruit pour répondre à la question et vérifier votre réponse en lançant la commande appropriée.

Réponse : Non, car les deux solutions font le même nombre d'échanges (1). Il est possible de le vérifier en tapant la commande suivante, qui enumère les deux mêmes solutions que l'option 'soup'

In [18]:
run_mincom(
    option='minexch',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=True
)

# miscoto mincom -a 'bac_a_chable/Village.lp' -o minexch --enumeration

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch.lp


{'enum_bacteria': {1: ['CHALUMO'], 2: ['CHALTIMBANQUE']},
 'enum_exchanged': {1: {('CHALUMO', 'host_metab_mod'): ['EPEE']},
  2: {('CHALTIMBANQUE', 'host_metab_mod'): ['EPEE']}},
 'enum_targetsproducers': {1: {'EPEE_MAGIK': ['host_metab_mod']},
  2: {'EPEE_MAGIK': ['host_metab_mod']}}}

##### Question 1.13 : Il y a une soudaine pénurie de minerais. Supprimez le minerais des ressources disponibles dans le fichier "Village.lp". Quelle sont maintenant la ou les meilleure(s) option(s) pour que Biscotte récupère son épée avec le moins d'intermédiares possibles ?

Réponse : seul CHALTIMBANQUE est dans les solutions car maintenant les forgerons doivent passer par le marchand pour récupérer du minerais ce qui ajoute un échange pour tous les forgerons. CHALUMO passe à deux échanges alors que CHALTIMBANQUE n'en fait toujours qu'un seul.

In [20]:
run_mincom(
    option='minexch',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=True
)
# miscoto mincom -a 'bac_a_chable/Village.lp' -o minexch --enumeration

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch.lp


{'enum_bacteria': {1: ['CHALUMO'], 2: ['CHALTIMBANQUE']},
 'enum_exchanged': {1: {('CHALUMO', 'host_metab_mod'): ['EPEE']},
  2: {('CHALTIMBANQUE', 'host_metab_mod'): ['EPEE']}},
 'enum_targetsproducers': {1: {'EPEE_MAGIK': ['host_metab_mod']},
  2: {'EPEE_MAGIK': ['host_metab_mod']}}}

## Partie II - Les rocambolesques aventures des bactéries intestinales d'un humain sous stress

L’outil a été utilisé pour étudier le microbiome humain et les fonctions associées en utilisant le dataset généré par une étude centrée sur le microbiote humain (HMP). Cela représente 2051 bactéries et 3606 différentes réactions. L’étude a montré que seulement 8 % des fonctions nécessitaient des coopérations entre un maximum de 6 organismes. Elle a aussi mis à jour de nombreuses redondances de fonction au sein du microbiome. Dans cette partie nous allons reproduire une partie de ces résultats.

##### Les commandes vu précedemment sont listées ci dessous, utilisez les afin de répondre aux questions suivantes.

`SCOPES`

Renvoie la plus-value apportée par un groupe à l'environnement.
*Exemple : un ensemble de charpentiers dans une forêt peuvent construire une maison.*

`FOCUS`

Renvoie ce que peut produire un individu au sein du groupe sans prendre en compte ce qu'il a la capacité de produire seul.

`INSTANCE`

Renvoie la combinaison des fiches de compétences du groupe, ainsi que tout ce qu'il y a dans l'environnement et ce que l'on cherche à obtenir. On obtient en sortie un fichier plus lisible, et plus simple à modifier.

`MINCOM`

Renvoie la communauté minimale. 

Options
+ **soup** : renvoie une solution de communauté minimale. Elle peut être combinée avec une des deux options suivantes :
    + --enumeration : affiche toutes les solutions possibles de communautés minimales. Cette méthode peut prendre du temps sur de gros fichiers.
    + --union : liste l'union des individus présents dans les différentes communautés minimales.

+ **minexch** : renvoie la communauté minimale avec le plus petit nombre d'échanges parmi toutes les solutions minimales.

##### Remarques

Toutes ces commandes acceptent en paramètre `output_json='path_to_json_file.json'` ; n'hésitez pas à l'utiliser pour récupérer vos résultats.
Par ailleurs, en Python, il est possible d'écrire `results=load(open(f"path_to_json_file.json", "r"))` pour charger dans la variable `results` le contenu du fichier .json sous forme de dictionnaire.


La suite des questions portera sur un cas biologique dont les données sont contenues dans le dossier `cas biologique`. Celui-ci présente la même structure que les données sur lesquelles vous avez travaillé précédemment. Les questions seront moins guidées, et auront pour objectif de reconstruire une portion de la réflexion proposée par l'article [Scalable and exhaustive screening of metabolic functions carried out by microbial consortia](https://doi.org/10.1093/bioinformatics/bty588).

##### Question 2.1 : Nous souhaitons vérifier si à partir du métabolite ‘MM1’ notre système peut produire le métabolite ‘MM4’. Ecrivez la commande vous permettant de vérifier que `MM4` est productible. Vous pouvez modifier les fichiers ‘seeds.xml’ et ‘targets.xml’ avec les données appropriées.

In [22]:
run_scopes(
    targets_file='cas_biologique/target_test.xml',
    seeds_file='cas_biologique/seeds_test.xml',
    bacteria_dir='cas_biologique/bacteria-reduced/'
)

No host provided.


{'com_prodtargets': [],
 'com_unprodtargets': ['MM4'],
 'com_scope': ['M_metala_c',
  'M_xyluglc_e',
  'M_malt6p_c',
  'M_e4p_c',
  'M_3ig3p_c',
  'M_asn_L_e',
  'M_met_L_e',
  'MS2',
  'M_galmannan_e',
  'M_urate_c',
  'M_nmn_e',
  'M_alathr_c',
  'M_malt_e',
  'M_acald_e',
  'M_ile_L_c',
  'M_his_L_c',
  'M_pyr_e',
  'M_galctn_D_c',
  'M_thm_e',
  'M_ala_B_c',
  'M_ac_e',
  'M_hspg_degr_9_e',
  'M_mantr_e',
  'M_hspg_degr_8_e',
  'M_aso3_e',
  'M_5cmhmsa_c',
  'M_cgly_e',
  'M_nicrnt_c',
  'M_cspg_b_degr_e',
  'M_dcyt_e',
  'M_cytd_c',
  'M_ile_L_e',
  'M_rhamnogalurII_e',
  'M_tagur_c',
  'M_s17bp_c',
  'M_nac_c',
  'M_2h3oppan_c',
  'M_ncam_e',
  'M_arsenb_e',
  'M_ind3acam_c',
  'M_ser_D_e',
  'M_lcts_e',
  'M_alahis_c',
  'M_leu_L_e',
  'M_glc_D_c',
  'M_12ppd_S_e',
  'M_urea_e',
  'M_thdp_c',
  'M_2dh3dgal6p_c',
  'M_chol_e',
  'M_adocbl_e',
  'M_2ddglcn_c',
  'M_thymd_e',
  'M_mbdg_c',
  'M_hspg_degr_7_e',
  'M_cellb_e',
  'M_26dap_M_e',
  'M_ru5p_L_c',
  'M_asp_L_e',
  'M_glyp

Réponse : faire un scope, NON, MM4 n’est pas productible

##### Question 2.2 : On ajoute maintenant le métabolite ‘MM2’ à l’entrée de notre système. Est-ce que target1 est productible ? Est-il produit de façon triviale (une seule bactérie impliquée) ou par coopération ?

RÉPONSE : faire un scope, OUI, target 1 est productible

Nous avons réalisé l’opération avec XX paires seed-target et avons obtenu les résultats suivants: 
+ pourcentage de targets non productibles = 70%
+ pourcentage de targets produits via l’action d’une bactérie seule = 20%
+ pourcentage de targets produites par coopération de plusieurs bactéries = 10% 

##### Question 2.3 : Est-ce que ces résultats sont surprenants ? Pourquoi ?


Réponse : Non, c’est ce qui était attendu. Vu qu’on ne fournit au système qu’une seule seed cela réduit beaucoup les chances de produire la target.

##### Question 2.4 : Comparez les métabolites produits par `org1` et `org2`. Lesquels sont en commun ?

Conseil : sauvegardez les sorties au format .json pour pouvoir les recharger avec la méthode `load` de la librairie `json`.

In [None]:
# votre code ici

org1_results, org2_results = load(open(f"path_to_json_file_1.json", "r")), load(open(f"path_to_json_file_2.json", "r"))

# votre code ici

Réponse : scopes sur 2 bactéries + chargement des fichiers + comparaison de sets

##### Question 2.5 : Nous avons identifié que le métabolite ‘MTC’ peut être produit uniquement via une coopération entre bactéries. Écrivez la commande appropriée afin d’obtenir la liste de toutes les communautés minimales capables de produire le composé.

In [10]:
run_scopes(
    bacteria_dir='cas_biologique/bacteria-reduced/',
    seeds_file='cas_biologique/seeds.xml',
    targets_file='cas_biologique/mono_target.xml',
    )

No host provided.


{'com_prodtargets': ['MTC'],
 'com_unprodtargets': [],
 'com_scope': ['M_udpgal_c',
  'M_24dhhed_c',
  'M_23ddhb_c',
  'M_3ig3p_c',
  'M_aacald_c',
  'M_urate_c',
  'M_mmcoa_S_c',
  'M_mantr_c',
  'M_d5kgp_c',
  'M_ggdp_c',
  'M_acald_e',
  'M_udpglcur_c',
  'M_ala_B_c',
  'M_acbdma14gapuc_c',
  'M_gal1p_c',
  'M_methf_c',
  'M_skm_c',
  'M_mantr_e',
  'M_td2coa_c',
  'M_4r5au_c',
  'M_hspg_degr_8_e',
  'M_pe140_c',
  'M_aso3_e',
  'M_5cmhmsa_c',
  'M_cgly_e',
  'M_nicrnt_c',
  'M_cspg_b_degr_e',
  'M_dcyt_e',
  'M_cytd_c',
  'M_ile_L_e',
  'M_rhamnogalurII_e',
  'M_dudp_c',
  'M_s17bp_c',
  'M_gar_c',
  'M_2h3oppan_c',
  'M_ncam_e',
  'M_amob_c',
  'M_dkdi_c',
  'M_lcts_e',
  'M_2m1hbtpp_c',
  'M_23dhdp_c',
  'M_12ppd_S_e',
  'M_thdp_c',
  'M_2dh3dgal6p_c',
  'M_chol_e',
  'M_adocbl_e',
  'M_2ddglcn_c',
  'M_mbdg_c',
  'M_histd_c',
  'M_2dhglcn_c',
  'M_2mecdp_c',
  'M_26dap_M_e',
  'M_ru5p_L_c',
  'M_sttca1_c',
  'M_g6p_c',
  'M_dextran40_e',
  'M_sl26da_c',
  'M_met_D_e',
  'M_glcur

Réponse : Faire un mincom -o soup –enumeration => Plein de solutions

##### Question 2.6 : Comment interpréter cette multiplicité de solutions dans un cadre biologique ?

Réponse : Trouver plusieurs solutions pour la production d’une target revient à trouver une importante redondance de fonction au sein du microbiote. Plusieurs bactéries ou ensemble de bactéries sont capables de produire la même chose. Biologiquement parlant, plus une fonction est redondante, plus elle sera « efficace », c’est à dire que plus il y aura de communautés capables de restaurer cette fonction et plus l’organisme sera capable de s’adapter à différentes conditions par exemple. Ces fonctions peuvent aussi être des fonctions vitales ou très utiles à l’organisme.

##### Question 2.7 : Combien de bactéries peuvent participer à la production de ce composé ?

Réponse : Faire un mincom -o soup –union => Plein de bactéries

##### Question 2.8 : Cette méthode, rapide à exécuter, fait toutefois perdre de l’information biologique : les collaborations nécessaires pour produire un métabolite. Il existe une autre façon de réduire le nombre de solutions sans perdre d’information, laquelle ? Écrivez la commande correspondante. Combien de solutions obtient-on ?

Réponse : Faire un mincom -o minexch –enumeration => Moins de solutions qu’avec soup

##### Question 2.9 : Chargez la sortie .json de la question précédente dans un dictionnaire, et parcourez-le. Nous n’avions pas spécifié d’hôte, cependant les résultats associés au scope de l’hôte (clé `host_scope`) ne sont pas vides. A quoi correspondent-ils ?

Réponse : Aux seeds

##### Question 2.10 : On dispose également d’un fichier modélisant l’hôte. Écrivez la commande permettant de visualiser l’ensemble des composés produits par l’association des bactéries et de l’hôte.

Réponse : scope avec host

##### Question 2.11 : Recalculez les communautés minimales. Remarquez-vous des changements ? Si oui, à quoi sont-ils liés ? Si non, pourquoi ?

Réponse : oui, aux réactions dont l'hôte est capable

## Partie III : Les rocambolesques questions bonus

<img src='graph_relation.png' width="569" height="430">

Dans l'article [Scalable and exhaustive screening of metabolic functions carried out by microbial consortia](https://doi.org/10.1093/bioinformatics/bty588), lorsqu'ils travaillaient sur un grand jeu de données, les auteurs ont effectué un calcul de l'union des solutions. Or, on a pu voir qu'utiliser union faisait perdre l'information biologique du nombre de communautés minimales.

##### Question 3.1 : Quel est l'intérêt de faire un calcul d'union plutôt que d'énumération ?

Réponse : Énumération est très demandeur en ressources computationnelles, tandis que union l’est moins ; par ailleurs, il existe une relation polynômiale entre les deux, ce qui permet d'approcher l’un par l’autre, et déterminer si énumération peut être calculée en un temps raisonnable ou non.

Question 3.2 : Quelles sont d'après vous les limites de Miscoto ?

+ Pas de prise en charge de la stoechiométrie	
+ Pas de prise en compte des dégradations des composés 
+ Pas d’attention aux éventuelles compétitions et incompatibilités de cultures entre les différents organismes
+ Ne vérifie pas si les transports cellulaires sont réalistes ou non biologiquement.
+ Les résultats sont donc à prendre avec prudence, surtout qu’ils sont très dépendants de la qualité des annotations disponibles (notamment pour les compartiments cellulaires).

##### Question 3.3 : Tracez, pour le jeu de données fourni, le graphique en barres représentant le nombre de communautés minimales en fonction des fonctions.

In [None]:
import matplotlib.pyplot as plt