## Introduction

Le terme "communauté" fait référence à un groupe d'organismes occupant une niche écologique particulière et qui peut comprendre un nombre quelconque d'espèces. En biologie, de nombreuses études se focalisent sur l'étude des communautés bactériennes, ou microbiotes, tels qu'on en trouve dans le sol ou dans nos intestins. Dans ce TP nous allons utiliser un ensemble réduit de bactéries isolées du colon humain, qui vont former un petit microbiote intestinal dont nous allons explorer la synergie.

Ce TP a pour but de qualifier une ou plusieurs communautés minimales de bactéries capables de réaliser une fonction biologique en particuler, en se basant sur les métabolites que chaque communauté est capable de produire. Sélectionner des sous-communautées au sein d’un microbiote à de nombreuses applications, comme par exemple developper une communauté synthétique de bactéries pour des applications industrielle notamment. La recherche d’échanges entre organismes peut être un atout dans la reconstructions de réseaux métaboliques et dans l’annotation de génomes, afin d’élucider par exemple si un hôte est capable de réaliser une fonction spécifique par lui même ou si il repose sur un symbiote. Cela peut être réalisé grâce à l'outil Miscoto.

Miscoto (MIcrobiome Screening and Community selection using TOpology). C'est un outil utilisant la programmation logique (ASP) pour identifier des microbiotes de taille minimale capables de produire des métabolites d’intérets, indépendamment ou via une coopération. La coopération fait référence à des échanges de métabolites entre organismes afin de produire un métabolite d’intéret à partir des métabolites disponibles dans le mileu de culture. Miscoto met ainsi en commun toutes les capacités métaboliques de chaque organisme. Si plusieurs solutions sont disponibles il est aussi possible d’améliorer la sélection en introduisant la notion de nombre d’échanges minimum. En effet, les échanges de métabolites entre organismes étant couteux en énergie, il existe un fort sens biologique à les réduire au maximum. Les solutions générées par l’outil peuvent ensuite être filtrées par des critères biologiques.

## Procédure d'installation

1) Naviguez jusqu'au dossier contenant les fichiers d'environnement.

2) Editez le contenu du script bash `create_env.sh` en modifiant la version python, accordément à celle présente sur votre machine.
Vous devez avoir une version python >= à 3.6. Si ce n'est pas le cas, installez une distribution python remplissant cette condition. Si vous ne savez pas quelle version de python est installée sur votre machine, utilisez `python3 --version` ou par défaut `python --version`.

3) Exécutez le script pour créer l'environnement avec la commande `bash create_env.sh`.

4) Pour lancer l'environnement, utilisez la commande `source .venv_miscoto/bin/activate` dans le terminal, en étant placé dans le dossier où vous avez créé l'enironnement.

5) A ce stade, vous devriez pouvoir vérifier la bonne installation de **miscoto** grâce à la commande `miscoto --version`. Vous pouvez désormais ouvrir le Jupyter Notebook qui contient le sujet du TP avec la commande `jupyter-notebook miscoto.ipynb`.

Note : pour quitter l'environnement, utilisez la commande `deactivate` dans le terminal.

Vous pouvez par ailleurs retrouver le code source en suivant [ce lien](https://github.com/cfrioux/miscoto).

## Partie I - Les rocambolesques aventures de Biscotte, la Chaventurière

Dans cette première partie, nous vous proposons de vous familliariser avec les commandes de l'outil.

*Dans le village de Sô, champêtre bourgeade perdue parmi les monts, la jeune Biscotte se prépare pour partir à l'aventure. Depuis des semaines, elle entend à la chaverne où elle va se détendre tous les soirs après de dures journées de labeur que dangers et trésors attendent quiconque sera suffisament brave. Probablement enhardie par la boisson, elle s'est décidée à relever tous les défis que ses griffes rencontreraient. Prévoyante quant à son périple, elle a rassemblé de nombreuses victuailles et ressources nécessaires à sa survie, mais il lui manque un bien crucial : une arme pour se battre contre les nombreux dangers sur son chemin. Habile bretteuse, elle escompte bien obtenir une lame enchantée pour l'aider à affronter l'adversité. Bien qu'elle sache enchanter son épée, elle ignore comment la forger. Fort embarassée, elle va devoir requérir aux services d'autres chats de la ville pour obtenir sa rapière, et elle dispose de divers moyens. Plusieurs artisans sont installés en ville : Chachôff un forgeron en CDD, Chalumo l'expert forgeron et Chatastrophe son stagiaire. Par ailleurs, elle sait qu'elle pourrait aussi se procurer chez Chaltimbanque le marchand, qui a déplié son étal ce matin même. Un peu pressée et de nature timide, Biscotte souhaite avoir affaire au moins d'intermédiaires possible.*

Vous disposez du dossier `bac_a_chable` pour modéliser la situation. Il contient un certain nombre de fichiers, organisés comme suit :
```
bac_a_chable/
├─ Villageois/
│  ├─ CHATASTROPHE.xml
│  ├─ CHACHOFF.xml
│  ├─ CHALUMO.xml
│  ├─ CHALTIMBANQUE.xml
├─ BISCOTTE.xml
├─ EQUIPEMENTS.xml
├─ RESSOURCES.xml
```
Les **seeds** de votre système sont le fichier `RESSOURCES.xml`. Il contient ce qui est présent dans le milieu naturel.

Les **targets** de votre système se trouvent dans le fichier `EQUIPEMENTS.xml`. Il contient ce qui doit être produit.

Commencez par charger les packages nécessaires :

In [1]:
from miscoto import run_focus, run_scopes, run_instance, run_mincom
from json import load

Ouvrez le fichier `EQUIPEMENT.xml` avec un éditeur de texte.

##### Question 1.1 : Que cherche t'on à produire ?

Réponse : aller consulter le fichier de targets => une épée magique

Ouvrez le fichier `CHACHOFF.xml` avec un éditeur de texte.

##### Question 1.2 : Dans combien de réaction(s) Chachoff est-il impliqué ? Listez leur(s) nom(s).

Réponse : consulter Chachoff.xml et trouver les solutions, il est impliqué dans 3 réactions, R1, R4

##### Question 1.3 : Listez les réactifs et les produits de la ou des réactions identifiées précédemment.

Réponse : retrouver l'id de la réaction dans la liste des réactions de Chachoff.xml. Les réactifs sont les < species > contenues entre les balises < reactants > et les produits se trouvent entre les balises < products >

##### Question 1.4 : Il est possible de vérifier le rôle d'un individu au sein d'un système avec la commande `run_focus` de Miscoto. Exécutez le code ci-dessous. Retrouvez-vous bien ce que votre lecture du fichier XML vous avait permis de déterminer ?

Notez que l'option output_json permet d'exporter l'ensemble des résultats dans un fichier json.

In [7]:
run_focus(
    bacteria_dir='bac_a_chable/Villageois/',
    seeds_file='bac_a_chable/RESSOURCES.xml',
    focus_bact=['CHACHOFF'],
    output_json='CHACHOFF.json',
)

# Dans le terminal:
# miscoto focus -b 'bac_a_chable/Villageois/' -s 'bac_a_chable/RESSOURCES.xml' -f 'CHALUMO' --output 'CHALUMO.json'

{'CHACHOFF': {'produced_alone': ['CUIR'],
  'produced_in_community': ['EPEE', 'CUIR'],
  'community_metabolic_gain': ['EPEE']}}

Réponse : On retrouve le fait que Chalumo est capable de produire du CUIR, tout seul et une EPEE via une coopération avec d'autres individus.

La commande `instance` permet de combiner les fichiers xml des différents villageois, ressources et équipements afin d'obtenir un seul fichier combinant toutes les informations. Ce fichier est aussi reformatté afin d'être plus lisible qu'un fichier xml. Il est ainsi plus simple à éditer lorsqu'on souhaite réaliser des modifications sur le système. Vous pouvez lancer la commande suivante qui va générer un fichier "Village.lp".

In [5]:
run_instance(
    host_file='bac_a_chable/BISCOTTE.xml',
    bacteria_dir='bac_a_chable/Villageois',
    seeds_file='bac_a_chable/RESSOURCES.xml',
    targets_file='bac_a_chable/EQUIPEMENTS.xml',
    output='bac_a_chable/Village.lp'
    )
# Dans le terminal:
# miscoto instance -b 'bac_a_chable/Villageois' -m 'bac_a_chable/BISCOTTE.xml' -s 'bac_a_chable/RESSOURCES.xml' -t 'bac_a_chable/EQUIPEMENTS.xml' --out 'bac_a_chable/Village.lp'

'bac_a_chable/Village.lp'

##### Ce fichier regroupe les informations associées:
- au microbiome (les villageois)
- à l'hôte (Biscotte)
- aux seeds (les ressources)
- aux targets (l'épée magik qu'on souhaite produire)

##### Question 1.5 : Ouvrez le fichier et donner la liste des seeds du système:

Réponse : ARGENT, VACHE, MINERAIS

##### Question 1.6 : La commande 'scope' permet de se faire une première idée sur les capacités du système. Aidez vous en pour répondre aux questions ci dessous:

- Quel équipement (targets) peut produire BISCOTTE (l'hôte) toute seule ?
- Quelle est la liste des ressources auxquelles Biscotte a accès ? 
- Est ce qu'il est possible de produire une Epée en faisant appel aux différents villageois ?

In [8]:
run_scopes(
        lp_instance_file="bac_a_chable/Village.lp"
        )
# Dans le terminal:
# miscoto scopes -a 'bac_a_chable/Village.lp'

{'host_prodtargets': [],
 'host_unprodtargets': ['EPEE_MAGIK'],
 'host_scope': ['VACHE', 'MINERAIS', 'ARGENT'],
 'com_prodtargets': ['EPEE_MAGIK'],
 'com_unprodtargets': [],
 'comhost_scope': ['EPEE', 'EPEE_MAGIK'],
 'com_scope': ['ACIER', 'CUIR', 'EPEE', 'EPEE_MAGIK'],
 'targets_producers': {'EPEE_MAGIK': ['host_metab_mod']}}

Réponse 1: Les résultats sont listés dans la liste 'host_prodtargets'. La liste est vide, Biscotte ne peut rien produire toute seule.

Réponse 2: Les résultats sont listés dans la liste 'host_scope'. Biscotte à accès aux ressources VACHE, MINERAIS et ARGENT qui sont les seeds du système. Si elle avait pu produire quelque chose à partir des seeds, cela apparaitrait dans la liste 'host_scope' également.

Réponse 3: Les résultats sont listés dans la liste 'comhost_scope' ('com' fait référence à la 'communauté'). Oui il est possible de produire une EPEE (et une EPEE_MAGIK) via une coopération entre les individus du système.

##### Question 1.7 : La commande `run_mincom` de miscoto permet de récupérer les communautés minimales. L'option `soup` renvoie par défaut la première solution si plusieurs solutions existent. Lancez la commande. Qui peut aider Biscotte à récupérer une épée ?

In [11]:
run_mincom(
    option='soup',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=False
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o soup

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'one_model_targetsproducers': {'EPEE_MAGIK': ['host_metab_mod']},
 'one_model': {'chosen_bacteria': frozenset({('CHALUMO',)}),
  ('chosen_bacteria', 1): frozenset({('CHALUMO',)}),
  'chosen_bacteria/1': frozenset({('CHALUMO',)}),
  'producible_target': frozenset({('EPEE_MAGIK',)}),
  ('producible_target', 1): frozenset({('EPEE_MAGIK',)}),
  'producible_target/1': frozenset({('EPEE_MAGIK',)}),
  'target_producer_coop_selectedcom': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  ('target_producer_coop_selectedcom',
   2): frozenset({('host_metab_mod', 'EPEE_MAGIK')}),
  'target_producer_coop_selectedcom/2': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  'newly_producible_target': frozenset({('EPEE_MAGIK',)}),
  ('newly_producible_target', 1): frozenset({('EPEE_MAGIK',)}),
  'newly_producible_target/1': frozenset({('EPEE_MAGIK',)})},
 'exchanged': {},
 'bacteria': ['CHALUMO'],
 'still_unprod': [],
 'newly_prod': ['EPEE_MAGIK'],
 'producible': ['EPEE_MAGIK']

Réponse : La liste 'bacteria' contient 'CHALUMO', qui est une solution optimale du système. CHALUMO permet à Biscotte de récupérer une EPEE afin qu'elle puisse produire son EPEE_MAGIK

##### Question 1.8 : Pour énumérer toutes les solutions possibles, il faut rajouter l'option `--enumeration`. Modifiez la commande précédente afin de lister l'ensemble des choix s'offrant à Biscotte pour récupérer une épée.

In [12]:
# REPONSE
run_mincom(
    option='soup',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=True
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o soup --enumeration

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'enum_bacteria': {1: ['CHALUMO'], 2: ['CHALTIMBANQUE']},
 'enum_exchanged': {1: {}, 2: {}},
 'enum_targetsproducers': {1: {'EPEE_MAGIK': ['host_metab_mod']},
  2: {'EPEE_MAGIK': ['host_metab_mod']}}}

Réponse : Il existe deux individus qui peuvent aider Biscotte à récupérer une EPEE pour produire son EPEE_MAGIK, CHALUMO et CHALTIMBANQUE

##### Question 1.9 : Pour énumérer tous les individus impliqués dans la production d'une épée, il faut cette fois utiliser `--union` à la place d'`enumeration`. Modifiez la commande précédente afin de lister l'union des solutions.

In [13]:
# REPONSE
run_mincom(
    option='soup',
    lp_instance_file="bac_a_chable/Village.lp",
    union=True
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o soup --union

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'union_exchanged': {},
 'union_bacteria': ['CHALUMO', 'CHALTIMBANQUE'],
 'score_optimum_union': '1',
 'union_targetsproducers': {'EPEE_MAGIK': ['host_metab_mod']}}

Réponse : On retrouve nos deux individus identifiés précedemment, CHALUMO et CHALTIMBANQUE

##### Question 1.10 : Avec miscoto, il est possible de trouver la solution présentant le moins d'échanges grâce à l'option `minexch`. Un peu pressée par le temps, Biscotte cherche à récupérer une épée en passant par le minimum d'intermédiaires. Aidez-la à choisir la solution respectant cette contrainte en lançant la commande suivante.

In [15]:
run_mincom(
    option='minexch',
    lp_instance_file="bac_a_chable/Village.lp"
)

# Dans le terminal:
# miscoto mincom -a 'bac_a_chable/Village.lp' -o minexch

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch.lp


{'one_model_targetsproducers': {'EPEE_MAGIK': ['host_metab_mod']},
 'one_model': {'chosen_bacteria': frozenset({('CHALUMO',)}),
  ('chosen_bacteria', 1): frozenset({('CHALUMO',)}),
  'chosen_bacteria/1': frozenset({('CHALUMO',)}),
  'target_producer_coop_selectedcom': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  ('target_producer_coop_selectedcom',
   2): frozenset({('host_metab_mod', 'EPEE_MAGIK')}),
  'target_producer_coop_selectedcom/2': frozenset({('host_metab_mod',
              'EPEE_MAGIK')}),
  'newly_producible_target': frozenset({('EPEE_MAGIK',)}),
  ('newly_producible_target', 1): frozenset({('EPEE_MAGIK',)}),
  'newly_producible_target/1': frozenset({('EPEE_MAGIK',)}),
  'exchanged': frozenset({('EPEE', 'c', 'CHALUMO', 'host_metab_mod')}),
  ('exchanged', 4): frozenset({('EPEE', 'c', 'CHALUMO', 'host_metab_mod')}),
  'exchanged/4': frozenset({('EPEE', 'c', 'CHALUMO', 'host_metab_mod')})},
 'exchanged': {('CHALUMO', 'host_metab_mod'): ['EPEE']},
 'bacteria'

In [None]:
Réponse : CHALUMO est une solution optimale présentant le minimum d'échanges.

Notez qu'il est aussi possible d'utiliser l'option --enumeration avec minexch

##### Question 1.11 : Voici les graphes associés aux différents individus. Reconstituez le graphe métabolique du système, c'est à dire l'enchainement des réactions en combinant tous les individus.

<img src='recap_all.png' width="400" height="400">

##### Question 1.12 : Parmis les deux solutions données par l'option soup --enumeration, la solution donnée par l'option `minexch` est elle la meilleure des deux ? Pourquoi ? Aidez vous du graphe reconstruit pour répondre à la question et vérifier votre réponse en lançant la commande appropriée.

Réponse : Non, car les deux solutions font le même nombre d'échanges (1). Il est possible de le vérifier en tapant la commande suivante, qui enumère les deux mêmes solutions que l'option 'soup'

In [2]:
run_mincom(
    option='minexch',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=True
)

# miscoto mincom -a 'bac_a_chable/Village.lp' -o minexch --enumeration

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch.lp


{'enum_bacteria': {1: ['CHALUMO'], 2: ['CHALTIMBANQUE']},
 'enum_exchanged': {1: {('CHALUMO', 'host_metab_mod'): ['EPEE']},
  2: {('CHALTIMBANQUE', 'host_metab_mod'): ['EPEE']}},
 'enum_targetsproducers': {1: {'EPEE_MAGIK': ['host_metab_mod']},
  2: {'EPEE_MAGIK': ['host_metab_mod']}}}

##### Question 1.13 : Il y a une soudaine pénurie de minerais. Supprimez le minerais des ressources disponibles dans le fichier "Village.lp". Quelle sont maintenant la ou les meilleure(s) option(s) pour que Biscotte récupère son épée avec le moins d'intermédiares possibles ?

Réponse : seul CHALTIMBANQUE est dans les solutions car maintenant les forgerons doivent passer par le marchand pour récupérer du minerais ce qui ajoute un échange pour tous les forgerons. CHALUMO passe à deux échanges alors que CHALTIMBANQUE n'en fait toujours qu'un seul.

In [20]:
run_mincom(
    option='minexch',
    lp_instance_file="bac_a_chable/Village.lp",
    enumeration=True
)
# miscoto mincom -a 'bac_a_chable/Village.lp' -o minexch --enumeration

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch.lp


{'enum_bacteria': {1: ['CHALUMO'], 2: ['CHALTIMBANQUE']},
 'enum_exchanged': {1: {('CHALUMO', 'host_metab_mod'): ['EPEE']},
  2: {('CHALTIMBANQUE', 'host_metab_mod'): ['EPEE']}},
 'enum_targetsproducers': {1: {'EPEE_MAGIK': ['host_metab_mod']},
  2: {'EPEE_MAGIK': ['host_metab_mod']}}}

## Partie II - Les rocambolesques aventures des bactéries intestinales d'un humain sous stress

En tant que chercheur chez Nestlé nous cherchons à développer un nouveau yaourt révolutionnaire, le nouveau yaourt des joggeurs, le Joggourt. 
L'équipe marketing a identifié que les odeurs corporelles était un véritable fléau social, impactant une importante proportion de la population courante. Ce nouveau yaourt aura la particularité de transformer vos odeurs corporelles malodorantes en un véritable bouquet fleuri. Une solution idéale adaptée au petit déjeuné des coureurs et sportifs en tout genres. Après de multiples réunions pour convaincre l"équipe R&D du bien fondé de leur idée, cette dernière s'est attelée à la tâche. Des évidences bibliographiques ont montrées qu'un sous échantillon du microbiote intestinal était capable de métaboliser l'urée, responsable de l'odeur malodorante de la sueur, en acétate de neryl, un composé avec une douce odeur de rose. Le but de cette partie du TP est d'aider vos collègues biologistes à identifier des sous-ensembles minimaux de bactéries capables de transformer l'urée en acétate de neryl. Ce sous ensemble de bactérie pourra alors être ajouté dans le Joggourt de la même façon que les probiotiques. Vous avez à votre disposition pour commencer les bactéries disponibles dans le laboratoire et qui sont capables de survivre en milieu laitier, ainsi que de l'urée.

Les données sont contenues dans le dossier `cas biologique`. Celui-ci présente la même structure que les données sur lesquelles vous avez travaillé précédemment. Les questions seront moins guidées, et auront pour objectif de reconstruire une portion de la réflexion proposée par l'article [Scalable and exhaustive screening of metabolic functions carried out by microbial consortia](https://doi.org/10.1093/bioinformatics/bty588).

##### Pour rappel, les commandes vu précedemment sont listées ci dessous, utilisez les afin de répondre aux questions suivantes.

`SCOPES`

Renvoie la plus-value apportée par un groupe à l'environnement.
*Exemple : un ensemble de charpentiers dans une forêt peuvent construire une maison.*

`FOCUS`

Renvoie ce que peut produire un individu au sein du groupe sans prendre en compte ce qu'il a la capacité de produire seul.

`INSTANCE`

Renvoie la combinaison des fiches de compétences du groupe, ainsi que tout ce qu'il y a dans l'environnement et ce que l'on cherche à obtenir. On obtient en sortie un fichier plus lisible, et plus simple à modifier.

`MINCOM`

Renvoie la communauté minimale. 

Options
+ **soup** : renvoie une solution de communauté minimale. Elle peut être combinée avec une des deux options suivantes :
    + --enumeration : affiche toutes les solutions possibles de communautés minimales. Cette méthode peut prendre du temps sur de gros fichiers.
    + --union : liste l'union des individus présents dans les différentes communautés minimales.

+ **minexch** : renvoie la communauté minimale avec le plus petit nombre d'échanges parmi toutes les solutions minimales.

##### Remarques

Toutes ces commandes acceptent en paramètre `output_json='path_to_json_file.json'` ; n'hésitez pas à l'utiliser pour récupérer vos résultats.
Par ailleurs, en Python, il est possible d'écrire `results=load(open(f"path_to_json_file.json", "r"))` pour charger dans la variable `results` le contenu du fichier .json sous forme de dictionnaire.

##### Question 2.1 : La première étape est de définir un milieu de culture approprié pour nos bactéries. Nous souhaitons vérifier si à partir du métabolite `UREE` notre ensemble de bactéries peut produire le métabolite `NERYL_ACETATE`. Ecrivez la commande vous permettant de vérifier que `NERYL_ACETATE` est productible.

In [9]:
run_scopes(
    targets_file='cas_biologique/targets.xml',
    seeds_file='cas_biologique/seeds.xml',
    bacteria_dir='cas_biologique/bacteria-reduced/'
)

No host provided.


{'com_prodtargets': ['NERYL_ACETATE'],
 'com_unprodtargets': [],
 'com_scope': ['M_hexs_e',
  'M_ddca_e',
  'M_2dda7p_c',
  'M_glcn_e',
  'M_gua_e',
  'M_ocdca_c',
  'M_4abz_e',
  'M_ab6p3hxl_c',
  'M_tre_c',
  'M_rnam_c',
  'M_db4p_c',
  'M_ca2_e',
  'M_4h2oglt_c',
  'M_arab_L_c',
  'M_no2_c',
  'M_msa_c',
  'NEROL',
  'M_h2o2_c',
  'M_mal_L_c',
  'M_glypro_e',
  'M_leu_L_e',
  'M_alaglu_e',
  'M_micit_c',
  'M_thr_L_e',
  'M_adn_c',
  'M_gam1p_c',
  'M_his_L_c',
  'M_dmbzid_c',
  'M_alltn_c',
  'M_pro_L_e',
  'M_ind3ac_c',
  'M_cbp_c',
  'M_r5p_c',
  'M_arg_L_e',
  'M_ala_D_e',
  'M_oaa_c',
  'M_ru5p_D_c',
  'M_urea_c',
  'M_hpyr_c',
  'M_4abut_e',
  'M_glyc_c',
  'M_co2_c',
  'M_co2_e',
  'M_alaasp_c',
  'M_frmd_c',
  'M_zn2_c',
  'M_k_c',
  'M_thdp_c',
  'M_2hymeph_c',
  'M_etoh_c',
  'M_glyc3p_c',
  'M_tma_e',
  'M_4hpro_LT_c',
  'M_aso3_e',
  'M_alathr_e',
  'M_lcts_e',
  'M_f6p_c',
  'M_phe_L_c',
  'M_glyasn_e',
  'M_succitr_L_c',
  'M_ala_B_c',
  'M_26dap_M_c',
  'M_alaleu_e',


Réponse : Non, le neryl acetate n’est pas productible, 'com_unprodtargets': 'NERYL_ACETATE'

##### Question 2.2 : Après quelques recherches vous décidez d'ajouter maintenant les métabolites `ETHYL_ACETATE` et `MEVALONATE` en entrée du système en les ajoutant au fichier seeds.xml. Est-ce que `NERYL_ACETATE` est maintenant productible ? Quelles sont les bactéries qui le produisent ?

In [4]:
run_scopes(
    targets_file='cas_biologique/targets.xml',
    seeds_file='cas_biologique/seeds.xml',
    bacteria_dir='cas_biologique/bacteria-reduced/',
    output_json='scope.json'
)

No host provided.


{'com_prodtargets': ['NERYL_ACETATE'],
 'com_unprodtargets': [],
 'com_scope': ['M_hexs_e',
  'M_ddca_e',
  'M_2dda7p_c',
  'M_glcn_e',
  'M_gua_e',
  'M_ocdca_c',
  'M_4abz_e',
  'M_ab6p3hxl_c',
  'M_tre_c',
  'M_rnam_c',
  'M_db4p_c',
  'M_ca2_e',
  'M_4h2oglt_c',
  'M_arab_L_c',
  'M_no2_c',
  'M_msa_c',
  'NEROL',
  'M_h2o2_c',
  'M_mal_L_c',
  'M_glypro_e',
  'M_leu_L_e',
  'M_alaglu_e',
  'M_micit_c',
  'M_thr_L_e',
  'M_adn_c',
  'M_gam1p_c',
  'M_his_L_c',
  'M_dmbzid_c',
  'M_alltn_c',
  'M_pro_L_e',
  'M_ind3ac_c',
  'M_cbp_c',
  'M_r5p_c',
  'M_arg_L_e',
  'M_ala_D_e',
  'M_oaa_c',
  'M_ru5p_D_c',
  'M_urea_c',
  'M_hpyr_c',
  'M_4abut_e',
  'M_glyc_c',
  'M_co2_c',
  'M_co2_e',
  'M_alaasp_c',
  'M_frmd_c',
  'M_zn2_c',
  'M_k_c',
  'M_thdp_c',
  'M_2hymeph_c',
  'M_etoh_c',
  'M_glyc3p_c',
  'M_tma_e',
  'M_4hpro_LT_c',
  'M_aso3_e',
  'M_alathr_e',
  'M_lcts_e',
  'M_f6p_c',
  'M_phe_L_c',
  'M_glyasn_e',
  'M_succitr_L_c',
  'M_ala_B_c',
  'M_26dap_M_c',
  'M_alaleu_e',


Réponse : Oui, le neryl acetate est maintenant productible, 'com_prodtargets': ['NERYL_ACETATE'] 
2 bactéries réalisent la réaction conduisant à la production de neryl acetate(listées dans 'targets_producers')

##### Question 2.3 Voici le schéma des réactions impliquées. Complétez le en accords avec les informations données précédemment.

<img src='pics/cas_biologique_a_trou_début.png' width="800" height="400">

Réponse:
<img src='pics/cas_biologique_général_début.png' width="800" height="400">


##### Question 2.4 : Chargez la sortie .json de la question précédente dans un dictionnaire, et parcourez-le. A quoi correspond la liste associée à la clé `com_scope` ?

In [10]:
res = load(open(f"scope.json", "r"))

res['com_scope']

['M_hexs_e',
 'M_ddca_e',
 'M_2dda7p_c',
 'M_glcn_e',
 'M_gua_e',
 'M_ocdca_c',
 'M_4abz_e',
 'M_ab6p3hxl_c',
 'M_tre_c',
 'M_rnam_c',
 'M_db4p_c',
 'M_ca2_e',
 'M_4h2oglt_c',
 'M_arab_L_c',
 'M_no2_c',
 'M_msa_c',
 'NEROL',
 'M_h2o2_c',
 'M_mal_L_c',
 'M_glypro_e',
 'M_leu_L_e',
 'M_alaglu_e',
 'M_micit_c',
 'M_thr_L_e',
 'M_adn_c',
 'M_gam1p_c',
 'M_his_L_c',
 'M_dmbzid_c',
 'M_alltn_c',
 'M_pro_L_e',
 'M_ind3ac_c',
 'M_cbp_c',
 'M_r5p_c',
 'M_arg_L_e',
 'M_ala_D_e',
 'M_oaa_c',
 'M_ru5p_D_c',
 'M_urea_c',
 'M_hpyr_c',
 'M_4abut_e',
 'M_glyc_c',
 'M_co2_c',
 'M_co2_e',
 'M_alaasp_c',
 'M_frmd_c',
 'M_zn2_c',
 'M_k_c',
 'M_thdp_c',
 'M_2hymeph_c',
 'M_etoh_c',
 'M_glyc3p_c',
 'M_tma_e',
 'M_4hpro_LT_c',
 'M_aso3_e',
 'M_alathr_e',
 'M_lcts_e',
 'M_f6p_c',
 'M_phe_L_c',
 'M_glyasn_e',
 'M_succitr_L_c',
 'M_ala_B_c',
 'M_26dap_M_c',
 'M_alaleu_e',
 'M_phenol_c',
 'M_g6p_c',
 'M_akg_c',
 'M_mn2_e',
 'M_pb_e',
 'M_alltt_c',
 'M_gcald_e',
 'M_chol_e',
 'M_glu_L_c',
 'M_alagln_c',
 'M_ru5p_

Réponse : Cette liste correspond aux métabolites consommés et productibles par l'ensemble du système.

##### Question 2.5: Le métabolite `NERYL_ACETATE’`est il produit de façon trivial (unique bactérie) ou via une coopération entre bactéries ? Écrivez la commande appropriée afin d’obtenir la liste de toutes les communautés minimales capables de produire le composé. Combien en existe-il ? Quelle taille font elles ?

In [11]:
run_mincom(
    option='soup',
    bacteria_dir='cas_biologique/bacteria-reduced/',
    seeds_file='cas_biologique/seeds.xml',
    targets_file='cas_biologique/targets.xml',
    output_json='sousoupe.json',
    enumeration=True
)

No host provided


/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'enum_bacteria': {1: ['Helicobacter_pylori',
   'Bacillus_sonorensis',
   'Bacteroides_sp'],
  2: ['Helicobacter_pylori', 'Bacillus_sonorensis', 'Bacteroides_odorus'],
  3: ['Bacteroides_lactus', 'Helicobacter_pylori', 'Bacillus_sonorensis'],
  4: ['Bacteroides_lactus', 'Helicobacter_pylori', 'Bacillus_cereus'],
  5: ['Bacillus_cereus', 'Helicobacter_pylori', 'Bacteroides_sp'],
  6: ['Bacillus_cereus', 'Helicobacter_pylori', 'Bacteroides_odorus']},
 'enum_targetsproducers': {1: {'NERYL_ACETATE': ['Bacillus_sonorensis']},
  2: {'NERYL_ACETATE': ['Bacillus_sonorensis']},
  3: {'NERYL_ACETATE': ['Bacillus_sonorensis']},
  4: {'NERYL_ACETATE': ['Bacillus_cereus']},
  5: {'NERYL_ACETATE': ['Bacillus_cereus']},
  6: {'NERYL_ACETATE': ['Bacillus_cereus']}},
 'enum_exchanged': {1: [], 2: [], 3: [], 4: [], 5: [], 6: []}}

Réponse : Il existe 6 communautées minimales de taille 3

##### Question 2.6 : En vous aidant des résultats obtenus précédemment, comment interpréter cette multiplicité de solutions dans un cadre biologique ?

Réponse : Trouver plusieurs solutions pour la production d’une target revient à trouver une importante redondance de fonction au sein du microbiote. Plusieurs bactéries ou ensemble de bactéries sont capables de produire la même chose. Par exemple ici nous avons deux souches de Bacillus et 3 de Bacteroides. On peut penser que des souches proches peuvent réaliser de nombreuses réactions communes et que l'une peu être substituée par l'autre. Biologiquement parlant, plus une fonction est redondante, plus elle sera « efficace », c’est à dire que plus il y aura de communautés capables de restaurer cette fonction et plus l’organisme sera capable de s’adapter à différentes conditions par exemple. Ces fonctions peuvent aussi être des fonctions vitales ou très utiles à l’organisme.

##### Question 2.7: Afin d'y voir un peu plus clair, quelle commande permettrait de lister directement (de façon unique) les bactéries d'intérêt impliquées dans la production du `NERYL_ACETATE` ?

In [12]:
run_mincom(
    option='soup',
    bacteria_dir='cas_biologique/bacteria-reduced/',
    seeds_file='cas_biologique/seeds.xml',
    targets_file='cas_biologique/targets.xml',
    output_json='sousoupe.json',
    union=True
)

No host provided


/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'union_bacteria': ['Bacteroides_lactus',
  'Bacillus_sonorensis',
  'Bacteroides_sp',
  'Bacteroides_odorus',
  'Bacillus_cereus',
  'Helicobacter_pylori'],
 'score_optimum_union': '3',
 'union_targetsproducers': {'NERYL_ACETATE': ['Bacillus_sonorensis',
   'Bacillus_cereus']},
 'union_exchanged': []}

Réponse : On retrouve bien les 6 bactéries impliquées dans les 6 solutions précédentes

##### Question 2.8 : Cette méthode, rapide à exécuter, fait toutefois perdre de l’information biologique : les collaborations nécessaires pour produire un métabolite. Il existe une autre façon de réduire le nombre de solutions sans perdre d’information, laquelle ? Écrivez la commande correspondante. Combien de solutions obtient-on ? Que pouvez vous en déduire ?

In [13]:
run_mincom(
    option='minexch',
    bacteria_dir='cas_biologique/bacteria-reduced/',
    seeds_file='cas_biologique/seeds.xml',
    targets_file='cas_biologique/targets.xml',
    output_json='minexch.json',
    enumeration=True
)

No host provided


/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch_nohost.lp


{'enum_bacteria': {1: ['Bacteroides_lactus',
   'Helicobacter_pylori',
   'Bacillus_cereus'],
  2: ['Bacteroides_lactus', 'Helicobacter_pylori', 'Bacillus_sonorensis'],
  3: ['Bacillus_cereus', 'Helicobacter_pylori', 'Bacteroides_sp'],
  4: ['Helicobacter_pylori', 'Bacillus_sonorensis', 'Bacteroides_sp'],
  5: ['Bacillus_cereus', 'Helicobacter_pylori', 'Bacteroides_odorus'],
  6: ['Helicobacter_pylori', 'Bacillus_sonorensis', 'Bacteroides_odorus']},
 'enum_targetsproducers': {1: {'NERYL_ACETATE': ['Bacillus_cereus']},
  2: {'NERYL_ACETATE': ['Bacillus_sonorensis']},
  3: {'NERYL_ACETATE': ['Bacillus_cereus']},
  4: {'NERYL_ACETATE': ['Bacillus_sonorensis']},
  5: {'NERYL_ACETATE': ['Bacillus_cereus']},
  6: {'NERYL_ACETATE': ['Bacillus_sonorensis']}},
 'enum_exchanged': {1: [{'what': ['DMAPP', 'MVA'],
    'from_to': ('Helicobacter_pylori', 'Bacteroides_lactus')},
   {'what': ['LINALOL'],
    'from_to': ('Bacteroides_lactus', 'Bacillus_cereus')}],
  2: [{'what': ['LINALOL'],
    'from_t

Réponse : On obtient 6 communautés également, le nombre d'échanges est minimum est équivalent entre toutes les communautés minimales

Vous communiquez ces résultats aux biologistes de l'équipe. Malheuresement le `MEVALONATE` n'est pas un composé que l'on retrouve dans le métabolisme humain. Les biologistes décident alors de modifier génétiquement une bactérie pour intégrer la réaction suivante à son métabolisme :

<img src='pics/cas_biologique_add.png' width="250" height="300">


Cette bactérie est capable de produire du `MVA` à partir de l'`INDOLE`, un composé très présent au niveau des intestins.


##### Question 2.9 : Quel est l'interet de cette modification des biologistes ?

Réponse : Il faut que la réaction puisse se faire à partir des ressources du milieu dans lequel vont se trouver les bactéries. Il faut donc ajuster la chaine de réaction de façon à ce qu'elle puisse se faire au niveau du système digestif humain, à partir des ressources disponibles dans ce milieu. Le mévalonate n'est pas disponible dans ce milieu, mais l'indole oui.

##### Question 2.10 :  Ajoutez manuellement cette réaction au schéma complété précedemment.

Réponse:

<img src='pics/cas_biologique_général.png' width="800" height="300">

##### Question 2.11 : Ajoutez l'`INDOLE` dans le fichier seeds.xml. Ajoutez la bactérie Bactéroides_ovatus dans le répertoire 'cas_biologique'. Quel est l'impact de rajouter une bactérie dans ce dossier ? 

Réponse : Cela revient à l'ajouter à votre système, son métabolisme (ses réactions) est maintenant intégré dans les simulations.

##### Question 2.12 : Relancez la commande précédente. Quel changement observez vous dans les résultats ? Envous aidant du schéma, quelle hypothèse pourrait on faire sur la production et la consomation originale de MVA dans le réseau ? (avant l'ajout de Bacteroides_ovatus)

In [17]:
run_mincom(
    option='minexch',
    bacteria_dir='cas_biologique/bacteria-reduced/',
    seeds_file='cas_biologique/seeds.xml',
    targets_file='cas_biologique/targets.xml',
    output_json='minexch.json',
    enumeration=True
)

No host provided


/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_minexch_nohost.lp


{'enum_bacteria': {1: ['Bacteroides_ovatus',
   'Helicobacter_pylori',
   'Bacillus_cereus'],
  2: ['Bacteroides_ovatus', 'Helicobacter_pylori', 'Bacillus_sonorensis']},
 'enum_targetsproducers': {1: {'NERYL_ACETATE': ['Bacillus_cereus']},
  2: {'NERYL_ACETATE': ['Bacillus_sonorensis']}},
 'enum_exchanged': {1: [{'what': ['DMAPP'],
    'from_to': ('Helicobacter_pylori', 'Bacteroides_ovatus')},
   {'what': ['LINALOL'],
    'from_to': ('Bacteroides_ovatus', 'Bacillus_cereus')}],
  2: [{'what': ['DMAPP'],
    'from_to': ('Helicobacter_pylori', 'Bacteroides_ovatus')},
   {'what': ['LINALOL'],
    'from_to': ('Bacteroides_ovatus', 'Bacillus_sonorensis')}]}}

Réponse : On remarque qu'on retrouve uniquement Bacteroides_ovatus dans les échanges minimaux et que les autres bactéroides ont disparu, ce qui réduit le nombre de résultats à 2 solutions optimales avec le minimum d'échange. On peut faire l'hypothèse que l'ajout de Bacteroides_ovatus a permis de réduire le nombre d'échanges. Bacteroides ovatus permet de produire MVA directement à partir des ressources du sytème. On peut en déduire que MVA est originalement produit et consomé par deux bactéries différentes. Il faut 2 échanges si MVA est produit par deux bactéries différentes, ce qui explique que Bacteroides_ovatus soit privilégié dans ce cas là.

##### Question 2.13 : On dispose également d’un fichier modélisant l’hôte humain. Il est temps de simuler si nos bactéries et notre hote peuvent produire ensemble `NERYL ACETATE`. Écrivez la commande permettant de visualiser l’ensemble des composés produits par l’association des bactéries et de l’hôte. 

In [19]:
run_scopes(
    targets_file='cas_biologique/targets.xml',
    seeds_file='cas_biologique/seeds.xml',
    bacteria_dir='cas_biologique/bacteria-reduced/',
    host_file='cas_biologique/Human.xml'
)

{'host_prodtargets': [],
 'host_unprodtargets': ['NERYL_ACETATE'],
 'host_scope': ['M_alahis_e',
  'M_ddca_e',
  'M_hxan_e',
  'M_ile_L_c',
  'M_ind3ac_e',
  'M_h2o_c',
  'M_glyphe_c',
  'M_glcn_e',
  'M_pyr_c',
  'M_fe2_e',
  'M_ac_e',
  'M_ocdca_c',
  'M_ptrc_c',
  'M_leu_L_c',
  'M_fum_e',
  'M_adn_e',
  'M_met_D_e',
  'M_ins_c',
  'M_lys_L_c',
  'M_h_c',
  'M_dad_2_c',
  'M_db4p_c',
  'M_ca2_e',
  'M_metsox_R_L_e',
  'M_o2_e',
  'M_h2s_c',
  'M_thr_L_c',
  'M_nac_e',
  'M_asp_L_e',
  'M_3mob_c',
  'M_cgly_e',
  'M_ac_c',
  'M_uri_e',
  'M_pime_c',
  'M_glyphe_e',
  'MVD1',
  'M_alaglu_c',
  'M_g6p_B_c',
  'M_hxan_c',
  'M_cytd_e',
  'ETHYL_ACETATE',
  'M_proteinsynth_c',
  'MVA',
  'M_mal_L_c',
  'M_g1p_c',
  'M_leu_L_e',
  'M_alaasp_e',
  'M_glypro_e',
  'M_alaglu_e',
  'M_pydx_e',
  'M_e4p_c',
  'M_hg2_e',
  'M_thr_L_e',
  'M_thymd_e',
  'M_adn_c',
  'M_alahis_c',
  'M_ala_L_e',
  'M_gam1p_c',
  'M_his_L_c',
  'M_phe_L_e',
  'M_alagln_e',
  'M_cl_e',
  'M_glyasn_c',
  'M_cd2_e',


Réponse : scope avec host

##### Question 2.14 : Listez la liste des bactéries nécessaires pour obtenir le composé d'intérêt, en inclaunt l'hôte cette fois. Remarquez-vous des changements ? Si oui, à quoi sont-ils liés ? Si non, pourquoi ?

In [23]:
run_mincom(
    option='soup',
    bacteria_dir='cas_biologique/bacteria-reduced/',
    seeds_file='cas_biologique/seeds.xml',
    targets_file='cas_biologique/targets.xml',
    output_json='sousoupe.json',
    host_file='cas_biologique/Human.xml',
    union=True
)

/mnt/Data/M2_IBI/BS2/Projet_TP/miscoto_tp/.venv_miscoto/lib/python3.10/site-packages/miscoto/encodings/community_soup.lp


{'union_bacteria': ['Bacteroides_lactus',
  'Bacteroides_ovatus',
  'Bacillus_sonorensis',
  'Bacteroides_sp',
  'Bacteroides_odorus',
  'Bacillus_cereus'],
 'score_optimum_union': '2',
 'union_targetsproducers': {'NERYL_ACETATE': ['Bacillus_sonorensis',
   'Bacillus_cereus']},
 'union_exchanged': []}

Réponse : On observe que l'on obtient 6 bactéries, on a ajouté Bacteroides_ovatus précédemment mais Helicobacter_pylori a disparu des résultats. On peut émettre l'hypothèse que l'hôte est capable de réaliser les réactions réalisées par cette bactérie et que donc elle n'est plus nécessaire.

## Partie III : Les rocambolesques questions bonus

<img src='graph_relation.png' width="569" height="430">

Dans l'article [Scalable and exhaustive screening of metabolic functions carried out by microbial consortia](https://doi.org/10.1093/bioinformatics/bty588), lorsqu'ils travaillaient sur un grand jeu de données, les auteurs ont effectué un calcul de l'union des solutions. Or, on a pu voir qu'utiliser union faisait perdre l'information biologique du nombre de communautés minimales.

##### Question 3.1 : Quel est l'intérêt de faire un calcul d'union plutôt que d'énumération ?

Réponse : Énumération est très demandeur en ressources computationnelles, tandis que union l’est moins ; par ailleurs, il existe une relation polynômiale entre les deux, ce qui permet d'approcher l’un par l’autre, et déterminer si énumération peut être calculée en un temps raisonnable ou non.

Question 3.2 : Quelles sont d'après vous les limites de Miscoto ?

+ Pas de prise en charge de la stoechiométrie	
+ Pas de prise en compte des dégradations des composés 
+ Pas d’attention aux éventuelles compétitions et incompatibilités de cultures entre les différents organismes
+ Ne vérifie pas si les transports cellulaires sont réalistes ou non biologiquement.
+ Les résultats sont donc à prendre avec prudence, surtout qu’ils sont très dépendants de la qualité des annotations disponibles (notamment pour les compartiments cellulaires).

##### Question 3.3 : Tracez, pour le jeu de données fourni, le graphique en barres représentant le nombre de communautés minimales en fonction des fonctions.

In [1]:

##### Question 2.5 : Comparez les métabolites produits par deux des bactéries. Lesquels sont en commun ?

Conseil : sauvegardez les sorties au format .json pour pouvoir les recharger avec la méthode `load` de la librairie `json`.
run_focus(
    bacteria_dir='cas_biologique/bacteria-reduced/',
    seeds_file='cas_biologique/seeds.xml',
    focus_bact=["Bacteroides_sp_20_3","Helicobacter_pylori_26695"],
    output_json='compare_bacteria.json'
)

res = load(open(f"compare_bacteria.json", "r"))


set(res['Bacteroides_sp_20_3']['produced_alone']) - set(res['Helicobacter_pylori_26695']['produced_alone'])
    import matplotlib.pyplot as plt
    
Réponse : scopes sur 2 bactéries + chargement des fichiers + comparaison de sets

SyntaxError: invalid syntax (4223553062.py, line 3)