# Labo 05 - On travaille sur le TP!



### Objectif 'ultime' de la 1e partie du TP :

Exécuter l'un des programmes de la suite PHYLIP à l'aide de python; faire le suivi de l'exécution (connaître le statut, interrompre l'exécution, etc.); implémenter la solution à l'aide de la POO.


### ...mais d'abord :
    1. Utiliser Python pour exécuter une commande/processus simple ne nécessitant peu ou pas de suivi.
    2. Utiliser Python pour un processus plus long, pour lequel on veut un suivi :
        - Savoir si le processus est terminé ou non
        - Pouvoir interrompe le processus
        - etc.
    3. Utiliser une classe Python pour l'exécution et le suivi d'un processus.

### ...sans oublier :
    4. Exécuter un programme PHYLIP en ligne de commande, en suivant les directives au fur et à mesure, ce qui implique:
        - Avoir installé le programme et savoir comment le faire fonctionner
        - Avoir un/des fichiers de données pour alimenter le programme
    5. Exécuter un programme PHYLIP en ligne de commande, en passant les paramètres d'exécution via un fichier.

## 1. Exécuter une commande simple à l'aide de *subprocess.run()*

On met temporairement de côté les programmes PHYLIP. Cet exercice consiste à exécutez la commande ' **git --help** ' et à enregistrer la réponse retournée dans un fichier text ' **output.txt** ', et ce en utilisant **Python**.

Voir la [vidéo](https://youtu.be/2Fp1N6dof0Y) (19 min) de Corey Schafer sur le sujet.

In [5]:
# Exécutez cette cellule pour mettre la librairie en mémoire
import subprocess

Quelques exemples d'exécution simple, avec retour dans un fichier

In [6]:
# Spécifier shell=True lorsque args est une chaîne de caractères.
# Ici '> output.txt' permet de diriger le text de retour dans un fichier nommé output.txt.

args = "git --help > output.txt"
subprocess.run(args, shell=True)

CompletedProcess(args='git --help > output.txt', returncode=0)

In [7]:
# L'argument stdout permet de gérer la sortie à l'aide de python

args = "git --help"
with open('output2.txt', 'w') as f:
    subprocess.run(args, shell=True, stdout=f)

In [8]:
# En passant une liste d'arguments on laisse subprocess faire la gestion des noms avec espaces, etc.
# shell=False (par défaut) lorsque args est une liste. Plus sécuritaire.

args = ["git", "--help"]
with open('output3.tx', 'w') as f:
    subprocess.run(args, stdout=f)

## 2. Faire le suivi de processus avec *subprocess.popen()*



In [2]:
# Exécutez cette cellule pour mettre la librairie en mémoire
import subprocess
import time
import os
from psutil import pid_exists

Exemple d'interruption avec ***.kill()***. On vérifie l'existence du processus avec psutil.***pid_exists()*** par exemple.

In [4]:
# Ici le programme Curl est utilisé pour faire une requête http, ce qui devrait prendre 1 ou 2 secondes...
url = 'https://www.ebi.ac.uk/proteins/api/proteins?offset=0&size=100&gene=epo'
args = ["curl", url]
  
# Subprocess
p = subprocess.Popen(args)

# Obtenir le process id (pid)
pid = p.pid

# Vérifier si le processus existe
print(pid_exists(pid))

# # Interrompre l'exécution du programme
p.kill()
print(pid_exists(pid))



True
False


Exemple de boucle pour l'interrogation du statut avec ***.poll()***

In [6]:
# Ici le programme Curl est utilisé pour faire une requête http, ce qui devrait prendre 1 ou 2 secondes...
url = 'https://www.ebi.ac.uk/proteins/api/proteins?offset=0&size=100&gene=epo'
args = ["curl", url]

# Ouverture du fichier de output
try   : f = open('output_http.txt', 'w')
except: exit()
    
# Subprocess
p = subprocess.Popen(args, stdout=f)

# Obtenir le process id (pid)
pid = p.pid


# Paramètres pour la vérification du status
t      = time.time()
t_wait = .2                            # <-- Essayez différentes valeurs!
t_max  = .4  # Temps max, en secondes  # <-- Essayez différentes valeurs!

# Vérifier le status
success = True
while success and p.poll() == None:
    if time.time() - t <= t_max :
        # On a encore du temps...
        print(f"{p.pid} en cours d'exécution...")
        time.sleep(t_wait)
    else:
        # On a atteint la durée maximale...
        p.kill()
        success = False

        
# # Fermeture du fichier
f.close()

# Message
print('Terminé!' if success else 'Interrompu!')

18060 en cours d'exécution...
18060 en cours d'exécution...
Interrompu!


## 3. POO

Créez une classe Python permettant de gérer l'exécurion du programme Curl.

In [None]:
# Exécutez cette cellule pour mettre la librairie en mémoire
import subprocess
import time
import os
from psutil import pid_exists

In [None]:
# Voici une structure que vous pouvez suivre créer votre classe
class RunCurl:
    
    def __init__(self, url, output='output.txt'):
        self.url = url
        self.output = output
        # Il faut ajouter d'autres propriétés!!
        
    def run(self):
        # Lance l’exécution avec les paramètres fournis au constructeur. L’exécution ne doit pas être bloquante. 
        pass
    
    def status(self):
        # retourne le status d’exécution : (0) non commencée / (1) en cours
        # / (2) terminée avec succès / (3) terminée avec un échec
        pass
    
    def reset(self):
        # Permet d’interrompre l’exécution et d’en effacer toutes les traces.
        pass
    
    def view(self):
        # retourne la liste des fichiers générés.
        pass
    
    def read(self, fichier):
        # retourne le contenu du fichier (si il existe).
        pass
        

Programme principal

In [None]:
# Paramètres
url = 'https://www.ebi.ac.uk/proteins/api/proteins?offset=0&size=100&gene=epo'
output = 'output_http.txt'

# Créer un objet RunCurl
maRequeteCurl = RunCurl(url, output)

# Manupuler cet objet...
maRequeteCurl.run()
#...
#...

##  4. Exécuter un programme PHYLIP

La documentation pour télécharger, installer et utiliser le programme est en ligne; il faut la lire! Si vous avez des difficultés d'installations et que vous ne vous en sortez pas, il faut demander de l'aide.

Pour faire fonctionner les programmes, il faut généralement un fichier d'entrée, i.e. un fichier qui contient les données sur lesquelles votre programme va travailler. Pour l'exemple avec **dnaml**, le fichier requis est un alignement multiple au format phylip. Pour faire vos tests, vous avex besoin de vous en trouver/créer un. Par défaut, un fichier nommé 'infile' est recherché dans le répertoire courant; c'est la façon la plus simple de fournir le fichier au programme pour vos tests.

##  5. Fournir un fichier de paramètres

En exécutant le programme, vous avez du répondre à quelques questions/options. Il est possible de fournir à l'avance les réponses en passant un fichier de paramètres. Ce n'est pas une option propre aux porgrammes PHYLIP mais plutôt une astuce de programmeur... Attention, différences entre Windows et Linux à prendre en compte!

In [None]:
# Linux Bash
cmd = './exe/dnaml < params.txt'

# Windows PowerShell
cmd = 'Get-Content params.txt | .\exe\dnaml'