# Python pour biochimistes: Comment lire, créer et gérer des fichiers (ou des flux de données)

La plus grande partie du travail que nous faisons nécessite l'emploi de fichiers: on doit les lire, on doit en écrire, on doit en modifier. Comment faire en Python? Ce n'est pas très compliqué mais avant tout, il faut connaitre quelques rudiments de gestion d'un système de fichiers.

## Comment utiliser l'Internet pour récupérer des fichiers simplement? 

Dans l'exemple précédent, on utilise le système de fichiers local, donc pas besoin d'utiliser une connexion externe. Mais très souvent, les infos recherchées sont ailleurs... Ici encore, la notion de permission est importante car évidemment on doit avoir, au minimum, les droits de lecture sur le fichier recherché. On peut s'y prendre de deux manières différentes:

- Si le fichier est par exemple un simple fichier texte sur un serveur Web, on peut utiliser le module `requests`;
- Si le fichier est sur un service de partage de fichier type SFTP, on peut utiliser le module `paramiko` (https://docs.paramiko.org/en/2.2/index.html ) via le protocole SSH v2. 

### Méthode *requests*

Allons chercher un fichier: la liste des enzymes de restriction avec leur site de coupure. Mais ça ne marchera pas... La compagnie New England BioLab semble avoir rendu le téléchargement direct des données impossible :-( Mais j'ai mis le fichier correspondant ailleurs :-)

In [6]:
import requests

#
# Ça pourrait avoir l'air de ça
# Mais ça va cassé...
#
unURL = "https://rebase.neb.com/rebase/link_striderc"

response = requests.get(unURL)

aFile = open("../z.misc_files/data_misc/link_strider_from_neb.txt","w")

# On capture ce qui nous revient: une suite de caractères...
for aLine in response.text:
    # ... qu'on écrit une ligne à la fois dans le fichier
    aFile.write(aLine)

aFile.close()

### Méthode *paramiko*

Cette méthode dépend de l'installation du package du même nom:

In [8]:
!pip install paramiko


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.3.1[0m[39;49m -> [0m[32;49m25.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


Imaginons un serveur (totalement virtuel pour l'exemple) à l'adresse `10.175.49.165`, accessible à l'usager `bioubuntu`, avec le mot de passe identique (pas sécuritaire du tout mais c'est pour l'exemple!!). Dans ce compte usager, nous avons le fichier recherché, appellé `link_strider.txt`. Notre but: le télécharger et le sauvegarder localement dans `z.misc_files/demo_misc`.

In [3]:
import paramiko

# Variables nécessaires pour la connexion
# Evidemment, cet exemple ne fonctionnera que si
# les trois lignes suivantes donnent accès à un serveur 
host = "10.175.49.165"
user = "bioubuntu"
passwd = "bioubuntu"

# Le client SSH est l'outil qui nous permettra d'interagir avec le serveur
client_ssh= paramiko.SSHClient()
client_ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
client_ssh.connect(hostname=host, username=user, password=passwd)

# Effectuons le telechargement
client_sftp = client_ssh.open_sftp()
localFile  = "../z.misc_files/demo_misc/link_strider_remote_cvm.txt"
remoteFile = "link_strider.txt"
try:
  client_sftp.get(remoteFile, localFile)
  print("Succes!!")
except FileNotFoundError as err:
    print(f"File: {remoteFile} was not found on the source server {self.__host}")
client_sftp.close()

Succes!!
