# Virtual env

Note : ce notbook est disponible à titre de démonstration, il ne fonctionnera pas nécessairement sous google colab ou sur l'environnement de l'utilisateur particulièrement si celui-ci est sous Windows.

Le principe d'un environnement virtuel est de pouvoir faire cohabiter plusieurs versions des même librairies python sur un même systême. Cela est essentiel si vos travaillez sur différents projets, en collaboration avec différentes personnes, afin d'assurer la reproductibilité des résultats.

On utilisera pour cela le module virtualenv.  

A noter que dans les cellules suivantes, aucune ne correspond à un code python. Il y a deux types de cellules :  

- celle commençant par '%' correspondent à des instructions 'magic' jupyter  
- celle commençant par '!' sont directement des commandes shell / ligne de commande

Ces dernières commandes sont naturellement incompatibles linux / windows.

Documentation :  

https://docs.python.org/3/tutorial/venv.html  
https://python-guide-pt-br.readthedocs.io/fr/latest/dev/virtualenvs.html  

## Installation de virtualenv

Virtualenv est un module python. On l'installe donc avec pip.

In [1]:
%pip install virtualenv

Note: you may need to restart the kernel to use updated packages.


On peut ensuite créer un environnement virtuel avec la commande **virtualenv** suivi du nom de l'environnement (qui ici correspond à un répertoire local)

Ensuite l'activer avec la commande **source venv/bin/activate** (ou **venv/bin/activate.bat** sous windows) et enfin install une librairie avec une version spécifique.

NB : le symoble **&&** est utilisé en ligne de commande linux pour séparer les commandes, chaque commande n'étant exécutée que si la précédente a fonctionné.

In [2]:
!(virtualenv venv && source venv/bin/activate && pip install simplejson==3.16)

created virtual environment CPython3.9.7.final.0-64 in 183ms
  creator CPython3Posix(dest=/home/nicolas/dev/formations/PythonDataScience/PDS_orsys/PythonDataScience/jupyter_notebook/venv, clear=False, no_vcs_ignore=False, global=False)
  seeder FromAppData(download=False, pip=bundle, setuptools=bundle, wheel=bundle, via=copy, app_data_dir=/home/nicolas/.local/share/virtualenv)
    added seed packages: pip==22.3.1, setuptools==65.5.1, simplejson==3.16.0, wheel==0.37.1
  activators BashActivator,CShellActivator,FishActivator,NushellActivator,PowerShellActivator,PythonActivator


Maintenant si on utilise cet environnement virtuel pour déterminer la version de la librairie **simplejson**, on obtient :

In [3]:
!(source venv/bin/activate && python -c "import simplejson; print(simplejson.__version__)")

3.16.0


On fait la même chose, avec un autre environnement virtuel (**venv2**) et une autre version de la librairie (3.17 au lieu de 3.16) 

In [4]:
!(virtualenv venv2 && source venv2/bin/activate && pip install simplejson==3.17)

created virtual environment CPython3.9.7.final.0-64 in 184ms
  creator CPython3Posix(dest=/home/nicolas/dev/formations/PythonDataScience/PDS_orsys/PythonDataScience/jupyter_notebook/venv2, clear=False, no_vcs_ignore=False, global=False)
  seeder FromAppData(download=False, pip=bundle, setuptools=bundle, wheel=bundle, via=copy, app_data_dir=/home/nicolas/.local/share/virtualenv)
    added seed packages: pip==22.3.1, setuptools==65.5.1, simplejson==3.17.0, wheel==0.37.1
  activators BashActivator,CShellActivator,FishActivator,NushellActivator,PowerShellActivator,PythonActivator


In [5]:
!(source venv2/bin/activate && python -c "import simplejson; print(simplejson.__version__)")

3.17.0


Maintenant on peut user alternivement les deux environnements virtuels librement :

In [6]:
!(source venv/bin/activate && python -c "import simplejson; print(simplejson.__version__)")

3.16.0


In [7]:
!(source venv2/bin/activate && python -c "import simplejson; print(simplejson.__version__)")

3.17.0


In [8]:
!(source venv/bin/activate && python -c "import simplejson; print(simplejson.__version__)")

3.16.0


In [9]:
!(source venv2/bin/activate && python -c "import simplejson; print(simplejson.__version__)")

3.17.0


A noter que vous n'aurez besoin d'appeler **source venv2/bin/activate** qu'une seule fois en temps normal, simplement l'usage de virtual env dans un jupyter notebook qui est fait ici n'est pas naturel. 

# Pourquoi je n'utilise jamais virtualenv ...

Simplement parce que j'utilise linux et docker (NB : docker existe aussi sous windows)  
Souvent on peut trouver deux types de projets en data science :
- les études "one-shot"  
- les programmes et librairies vivant sur le long terme  

Dans le premier cas, il est souvent inutile d'utiliser virtualenv, on se contentera d'avoir des librairies décemment à jour, et d'utiliser **pip freeze** pour laisser à d'autres utilisateurs le soin d'éventuellement reproduire les résultats.

Dans le deuxième cas, il existe une solution beaucoup plus puissante, docker, qui consiste à faire tourner une application sur un kernel dédié. On a tous les avantages de l'environnement virtuel, en ajoutant une indépendance du système d'exploitation qui garantit la coopération possible linux / windows ainsi que le déploiement et l'intégration continue (ou les systèmes linux sont nettement prépondérants)   

