# Librairies Python

<center>
![https://pypi.org/static/images/logo-large.72ad8bf1.svg](https://pypi.org/static/images/logo-large.72ad8bf1.svg)
![https://www.anaconda.com/wp-content/themes/anaconda/images/logo-dark.png](https://www.anaconda.com/wp-content/themes/anaconda/images/logo-dark.png)
</center>


## Les librairies en Python

- Des librairies sont installées nativement en Python
- D'autres sont disponibles en ligne sur des dépots
- Des milliers de librairies disponibles
  - ~ 117000 sur [PyPI](https://pypi.org/)
  - Et certainement beaucoup d'autres sur différents dépots
  - Installation de librairies : `pip install librairie`
- Anaconda : Plateforme d'analyse scientifque pour Python 
  - Plus de 1000 paquets python orientés analyse scientifique disponibles à l'[installation](https://www.anaconda.com/download/)
  - Installation de librairies via `pip` ou `conda`
- Librairies générales + librairies scientifiques  

## Quelques librairies générales

### [os](https://docs.python.org/3.6/library/os.html) : interfaces au système d'exploitation

In [1]:
import os

In [2]:
# vérifie l'existance d'un fichier
print(os.path.exists("unfichier.txt"))

False


In [3]:
# Pour récupérer la valeur d'une variable d'environement 
# (os.setenv pour créer ou changer)
print(os.getenv("HOME"))

/home/chotard


In [4]:
os.chdir("/home/chotard/Work/Confs/lsst_drp_analysis")
print(os.getcwd())           # pour récupérer le repertoire courant
os.chdir(os.getenv("HOME"))  # change de répertoire
print(os.getcwd())
os.chdir("/home/chotard/Work/Confs/lsst_drp_analysis")

/home/chotard/Work/Confs/lsst_drp_analysis
/home/chotard


In [5]:
print(os.getlogin())

chotard


In [6]:
print(os.listdir("."))

['.ipynb_checkpoints', '.gitignore', 'README.rst', 'stack', 'python', '.git']


In [7]:
print(os.listdir("../lsst_drp_analysis"))

['.ipynb_checkpoints', '.gitignore', 'README.rst', 'stack', 'python', '.git']


### [glob](https://docs.python.org/3.6/library/glob.html) : contenu de repertoire "à la unix"

In [8]:
import glob

In [9]:
print(glob.glob("*.*"))   # ** + recursive=True pour chercher dans les sous répertoires

['README.rst']


In [10]:
print(glob.glob("../lsst_drp_analysis/*.*"))

['../lsst_drp_analysis/README.rst']


In [11]:
glob.glob("/home/chotard/Work/Confs/lsst_drp_analysis/.*")

['/home/chotard/Work/Confs/lsst_drp_analysis/.ipynb_checkpoints',
 '/home/chotard/Work/Confs/lsst_drp_analysis/.gitignore',
 '/home/chotard/Work/Confs/lsst_drp_analysis/.git']

### [PyYAML](http://pyyaml.org/wiki/PyYAML) : lire et écrire des fichiers YAML

*YAML is a data serialization format designed for human readability and interaction with scripting languages*

In [12]:
import yaml

In [13]:
# Sauvegarder des données structurées dans un dictionnaire
d = {'a': 1, 'b': 2}
yaml.dump(d, open('fichier.yaml', 'w'))

In [1]:
less fichier.yaml

In [15]:
d2 = yaml.load(open("fichier.yaml"))
print(d2)

{'a': 1, 'b': 2}


In [16]:
d = yaml.load("""
cluster: MACSJ2243.3-0935
ra: 340.83
dec: -9.59
redshift: 0.4470
filter: [u, g, r, i, 'i2', z]
butler: /sps/lsst/data/clusters/MACSJ2243.3-0935/output_v1/coadd_dir
patch: ['1,1', '1,3', '1,2', '1,4', '1,5', '2,1', '2,2', '2,3', '2,4', '2,5', '3,2', '3,3', '3,4']
""")

In [17]:
print(d)

{'cluster': 'MACSJ2243.3-0935', 'ra': 340.83, 'dec': -9.59, 'redshift': 0.447, 'filter': ['u', 'g', 'r', 'i', 'i2', 'z'], 'butler': '/sps/lsst/data/clusters/MACSJ2243.3-0935/output_v1/coadd_dir', 'patch': ['1,1', '1,3', '1,2', '1,4', '1,5', '2,1', '2,2', '2,3', '2,4', '2,5', '3,2', '3,3', '3,4']}


In [18]:
yaml.dump(d, open("fichier2.yaml", 'w'))

In [19]:
less fichier2.yaml

## D'autres librairies générales intéressantes

- [csv](https://docs.python.org/3.6/library/csv.html) : Lire et écrire des fichiers de données
- [pickle](https://docs.python.org/3.6/library/pickle.html) : Sérialisation binaire d'objets Python
- [re](https://docs.python.org/3.6/library/re.html) : Opérations sur les expression regulières
- [subprocess](https://docs.python.org/3.6/library/subprocess.html) : Gérer des sous-processus (entrées, sorties, erreurs)
- [requests](http://docs.python-requests.org/en/master/) : Simplifier les requettes HTTP via Python
- [logging](https://docs.python.org/3.6/library/logging.html) : Gèrer les logs
- [time](https://docs.python.org/3.6/library/time.html) & [datetime](https://docs.python.org/3.6/library/datetime.html) :  Manipulation de date, heure, et conversions
- [itertools](https://docs.python.org/3.6/library/itertools.html) : Créer des itérateur, permutations, combinaisons, etc.
- [argparse](https://docs.python.org/3/library/argparse.html) : Parseur d'options pour Python en ligne de commande
- [ipython](https://ipython.org/) : Calcul et visualisation intéractive pour Python 
- [jupyter](https://jupyter.org/) : Python interactif sur votre navigateur
- et bien d'autres...

## Quelques librairies scientifiques

<center>
<img src="http://www.numpy.org/_static/numpy_logo.png" alt="Drawing" style="width: 300px;"/>
</center>

### [NumPy](http://www.numpy.org/)

NumPy est la librairie fondamentale pour les calculs scientifiques en Python. Cette librairie contient, entre autre :

- un object `array` très puissant de tableau à N dimensions
- des fonctions sophistiqués de combinaison et de manipulation d'array (broadcasting)
- des outils utiles à l'intégration de codes C/C++ ou Fortran
- des outils d'algèbre linéaire, de transformés de Fourier, ou de création de nombres aléatoires


<center>
<img src="http://matplotlib.org/_static/logo2.svg" alt="Drawing" style="width: 300px;"/>
</center>

### [Matplotlib](http://matplotlib.org/index.html)

- Bibliothèque graphique de visualisation 2D (support 3D, animation et interactivité), permettant des sorties de haute qualité « prêtes à publier »
- Fonctions de visualisation clé en main (échelle logarithmique, histogramme, courbes de niveau, etc)
- Figures modifiables à souhait, tous les éléments graphiques de la figure étant accessibles (titre, axes, lignes, etc.)
- Utilisable dans des scripts Python, les schell Python et IPython, les notebooks Jupyter, des applications web et avec différentes interfaces graphiques
- [Galerie et exemples](http://matplotlib.org/gallery.html)

<center>
<img src="http://matplotlib.org/_images/hexbin_demo1.png" alt="Drawing"/>
</center>

<center>
<img src="https://docs.scipy.org/doc/scipy/reference/_static/img/scipy_org_logo.gif" alt="Drawing" style="width: 300px;"/>
</center>

### [SciPy](https://docs.scipy.org/doc/scipy/reference/)

- Bibliothèque numérique d’algorithmes et de fonctions mathématiques, basée sur les tableaux `numpy.ndarray`

- De très nombreux exemples et tutoriels sont disponibles en ligne, couvrant les principales fonctionnalité de `scipy`
 - [tutoriels](https://docs.scipy.org/doc/scipy/reference/)
 - [cookbook](http://scipy-cookbook.readthedocs.io/)

- Integration (scipy.integrate)
- Optimisation (scipy.optimize)
- Interpolation (scipy.interpolate)
- Transformé de Fourier (scipy.fftpack)
- Traitement du signal (scipy.signal)
- Algèbre linéaire (scipy.linalg)
- Statistics (scipy.stats)
- File IO (scipy.io)
- Etc.

<center>
<img src="https://docs.scipy.org/doc/scipy/reference/_images/interpolate-2.png" alt="Drawing"/>
</center>

<center>
[Interpolation](https://docs.scipy.org/doc/scipy/reference/tutorial/interpolate.html)
</center>

<center>
<img src="http://pandas.pydata.org/_static/pandas_logo.png" alt="Drawing" style="width: 400px;"/>
</center>

### [Pandas](http://pandas.pydata.org/)

Pandas est une librairies d'analyse de données basée sur NumPy pour Python

- fournissant une structure de données très performante et facile d'utilisation (DataFrame) 
- gestion des données "à la base de données"
- bonne intégration avec NumPy et matplotlib
- grand nombre de fonctions I/O pour lire et écrire des données : CSV, HDF5, SQL, JSON, HTML, Excel, etc.

[Documentation](http://pandas.pydata.org/pandas-docs/stable/) et [tutoriels](http://pandas.pydata.org/pandas-docs/stable/tutorials.html) accessibles en ligne.

<center>
<img src="http://www.astropy.org/images/astropy_banner.svg" alt="Drawing" style="width: 400px;"/>
</center>

### [Astropy](http://docs.astropy.org/en/stable/)

- Librairie centrale et unique contenant les élément essentiels des analyses pour l'astronomie, et ayant pour but de rendre possible l'inter-operabilité des librairies d'astronomies.
- Les fonctionnalités principales d'astropy se font selon trois catégories principales
  - Data structures and transformations (constantes, unitées, temps, coordonnées, WCS, table, etc)
  - Files, I/O, and Communication (FITS, ASCII, VOTable, HDF5, YAML, etc.)
  - Computations and utilities (cosmologie, statistique, visualisation)

- Il existe aussi des "affiliated packages"
  - Librairies Python lié à l'astronomy, utilisant et complétant Astropy 
  - Ne font pas partie de la librairies central d'Astropy
  - Mais inclues comme partie intégrante de l'"Astropy Project community"
  - Améliorant la réutilisabilté, l'interoperabilité, interface standard aux autres librairies Python d'astronomie et d'astrophysique.
- Par exemple : [Astroquery](http://astroquery.readthedocs.io/en/latest/), [galpy](http://galpy.readthedocs.io/en/latest/), [sncosmo](http://sncosmo.readthedocs.io/en/v1.5.x/), [gammapy](https://gammapy.readthedocs.io/en/latest/), [cluster-lensing](http://jesford.github.io/cluster-lensing/index.html), [astroplan](https://astroplan.readthedocs.io/en/latest/), [photutils](https://photutils.readthedocs.io/en/stable/)

## D'autres librairies scientifiques intéressantes
- [math](https://docs.python.org/3.6/library/math.html) : Fonctions mathématiques standards (natif)
- [sympy](http://www.sympy.org/en/index.html) : Calcul mathématiques formel : résolution d'équations, simplification, factorisation, statistics, etc. 
- [sage](http://www.sagemath.org/) : Environnement de calcul mathématique
- [scikit-learn](http://scikit-learn.org/stable/index.html) : Outils d'exploration et d'analyse de données (classification, regression, clustering, etc )
- [h5py](http://www.h5py.org/) : Interface Python au format de données HDF5
- [pyfits](http://pythonhosted.org/pyfits/) : Interface au format de données FITS 
- [healpy](https://github.com/healpy/healpy) : Interface au format de données HEALPIX (cartes)
- [numba](http://numba.pydata.org/) : Compilation à la volée de morceau de code
- [scipy](https://scipy.org/), [numpy](http://www.numpy.org/), [matplotlib](http://matplotlib.org/), [pandas](http://pandas.pydata.org/), [astropy](http://www.astropy.org/)
- et bien d'autres...