# Anaconda Vs Miniconda

Une petite comparaison entre Miniconda et Anaconda:

| Caractéristique        | Miniconda                                   | Anaconda                                      |
|------------------------|---------------------------------------------|-----------------------------------------------|
| **Taille de l'installation** | Petit (Moins de 100MB)                      | Grand (Plusieurs GB, selon les packages)      |
| **Contenu**            | - Conda (gestionnaire de paquets et d'environnements)  | - Conda + <br> - Plus de 250 paquets scientifiques et de traitement de données par défaut |
| **Paquets par défaut** | Aucun paquet supplémentaire n'est installé par défaut | Contient un grand nombre de paquets scientifiques populaires (comme NumPy, Pandas, Jupyter, etc.) |
| **Utilisation**        | Vous installez manuellement les paquets dont vous avez besoin | Prêt à l'emploi pour la plupart des tâches scientifiques et d'analyse de données |
| **Taille après l'installation** | La taille dépend des paquets que vous choisissez d'installer ultérieurement | Typiquement plus grand en raison du grand nombre de paquets installés |
| **Idéal pour**         | Utilisateurs avancés, installations légères, serveurs, conteneurs, ou lorsque l'espace est une préoccupation | Nouveaux utilisateurs, éducation, ateliers, et lorsque vous souhaitez avoir un ensemble de paquets scientifiques et de traitement de données prêt à l'emploi |

La principale distinction est qu'Anaconda est une distribution qui comprend Conda, un grand nombre de paquets scientifiques, et d'autres outils, tandis que Miniconda n'inclut que Conda et dépend de l'utilisateur pour installer les paquets nécessaires.

# Setup de l'environnement

## Etape 1:
Ouvrir le terminal.

## Etape 2:
Liste des environnements conda disponibles:

```bash
conda env list
```

## Etape 3:
Activer l'environnement:

```bash
# créer un environement
conda create --name mon_env python=3.8

# activer
conda activate env_name
```

## Etape 5:
Lister les packages:

```bash
conda list
```

## Installation et lancement de jupyter notebook et de jupyter lab

```bash
# install jupyter
conda install jupyter

# install jupyterlab
conda install jupyterlab

# lancement de jupyter notebook
jupyter notebook

# lancement de jupyter lab
jupyter lab
```

## Création de kernel

```bash
# création de kernel (avec un environnement)
python -m ipykernel install --user --name env_name

# création de kernel (sans environnement) Bien penser à activer l'environnement au premier lancement
python -m ipykernel
```

La différence entre un kernel et environnement:

* Un **kernel** est une interface qui permet à des outils comme Jupyter d'exécuter du code dans un langage de programmation spécifique. 

* Un **environnement** est un espace isolé contenant un ensemble défini de paquets, qui peut avoir son propre kernel associé (par exemple, un environnement Conda avec Python 3.8 peut avoir un kernel Jupyter associé qui utilise ce Python 3.8).

C'est donc est un répertoire autonome qui contient une version spécifique de Python et tous les packages supplémentaires que vous avez installés. Il vous permet de créer des environnements isolés avec différentes versions de Python et différents packages installés dans chaque environnement.

## Qu'est ce qu'un kernel (ou noyau)

Le package ipykernel est un package Python qui fournit le noyau IPython pour les notebooks Jupyter. Il est nécessaire d'installer ipykernel si vous voulez utiliser Jupyter Notebook ou Jupyter Lab avec un environnement virtuel créé en utilisant conda prompt de mini conda.

Lorsque vous installez ipykernel, il crée un noyau qui peut être utilisé par Jupyter Notebook ou Jupyter Lab pour exécuter du code dans l'environnement virtuel. Cela vous permet d'utiliser les packages installés dans l'environnement virtuel dans vos notebooks Jupyter.

Dans le contexte de Jupyter Notebook ou Jupyter Lab, un **noyau** est un moteur de calcul qui exécute le code dans un document de notebook. Il prend en charge plusieurs langages de programmation et vous permet d'interagir avec le document de notebook en utilisant ce langage.

Lorsque vous créez un nouvel environnement virtuel en utilisant conda prompt de mini conda, il crée un nouveau répertoire avec son propre exécutable Python et ses packages. Vous pouvez ensuite activer cet environnement pour utiliser cette version spécifique de Python et ces packages dans votre terminal ou Anaconda prompt.

Lorsque vous installez `ipykernel` dans un environnement, il crée un noyau qui peut être utilisé par Jupyter Notebook ou Jupyter Lab pour exécuter du code dans cet environnement. Cela vous permet d'utiliser les packages installés dans l'environnement dans vos notebooks Jupyter.




## Pourquoi créer des kernels différents?

Créer des kernels différents est utile pour plusieurs raisons:

- **Flexibilité**: Vous pouvez utiliser différents langages de programmation et versions de Python dans vos notebooks Jupyter, en fonction du kernel que vous choisissez. Par exemple, vous pouvez avoir un kernel Python 3.8 pour un notebook et un kernel Python 3.9 pour un autre notebook.

- **Isolation**: Vous pouvez installer des packages spécifiques à chaque kernel, sans affecter les autres kernels ou l'environnement de base. Par exemple, vous pouvez avoir un kernel avec scikit-learn 1.3.2 et un autre kernel avec scikit-learn 1.2.1.

- **Reproductibilité**: Vous pouvez partager vos notebooks Jupyter avec d'autres utilisateurs, en leur indiquant le kernel associé à chaque notebook. Ainsi, ils pourront exécuter le code dans les mêmes conditions que vous.

Dans un environnement virtuel, chaque kernel est associé à un environnement Python spécifique. Lorsque vous créez un nouveau kernel, vous pouvez spécifier l'environnement Python que vous souhaitez utiliser pour ce kernel. Par défaut, le kernel est créé dans l'environnement de base de votre installation de Python.

Lorsque vous exécutez du code dans un notebook Jupyter, le kernel associé à ce notebook est utilisé pour exécuter le code. Si vous avez plusieurs kernels dans le même environnement virtuel, vous pouvez choisir le kernel à utiliser pour chaque notebook.

Pour gérer les kernels dans un environnement virtuel, vous pouvez utiliser la commande `conda` suivie de l'option `install` pour installer un nouveau kernel, ou de l'option `remove` pour supprimer un kernel existant. Vous pouvez également utiliser la commande `jupyter kernelspec list` pour afficher une liste des kernels installés dans votre environnement virtuel.

Pour résumer, Un kernel est simplement un programme qui exécute le code Python dans un environnement spécifique. Il n’a pas besoin d’être stocké dans un sous-dossier de l’environnement virtuel, mais plutôt dans un répertoire spécifique à Jupyter.


# Installation de packages depuis un Jupyter Notebook

Installlation depuis un jupyter notebook.

In [None]:
!pip install pandas

In [None]:
# install sklearn
!pip install scikit-learn

In [6]:
# import pandas
import pandas as pd

In [9]:
# load a dataset from sklearn
from sklearn.datasets import load_iris

# load dataset
iris = load_iris()

# print the names of the features
print(iris.feature_names)

['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']


In [34]:
# convert iris dataset to pandas dataframe
df = pd.DataFrame(iris.data, columns=iris.feature_names)

# print the first 5 rows of the dataframe
df.head()

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm)
0,5.1,3.5,1.4,0.2
1,4.9,3.0,1.4,0.2
2,4.7,3.2,1.3,0.2
3,4.6,3.1,1.5,0.2
4,5.0,3.6,1.4,0.2


In [None]:
# list packages installed
!conda list

## Différences entre pip et conda

Il est également possible d'utiliser les commandes `pip` pour lister et installer des packages.

`pip` et `conda` sont tous deux des gestionnaires de paquets pour Python, mais ils présentent des différences majeures dans leur conception, leur fonctionnalité et leur usage. Voici un tableau comparatif pour souligner certaines de ces différences :

| Caractéristique              | pip                                         | conda                                       |
|-----------------------------|---------------------------------------------|---------------------------------------------|
| **Nature**                  | Gestionnaire de paquets pour Python.        | Gestionnaire de paquets et système de gestion d'environnements, principalement pour Python mais aussi pour d'autres langages. |
| **Source des paquets**      | PyPI (Python Package Index).                | Les canaux Conda, avec `conda-forge` étant un canal populaire.   |
| **Format des paquets**      | Wheels (`*.whl`) ou sdist.                  | Binaires conda (`*.tar.bz2`).               |
| **Dépendances**             | Gère les dépendances Python.                | Gère les dépendances à la fois au niveau du langage et du système. Par exemple, `conda` peut installer des paquets non-Python comme `gcc` ou des bibliothèques système. |
| **Environnements virtuels** | Doit être utilisé avec `virtualenv` ou `venv` pour gérer les environnements virtuels. | Intègre son propre système de gestion d'environnements. |
| **Plateformes**             | Fonctionne principalement sur Python.       | Fonctionne avec Python et d'autres langages et plateformes. |
| **Installation de paquets non-Python** | Limité, car c'est spécifique à Python. | Peut installer des paquets non-Python, comme des outils de ligne de commande ou des bibliothèques écrites en C, C++, etc. |
| **Intégration avec les systèmes** | Moins intégré avec des systèmes comme Anaconda ou Miniconda. | Est le gestionnaire de paquets principal pour les systèmes Anaconda et Miniconda. |
| **Provenance**              | Projet open source de la Software Freedom Conservancy. | Projet open source développé par Anaconda, Inc. |

En résumé :
- `pip` est un gestionnaire de paquets spécifiquement pour Python et est idéal pour les bibliothèques et les cadres qui sont purement Python.
- `conda` est un gestionnaire de paquets et d'environnements plus général qui gère non seulement les paquets Python, mais aussi les dépendances au niveau du système, ce qui le rend idéal pour les projets qui ont des dépendances complexes ou qui nécessitent des bibliothèques non-Python.

In [19]:
# liste des packages avec pip
!pip list

Package               Version
--------------------- ------------
aiofiles              22.1.0
aiosqlite             0.18.0
anyio                 3.5.0
argon2-cffi           21.3.0
argon2-cffi-bindings  21.2.0
asttokens             2.0.5
attrs                 23.1.0
Babel                 2.11.0
backcall              0.2.0
beautifulsoup4        4.12.2
bleach                4.1.0
Brotli                1.0.9
certifi               2023.7.22
cffi                  1.15.1
charset-normalizer    2.0.4
colorama              0.4.6
comm                  0.1.2
cryptography          41.0.3
debugpy               1.6.7
decorator             5.1.1
defusedxml            0.7.1
entrypoints           0.4
executing             0.8.3
fastjsonschema        2.16.2
idna                  3.4
ipykernel             6.25.0
ipython               8.15.0
ipython-genutils      0.2.0
ipywidgets            8.0.4
jedi                  0.18.1
Jinja2                3.1.2
joblib                1.3.2
json5                 0.9.

In [25]:
# create requirements.txt and list the packages in it using conda
!conda list > requirements.txt

## Installer des packages listés dans le fichier requirements.txt

```shell
# Installation avec conda
!conda install -c conda-forge --file requirements.txt
```

## organisation de dossiers quand vous commencez un nouveau projet

Il est recommandé d'avoir une organisation de dossiers claire. Par exemple on la workflow ci-dessous:

```python
# Create a folder called `myproject`
mkdir myproject

# change directory to `myproject`
cd myproject

# Create folders notebook, src and data
mkdir notebook src data

# list all folders and create ___init__.py in each folders

```

Dans Python, un package est simplement un moyen d'organiser des modules connexes dans une hiérarchie de répertoires unique. Le fichier `__init__.py` sert d'initialiseur pour le package, et sa présence indique à Python qu'un répertoire doit être traité comme un package ou un sous-package.

Lorsqu'un package est importé, le fichier `__init__.py` est implicitement exécuté, et les objets qu'il définit sont liés à des noms dans l'espace de noms du package ¹. Le fichier `__init__.py` peut contenir le même code Python que tout autre module et Python ajoutera quelques attributs supplémentaires au module lorsqu'il est importé.

Le fichier `__init__.py` est également utilisé pour créer des packages imbriqués. Par exemple, si vous avez un répertoire `foo` qui contient un fichier `__init__.py`, vous pouvez créer un sous-répertoire `bar` qui contient également un fichier `__init__.py`. Cela créera un package imbriqué appelé `foo.bar`.

In [29]:
# folders creation
!mkdir notebook src data

In [35]:
# function to list all folders and create __init__.py in each folder
#!find . -type d -exec touch {}/__init__.py \;
import os

def create_init_files(root_dir):
    """Create __init__.py in each folder"""
    for dirpath, dirnames, filenames in os.walk(root_dir):
        for dirname in dirnames:
            init_file = os.path.join(dirpath, dirname, '__init__.py')
            if not os.path.exists(init_file):
                with open(init_file, 'w') as f:
                    f.write('')

create_init_files('.')
print("done!")

done!


Ensuite vous pouvez créer un fichier python `test_py.py` dans le dossier `src`.

In [1]:
# import d'une fonction du dossier src
from src.test_py import hello

hello()

Hello World!


## Suppression d'un environnement virtuel

```python
# delete the virtual environment sous linux
!rm -rf myproject

# delete the virtual environment sous windows avec conda
!conda env remove -n myproject
```

## Association d'un dosier local avec un repertoire virtuel

1. ETape 1: création d'un repo test sur votre votre
2. Suivre les étape ci-dessous depuis un terminal:
```bash
echo "# test" >> README.md
git init
git add README.md
git commit -m "first commit"
git branch -M main
git remote add origin https://github.com/ssime-git/test.git
git push -u origin main
```

## Création de repo Github depuis un invite de commande (pour des utilisations avancées)

En régle générale, on peut créer les repo github depuis le navigateur internet. C'est la méthode la plus simple. Il est possible de créer un dépôt GitHub à partir d'une invite de commande en utilisant l'outil `hub`. `hub` est une extension de la ligne de commande Git qui ajoute des fonctionnalités GitHub. Vous pouvez utiliser la commande `hub create` pour créer un nouveau dépôt sur GitHub. Voici les étapes à suivre:

1. Installez `hub` en suivant les instructions sur le site officiel de `hub`.

2. Ouvrez une invite de commande et accédez au répertoire local que vous souhaitez pousser vers GitHub.

3. Exécutez la commande `git init` pour initialiser un nouveau référentiel Git.

4. Exécutez la commande `hub create` pour créer un nouveau dépôt sur GitHub.

5. Suivez les invites pour configurer le dépôt, y compris le nom, la description et la visibilité.

6. Exécutez la commande `git push -u origin master` pour pousser votre code local vers le dépôt distant.

Cela créera un nouveau dépôt sur GitHub à partir de l'invite de commande et poussera votre code local vers le dépôt distant.

Pour plus de détails voir https://hub.github.com/.

# Conclusion

Vous voilà prêt à démarrer vos projets avec Github, Jupyter Notebook, Vs Code et Python!