# Prise en main de `jupyter_ai` avec `ollama`

On commence par charger l'extension pour être en mesure de l'utiliser.

In [1]:
# Load the jupyter_ai_magics extension
%load_ext jupyter_ai_magics

Permet de vérifier que l'extension fonctionne correctement.

In [5]:
# Check available AI models
%ai list ollama

| Provider | Environment variable | Set? | Models |
|----------|----------------------|------|--------|
| `ollama` | Not applicable. | <abbr title="Not applicable">N/A</abbr> | See [https://www.ollama.com/library](https://www.ollama.com/library) for a list of models. Pass a model's name; for example, `deepseek-coder-v2`. |


## Utilisation de l'extension

La syntaxe générale pour utiliser l'extension est la suivante :

```txt
%%ai <provider>:<model-name>
<prompt>
```

* `provider` : nom du fournisseur du modèle. On va utiliser ici `ollama` mais vous êtes tout à fait libre  d'utiliser un autre fournisseur comme `openai`, `Anthropic`, etc.
*  `model-name` : le nom du modèle.
*  `prompt` : l'instruction à passer au modèle.

In [7]:
%%ai ollama:llama3.2
Décrire simplement le prompt engineering en une phrase

Le **prompt engineering** est un processus de rédaction et d'amélioration des instructions pour les modèles de langage artificiels, permettant de obtenir des résultats plus précis et pertinents.

Spécifier le nom du modèle peut être fastidieux à la longue. Il est possible de définir un modèle par défaut.

In [5]:
%config AiMagics.default_language_model = "ollama:llama3.2"

In [6]:
%%ai
hello comment ça va ?

# Bonjour !

Il fait bien, merci ! Et vous ? Comment allez-vous aujourd'hui ?

### Comment puis-je vous aider ?

Vous avez besoin d'aide ou de conseils sur un sujet précis ? N'hésitez pas à me poser vos questions et je ferai de mon mieux pour vous aider.

On peut voir que le modèle utilisé (ici `llama3.2` n'est pas très performant en français. Essayons autre chose.

In [15]:
text = """
Le contexte
La tâche
Le persona
Le format de sortie
La tonalité
etc.
"""

In [16]:
%%ai
Quels sont les 6 composantes d'un prompt
Tu as quelques éléments dans ce text {text}

# Composantes d'un prompt

*   **Contexte** : Le contexte dans lequel le modèle de langage doit fonctionner.
*   **Tâche** : L'objet ou la tâche à accomplir avec le modèle de langage.
*   **Persona** : Le persona ou l'utilisateur cible que le modèle de langage doit simuler.
*   **Format de sortie** : Le format de sortie attendu par le modèle de langage (par exemple, texte, liste, etc.).
*   **Tonalité** : La tonalité ou le niveau d'formulé que le modèle de langage doit adopter.
*   **Contraintes** : Les contraintes ou les limites à prendre en compte lors de la réponse.

Les petits modèles de langage ont une connaissance limitée et donc une forte tendance à halluciner.

## Les autres fonctionnalités de `jupyter_ai`

In [18]:
%%ai -f code
Ecrire une fonction qui additionne 2 nombres
Inclure un exemple d'utilisation

In [19]:
def addition(x, y):
    return x + y

# Exemple d'utilisation :
resultat = addition(5, 7)
print(resultat)  # Affiche la valeur de résultat

12


On peut voir que le code fonctionne correctement.

On peut aller plus loin en demandant au modèle d'expliquer le code et plus généralement la syntaxe Python

In [22]:
%%ai
Expliquer la syntaxe python du code ci-dessous pour un débutant en python. Inclure des bonnes pratiques et convention de code
--
{In[19]}

**Exemple de code Python**
=========================

### Fonction `addition`

*   `def` est l'élément qui commence une définition de fonction en Python.
*   `addition` est le nom de la fonction.

### Paramètres

*   La fonction prend deux paramètres : `x` et `y`. Ces paramètres ne sont pas typés, ce qui peut entraîner des erreurs si nous utilisons les valeurs incorrectes.

```python
def addition(x: int, y: int) -> int:
    """
    Additionne deux nombres entiers et renvoie le résultat.

    Args:
        x (int): Le premier nombre à ajouter.
        y (int): Le second nombre à ajouter.

    Returns:
        int: La somme de x et y.
    """
    return x + y
```

### Exemple d'utilisation

*   `resultat` est une variable qui stocke le résultat de l'appel à la fonction `addition`.
*   Nous utilisons un style de documentation Python (`"""`) pour fournir des informations supplémentaires sur la fonction.

```python
# Exemple d'utilisation :
resultat = addition(5, 7)
print(resultat)  # Affiche la valeur de résultat
```

### Sortie attendue

*   L'expression `return x + y` renvoie le résultat de l'opération entre `x` et `y`.

```markdown
# Sortie attendue :
12
```

**Meilleures pratiques**

*   Utiliser des types de données pour les paramètres pour améliorer la sécurité et faciliter la maintenance du code.
*   Utiliser un style de documentation Python (`"""`) pour fournir des informations supplémentaires sur les fonctions et les modules.

**Code complet**
-----------------

```python
def addition(x: int, y: int) -> int:
    """
    Additionne deux nombres entiers et renvoie le résultat.

    Args:
        x (int): Le premier nombre à ajouter.
        y (int): Le second nombre à ajouter.

    Returns:
        int: La somme de x et y.
    """
    return x + y

# Exemple d'utilisation :
resultat = addition(5, 7)
print(resultat)  # Affiche la valeur de résultat
```

**Conclusion**
--------------

Cette exemple nous montre comment créer une fonction simple pour l'addition en Python. Les meilleures pratiques et les conventions de code utilisées dans cet exemple peuvent aider à améliorer la qualité et la maintenance du code.

Essayons maintenant un code en Python non fonctionnel.

In [23]:
# creation d'une liste
liste = [1, 2, 3]

# récupération du dernier élément de la liste
liste[len(liste)]

IndexError: list index out of range

In [24]:
%%ai
expliquer l'erreur ci-dessous:
--
{Err[23]}

**Erreur d'IndexError**
=====================

L'erreur `IndexError` est déclenchée lorsque vous essayez d'accéder à un élément d'une liste en utilisant une position qui n'existe pas.

### Explication de l'erreur

Dans cet exemple, nous créons une liste avec trois éléments : `[1, 2, 3]`. Lorsque nous utilisons la syntaxe `liste[len(liste)]`, nous essayons d'accéder à l'élément du dernier index de la liste.

Cependant, si nous avons seulement deux éléments dans la liste (à savoir les indices 0 et 1), alors `len(liste)` renvoie la valeur `2`. Ensuite, lorsque nous essayons d'accéder au troisième élément (`liste[2]`), Python nous dit que c'est une erreur car l'index `2` n'existe pas dans la liste.

**Erreurs possibles**
-------------------

*   **Index out of range**: L'erreur la plus courante est lorsque vous essayez d'accéder à un élément avec une position qui n'existe pas.
*   **TypeError**: On peut rencontrer également des erreurs `TypeError` si le type de données utilisé pour l'index n'est pas compatible avec le type de données utilisé dans la liste.

### Correction
----------------

Pour éviter cette erreur, vous pouvez vérifier si la position indexée est valide avant d'essayer d'accéder à l'élément :

```markdown
# Correction :
if len(liste) > 0:
    print(liste[len(liste)])
else:
    print("La liste est vide.")
```

Dans cet exemple, nous vérifions si la longueur de la liste est supérieure à zéro avant d'essayer d'accéder au dernier élément. Si la liste est vide, nous affichons un message de erreur.

**Exemple complet**
-----------------

```python
liste = [1, 2, 3]

# Vérification si la liste n'est pas vide
if len(liste) > 0:
    # Récupération du dernier élément
    print(liste[len(liste)])
else:
    # Message d'erreur si la liste est vide
    print("La liste est vide.")
```

**Conclusion**
--------------

L'erreur `IndexError` peut être évitée en vérifiant si le position indexée est valide avant d'essayer d'accéder à l'élément.

L'explication est pertinente mais le modèle n'a pas eu toutes les informations concernant le contexte.

In [25]:
%%ai --format code
The following Python code:
--
{In[23]}
--
produced the following Python error:
--
{Err[23]}
--
Write a new version of this code that does not produce that error.

In [None]:
# creation d'une liste
liste = [1, 2, 3]

# récupération du dernier élément de la liste
last_element_index = len(liste) - 1
print(liste[last_element_index])

Pour aller plus loin, consulter [ce site](https://jupyter-ai.readthedocs.io/en/latest/users/index.html#configuration)

# Import d'un jeu de données

In [2]:
import pandas as pd

In [8]:
df = pd.read_csv("adults_census.csv")
print(df.shape)
df.head(2)

(48842, 16)


Unnamed: 0.1,Unnamed: 0,age,workclass,fnlwgt,education,education_num,marital_status,occupation,relationship,race,sex,capital_gain,capital_loss,hours_per_week,native_country,income
0,0,39,State-gov,77516,Bachelors,13,Never-married,Adm-clerical,Not-in-family,White,Male,2174,0,40,United-States,<=50K
1,1,50,Self-emp-not-inc,83311,Bachelors,13,Married-civ-spouse,Exec-managerial,Husband,White,Male,0,0,13,United-States,<=50K


In [11]:
%%ai
can you give a simple explanation of columns
--
{Out[8]}

**Ce qui sont les colonnes d'un tableau de données ?**

Une colonne est une unité de données qui contient des informations relatives à un seul aspect du tableau. Les colonnes sont organisées horizontalement et sont souvent étiquetées avec des noms pour faciliter la compréhension.

**Exemple :**

Dans le tableau donné, il y a 8 colonnes :

* `Unnamed: 0` est l'index unique de chaque ligne
* `age`, `workclass`, `fnlwgt`, `education`, etc. sont les colonnes qui contiennent des informations sur la personne, comme son âge, sa classe d'emploi, son poids corporel, etc.
* Les colonnes `marital_status`, `occupation`, `relationship`, `race` et `sex` contiennent des informations relatives à la vie personnelle et aux caractéristiques de la personne
* Les colonnes `capital_gain`, `capital_loss`, `hours_per_week` et `income` contiennent des informations sur les revenus et les activités professionnelles

**En résumé :**

Une colonne est une unité de données qui contient des informations relatives à un seul aspect du tableau. Les colonnes sont organisées horizontalement et peuvent contenir différents types de données, comme des nombres, des textes ou des catégories.

In [26]:
%%ai -f code
Write the code to load the data
and specifyng the index column
--
{In[8]}
--
{Out[8]}

In [None]:
import pandas as pd

df = pd.read_csv("adults_census.csv", index_col=0)
print(df.shape)
df.head()