# 🤖 Formation RAG - Partie 2

# 🚧 Séquence 2.0 – Installation d’Ollama & des modèles

## 🛠️ Installation d’Ollama

Cette cellule télécharge et installe **Ollama**, un outil qui permet de faire tourner des modèles d’intelligence artificielle (comme des LLMs) localement sur la machine, sans avoir besoin d’une connexion à un service cloud.

Utiliser des modèles localement présente plusieurs avantages :
- **Confidentialité** : les données ne sortent pas de votre machine
- **Coût** : pas besoin de serveur distant ou d’API payante
- **Performance** : temps de réponse plus rapide dans certains cas

In [None]:
!curl -fsSL https://ollama.com/install.sh | sh

## 🚀 Lancement d'Ollama en arrière‑plan
Cette cellule sert à lancer le serveur Ollama, c’est-à-dire à démarrer l’outil qui fera fonctionner un modèle d’IA localement.

###💡 Pourquoi on fait ça ?
Pour interagir avec un modèle d’intelligence artificielle installé localement, il faut d’abord démarrer un service en fond qui « écoute » et attend nos demandes.


In [None]:
import subprocess, time
ollama_proc = subprocess.Popen("ollama serve", shell=True)
time.sleep(2)
print('✅ Ollama est prêt')

## 📥 Téléchargement des modèles

Ici, on télécharge deux modèles LLM nécessaires pour la suite :

- **Llama 3.2 (3B)** : un modèle de génération de texte développé en open source par Meta
- **Nomic Embed Text** : un modèle spécialisé pour convertir du texte en vecteurs numériques (embeddings), utilisé plus tard dans la partie RAG

Ces modèles sont stockés localement pour être utilisés sans connexion externe.

### 💡 Pourquoi on fait ça ?
Les LLM sont pré-entraînés. Pour pouvoir les utiliser, il faut d’abord les télécharger sur votre machine, un peu comme si vous installiez une application.

Sans cela, le système ne saura pas quel modèle utiliser, ni comment répondre aux questions ou traiter les textes.

In [None]:
!ollama pull llama3.2:3B
!ollama pull nomic-embed-text:latest

# 🔗 Séquence 2.1 – Bootstrap Colab

## 🔌 Connexion à Google Drive
**Cette cellule permet de connecter Google Drive à l’environnement de travail.** Cela permet d’utiliser des fichiers (ex : jeux de données, documents, modèles) qui sont stockés dans votre Google Drive directement dans le Notebook.

### 💡 Pourquoi on fait ça ?
Cela évite de devoir uploader manuellement des fichiers à chaque fois.

In [None]:
from google.colab import drive
drive.mount("/content/gdrive")

## 👨‍💻 Clonage du repertoire Github
Cette cellule permet de copier un dossier contenant des fichiers depuis GitHub vers l’environnement de travail du notebook.

### 💡 Pourquoi on fait ça ?
GitHub est une plateforme utilisée pour stocker, partager du code ou des fichiers de projet. Ici, on télécharge les ressources nécessaires à la formation pour pouvoir les utiliser facilement dans les cellules suivantes.



In [None]:
%cd /content/gdrive/MyDrive
!git clone https://github.com/antoinecstl/FormationEYAI.git
%cd FormationEYAI

## 🛠️ Installation des dépendances

Cette cellule installe toutes les **bibliothèques Python** nécessaires à l'exécution du notebook, à partir du fichier `requirements.txt`.


### 💡 Pourquoi on fait ça ?
Plutôt que d’installer chaque outil un par un, ce fichier centralise tout, ce qui fait gagner du temps et évite les erreurs d’oubli ou d’incompatibilité.

In [None]:
%pip install -r requirements.txt

# 🏎️ Séquence 2.2 – Run de notre application

## 📘 Description pédagogique
Cette section permet de lancer votre application dans une interface web grace à Streamlit et de la rendre accessible depuis votre navigateur Internet grâce à un outil appelé LocalTunnel.

*   L’outil LocalTunnel, va permettre de partager l’application Streamlit via un lien web (nécessaire ici car nous somme dans un environnement google colab).

`import urllib + print(...)`
*   Affiche l’adresse IP publique de votre environnement pour référence (souvent inutile côté utilisateur, mais utile pour des logs ou du debug).

`!streamlit run app.py &>/content/logs.txt &`
*   Lance l’application Streamlit (app.py) en arrière-plan. C’est cette application qui permet d'interagir avec le modèle IA via une interface utilisateur.

`npx localtunnel --port 8501`
*   Crée un lien temporaire et public vers l'application, utilisable depuis n’importe quel navigateur.

# 💡 Pourquoi on fait ça ?
On crée ici une interface simple et accessible (dans un navigateur) pour interagir avec le modèle IA, sans écrire de code.
Et comme Google Colab ou certains environnements locaux n’ont pas d’adresse web fixe, LocalTunnel sert de pont entre votre application et le reste du monde.

In [None]:
import urllib
print("Password/Enpoint IP for localtunnel is:",urllib.request.urlopen('https://ipv4.icanhazip.com').read().decode('utf8').strip("\n"))
!streamlit run app_finale.py &>/content/logs.txt & npx localtunnel --port 8501