## 🧠 Qu’est-ce qu’un modèle de chat ?

Les **modèles de chat** sont des interfaces qui permettent d'interagir avec des **grands modèles de langage (LLM)** via une série de messages, simulant ainsi une conversation humaine. LangChain fournit une interface cohérente pour travailler avec ces modèles, indépendamment du fournisseur, tout en offrant des fonctionnalités supplémentaires pour le suivi, le débogage et l'optimisation des performances des applications utilisant des LLM

---

## 🚀 Fonctionnalités principales

- 🔧 **Appel d’outils (Tool Calling)** : permet aux modèles d'exécuter des fonctions personnalisées (APIs, outils externes, agents...).
- 🧾 **Sortie structurée** : génère des réponses JSON selon un schéma défini.
- 🖼️ **Multimodalité** : certains modèles traitent du texte, mais aussi des images ou du son.
- 🌊 **Streaming** : renvoie les réponses progressivement, token par token.
- 🧺 **Batching** : traitement de plusieurs requêtes en parallèle pour optimiser les appels.

---

## ⚙️ Paramètres standards des modèles

| Paramètre        | Description                                                                 |
|------------------|-----------------------------------------------------------------------------|
| `model`          | Nom du modèle à utiliser (ex. `gpt-4`, `claude-3-opus`).                    |
| `temperature`    | Contrôle la créativité : `0` (réponse fiable) → `1` (réponse imaginative).   |
| `max_tokens`     | Nombre maximum de tokens générés.                                           |
| `stop`           | Liste de séquences où la génération doit s’arrêter.                         |
| `timeout`        | Délai maximal d’attente de réponse (en secondes).                           |
| `max_retries`    | Nombre de tentatives en cas d’échec de l’appel.                             |
| `api_key`        | Clé API pour authentification.                                              |
| `base_url`       | URL personnalisée du fournisseur si nécessaire.                             |
| `rate_limiter`   | Contrôle du débit pour éviter les erreurs de quota.                         |

---

## 🛠️ Méthodes disponibles

- `invoke(messages)`  
  Appel standard d’un modèle de chat avec une liste de messages.

- `stream(messages)`  
  Retourne la réponse en temps réel, idéale pour le live chat.

- `with_structured_output(schema)`  
  Contraint la sortie à respecter un format structuré (ex : dictionnaire Python).

- `bind_tools(tools)`  
  Connecte des outils externes à utiliser durant la conversation.

---

## 🔗 Fournisseurs compatibles

LangChain supporte les principaux fournisseurs :
- **OpenAI**
- **Anthropic**
- **Azure OpenAI**
- **Ollama**
- **Amazon Bedrock**
- **Google Vertex AI**
- **Hugging Face**
- **Groq**, etc.


