# Décryptage des difficultés des développeurs face aux LLMs


## Objectif

Ce projet est basé sur l’article [“An Empirical Study on Challenges for LLM Application Developers”](https://dl.acm.org/doi/pdf/10.1145/3715007).  
Il vise à :

- Comprendre la méthodologie empirique utilisée
- Analyser la structure de la taxonomie des défis liés aux LLM
- Identifier les implications pratiques pour les plateformes et APIs LLM
- Proposer des solutions concrètes sous forme d’outils ou de ressources communautaires



## 1. Méthodologie (Section 3)

### Principales décisions méthodologiques

- Les auteurs ont analysé **98 posts de développeurs** sur Reddit, GitHub, Stack Overflow et Hacker News.
- La méthode utilisée est une **analyse qualitative thématique**, appuyée par une stratégie de **codage inductif**.
- Les participants étaient des développeurs de LLMs expérimentés (projets open-source, outils internes).

### Validité et fiabilité

- Codage réalisé de façon **indépendante par deux chercheurs**, puis confrontation des catégories.
- Utilisation de **l’approche par saturation** : le codage s’est arrêté lorsque plus aucun nouveau thème n’émergeait.
- Les exemples et citations ont été validés par **triangulation des sources**.




## 2. Taxonomie des défis (Section 6)

Voici la taxonomie des défis rencontrés par les développeurs utilisant des LLMs :

### Taxonomie en hiérarchie :

- **1. Prompt Engineering**
  - Difficulté à concevoir des prompts efficaces
  - Manque de généralisation des prompts
- **2. Tooling & Infrastructure**
  - Manque d’outils pour le débogage
  - Limites des API et interfaces
- **3. Evaluation & Testing**
  - Absence de métriques fiables
  - Evaluation subjective ou qualitative
- **4. Cost & Performance**
  - Coût élevé des appels LLM
  - Latence et instabilité des réponses
- **5. LLM Behavior**
  - Hallucinations et incohérences
  - Difficulté de contrôle du style ou du ton
- **6. Security & Ethics**
  - Biais et contenus offensants
  - Risques de fuites de données




## 3. Analyse et implications

### Quels types de défis dominent le développement LLM ?

Les défis dominants sont liés à **l’engineering de prompt**, **l’évaluation**, et **la compréhension du comportement des modèles**.  
Les développeurs peinent à **maîtriser le comportement des LLMs**, à tester de manière fiable, et à obtenir des résultats consistants.

### Implications pour le design des APIs / plateformes LLM

- Les APIs doivent **intégrer des outils d’évaluation intégrés** (métriques, scoring subjectif + quantitatif)
- Il est nécessaire d’offrir des **outils interactifs pour l’ingénierie de prompt** avec visualisation des variantes
- Les plateformes doivent mieux **documenter les comportements non-déterministes** et **exposer les limites connues**




## 4. Idées d’outils ou ressources communautaires

### 1. LLM Prompt Playground Collaboratif

- Interface open-source où les développeurs peuvent tester des prompts, voir les résultats d’autres utilisateurs, et évaluer leur efficacité.
- Historique, scoring collaboratif, suggestions automatisées, partage de "recipes".

### 2. Guide vivant des erreurs LLM

- Une base de connaissance partagée, type wiki, contenant les erreurs fréquentes (hallucinations, biais, incohérences) par type de modèle et cas d’usage.
- Enrichie par la communauté et validée par des experts.

