lien streamlit : https://softway-llm-rqp.streamlit.app/
Ce projet permet d'analyser et de comparer différents modèles LLM pour identifier le meilleur rapport qualité/prix pour une entreprise en 2025.
- Python 3.8 ou supérieur
- Windows, macOS ou Linux
Sur Windows :
venv\Scripts\activateSur macOS/Linux :
source venv/bin/activateLes dépendances devraient déjà être installées, mais si besoin :
pip install -r requirements.txtAprès avoir activé l'environnement virtuel :
jupyter notebookOu avec JupyterLab :
jupyter lab- Ouvrir le fichier :
comparaison modeles IA/analyse_llm_qualite_prix.ipynb - Exécuter les cellules une par une (Shift + Enter) ou toutes ensemble (Cell > Run All)
Le notebook contient :
- Import et chargement des données : Importation des bibliothèques et chargement des CSV
- Exploration des données : Statistiques descriptives et aperçu des données
- Calcul des métriques :
- Score de qualité global
- Score rapport qualité/prix
- Score entreprise (qualité + prix + vitesse)
- Analyses :
- Top 10 meilleur rapport qualité/prix
- Top 10 meilleurs pour entreprises
- Visualisations graphiques
- Recommandations par cas d'usage
- Conclusion : Recommandation finale du meilleur modèle
data/
├── venv/ # Environnement virtuel Python
├── comparaison modeles IA/
│ ├── llm_comparison_dataset.csv # Dataset principal
│ ├── large_scale_ai_models.csv # Dataset complémentaire
│ └── analyse_llm_qualite_prix.ipynb # Notebook d'analyse
├── requirements.txt # Dépendances Python
└── README.md # Ce fichier
- Quality_Score : Score de qualité combinant MMLU, Chatbot Arena et Quality Rating
- Qualite_Prix_Score : Rapport qualité/prix optimisé
- Score_Entreprise : Score global pour entreprises (qualité 50%, prix 30%, vitesse 20%)
- Exécutez les cellules dans l'ordre pour une analyse complète
- Modifiez les pondérations dans la section "Calcul des métriques" pour adapter à vos besoins
- Explorez les différents graphiques pour visualiser les tendances
- Consultez les recommandations par cas d'usage pour des choix spécifiques
- Les données sont normalisées pour permettre la comparaison entre modèles
- Les scores Open Source vs Propriétaire sont également analysés
- Les visualisations sont interactives et peuvent être ajustées