LLMevalFM

Качество Моделей: Измерения

LLMevalFM - бенчмарк, предназначенный для оценки фактической точности больших языковых моделей (LLM).

Цели:

Структура:

Тематика: Вопросы по истории, политическим наукам, социологии, политической географии и основам национальной безопасности.
Провокация: Оценка чувствительности респондента к теме.

Актуальность:

Заключение: Мы надеемся, что результаты данного исследования будут полезны для улучшения качества LLM и их внедрения в различные системы.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
README.md		README.md

Provide feedback