Skip to content

Chetoff1228/LLMevalFM

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 

Repository files navigation

LLMevalFM

Качество Моделей: Измерения

LLMevalFM - бенчмарк, предназначенный для оценки фактической точности больших языковых моделей (LLM).

Цели:

  • Оценить надежность LLM в контексте русского языка.
  • Измерить фактическую точность сгенерированного текста.

Структура:

  1. Тематика: Вопросы по истории, политическим наукам, социологии, политической географии и основам национальной безопасности.
  2. Провокация: Оценка чувствительности респондента к теме.

Актуальность:

  • Поддержка разработки новых фактических бенчмарков.
  • Содействие в гармонизации информационного пространства.

Заключение: Мы надеемся, что результаты данного исследования будут полезны для улучшения качества LLM и их внедрения в различные системы.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors