Репозиторий содержит ссылки на публичные Obsidian-хранилища, которые можно использовать как наборы данных для тестирования и разработки системы.
Цель репозитория — собрать качественные базы знаний в формате Obsidian, на которых можно проверять:
- корректность парсинга заметок
- извлечение ссылок
- семантический поиск
- анализ графа знаний, содержащегося в хранилище
- генерацию ответов на основе контекста
Каждое хранилище-набор данных должно удовлетворять следующим требованиям:
- Большое количество заметок (не несколько случайных файлов)
- Развитая система внутренних ссылок
- Хранилище должно в основном состоять из текстовых .md заметок. Активное использование плагинов, изображений и визуальных элементов нежелательно, поскольку на этапе разработки mvp их обработка не планируется
- Заметки на русском или английском языке
- Публичный доступ
- Специализированные знания, например:
- математика,
- физика,
- программирование,
- компьютерные науки,
- инженерные дисциплины и смежные области