Skip to content

Conversation

@truff4ut
Copy link
Collaborator

No description provided.

@truff4ut truff4ut requested a review from voorhs November 12, 2024 05:36
Copy link
Collaborator

@voorhs voorhs left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

найс! можно продолжить работу в этом направлении

мне больше всего нравится что тут поддерживаются сплиты на трейн тест вал

@truff4ut truff4ut requested review from Samoed and voorhs November 20, 2024 11:01
Copy link
Collaborator

@voorhs voorhs left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

осталось добавить валидацию и пуш в hf hub

Comment on lines +32 to +33
if self.dataset.multilabel:
self.dataset = self.dataset.encode_labels()
Copy link
Collaborator

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

эти действия никак не вставить на этап загрузки датасета?

Copy link
Collaborator Author

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Надо подумать

Copy link
Collaborator

@voorhs voorhs left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Кажется надо удалить файл autointent/context/data_handler/scheme.py и соседние ему multilabel_generation.py и sampling.py. Они не используется и при этом вызывают ошибки тайпинга.

Плюс надо прогнать форматтер make lint

Еще я сейчас обнаружил что у нас есть целая фича не покрытая тестами: Tags. Надо будет заняться этим до релиза

@voorhs voorhs merged commit 4e1d43f into dev Nov 25, 2024
20 checks passed
@voorhs voorhs deleted the refactor/datasets branch November 25, 2024 15:33
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

4 participants