Yandex.Practicum.DataScience/12 Классификация текстовых комментариев at main · hairymax/Yandex.Practicum.DataScience

History

Name		Name	Last commit message	Last commit date
parent directory ..
README.md		README.md
project12.ipynb		project12.ipynb

README.md

Классификация текстовых комментариев

Цель

Построить модель бинарной классификации текстовых комментариев на позитивные и негативные. Модель должна стать инструментом детекции токсичных комментариев для их последующей модерации.

Описание

Имеются набор данных с англоязычными комментариями с разметкой о их токсичности.

Необходимо построить модель со значением метрики качества F1 не меньше 0.75.

Используемые библиотеки

NLTK
tf-idf
LightGBM
Scikit-learn
Pandas
Matplotlib
Seaborn

Результаты

С испозьзованием кроссвалидации построены, обучены и протестированы разные модели машинного обучения.
Протестировано влияние разного способа векторизации корпуса слов на качество предсказания
Удалось достичь значения f1_score = 0.79

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

12 Классификация текстовых комментариев

12 Классификация текстовых комментариев

README.md

Классификация текстовых комментариев

Цель

Описание

Используемые библиотеки

Результаты

Files

12 Классификация текстовых комментариев

Directory actions

More options

Directory actions

More options

Latest commit

History

12 Классификация текстовых комментариев

Folders and files

parent directory

README.md

Классификация текстовых комментариев

Цель

Описание

Используемые библиотеки

Результаты