Skip to content

pavelkochkin1/fake-classification-kontur

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

39 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

FakeClassifier - тестовое задание Контур.

CLI Сервис который определяет является ли новость фейковой или нет.

To-do list

  • Ресерч
  • Поиск подходящей модели для дообучения SkolkovoInstitute/russian_toxicity_classifier
  • Эксперименты с лемматизацией и стопсловами
  • Подбор параметров
  • Создание скриптов для обучения
  • Создание скриптов для предсказаний
  • Создание мини-сервиса на flask
  • Docker

Инструкция:

  • установите необходимые зависимости pip install -r requirements.txt
  • настройте под себя параметры в config.yml, если решаете свою задачу.
  • если необходимо, вы можете изменить предобработку данных внутри solution/data.py
  • модель находится в solution/model.py
  • Обучение модели python solution/train.py
  • Запуск из консоли python solution/predict.py -f [FILE PATH]
  • Или python solution/predict.py -t [TEXT]

Исходный код

  • predictions.tsv - предсказания на тестовых данных от Контур
  • config.yml - параметры предобработки, обучения модели и другие
  • dataset/ - содержит датасеты для обучения и тестирования задачи от Контур
  • img/ - скрины с метриками по ранее использованным моделям
  • solution/data.py - внутри находится функция для подготовки данных к обучению
  • solution/model.py - модель для обучения
  • solution/train.py - скрипт для обучения модели и предсказания на тестовых данных
  • solution/evaluating.py - функции для вывода метрик и создания предсказания на новых данных
  • solution/predict.py - скрипт для использования предобученной модели из train.py по инструкции выше
  • solution/utils.py - логика обработки текстов и некоторые дополнительные функции
  • solution/rubert_and_catalyst.ipynb - ноутбук с обучением модели и созданием всей логики будущего скрипта
  • solution/UsingByTerminal.ipynb - пример использования скриптов

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages