Skip to content

Ollldman/MLScriptAutomatize

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Скрипт для автоматизации рутинных задач инженера машинного обучения

1. Задачи, которые необходимо решить.

  1. Автоматизация загрузки данных из различных источников:

    • csv / excel, +
    • API (Kaggle)
    • Локальная база данных (Реляционная SQL СУБД на примере PostgreSQL), +
    • Не реляционная база данных (NoSQL - MongoDB),
    • Документация по модулям загрузки данных.
  2. Валидация данных при загрузке

    • Проверка на дубликаты,
    • Проверка пропусков и корректности данных,
    • Выявление и обработка выбросов,
    • Логирование результатов валидации,
    • Документация по модулям валидации данных.
  3. Очистка данных

  4. Анализ данных

  5. Отчетность

  6. Интеграция с бизнесс-процессами

  7. Документация и тестирование.




Codewars

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages