layout |
---|
about |
Я решил посвятить этот блог статьям о своих проектах для продукт-менеджеров, аналитиков и управленцев. В сети много материала с детальными техническими подробностями алгоритмов, которые будут полезны техническим экспертам, или маркетинговых статей в популярных медиа – для широкой публики. Этот блог может стать чем-то средним для людей, которые заинтересованы в применении технологий машинного обучения в своих проектах, но необязательно умеют или хотят программировать.
- 2019 - по н.в. Ведущий специалист Data Science, место - ОАЭ. Проекты связаны с анализом текстовых и медиа-данных из открытых источников информации
- 2019 - Инженер-исследователь компьютерного зрения, место - Москва. Разрабатывал алгоритмы для обработки изображений и видео
- 2017-2019 - Специалист Data Science, место - Казань, Россия. Решение задач, связанных с обработкой структурированных больших данных
- Специлиазация Deep Learning deeplearning.ai (2018)
- Курс Deep Learning Udacity (2018)
- Вводный курс Analytics Edge (2016)
- Магистратура University of Arkansas, "Экономика и информационные системы" (2016)
- Бакалавриат Казанского федерального университета, "Бухучет, анализ и аудит" (2014)
Здесь хочу поделиться некоторыми взглядами на реализацию проектов, которые я выработал за последние несколько лет.
Я часто слышу от самих дата-саентистов и тех, кто утверждает, что разбирается в профессии: скрам не применим в исследовательской работе. Они говорят, что разработка алгоритмов и весь исследовательский процесс не предсказуем и никак не может уложиться в двухнедельные спринты.
Наиболее частые проблемы, которые я наблюдал при таком подходе, – люди, ставившие задачи не могли получить ответ о сроках и скоупе работы. Часто финальный результат не совпадал с изначальными ожиданиями заказчика. Это легко себе представить: мировоззрение исследователя отличается от мировоззрения продукт-менеджера.
Я настаиваю на том, что применять скрам можно и нужно. Если саентисту описать пользовательскую историю и ожидаемый результат, то ему будет намного легче понять, какие методы применить можно, а какие нельзя. Какие будут ограничения и как в итоге будет использоваться обученная модель.
Да, невозможно обещать определенный уровень точности алгоритма или построения всего пайплана, начиная от сбора данных, завершая оценкой обученного алгоритма к концу спринта. Но можно определить методы и шаги, которые необходимо сделать в течение спринта, - это уже более четкая постановка задачи, на которую может "подписаться" дата-саентист.
Плохие примеры | Хорошие примеры |
---|---|
Улучшить алгоритм распознавания лиц | Применить center loss при обучение модели распознавания лиц |
Исследовать алгоритмы анализа тональности текста | Собрать датасеты, метрики и подходы для обучения алгоритма анализа тональности |
Описание задач в этом случае не звучит как фича для пользователей. Однако дает исполнителю понять, какие результаты от него ожидает команда.
Мне близка идея отношения между специалистами по модели Netflix. Их подход утверждает:
"мы не семья, мы - команда!"
Это означает, что ты не обязан относится к членам команды, как к членам семьи, т.е. любить и поддерживать несмотря ни на что. Наоборот, команда разработчиков похожа на футбольную команду: в ее составе должны играть лучшие. Вся команда заинтересована в достижении результата. На основе этого происходит перераспределение бонусов и ресурсов. Заказчики требуют от членов команды результатов выше средних по рынку, и за это дают соответствующие вознаграждения.
Наиболее частый вопрос. Видимо он связан с некоторым хайпом вокруг профессии. Думаю не бывает, что человек занимается чем-то совсем иным, затем резко решает освоить новые навыки программирования, статистики и математики и идет работать специалистом по машинному обучению. Чаще происходит по следующему сценарию: работая в смежной специальности, возникает необходимость применения методов машинного обучения или статистики, проявляется интерес и вовлеченность. Дальше возникает желание изучить эту дисциплину поглубже.
Действенный способ достижения успеха в какой-то сфере описан в книге "So Good They Can't Ignore You". Автор утверждает, что подход "бросить все и следовать мечте" таит множество подводных камней и в корне неправильный. Напротив, Cal Newport предлагает другой алгоритм достижения успеха: полюбить то, чем занимаешься и научиться делать это лучше. Затем начать копить карьерный капитал и контролировать свой карьерный путь. В какой-то момент твоя ценность для работодателя значительно превысит уровень его предложения.