Skip to content

Latest commit

 

History

History
64 lines (40 loc) · 9.27 KB

about.markdown

File metadata and controls

64 lines (40 loc) · 9.27 KB
layout
about

Обо мне

me

Меня зовут Рустем Галиуллин. Работаю в сфере Data Science и реализую проекты с использованием технологий машинного обучения. Обладаю опытом работы со структурированными данными и анализа неструктурированной информации: текста, изображений и видео.

Я решил посвятить этот блог статьям о своих проектах для продукт-менеджеров, аналитиков и управленцев. В сети много материала с детальными техническими подробностями алгоритмов, которые будут полезны техническим экспертам, или маркетинговых статей в популярных медиа – для широкой публики. Этот блог может стать чем-то средним для людей, которые заинтересованы в применении технологий машинного обучения в своих проектах, но необязательно умеют или хотят программировать.

Опыт работы

  • 2019 - по н.в. Ведущий специалист Data Science, место - ОАЭ. Проекты связаны с анализом текстовых и медиа-данных из открытых источников информации
  • 2019 - Инженер-исследователь компьютерного зрения, место - Москва. Разрабатывал алгоритмы для обработки изображений и видео
  • 2017-2019 - Специалист Data Science, место - Казань, Россия. Решение задач, связанных с обработкой структурированных больших данных

Обучение и курсы

О рабочих процессах

Здесь хочу поделиться некоторыми взглядами на реализацию проектов, которые я выработал за последние несколько лет.

Scrum и машинное обучение

Я часто слышу от самих дата-саентистов и тех, кто утверждает, что разбирается в профессии: скрам не применим в исследовательской работе. Они говорят, что разработка алгоритмов и весь исследовательский процесс не предсказуем и никак не может уложиться в двухнедельные спринты.

Наиболее частые проблемы, которые я наблюдал при таком подходе, – люди, ставившие задачи не могли получить ответ о сроках и скоупе работы. Часто финальный результат не совпадал с изначальными ожиданиями заказчика. Это легко себе представить: мировоззрение исследователя отличается от мировоззрения продукт-менеджера.

Я настаиваю на том, что применять скрам можно и нужно. Если саентисту описать пользовательскую историю и ожидаемый результат, то ему будет намного легче понять, какие методы применить можно, а какие нельзя. Какие будут ограничения и как в итоге будет использоваться обученная модель.

Да, невозможно обещать определенный уровень точности алгоритма или построения всего пайплана, начиная от сбора данных, завершая оценкой обученного алгоритма к концу спринта. Но можно определить методы и шаги, которые необходимо сделать в течение спринта, - это уже более четкая постановка задачи, на которую может "подписаться" дата-саентист.

Плохие примеры Хорошие примеры
Улучшить алгоритм распознавания лиц Применить center loss при обучение модели распознавания лиц
Исследовать алгоритмы анализа тональности текста Собрать датасеты, метрики и подходы для обучения алгоритма анализа тональности

Описание задач в этом случае не звучит как фича для пользователей. Однако дает исполнителю понять, какие результаты от него ожидает команда.

Netflix команды

Мне близка идея отношения между специалистами по модели Netflix. Их подход утверждает:

"мы не семья, мы - команда!"

Это означает, что ты не обязан относится к членам команды, как к членам семьи, т.е. любить и поддерживать несмотря ни на что. Наоборот, команда разработчиков похожа на футбольную команду: в ее составе должны играть лучшие. Вся команда заинтересована в достижении результата. На основе этого происходит перераспределение бонусов и ресурсов. Заказчики требуют от членов команды результатов выше средних по рынку, и за это дают соответствующие вознаграждения.

Как стать дата саентистом?

Наиболее частый вопрос. Видимо он связан с некоторым хайпом вокруг профессии. Думаю не бывает, что человек занимается чем-то совсем иным, затем резко решает освоить новые навыки программирования, статистики и математики и идет работать специалистом по машинному обучению. Чаще происходит по следующему сценарию: работая в смежной специальности, возникает необходимость применения методов машинного обучения или статистики, проявляется интерес и вовлеченность. Дальше возникает желание изучить эту дисциплину поглубже.

Действенный способ достижения успеха в какой-то сфере описан в книге "So Good They Can't Ignore You". Автор утверждает, что подход "бросить все и следовать мечте" таит множество подводных камней и в корне неправильный. Напротив, Cal Newport предлагает другой алгоритм достижения успеха: полюбить то, чем занимаешься и научиться делать это лучше. Затем начать копить карьерный капитал и контролировать свой карьерный путь. В какой-то момент твоя ценность для работодателя значительно превысит уровень его предложения.

Контакты