# Практика. API Headhunter

Проведем анализ вакансий для Data Science. Документация API hh: https://api.hh.ru/openapi/redoc

In [45]:
import requests
from bs4 import BeautifulSoup
import json
from tqdm import tqdm
import numpy as np
import pandas as pd
from time import sleep
from collections import Counter

Запросы к API всегда выстраиваются в таком формате: 

URL API + нужный раздел + API-ключ (по требованию) + параметры

https://api.hh.ru/vacancies?text=data%20science&only_with_salary=true&per_page=100

Что в этом запросе?

`https://api.hh.ru/vacancies` – запрос к БД с вакансиями \
`?text=data%20science` – прицепляем с помощью **?** первый параметр `text` с поиском по тексу вакансий \
`&only_with_salary=true` – все следующие параметры прицепляем через **&**. Ищем вакансии только с указанной з/п \
`&per_page=100` – используем пагинацию

In [8]:
vacancies = []

for i in range(0, 2):
    vac = requests.get(f"https://api.hh.ru/vacancies?text=data%20science&only_with_salary=true&per_page=100&page={i}")
    vacancies.extend(json.loads(vac.text)['items'])

In [10]:
vacancies[0]

{'id': '89601541',
 'premium': False,
 'name': 'Junior Backend Developer (Java)',
 'department': None,
 'has_test': False,
 'response_letter_required': False,
 'area': {'id': '2',
  'name': 'Санкт-Петербург',
  'url': 'https://api.hh.ru/areas/2'},
 'salary': {'from': 60000, 'to': 120000, 'currency': 'RUR', 'gross': True},
 'type': {'id': 'open', 'name': 'Открытая'},
 'address': {'city': 'Санкт-Петербург',
  'street': 'Аптекарский проспект',
  'building': '4',
  'lat': 59.969533,
  'lng': 30.318276,
  'description': None,
  'raw': 'Санкт-Петербург, Аптекарский проспект, 4',
  'metro': {'station_name': 'Петроградская',
   'line_name': 'Московско-Петроградская',
   'station_id': '15.215',
   'line_id': '15',
   'lat': 59.966389,
   'lng': 30.311293},
  'metro_stations': [{'station_name': 'Петроградская',
    'line_name': 'Московско-Петроградская',
    'station_id': '15.215',
    'line_id': '15',
    'lat': 59.966389,
    'lng': 30.311293}],
  'id': '3942995'},
 'response_url': None,
 'sor

In [9]:
for v in vacancies:
    print(v['name'], v['salary']['from'], v['salary']['to'], v['area']['name'], v['url'])

Junior Backend Developer (Java) 60000 120000 Санкт-Петербург https://api.hh.ru/vacancies/89601541?host=hh.ru
Аналитик данных (Data Science) 50000 100000 Иннополис https://api.hh.ru/vacancies/89380163?host=hh.ru
Специалист по работе с клиентами 40000 None Чебоксары https://api.hh.ru/vacancies/87623047?host=hh.ru
C++ developer to Berlin 7500 10834 Германия https://api.hh.ru/vacancies/89443252?host=hh.ru
Делопроизводитель 50000 None Москва https://api.hh.ru/vacancies/89215196?host=hh.ru
Data-science-специалист 40000 100000 Москва https://api.hh.ru/vacancies/89072255?host=hh.ru
Backend-разработчик 120000 None Ростов-на-Дону https://api.hh.ru/vacancies/89607557?host=hh.ru
Специалист по работе с физическими лицами (без продаж, без поиска клиентов) 50000 None Саратов https://api.hh.ru/vacancies/87710180?host=hh.ru
АККРЕДИТОВАННАЯ КОМПАНИЯ Начинающий Java разработчик 40000 None Ростов-на-Дону https://api.hh.ru/vacancies/89291378?host=hh.ru
Senior Customer Service Coordinator 160000 None Москва

Соберем все ссылки на вакансии, чтобы вытащить оттуда описание вакансии и ключевые навыки.

In [11]:
links = []

for v in vacancies:
    links.append(v['url'])

In [37]:
test = requests.get(links[0])
test0 = json.loads(test.text)
test0

{'id': '89601541',
 'premium': False,
 'billing_type': {'id': 'standard', 'name': 'Стандарт'},
 'relations': [],
 'name': 'Junior Backend Developer (Java)',
 'insider_interview': None,
 'response_letter_required': False,
 'area': {'id': '2',
  'name': 'Санкт-Петербург',
  'url': 'https://api.hh.ru/areas/2?host=hh.ru'},
 'salary': {'from': 60000, 'to': 120000, 'currency': 'RUR', 'gross': True},
 'type': {'id': 'open', 'name': 'Открытая'},
 'address': {'city': 'Санкт-Петербург',
  'street': 'Аптекарский проспект',
  'building': '4',
  'lat': 59.969533,
  'lng': 30.318276,
  'description': None,
  'raw': 'Санкт-Петербург, Аптекарский проспект, 4',
  'metro': {'station_name': 'Петроградская',
   'line_name': 'Московско-Петроградская',
   'station_id': '15.215',
   'line_id': '15',
   'lat': 59.966389,
   'lng': 30.311293},
  'metro_stations': [{'station_name': 'Петроградская',
    'line_name': 'Московско-Петроградская',
    'station_id': '15.215',
    'line_id': '15',
    'lat': 59.966389,

In [19]:
test0['description']

'<p>Мы IT-компания из Санкт-Петербурга, которая занимается разработкой мобильных приложений, веб-порталов, высоконагруженных сервисов, облачных решений, Gamedev-проектов и Data Science. Мы активно развиваемся, в нашей команде уже более 100 человек.</p> <p>Сейчас мы ищем <strong>Java разработчика,</strong> который хочет участвовать в интересных проектах, прокачивать свои навыки и расти вместе с нами.</p> <p> </p> <p><strong>Обязанности:</strong></p> <ul> <li>Разработка backend-программного обеспечения для веб-сайтов и мобильных приложений</li> <li>Проектирование и реализация баз данных MySQL / SQLite / PostgreSQL</li> <li>Проектирование и разработка REST API</li> </ul> <p><strong>Требования:</strong></p> <ul> <li>Умение работать с Java и фреймоворком Spring</li> <li>Умение работать с MySQL / PostgreSQL, REST API</li> </ul> <p><strong>Условия:</strong></p> <ul> <li>Гибкий график (согласовывается индивидуально)</li> <li>Решение интересных задач</li> <li>Работа в молодой команде</li> <li>Р

In [28]:
test0['key_skills']

[{'name': 'Java SE'},
 {'name': 'Spring Framework'},
 {'name': 'PostgreSQL'},
 {'name': 'ООП'}]

In [27]:
[i['name'] for i in test0['key_skills']]

['Java SE', 'Spring Framework', 'PostgreSQL', 'ООП']

Соберем в одну таблицу.

In [81]:
info = []

for l in tqdm(links):
    v = requests.get(l)
    v_loaded = json.loads(v.text)
    
    if v_loaded['salary']['currency'] == 'RUR':
    
        descr = v_loaded['description']
        skills = [i['name'] for i in v_loaded['key_skills']]
        money_from = v_loaded['salary'].get('from', np.nan)
        money_to = v_loaded['salary'].get('to', np.nan)
        url = v_loaded['alternate_url']

        info.append([descr, skills, money_from, money_to, url])
        sleep(3)

100%|█████████████████████████████████████████| 163/163 [06:29<00:00,  2.39s/it]


In [82]:
df = pd.DataFrame(info, columns=['description', 'key_skills', 'salary_from', 'salary_to', 'url'])

In [83]:
df

Unnamed: 0,description,key_skills,salary_from,salary_to,url
0,"<p>Мы IT-компания из Санкт-Петербурга, которая...","[Java SE, Spring Framework, PostgreSQL, ООП]",60000.00,120000.00,https://hh.ru/vacancy/89601541
1,<p>Мы создали<strong> RANKS.pro</strong> — Сис...,"[Python, Математическая статистика, SQL, Panda...",50000.00,100000.00,https://hh.ru/vacancy/89380163
2,<p><em><strong>IDF Eurasia </strong></em>специ...,[],40000.00,,https://hh.ru/vacancy/87623047
3,<p><strong>Karpov.courses </strong>— молодая E...,"[Документооборот, Работа с большим объемом инф...",50000.00,,https://hh.ru/vacancy/89215196
4,"<strong>O2 Trading - ищем, проверяем, внедряем...","[Python, SQL, Анализ данных, Работа с большим ...",40000.00,100000.00,https://hh.ru/vacancy/89072255
...,...,...,...,...,...
117,<p>Pygmalion AI — это передовая AI-платформа д...,"[Python, Аналитическое мышление, Data Analysis...",400000.00,,https://hh.ru/vacancy/88412207
118,<p>Pygmalion AI — это передовая AI-платформа д...,"[Python, Аналитическое мышление, Data Analysis...",400000.00,,https://hh.ru/vacancy/88412212
119,<p><strong>Про нас:</strong></p> <p>OTUS сегод...,"[Расчет заработной платы, Расчет зарплаты, Бух...",,80000.00,https://hh.ru/vacancy/89142460
120,<p>Pygmalion AI — это передовая AI-платформа д...,"[Python, Аналитическое мышление, Data Analysis...",400000.00,,https://hh.ru/vacancy/88412209


In [84]:
df['key_skills'].sum()

['Java SE',
 'Spring Framework',
 'PostgreSQL',
 'ООП',
 'Python',
 'Математическая статистика',
 'SQL',
 'Pandas',
 'Машинное обучение',
 'Документооборот',
 'Работа с большим объемом информации',
 'Деловая переписка',
 'Грамотная речь',
 'amoCRM',
 'Делопроизводство',
 'Электронный документооборот',
 'Python',
 'SQL',
 'Анализ данных',
 'Работа с большим объемом информации',
 'Базы данных',
 'Аналитическое мышление',
 'Работа с базами данных',
 'Математическая статистика',
 'Python',
 'PostgreSQL',
 'Docker',
 'SQL',
 'Git',
 'FastAPI',
 'Backend',
 'MS SQL',
 'Базы данных',
 'ООП',
 'SOLID',
 'Работа в команде',
 'Грамотная речь',
 'Телефонные переговоры',
 'Работа с базами данных',
 'Ориентация на результат',
 'Git',
 'Java Core',
 'Spring',
 'Java',
 'Hibernate',
 'Apache Maven',
 'PostgreSQL',
 'Hibernate ORM',
 'Web',
 'MySQL',
 'MongoDB',
 'Linux',
 'ООП',
 'Teamplayer',
 'Time management',
 'Negotiation skills',
 'Analytical skills',
 'Sales Skills',
 'JavaScript',
 'Bootstrap

In [85]:
Counter(df['key_skills'].sum()).most_common(15)

[('Python', 37),
 ('SQL', 27),
 ('Аналитическое мышление', 16),
 ('Data Analysis', 12),
 ('Анализ данных', 11),
 ('Работа с базами данных', 11),
 ('ETL', 11),
 ('MySQL', 10),
 ('Git', 9),
 ('Английский язык', 9),
 ('Бизнес-анализ', 9),
 ('Agile Project Management', 9),
 ('Грамотная речь', 8),
 ('Big Data', 8),
 ('NLP', 8)]

In [86]:
pd.options.display.float_format = '{:,.2f}'.format

df[['salary_from', 'salary_to']].describe()

Unnamed: 0,salary_from,salary_to
count,106.0,63.0
mean,150718.4,234171.43
std,122098.93,166547.08
min,30000.0,30000.0
25%,50000.0,100000.0
50%,100000.0,150000.0
75%,200000.0,390000.0
max,400000.0,550000.0


In [87]:
with pd.option_context('display.max_colwidth', None):
    display(df[df['salary_from'] == df['salary_from'].max()])

Unnamed: 0,description,key_skills,salary_from,salary_to,url
68,"<p>Pygmalion AI — это передовая AI-платформа для создания, публикации и продвижения контента в социальных медиа. Для достижения этой цели мы ищем Старшего инженера по данным, который будет играть ключевую роль во внедрении практик DataOps для эффективного управления данными социальных медиа. В этой роли подразумевается контроль за всем жизненным циклом данных, обеспечение целостности данных и расширение возможностей нашей AI-платформы для обеспечения исключительного пользовательского опыта.</p> <p>Ключевые обязанности:</p> <ul> <li>Проектирование, разработка и поддержание надежных и масштабируемых конвейеров данных для сбора, обработки и хранения данных из различных источников социальных медиа и пользовательских взаимодействий.</li> <li>Проектирование хранилища данных.</li> <li>Реализация строгих проверок качества данных и процессов валидации для поддержания целостности, точности и надежности данных социальных медиа, используемых нашими AI-моделями.</li> <li>Автоматизация процессов извлечения, трансформации и загрузки (ETL) для оптимизации загрузки и трансформации данных, уменьшения ручного вмешательства и повышения эффективности.</li> <li>Непрерывный мониторинг и оптимизация конвейеров данных для улучшения скорости, надежности и масштабируемости, обеспечивая бесшовную работу нашего AI-ассистента.</li> <li>Тесное сотрудничество с инженерами машинного обучения и межфункциональными командами для понимания требований к данным и предоставления необходимой инфраструктуры данных для разработки и обучения моделей.</li> <li>Проведение практик управления данными, гарантирование конфиденциальности данных, безопасности и соответствия соответствующим нормативам, включая GDPR, в контексте данных социальных медиа.</li> <li>Установление показателей производительности и внедрение решений мониторинга для выявления и устранения узких мест или аномалий в конвейере данных.</li> <li>Сотрудничество с аналитиками данных и бизнес-командами для проектирования интерактивных панелей инструментов, которые обеспечивают принятие решений на основе данных.</li> <li>Разработка и поддержка датамартов и панелей инструментов, предоставляющих оперативные аналитические данные по данным социальных медиа.</li> <li>Быть в курсе появляющихся технологий, инструментов и фреймворков в области данных, оценивая их потенциал для улучшения процессов инженерии данных.</li> </ul> <p> </p> <p>Требования к кандидату:</p> <ul> <li>Степень бакалавра или магистра по компьютерным наукам, инженерии данных или смежной области.</li> <li>Доказанный опыт работы в области инженерии данных, с акцентом на процессы ETL, разработку конвейеров данных и обеспечение качества данных.</li> <li>Высокая профессиональная компетенция в языках программирования, таких как Python, SQL, а также знание библиотек и фреймворков инженерии данных.</li> <li>Опыт работы с облачными решениями для хранения и обработки данных, такими как AWS, Azure или Google Cloud.</li> <li>Знакомство с принципами DataOps и гибкими методологиями.</li> <li>Отличные навыки решения проблем и способность к совместной работе в межфункциональной команде.</li> <li>Сильные коммуникационные навыки для объяснения технических концепций неспециализированным заинтересованным сторонам.</li> <li>Знание нормативов управления данными и регулирования конфиденциальности данных является преимуществом.</li> </ul> <p> </p> <p>Условия:</p> <p>Удаленная работа. Готовы оформить как в РФ так и в других юрисдикциях в том числе с релокацией. В случае работы за рубежом, готовы рассматривать иную ставку заработной платы.</p> <p>Высококвалифицированная команда специалистов разного профиля, объединенных одной целью - изменить представление блогеров о возможностях своего продвижения и монетизации аккаунтов.</p> <p>Доступ к последним технологиям и сотрудничество с ведущими экспертами, приглашенными в качестве консультантов.</p> <p>Использование современных инструментов взаимодействия внутри команды: Слэк, Миро, Ноушн и др.</p> <p>Стабильное финансирование стартапа - runway не менее 1 года.</p>","[Python, Аналитическое мышление, Data Analysis, MySQL, ETL, AWS, azure, google cloud, Agile Project Management, data ops]",400000.0,,https://hh.ru/vacancy/88412208
81,"<p>Pygmalion AI — это передовая AI-платформа для создания, публикации и продвижения контента в социальных медиа. Для достижения этой цели мы ищем Старшего инженера по данным, который будет играть ключевую роль во внедрении практик DataOps для эффективного управления данными социальных медиа. В этой роли подразумевается контроль за всем жизненным циклом данных, обеспечение целостности данных и расширение возможностей нашей AI-платформы для обеспечения исключительного пользовательского опыта.</p> <p>Ключевые обязанности:</p> <ul> <li>Проектирование, разработка и поддержание надежных и масштабируемых конвейеров данных для сбора, обработки и хранения данных из различных источников социальных медиа и пользовательских взаимодействий.</li> <li>Проектирование хранилища данных.</li> <li>Реализация строгих проверок качества данных и процессов валидации для поддержания целостности, точности и надежности данных социальных медиа, используемых нашими AI-моделями.</li> <li>Автоматизация процессов извлечения, трансформации и загрузки (ETL) для оптимизации загрузки и трансформации данных, уменьшения ручного вмешательства и повышения эффективности.</li> <li>Непрерывный мониторинг и оптимизация конвейеров данных для улучшения скорости, надежности и масштабируемости, обеспечивая бесшовную работу нашего AI-ассистента.</li> <li>Тесное сотрудничество с инженерами машинного обучения и межфункциональными командами для понимания требований к данным и предоставления необходимой инфраструктуры данных для разработки и обучения моделей.</li> <li>Проведение практик управления данными, гарантирование конфиденциальности данных, безопасности и соответствия соответствующим нормативам, включая GDPR, в контексте данных социальных медиа.</li> <li>Установление показателей производительности и внедрение решений мониторинга для выявления и устранения узких мест или аномалий в конвейере данных.</li> <li>Сотрудничество с аналитиками данных и бизнес-командами для проектирования интерактивных панелей инструментов, которые обеспечивают принятие решений на основе данных.</li> <li>Разработка и поддержка датамартов и панелей инструментов, предоставляющих оперативные аналитические данные по данным социальных медиа.</li> <li>Быть в курсе появляющихся технологий, инструментов и фреймворков в области данных, оценивая их потенциал для улучшения процессов инженерии данных.</li> </ul> <p> </p> <p>Требования к кандидату:</p> <ul> <li>Степень бакалавра или магистра по компьютерным наукам, инженерии данных или смежной области.</li> <li>Доказанный опыт работы в области инженерии данных, с акцентом на процессы ETL, разработку конвейеров данных и обеспечение качества данных.</li> <li>Высокая профессиональная компетенция в языках программирования, таких как Python, SQL, а также знание библиотек и фреймворков инженерии данных.</li> <li>Опыт работы с облачными решениями для хранения и обработки данных, такими как AWS, Azure или Google Cloud.</li> <li>Знакомство с принципами DataOps и гибкими методологиями.</li> <li>Отличные навыки решения проблем и способность к совместной работе в межфункциональной команде.</li> <li>Сильные коммуникационные навыки для объяснения технических концепций неспециализированным заинтересованным сторонам.</li> <li>Знание нормативов управления данными и регулирования конфиденциальности данных является преимуществом.</li> </ul> <p> </p> <p>Условия:</p> <p>Удаленная работа. Готовы оформить как в РФ так и в других юрисдикциях в том числе с релокацией. В случае работы за рубежом, готовы рассматривать иную ставку заработной платы.</p> <p>Высококвалифицированная команда специалистов разного профиля, объединенных одной целью - изменить представление блогеров о возможностях своего продвижения и монетизации аккаунтов.</p> <p>Доступ к последним технологиям и сотрудничество с ведущими экспертами, приглашенными в качестве консультантов.</p> <p>Использование современных инструментов взаимодействия внутри команды: Слэк, Миро, Ноушн и др.</p> <p>Стабильное финансирование стартапа - runway не менее 1 года.</p>","[Python, Аналитическое мышление, Data Analysis, MySQL, ETL, AWS, azure, google cloud, Agile Project Management, data ops]",400000.0,,https://hh.ru/vacancy/88412206
102,"<p>Контур — экосистема для бизнеса. Каждая четвертая компания в стране решает бизнес-задачи, используя наши сервисы. Мы автоматизируем документооборот, бухгалтерию и отчетность. Делаем эти процессы простыми и быстрыми, а сервисы — удобными для клиента.</p> <p>Центр искусственного интеллекта в Контуре помогает зарабатывать деньги за счет технологий машинного обучения и больших данных. Например, чат-бот Сирена экономит около 25% времени консультантов техподдержки в чатах, а технология распознавания речи обрабатывает тысячи лет записей каждый год. Мы постоянно следим за прогрессом в технологиях и разрабатываем новые методы и алгоритмы, чтобы сделать инновации доступными для использования в продуктах и процессах компании.</p> <p>В Центре искусственного интеллекта представлены разные роли: есть Data Scientist, разработчики и аналитики данных, DevOps-инженеры, QA-специалисты, системные аналитики, product- и project-менеджеры. Свое железо (V100/A100) и асессорская служба позволяют нам не ограничивать себя при работе с чувствительными данными. А крутая инфраструктурная команда создает, улучшает и развивает инструменты MLOps на любой вкус от ресерча до прода. Ищем эксперта, чтобы реализовывать и внедрять SOTA-подходы в наши сервисы.</p> <p>В лаборатории «Speech&amp;NLP» Центра искусственного интеллекта команда (7 ML Research Engineer) запустила с нуля и масштабировала на всю компанию собственный ASR, сэкономив сотни миллионов рублей в год. Сейчас, например, мы хотим аналогично создать и внедрить Text To Speech.</p> <p><strong>Чем предстоит заниматься</strong></p> <p><em>Концептуально:</em></p> <ul> <li> <p>Взять на себя определенное направление технологий (или несколько).</p> </li> <li> <p>Сформулировать видение его развития и актуализировать его своевременно, исходя из внутренних или внешних изменений.</p> </li> <li> <p>Планировать последовательность задач и помогать другим участникам лаборатории участвовать в его развитии, т. е. делать задачки и привносить что-то от себя в планы.</p> </li> <li> <p>Участвовать в разработке других технологий, помимо своего направления: ревью, небольшие задачи, обсуждения.</p> </li> </ul> <p><em>На испытательный срок поставим цель:</em></p> <ul> <li> <p>Погрузиться в одну из технологий.</p> </li> <li> <p>Понять, где мы сейчас.</p> </li> <li> <p>Уточнить, куда идем.</p> </li> <li> <p>Подготовить план развития с перспективой примерно на год.</p> </li> </ul> <p><em>Примеры задач (могут меняться в зависимости от вашего опыта и новостей мира технологий):</em></p> <ul> <li> <p>Разделение аудио на нескольких говорящих.</p> </li> <li> <p>Voice cloning.</p> </li> <li> <p>Улучшение текущего решения ASR.</p> </li> <li> <p>Поддержка и расширение набора NLP технологий: NER, sentiment analysis, spelling correction и другие.</p> </li> </ul> <p><strong>Наши ожидания</strong></p> <ul> <li> <p>Отличное понимание текущего состояния области Speech/NLP: следите за свежими статьями и SOTA по технологиям и делитесь с командой.</p> </li> <li> <p>Глубокое понимание PyTorch: сможете при необходимости быстро провести эксперименты, править архитектуру и разобраться в коде коллег.</p> </li> <li> <p>Умение рассказывать сложные вещи простым языком: кроме Data Scientist, в команде есть product- и project-менеджеры, разработчики, аналитики.</p> </li> </ul> <p><strong>Дополнительным плюсом будет</strong></p> <ul> <li> <p>Знание и практический опыт с transformers, fairseq, Nemo, SpeechBrain, ONNX/TorchScript.</p> </li> <li> <p>Знание методов обработки сигналов.</p> </li> <li> <p>Опыт оптимизации / дистилляции DL-моделей для продакшена.</p> </li> <li> <p>Публикации или блогпосты в области Speech/NLP.</p> </li> </ul> <p><strong>Мы предлагаем</strong></p> <ul> <li> <p>Оклад от 350 до 470 тысяч рублей на руки, точная сумма зависит от ваших компетенций и растет по итогам ревью. Кроме оклада есть внутригодовые премии за выполнение целей — 2-3 оклада в год. С ними ежемесячный доход будет от 400 до 550 тысяч рублей. Цели могут быть похожими на то, чего мы ждем на испытательном сроке.<br />По итогам может быть принято решение о включении в опционную программу.</p> </li> <li> <p>Нам важно, чтобы вам было комфортно: непринципиально, где вы находитесь и во сколько начинаете рабочий день, главное — выполненные задачи. Умеем работать в команде, находясь в разных точках мира (Таллин, Ташкент, Астана, Лимассол, Екатеринбург, Москва и т. д.).</p> </li> <li> <p>Мы поддерживаем участие в конференциях, митапах и обучающих проектах. Наши деврелы помогут написать статью на Хабр, снять видео или подготовиться к выступлению на конференции.</p> </li> <li> <p>У нас сильное инженерное сообщество: регулярно проводим техническую конференцию КонфУР, обмениваемся опытом между командами, проводим дизайн-ревью с экспертами в разных технологиях. Всегда найдется, с кем посоветоваться. А еще у нас есть инженерный совет. Он придумывает и реализует проекты, которые улучшают жизнь инженеров в компании.</p> </li> <li> <p>Максимум горизонтальных связей в коллективе, чтобы быстрее договариваться и решать рабочие задачи.</p> </li> </ul> <p>Присоединяйтесь :)</p>","[Python, PyTorch, NLP, SQL, Data Science, Speech, Ner]",400000.0,550000.0,https://hh.ru/vacancy/89384357
104,"<p>Контур — экосистема для бизнеса. Каждая четвертая компания в стране решает бизнес-задачи, используя наши сервисы. Мы автоматизируем документооборот, бухгалтерию и отчетность. Делаем эти процессы простыми и быстрыми, а сервисы — удобными для клиента.</p> <p>Центр искусственного интеллекта в Контуре помогает зарабатывать деньги за счет технологий машинного обучения и больших данных. Например, чат-бот Сирена экономит около 25% времени консультантов техподдержки в чатах, а технология распознавания речи обрабатывает тысячи лет записей каждый год. Мы постоянно следим за прогрессом в технологиях и разрабатываем новые методы и алгоритмы, чтобы сделать инновации доступными для использования в продуктах и процессах компании.</p> <p>В Центре искусственного интеллекта представлены разные роли: есть Data Scientist, разработчики и аналитики данных, DevOps-инженеры, QA-специалисты, системные аналитики, product- и project-менеджеры. Свое железо (V100/A100) и асессорская служба позволяют нам не ограничивать себя при работе с чувствительными данными. А крутая инфраструктурная команда создает, улучшает и развивает инструменты MLOps на любой вкус от ресерча до прода. Ищем эксперта, чтобы реализовывать и внедрять SOTA-подходы в наши сервисы.</p> <p>В лаборатории «Speech&amp;NLP» Центра искусственного интеллекта команда (7 ML Research Engineer) запустила с нуля и масштабировала на всю компанию собственный ASR, сэкономив сотни миллионов рублей в год. Сейчас, например, мы хотим аналогично создать и внедрить Text To Speech.</p> <p><strong>Чем предстоит заниматься</strong></p> <p><em>Концептуально:</em></p> <ul> <li> <p>Взять на себя определенное направление технологий (или несколько).</p> </li> <li> <p>Сформулировать видение его развития и актуализировать его своевременно, исходя из внутренних или внешних изменений.</p> </li> <li> <p>Планировать последовательность задач и помогать другим участникам лаборатории участвовать в его развитии, т. е. делать задачки и привносить что-то от себя в планы.</p> </li> <li> <p>Участвовать в разработке других технологий, помимо своего направления: ревью, небольшие задачи, обсуждения.</p> </li> </ul> <p><em>На испытательный срок поставим цель:</em></p> <ul> <li> <p>Погрузиться в одну из технологий.</p> </li> <li> <p>Понять, где мы сейчас.</p> </li> <li> <p>Уточнить, куда идем.</p> </li> <li> <p>Подготовить план развития с перспективой примерно на год.</p> </li> </ul> <p><em>Примеры задач (могут меняться в зависимости от вашего опыта и новостей мира технологий):</em></p> <ul> <li> <p>Разделение аудио на нескольких говорящих.</p> </li> <li> <p>Voice cloning.</p> </li> <li> <p>Улучшение текущего решения ASR.</p> </li> <li> <p>Поддержка и расширение набора NLP технологий: NER, sentiment analysis, spelling correction и другие.</p> </li> </ul> <p><strong>Наши ожидания</strong></p> <ul> <li> <p>Отличное понимание текущего состояния области Speech/NLP: следите за свежими статьями и SOTA по технологиям и делитесь с командой.</p> </li> <li> <p>Глубокое понимание PyTorch: сможете при необходимости быстро провести эксперименты, править архитектуру и разобраться в коде коллег.</p> </li> <li> <p>Умение рассказывать сложные вещи простым языком: кроме Data Scientist, в команде есть product- и project-менеджеры, разработчики, аналитики.</p> </li> </ul> <p><strong>Дополнительным плюсом будет</strong></p> <ul> <li> <p>Знание и практический опыт с transformers, fairseq, Nemo, SpeechBrain, ONNX/TorchScript.</p> </li> <li> <p>Знание методов обработки сигналов.</p> </li> <li> <p>Опыт оптимизации / дистилляции DL-моделей для продакшена.</p> </li> <li> <p>Публикации или блогпосты в области Speech/NLP.</p> </li> </ul> <p><strong>Мы предлагаем</strong></p> <ul> <li> <p>Оклад от 350 до 470 тысяч рублей на руки, точная сумма зависит от ваших компетенций и растет по итогам ревью. Кроме оклада есть внутригодовые премии за выполнение целей — 2-3 оклада в год. С ними ежемесячный доход будет от 400 до 550 тысяч рублей. Цели могут быть похожими на то, чего мы ждем на испытательном сроке.<br />По итогам может быть принято решение о включении в опционную программу.</p> </li> <li> <p>Нам важно, чтобы вам было комфортно: непринципиально, где вы находитесь и во сколько начинаете рабочий день, главное — выполненные задачи. Умеем работать в команде, находясь в разных точках мира (Таллин, Ташкент, Астана, Лимассол, Екатеринбург, Москва и т. д.).</p> </li> <li> <p>Мы поддерживаем участие в конференциях, митапах и обучающих проектах. Наши деврелы помогут написать статью на Хабр, снять видео или подготовиться к выступлению на конференции.</p> </li> <li> <p>У нас сильное инженерное сообщество: регулярно проводим техническую конференцию КонфУР, обмениваемся опытом между командами, проводим дизайн-ревью с экспертами в разных технологиях. Всегда найдется, с кем посоветоваться. А еще у нас есть инженерный совет. Он придумывает и реализует проекты, которые улучшают жизнь инженеров в компании.</p> </li> <li> <p>Максимум горизонтальных связей в коллективе, чтобы быстрее договариваться и решать рабочие задачи.</p> </li> </ul> <p>Присоединяйтесь :)</p>","[Python, PyTorch, NLP, SQL, Data Science, Speech, Ner]",400000.0,550000.0,https://hh.ru/vacancy/89384334
106,"<p><strong>Responsibilities:</strong></p> <p>Performance Marketing/CRM/Loyalty programs, Analytics, Data science:</p> <p>· Leadership of a team (8-10 ppl): processes, effectiveness, staffing the team, supervision.</p> <p>· Development of CRM strategy/Loyalty programs.</p> <p>· Supervision of web analytics projects, data driven projects.</p> <p>· Development of Agency’s business in terms of CRM, analytics, data.</p> <p>· Negotiations and fixing with clients (on top management level) re annual budgeting and scope of work.</p> <p>· Participation in tenders.</p> <p><strong>Needed skills:</strong></p> <p>· Working experience on position of digital director/digital lead- not less than 3 years.</p> <p>· Working experience on leading positions (people management)- not less, than 5 years.</p> <p>· Overall knowledge about Data Science and data management. Experience of working with web- analytics.</p> <p>· Experience in CRM and loyalty programs.</p> <p>· Good presentation skills.</p> <p>· Good PPT design skills.</p> <p>· Strong communicational and negotiations skills.</p> <p>· Strong team player. “Model role” for the teams.</p> <p>· Fluent English</p> <p><strong>We offer:</strong></p> <p>• Unique experience in global company.</p> <p>• Professional team.</p> <p>• Salary discuss with successful candidate.</p> <p>• Free lunches.</p> <p>• Medical insurance after 3 months working in company.</p>",[],400000.0,,https://hh.ru/vacancy/88681004
110,"<p>Контур — экосистема для бизнеса. Каждая четвертая компания в стране решает бизнес-задачи, используя наши сервисы. Мы автоматизируем документооборот, бухгалтерию и отчетность. Делаем эти процессы простыми и быстрыми, а сервисы — удобными для клиента.</p> <p>Центр искусственного интеллекта в Контуре помогает зарабатывать деньги за счет технологий машинного обучения и больших данных. Например, чат-бот Сирена экономит около 25% времени консультантов техподдержки в чатах, а технология распознавания речи обрабатывает тысячи лет записей каждый год. Мы постоянно следим за прогрессом в технологиях и разрабатываем новые методы и алгоритмы, чтобы сделать инновации доступными для использования в продуктах и процессах компании.</p> <p>В Центре искусственного интеллекта представлены разные роли: есть Data Scientist, разработчики и аналитики данных, DevOps-инженеры, QA-специалисты, системные аналитики, product- и project-менеджеры. Свое железо (V100/A100) и асессорская служба позволяют нам не ограничивать себя при работе с чувствительными данными. А крутая инфраструктурная команда создает, улучшает и развивает инструменты MLOps на любой вкус от ресерча до прода. Ищем эксперта, чтобы реализовывать и внедрять SOTA-подходы в наши сервисы.</p> <p>В лаборатории «Speech&amp;NLP» Центра искусственного интеллекта команда (7 ML Research Engineer) запустила с нуля и масштабировала на всю компанию собственный ASR, сэкономив сотни миллионов рублей в год. Сейчас, например, мы хотим аналогично создать и внедрить Text To Speech.</p> <p><strong>Чем предстоит заниматься</strong></p> <p><em>Концептуально:</em></p> <ul> <li> <p>Взять на себя определенное направление технологий (или несколько).</p> </li> <li> <p>Сформулировать видение его развития и актуализировать его своевременно, исходя из внутренних или внешних изменений.</p> </li> <li> <p>Планировать последовательность задач и помогать другим участникам лаборатории участвовать в его развитии, т. е. делать задачки и привносить что-то от себя в планы.</p> </li> <li> <p>Участвовать в разработке других технологий, помимо своего направления: ревью, небольшие задачи, обсуждения.</p> </li> </ul> <p><em>На испытательный срок поставим цель:</em></p> <ul> <li> <p>Погрузиться в одну из технологий.</p> </li> <li> <p>Понять, где мы сейчас.</p> </li> <li> <p>Уточнить, куда идем.</p> </li> <li> <p>Подготовить план развития с перспективой примерно на год.</p> </li> </ul> <p><em>Примеры задач (могут меняться в зависимости от вашего опыта и новостей мира технологий):</em></p> <ul> <li> <p>Разделение аудио на нескольких говорящих.</p> </li> <li> <p>Voice cloning.</p> </li> <li> <p>Улучшение текущего решения ASR.</p> </li> <li> <p>Поддержка и расширение набора NLP технологий: NER, sentiment analysis, spelling correction и другие.</p> </li> </ul> <p><strong>Наши ожидания</strong></p> <ul> <li> <p>Отличное понимание текущего состояния области Speech/NLP: следите за свежими статьями и SOTA по технологиям и делитесь с командой.</p> </li> <li> <p>Глубокое понимание PyTorch: сможете при необходимости быстро провести эксперименты, править архитектуру и разобраться в коде коллег.</p> </li> <li> <p>Умение рассказывать сложные вещи простым языком: кроме Data Scientist, в команде есть product- и project-менеджеры, разработчики, аналитики.</p> </li> </ul> <p><strong>Дополнительным плюсом будет</strong></p> <ul> <li> <p>Знание и практический опыт с transformers, fairseq, Nemo, SpeechBrain, ONNX/TorchScript.</p> </li> <li> <p>Знание методов обработки сигналов.</p> </li> <li> <p>Опыт оптимизации / дистилляции DL-моделей для продакшена.</p> </li> <li> <p>Публикации или блогпосты в области Speech/NLP.</p> </li> </ul> <p><strong>Мы предлагаем</strong></p> <ul> <li> <p>Оклад от 350 до 470 тысяч рублей на руки, точная сумма зависит от ваших компетенций и растет по итогам ревью. Кроме оклада есть внутригодовые премии за выполнение целей — 2-3 оклада в год. С ними ежемесячный доход будет от 400 до 550 тысяч рублей. Цели могут быть похожими на то, чего мы ждем на испытательном сроке.<br />По итогам может быть принято решение о включении в опционную программу.</p> </li> <li> <p>Нам важно, чтобы вам было комфортно: непринципиально, где вы находитесь и во сколько начинаете рабочий день, главное — выполненные задачи. Умеем работать в команде, находясь в разных точках мира (Таллин, Ташкент, Астана, Лимассол, Екатеринбург, Москва и т. д.).</p> </li> <li> <p>Мы поддерживаем участие в конференциях, митапах и обучающих проектах. Наши деврелы помогут написать статью на Хабр, снять видео или подготовиться к выступлению на конференции.</p> </li> <li> <p>У нас сильное инженерное сообщество: регулярно проводим техническую конференцию КонфУР, обмениваемся опытом между командами, проводим дизайн-ревью с экспертами в разных технологиях. Всегда найдется, с кем посоветоваться. А еще у нас есть инженерный совет. Он придумывает и реализует проекты, которые улучшают жизнь инженеров в компании.</p> </li> <li> <p>Максимум горизонтальных связей в коллективе, чтобы быстрее договариваться и решать рабочие задачи.</p> </li> </ul> <p>Присоединяйтесь :)</p>","[Python, PyTorch, NLP, SQL, Data Science, Speech, Ner]",400000.0,550000.0,https://hh.ru/vacancy/89384325
114,"<p>Pygmalion AI — это передовая AI-платформа для создания, публикации и продвижения контента в социальных медиа. Для достижения этой цели мы ищем Старшего инженера по данным, который будет играть ключевую роль во внедрении практик DataOps для эффективного управления данными социальных медиа. В этой роли подразумевается контроль за всем жизненным циклом данных, обеспечение целостности данных и расширение возможностей нашей AI-платформы для обеспечения исключительного пользовательского опыта.</p> <p>Ключевые обязанности:</p> <ul> <li>Проектирование, разработка и поддержание надежных и масштабируемых конвейеров данных для сбора, обработки и хранения данных из различных источников социальных медиа и пользовательских взаимодействий.</li> <li>Проектирование хранилища данных.</li> <li>Реализация строгих проверок качества данных и процессов валидации для поддержания целостности, точности и надежности данных социальных медиа, используемых нашими AI-моделями.</li> <li>Автоматизация процессов извлечения, трансформации и загрузки (ETL) для оптимизации загрузки и трансформации данных, уменьшения ручного вмешательства и повышения эффективности.</li> <li>Непрерывный мониторинг и оптимизация конвейеров данных для улучшения скорости, надежности и масштабируемости, обеспечивая бесшовную работу нашего AI-ассистента.</li> <li>Тесное сотрудничество с инженерами машинного обучения и межфункциональными командами для понимания требований к данным и предоставления необходимой инфраструктуры данных для разработки и обучения моделей.</li> <li>Проведение практик управления данными, гарантирование конфиденциальности данных, безопасности и соответствия соответствующим нормативам, включая GDPR, в контексте данных социальных медиа.</li> <li>Установление показателей производительности и внедрение решений мониторинга для выявления и устранения узких мест или аномалий в конвейере данных.</li> <li>Сотрудничество с аналитиками данных и бизнес-командами для проектирования интерактивных панелей инструментов, которые обеспечивают принятие решений на основе данных.</li> <li>Разработка и поддержка датамартов и панелей инструментов, предоставляющих оперативные аналитические данные по данным социальных медиа.</li> <li>Быть в курсе появляющихся технологий, инструментов и фреймворков в области данных, оценивая их потенциал для улучшения процессов инженерии данных.</li> </ul> <p> </p> <p>Требования к кандидату:</p> <ul> <li>Степень бакалавра или магистра по компьютерным наукам, инженерии данных или смежной области.</li> <li>Доказанный опыт работы в области инженерии данных, с акцентом на процессы ETL, разработку конвейеров данных и обеспечение качества данных.</li> <li>Высокая профессиональная компетенция в языках программирования, таких как Python, SQL, а также знание библиотек и фреймворков инженерии данных.</li> <li>Опыт работы с облачными решениями для хранения и обработки данных, такими как AWS, Azure или Google Cloud.</li> <li>Знакомство с принципами DataOps и гибкими методологиями.</li> <li>Отличные навыки решения проблем и способность к совместной работе в межфункциональной команде.</li> <li>Сильные коммуникационные навыки для объяснения технических концепций неспециализированным заинтересованным сторонам.</li> <li>Знание нормативов управления данными и регулирования конфиденциальности данных является преимуществом.</li> </ul> <p> </p> <p>Условия:</p> <p>Удаленная работа. Готовы оформить как в РФ так и в других юрисдикциях в том числе с релокацией. В случае работы за рубежом, готовы рассматривать иную ставку заработной платы.</p> <p>Высококвалифицированная команда специалистов разного профиля, объединенных одной целью - изменить представление блогеров о возможностях своего продвижения и монетизации аккаунтов.</p> <p>Доступ к последним технологиям и сотрудничество с ведущими экспертами, приглашенными в качестве консультантов.</p> <p>Использование современных инструментов взаимодействия внутри команды: Слэк, Миро, Ноушн и др.</p> <p>Стабильное финансирование стартапа - runway не менее 1 года.</p>","[Python, Аналитическое мышление, Data Analysis, MySQL, ETL, AWS, azure, google cloud, Agile Project Management, data ops]",400000.0,,https://hh.ru/vacancy/88412213
117,"<p>Pygmalion AI — это передовая AI-платформа для создания, публикации и продвижения контента в социальных медиа. Для достижения этой цели мы ищем Старшего инженера по данным, который будет играть ключевую роль во внедрении практик DataOps для эффективного управления данными социальных медиа. В этой роли подразумевается контроль за всем жизненным циклом данных, обеспечение целостности данных и расширение возможностей нашей AI-платформы для обеспечения исключительного пользовательского опыта.</p> <p>Ключевые обязанности:</p> <ul> <li>Проектирование, разработка и поддержание надежных и масштабируемых конвейеров данных для сбора, обработки и хранения данных из различных источников социальных медиа и пользовательских взаимодействий.</li> <li>Проектирование хранилища данных.</li> <li>Реализация строгих проверок качества данных и процессов валидации для поддержания целостности, точности и надежности данных социальных медиа, используемых нашими AI-моделями.</li> <li>Автоматизация процессов извлечения, трансформации и загрузки (ETL) для оптимизации загрузки и трансформации данных, уменьшения ручного вмешательства и повышения эффективности.</li> <li>Непрерывный мониторинг и оптимизация конвейеров данных для улучшения скорости, надежности и масштабируемости, обеспечивая бесшовную работу нашего AI-ассистента.</li> <li>Тесное сотрудничество с инженерами машинного обучения и межфункциональными командами для понимания требований к данным и предоставления необходимой инфраструктуры данных для разработки и обучения моделей.</li> <li>Проведение практик управления данными, гарантирование конфиденциальности данных, безопасности и соответствия соответствующим нормативам, включая GDPR, в контексте данных социальных медиа.</li> <li>Установление показателей производительности и внедрение решений мониторинга для выявления и устранения узких мест или аномалий в конвейере данных.</li> <li>Сотрудничество с аналитиками данных и бизнес-командами для проектирования интерактивных панелей инструментов, которые обеспечивают принятие решений на основе данных.</li> <li>Разработка и поддержка датамартов и панелей инструментов, предоставляющих оперативные аналитические данные по данным социальных медиа.</li> <li>Быть в курсе появляющихся технологий, инструментов и фреймворков в области данных, оценивая их потенциал для улучшения процессов инженерии данных.</li> </ul> <p> </p> <p>Требования к кандидату:</p> <ul> <li>Степень бакалавра или магистра по компьютерным наукам, инженерии данных или смежной области.</li> <li>Доказанный опыт работы в области инженерии данных, с акцентом на процессы ETL, разработку конвейеров данных и обеспечение качества данных.</li> <li>Высокая профессиональная компетенция в языках программирования, таких как Python, SQL, а также знание библиотек и фреймворков инженерии данных.</li> <li>Опыт работы с облачными решениями для хранения и обработки данных, такими как AWS, Azure или Google Cloud.</li> <li>Знакомство с принципами DataOps и гибкими методологиями.</li> <li>Отличные навыки решения проблем и способность к совместной работе в межфункциональной команде.</li> <li>Сильные коммуникационные навыки для объяснения технических концепций неспециализированным заинтересованным сторонам.</li> <li>Знание нормативов управления данными и регулирования конфиденциальности данных является преимуществом.</li> </ul> <p> </p> <p>Условия:</p> <p>Удаленная работа. Готовы оформить как в РФ так и в других юрисдикциях в том числе с релокацией. В случае работы за рубежом, готовы рассматривать иную ставку заработной платы.</p> <p>Высококвалифицированная команда специалистов разного профиля, объединенных одной целью - изменить представление блогеров о возможностях своего продвижения и монетизации аккаунтов.</p> <p>Доступ к последним технологиям и сотрудничество с ведущими экспертами, приглашенными в качестве консультантов.</p> <p>Использование современных инструментов взаимодействия внутри команды: Слэк, Миро, Ноушн и др.</p> <p>Стабильное финансирование стартапа - runway не менее 1 года.</p>","[Python, Аналитическое мышление, Data Analysis, MySQL, ETL, AWS, azure, google cloud, Agile Project Management, data ops]",400000.0,,https://hh.ru/vacancy/88412207
118,"<p>Pygmalion AI — это передовая AI-платформа для создания, публикации и продвижения контента в социальных медиа. Для достижения этой цели мы ищем Старшего инженера по данным, который будет играть ключевую роль во внедрении практик DataOps для эффективного управления данными социальных медиа. В этой роли подразумевается контроль за всем жизненным циклом данных, обеспечение целостности данных и расширение возможностей нашей AI-платформы для обеспечения исключительного пользовательского опыта.</p> <p>Ключевые обязанности:</p> <ul> <li>Проектирование, разработка и поддержание надежных и масштабируемых конвейеров данных для сбора, обработки и хранения данных из различных источников социальных медиа и пользовательских взаимодействий.</li> <li>Проектирование хранилища данных.</li> <li>Реализация строгих проверок качества данных и процессов валидации для поддержания целостности, точности и надежности данных социальных медиа, используемых нашими AI-моделями.</li> <li>Автоматизация процессов извлечения, трансформации и загрузки (ETL) для оптимизации загрузки и трансформации данных, уменьшения ручного вмешательства и повышения эффективности.</li> <li>Непрерывный мониторинг и оптимизация конвейеров данных для улучшения скорости, надежности и масштабируемости, обеспечивая бесшовную работу нашего AI-ассистента.</li> <li>Тесное сотрудничество с инженерами машинного обучения и межфункциональными командами для понимания требований к данным и предоставления необходимой инфраструктуры данных для разработки и обучения моделей.</li> <li>Проведение практик управления данными, гарантирование конфиденциальности данных, безопасности и соответствия соответствующим нормативам, включая GDPR, в контексте данных социальных медиа.</li> <li>Установление показателей производительности и внедрение решений мониторинга для выявления и устранения узких мест или аномалий в конвейере данных.</li> <li>Сотрудничество с аналитиками данных и бизнес-командами для проектирования интерактивных панелей инструментов, которые обеспечивают принятие решений на основе данных.</li> <li>Разработка и поддержка датамартов и панелей инструментов, предоставляющих оперативные аналитические данные по данным социальных медиа.</li> <li>Быть в курсе появляющихся технологий, инструментов и фреймворков в области данных, оценивая их потенциал для улучшения процессов инженерии данных.</li> </ul> <p> </p> <p>Требования к кандидату:</p> <ul> <li>Степень бакалавра или магистра по компьютерным наукам, инженерии данных или смежной области.</li> <li>Доказанный опыт работы в области инженерии данных, с акцентом на процессы ETL, разработку конвейеров данных и обеспечение качества данных.</li> <li>Высокая профессиональная компетенция в языках программирования, таких как Python, SQL, а также знание библиотек и фреймворков инженерии данных.</li> <li>Опыт работы с облачными решениями для хранения и обработки данных, такими как AWS, Azure или Google Cloud.</li> <li>Знакомство с принципами DataOps и гибкими методологиями.</li> <li>Отличные навыки решения проблем и способность к совместной работе в межфункциональной команде.</li> <li>Сильные коммуникационные навыки для объяснения технических концепций неспециализированным заинтересованным сторонам.</li> <li>Знание нормативов управления данными и регулирования конфиденциальности данных является преимуществом.</li> </ul> <p> </p> <p>Условия:</p> <p>Удаленная работа. Готовы оформить как в РФ так и в других юрисдикциях в том числе с релокацией. В случае работы за рубежом, готовы рассматривать иную ставку заработной платы.</p> <p>Высококвалифицированная команда специалистов разного профиля, объединенных одной целью - изменить представление блогеров о возможностях своего продвижения и монетизации аккаунтов.</p> <p>Доступ к последним технологиям и сотрудничество с ведущими экспертами, приглашенными в качестве консультантов.</p> <p>Использование современных инструментов взаимодействия внутри команды: Слэк, Миро, Ноушн и др.</p> <p>Стабильное финансирование стартапа - runway не менее 1 года.</p>","[Python, Аналитическое мышление, Data Analysis, MySQL, ETL, AWS, azure, google cloud, Agile Project Management, data ops]",400000.0,,https://hh.ru/vacancy/88412212
120,"<p>Pygmalion AI — это передовая AI-платформа для создания, публикации и продвижения контента в социальных медиа. Для достижения этой цели мы ищем Старшего инженера по данным, который будет играть ключевую роль во внедрении практик DataOps для эффективного управления данными социальных медиа. В этой роли подразумевается контроль за всем жизненным циклом данных, обеспечение целостности данных и расширение возможностей нашей AI-платформы для обеспечения исключительного пользовательского опыта.</p> <p>Ключевые обязанности:</p> <ul> <li>Проектирование, разработка и поддержание надежных и масштабируемых конвейеров данных для сбора, обработки и хранения данных из различных источников социальных медиа и пользовательских взаимодействий.</li> <li>Проектирование хранилища данных.</li> <li>Реализация строгих проверок качества данных и процессов валидации для поддержания целостности, точности и надежности данных социальных медиа, используемых нашими AI-моделями.</li> <li>Автоматизация процессов извлечения, трансформации и загрузки (ETL) для оптимизации загрузки и трансформации данных, уменьшения ручного вмешательства и повышения эффективности.</li> <li>Непрерывный мониторинг и оптимизация конвейеров данных для улучшения скорости, надежности и масштабируемости, обеспечивая бесшовную работу нашего AI-ассистента.</li> <li>Тесное сотрудничество с инженерами машинного обучения и межфункциональными командами для понимания требований к данным и предоставления необходимой инфраструктуры данных для разработки и обучения моделей.</li> <li>Проведение практик управления данными, гарантирование конфиденциальности данных, безопасности и соответствия соответствующим нормативам, включая GDPR, в контексте данных социальных медиа.</li> <li>Установление показателей производительности и внедрение решений мониторинга для выявления и устранения узких мест или аномалий в конвейере данных.</li> <li>Сотрудничество с аналитиками данных и бизнес-командами для проектирования интерактивных панелей инструментов, которые обеспечивают принятие решений на основе данных.</li> <li>Разработка и поддержка датамартов и панелей инструментов, предоставляющих оперативные аналитические данные по данным социальных медиа.</li> <li>Быть в курсе появляющихся технологий, инструментов и фреймворков в области данных, оценивая их потенциал для улучшения процессов инженерии данных.</li> </ul> <p> </p> <p>Требования к кандидату:</p> <ul> <li>Степень бакалавра или магистра по компьютерным наукам, инженерии данных или смежной области.</li> <li>Доказанный опыт работы в области инженерии данных, с акцентом на процессы ETL, разработку конвейеров данных и обеспечение качества данных.</li> <li>Высокая профессиональная компетенция в языках программирования, таких как Python, SQL, а также знание библиотек и фреймворков инженерии данных.</li> <li>Опыт работы с облачными решениями для хранения и обработки данных, такими как AWS, Azure или Google Cloud.</li> <li>Знакомство с принципами DataOps и гибкими методологиями.</li> <li>Отличные навыки решения проблем и способность к совместной работе в межфункциональной команде.</li> <li>Сильные коммуникационные навыки для объяснения технических концепций неспециализированным заинтересованным сторонам.</li> <li>Знание нормативов управления данными и регулирования конфиденциальности данных является преимуществом.</li> </ul> <p> </p> <p>Условия:</p> <p>Удаленная работа. Готовы оформить как в РФ так и в других юрисдикциях в том числе с релокацией. В случае работы за рубежом, готовы рассматривать иную ставку заработной платы.</p> <p>Высококвалифицированная команда специалистов разного профиля, объединенных одной целью - изменить представление блогеров о возможностях своего продвижения и монетизации аккаунтов.</p> <p>Доступ к последним технологиям и сотрудничество с ведущими экспертами, приглашенными в качестве консультантов.</p> <p>Использование современных инструментов взаимодействия внутри команды: Слэк, Миро, Ноушн и др.</p> <p>Стабильное финансирование стартапа - runway не менее 1 года.</p>","[Python, Аналитическое мышление, Data Analysis, MySQL, ETL, AWS, azure, google cloud, Agile Project Management, data ops]",400000.0,,https://hh.ru/vacancy/88412209


## Задание 1

Найдите все вакансии, в которых тип занятости "Волонтер".
В этом вам поможет поле "employment", в которое подставляются значения из общих словарей: https://api.hh.ru/dictionaries

In [None]:
# ваш код

## Задание 2

Найдите, сколько вакансий на hh было опубликовано за эту неделю.

In [None]:
# ваш код

## Задание 3

Найдите все вакансии, которые сейчас открыты у вашей компании (учебного заведения / интересующей вас компании). Загрузите данные в таблицу и сделайте описательную статистику заработных плат в вакансиях с помощью метода describe().

В этом вам поможет модуль "Поиск работодателя": https://api.hh.ru/openapi/redoc#tag/Rabotodatel/operation/search-employer

In [None]:
# ваш код