Skip to content

Kubik91/hac_19_10

Repository files navigation

Набор данных о вакансиях для поиска IT специалистов на сайте headhunter.ru

Набор данных содержит подробные данные о вакансиях, размещенных для поиска специалистов в IT и Телеком сферах: регион, уровень зарплаты, индустрия, тип занятости, специализация и т.д.

Команда проекта:

  • Анна Елфимова
  • Оксана Евсеева
  • Пшеничный Андрей
  • Павел Кондратёнок
  • Светлана Щербакова

Иcпользуя датасет на следующих этатапах проекта мы сделаем анализ рынка труда IT специалистов в России. В результате мы получим ответы на следующие исследовательские вопросы:

  • Какие навыки являются самыми востребованными среди IT специалистов по разным направлениям (разработка, аналитика, системное администрирование и т.д.). На этот вопрос мы ответим с помощью анализа частоты упоминания навыков в тегах требуемых навыков в описании вакансии.
  • Какие характеристики (переменные) вакансии влияют на предлагаемое вознаграждение. Для вакансий, где указана заработная плата, мы составим регрессионную модель (OLS) и проверим, какие характеристики и насколько влияют на увеличение вознаграждения (отрасль, тип занятости, регион, опыт работы и др.
  • Составим ряд описательных статистик, рассказывающих о рынке труда IT специалистов: рейтинг регионов по спросу на IT специалистов, рейтинг регионов по предлагаемой заработной плате, распределение вакансий по индустрии, типу занятости, типу графика рабочего и др.

Источники данных:

данные были получены с сайта https://hh.ru с помощью API.

Структура данных (итоговый набор данных)

Наименование переменной Тип переменной Описание
id string Идентификатор вакансии
key_skills array Информация о ключевых навыках, заявленных в вакансии. Список может быть пустым
key_skills[].name string Название ключевого навыка
schedule object График работы
experience object Требуемый опыт работы
experience.id string Идентификатор требуемого опыта работы
employment object или null Тип занятости
salary object или null Оклад
salary.from number или null Нижняя граница вилки оклада
salary.to number или null Верняя граница вилки оклада
salary.currency string Идентификатор валюты оклада (справочник currency)
name string Название вакансии
area object Регион размещения вакансии
specialization array Специализации. Элементы справочника specializations
specializations[].id string Идентификатор специализации
specializations[].name string Название специализации
specializations[].profarea_id string Идентификатор профессиональной области, в которую входит специализация
specializations[].profarea_name string Название профессиональной области, в которую входит специализация
schedule.id string Идентификатор графика работы
schedule.name string Название графика работы
experience.name string Название требуемого опыта работы
employment.id string Идентификатор типа занятости
employment.name string Название типа занятости
salary.gross boolean или null Признак того что оклад указан до вычета налогов. В случае если не указано - null.
area.id string Идентификатор региона
area.name string Название региона
working_days object или null Рабочие дни. Элемент справочника working_days
working_days.id string Идентификатор рабочих дней
working_days.name string Название рабочих дней
working_time_intervals object или null Временные интервалы работы. Элемент справочника working_time_intervals
working_time_intervals.id string Идентификатор временного интервала работы
working_time_intervals.name string Название временного интервала работы
working_time_modes object или null Режимы времени работы. Элемент справочника working_time_modes
working_time_modes.id string Идентификатор режима времени работы
working_time_modes.name string Название режима времени работы
accept_temporary boolean или null Указание, что вакансия доступна для соискателей с временным трудоустройством

Releases

No releases published

Packages

No packages published

Languages