<h1>Содержание<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"></ul></div>

In [1]:
import requests
import pandas as pd

In [74]:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', None)
pd.set_option('display.max_rows', None)

In [255]:
API_URL = 'https://api.hh.ru/vacancies'
USER_AGENT = 'MyApp/1.0'
PERIOD = 7

In [250]:
TEXT = 'NAME:(аналитик \
        NOT (бизнес* OR 1C OR 1С OR системный OR медицинский OR финансовый)) AND \
        DESCRIPTION:(python)'

In [186]:
def extract_job_info(items_list, records):
    """
    Извлекает запрошенную информацию из списка вакансий и
    добавляет её в пользовательский список.
    Получает:
    items_list - список вакансий
    records - пользовательский список.
    Возвращает: пользовательский список
    """
    # список полей для сбора информации
    info_list = ['id', 'name', 'area', 'salary', 'published_at', 'snippet',
                 'responsibility', 'employer', 'experience', 'employment']
    # список служебных полей, которые не используются
    stop_items = ['id', 'url', 'alternate_url', 'logo_urls',
                  'vacancies_url', 'accredited_it_employer', 'trusted']
    for item in items_list:
        record = {}
        for key, value in item.items():
            if key in info_list:
                # проверка на вложенные поля
                if isinstance(value, dict):
                    for subkey in value.keys():
                        if subkey not in stop_items:
                            record[f'{key}_{subkey}']=value.get(subkey)
                else:
                    # проверка наличия значения, чтобы не заводить полностью пустое поле
                    if value:
                        record[key]=value
        records.append(record)
    return records

In [251]:
# параметры запроса
params = {
    'User-Agent': USER_AGENT,
    'text': TEXT,
    'search_field': ['name', 'description'],
    'experience': ['noExperience', 'between1And3'],
    'schedule': 'remote', 
    'period': PERIOD
}

In [252]:
params['page'] = 0
r = requests.get(API_URL, params=params)
# пользовательский список
records = []
# сбор данных с первой страницы и получение количества страниц
records = extract_job_info(r.json()['items'], records)
# сбор данных с остальных страниц
for i in range(1, r.json()['pages']):
    params['page'] = i
    r = requests.get(API_URL, params=params)
    records = extract_job_info(r.json()['items'], records)

data = pd.DataFrame(records)

In [254]:
data

Unnamed: 0,id,name,area_name,salary_from,salary_to,salary_currency,salary_gross,published_at,employer_name,snippet_requirement,snippet_responsibility,experience_name,employment_name
0,83290363,Аналитик отдела статистики (удаленно),Санкт-Петербург,,90000.0,RUR,True,2023-07-11T14:57:46+0300,ГК Эксперт,"Обладает высшим образованием в области <highlighttext>аналитики</highlighttext> / техническим образованием (Математика, IT, инженерное) / финансовым или экономическим образованием. Обладает прекрасными навыками <highlighttext>аналитики</highlighttext>, умеет...","Взаимодействие с различными внутренними отделами, предоставление им необходимой аналитической поддержки. Сбор <highlighttext>бизнес</highlighttext>-требований, поиск подходящей информации и обработка данных в...",Нет опыта,Полная занятость
1,83185391,Junior Аналитик,Москва,,120000.0,RUR,False,2023-07-09T20:25:08+0300,Доценко Дарья,"Интерес к теме. Внимательность, любопытство. Коммерческий опыт работы <highlighttext>аналитиком</highlighttext> не требуется.",<highlighttext>Аналитик</highlighttext> будет разбираться в доменной области с помощью DS-навыков. Работа может включать анализ требований к компании со стороны торговых...,Нет опыта,Полная занятость
2,83247130,Младший аналитик данных,Москва,,,,,2023-07-10T21:36:49+0300,РОСБАНК,Высшее/неполное высшее образование (техническое/финансовое/экономическое). Навыки анализа данных для решения практических задач. Опыт написания SQL запросов.,"Проведение анализа для проверки гипотез совместно с <highlighttext>бизнес</highlighttext>-подразделениями. Построение аналитических представлений и отчетов (таблицы, графики) в MS Power BI...",Нет опыта,Полная занятость
3,83321542,Дата-аналитик,Санкт-Петербург,,,,,2023-07-12T10:14:18+0300,Приложение «Кошелёк»,"...разного уровня сложности. Опыт работы с любым BI-инструментом (Tableau, PowerBI). Самое главное — инициативность и желание развиваться в продуктовой <highlighttext>аналитике</highlighttext>.","Активно участвовать в дискавери-процессах: искать и предлагать возможности для роста метрик продуктовой команды и всей компании, проводить соответствующие исследования.",От 1 года до 3 лет,Полная занятость
4,83114951,Аналитик данных,Москва,,,,,2023-07-12T18:07:27+0300,Верме,"Высшее техническое образование. Знание Python и библиотек (numpy, pandas) + Базовый ML. Знание английского языка для чтения и перевода технической...",Преобразование данных и предобработка данных для ML-расчетов. Анализ данных и перевод данных в доступный формат интерпретации. Интерпретация тенденций и...,Нет опыта,Полная занятость
5,83100771,Junior data analyst,Санкт-Петербург,,,,,2023-07-06T15:00:25+0300,Самокат (ООО Умный ритейл),"Опыт работы на аналогичной позиции от 1 года. Базовый опыт SQL, Power BI(M/DAX), Excel. Опыт программирования на Python...",Формировать отчеты в Power BI. Проводить анализ причин изменений. Прогнозировать результат и оценивать эффективность маркетинговых акций. Делать выгрузки из DWH...,От 1 года до 3 лет,Полная занятость
6,83323498,Аналитик данных,Москва,,,,,2023-07-12T10:40:09+0300,Делимобиль,"Знание основ работы с базами данных, SQL. Преимущество – работа с БД Vertica. Опыт разработки дашбордов – PowerBI. Знание PowerQuery и DAX.","Разработка дашбордов (PowerBI) по заданиям пользователей, начиная с написания необходимых представлений в базе данных (SQL). Формирование и выгрузка данных из...",От 1 года до 3 лет,Полная занятость
7,83233456,Data Analyst,Москва,,,,,2023-07-10T15:30:59+0300,Европлан,"Уверенное знание основ математики, статистики и теории вероятности. Навыки анализа данных, поиска закономерностей и отклонений. Опыт работы с SQL (сложные...",Выбор и расчёт продуктовых метрик и <highlighttext>бизнес</highlighttext>-метрик при реализации проектов. Ad-Hoc <highlighttext>аналитика</highlighttext> для поддержки принятия продуктовых решений (SQL...,Нет опыта,Полная занятость
8,83223549,Младший аналитик данных (декретная ставка),Москва,,,,,2023-07-10T13:36:13+0300,РОСБАНК,"Наличия высшего образования (математика, статистика, ИТ). Хороших знаний теории вероятностей и математической статистики. Опыта создания отчетов, дашбордов, навыков работы с...",Заниматься созданием отчетов и дашбордов по внутренним курсам. Внедрять автоматизации в создание и обновление отчетов. Заниматься предиктивной <highlighttext>аналитикой</highlighttext> - формированием и...,От 1 года до 3 лет,Полная занятость
9,83316379,Data Analyst,Томск,,,,,2023-07-12T09:04:11+0300,Rubius,Опыт работы в области анализа данных — от 2 лет. Знание методов сбора и подготовки данных. Опыт обработки данных в Python...,"Сбор требований с <highlighttext>бизнес</highlighttext>-заказчиков. Написание технических заданий на разработку витрин данных и дашбордов. Анализ проблем с качеством данных, постановка...",От 1 года до 3 лет,Полная занятость
