In [1]:
# Для осуществления запросов к REST API hh.ru нам понадобится модуль 'requests',
# содержащий некоторые необходимые функции для работы с HTTP

import requests

In [2]:
# Точка входа в API HeadHunter для поиска вакансий

api_url = 'https://api.hh.ru/vacancies'

In [3]:
# Параметры запроса к API, конкретизирующие поисковый запрос.
# Для прояснения значений параметров следует обратиться к документации
# по REST API hh.ru (https://github.com/hhru/api)

search_parameters = {'text': 'Системный аналитик',
                     'search_field':'name',
                     'per_page':'100',
                     'page': 0,
                     'describe_arguments':'true'}

In [4]:
# Делаем запрос с помощью функции 'get' из модуля 'requests' импортированного ранее.
# В качестве параметров запроса указываем URL поиска вакансий
# (на этот адрес будет отправлен поисковый запрос) и собственно сам запрос.
# После выполнения запроса веб-сервер hh.ru возвращает ответ,
# который мы помещаем в переменную 'raw_response'

raw_response = requests.get(api_url, params = search_parameters)

In [5]:
# В IPython можно получить содержимое переменной просто введя её имя

raw_response

<Response [200]>

In [6]:
# Посмотрим тип объекта содержащего результат работы функции 'requests.get()'
# с помощью встроенной в Python функции 'type()'

type(raw_response)

requests.models.Response

In [7]:
# Никакой определённости...
# Посмотрим структуру объекта с помощью встроенной в Python функции 'dir()'

dir(raw_response)

['__attrs__',
 '__bool__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__nonzero__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setstate__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_content',
 '_content_consumed',
 '_next',
 'apparent_encoding',
 'close',
 'connection',
 'content',
 'cookies',
 'elapsed',
 'encoding',
 'headers',
 'history',
 'is_permanent_redirect',
 'is_redirect',
 'iter_content',
 'iter_lines',
 'json',
 'links',
 'next',
 'ok',
 'raise_for_status',
 'raw',
 'reason',
 'request',
 'status_code',
 'text',
 'url']

In [8]:
# Приступаем к исследованию объеков.
# Например вот здесь (параметр '.url'), лежит сформированная из адреса API и наших параметров строка запроса,
# которая и была отправлена веб-серверу hh.ru

raw_response.url

'https://api.hh.ru/vacancies?text=%D0%A1%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%BD%D1%8B%D0%B9+%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D1%82%D0%B8%D0%BA&search_field=name&per_page=100&page=0&describe_arguments=true'

In [9]:
# А здесь (параметр '.status_code') статус результата запроса (стандартный код HTTP)

raw_response.status_code

200

In [10]:
# Прошёл ли запрос успешно (спойлер: ДА!)

raw_response.ok

True

In [11]:
# То что нам нужно лежит в свойстве '.content'

raw_response.content[0:200]

b'{"items":[{"id":"28565981","premium":false,"name":"\xd0\xa1\xd0\xb8\xd1\x81\xd1\x82\xd0\xb5\xd0\xbc\xd0\xbd\xd1\x8b\xd0\xb9 \xd0\xb0\xd0\xbd\xd0\xb0\xd0\xbb\xd0\xb8\xd1\x82\xd0\xb8\xd0\xba","department":null,"has_test":false,"response_letter_required":true,"area":{"id":"1","name":"\xd0\x9c\xd0\xbe\xd1\x81\xd0\xba\xd0\xb2\xd0\xb0","url":'

In [12]:
# В свойстве '.text', с поправкой на unicode 

raw_response.text[0:200]

'{"items":[{"id":"28565981","premium":false,"name":"Системный аналитик","department":null,"has_test":false,"response_letter_required":true,"area":{"id":"1","name":"Москва","url":"https://api.hh.ru/area'

In [13]:
# Запрос возвращает сырой текст описанный в JSON
# Восстанавливаем нативный объект Python из JSON plaintext используя метод '.json()'
# объекта 'requests.models.Response'
# И кладём результат в переменную response

response = raw_response.json()

In [14]:
# Исследуем то, что получилось в итоге

type(response)

dict

In [15]:
# Ну вот, теперь гораздо лучше - нормальный словарь.
# Раз словарь, значит смотрим ключи с помощью метода '.keys()'

response.keys()

dict_keys(['items', 'found', 'pages', 'per_page', 'page', 'clusters', 'arguments', 'alternate_url'])

In [16]:
# Список параметров поиска, указанных в поисковом запросе к API

response['arguments']

[{'argument': 'text',
  'value': 'Системный аналитик',
  'value_description': None,
  'disable_url': 'https://api.hh.ru/vacancies?describe_arguments=true&per_page=100&search_field=name',
  'cluster_group': None},
 {'argument': 'search_field',
  'value': 'name',
  'value_description': 'в названии вакансии',
  'disable_url': 'https://api.hh.ru/vacancies?describe_arguments=true&no_magic=true&per_page=100&text=%D0%A1%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%BD%D1%8B%D0%B9+%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D1%82%D0%B8%D0%BA',
  'cluster_group': None},
 {'argument': 'per_page',
  'value': '100',
  'value_description': None,
  'disable_url': 'https://api.hh.ru/vacancies?describe_arguments=true&search_field=name&text=%D0%A1%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%BD%D1%8B%D0%B9+%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D1%82%D0%B8%D0%BA',
  'cluster_group': None}]

In [17]:
# Номер страницы с которой были получены вакансии

response['page']

0

In [18]:
# Общее количество страниц найденных по запросу

response['pages']

9

In [19]:
# Общее количество вакансий найденных по запросу.
# Всё правильно, мы указывали 'per_page':'100', страниц нашлось 9
# 100 * 9 = 900, на последней странице только 33 вакансии, на остальных по сто

response['found']

833

In [20]:
# Двигаемся вглубь...

type(response['items'])

list

In [21]:
# Раз список, то следовательно можно

response['items'][0]

{'id': '28565981',
 'premium': False,
 'name': 'Системный аналитик',
 'department': None,
 'has_test': False,
 'response_letter_required': True,
 'area': {'id': '1', 'name': 'Москва', 'url': 'https://api.hh.ru/areas/1'},
 'salary': {'from': 110000, 'to': None, 'currency': 'RUR', 'gross': False},
 'type': {'id': 'open', 'name': 'Открытая'},
 'address': {'city': 'Москва',
  'street': 'Зубовский бульвар',
  'building': '4',
  'description': None,
  'lat': 55.73735,
  'lng': 37.590479,
  'raw': None,
  'metro': {'station_name': 'Парк культуры',
   'line_name': 'Кольцевая',
   'station_id': '5.104',
   'line_id': '5',
   'lat': 55.735221,
   'lng': 37.593095},
  'metro_stations': [{'station_name': 'Парк культуры',
    'line_name': 'Кольцевая',
    'station_id': '5.104',
    'line_id': '5',
    'lat': 55.735221,
    'lng': 37.593095}],
  'id': '123909'},
 'response_url': None,
 'sort_point_distance': None,
 'employer': {'id': '24934',
  'name': 'Агентство Экономической Информации ПРАЙМ',
  '

In [23]:
# Продолжаем в том же духе...

type(response['items'][0])

dict

In [24]:
# И далее...

response['items'][0].keys()

dict_keys(['id', 'premium', 'name', 'department', 'has_test', 'response_letter_required', 'area', 'salary', 'type', 'address', 'response_url', 'sort_point_distance', 'employer', 'published_at', 'created_at', 'archived', 'apply_alternate_url', 'insider_interview', 'url', 'alternate_url', 'relations', 'snippet', 'contacts'])

In [25]:
# Ещё глубже...

type(response['items'][0]['employer'])

dict

In [26]:
# ...

response['items'][0]['employer'].keys()

dict_keys(['id', 'name', 'url', 'alternate_url', 'logo_urls', 'vacancies_url', 'trusted'])

In [27]:
# Дошли до дна

response['items'][0]['employer']['url']

'https://api.hh.ru/employers/24934'

In [28]:
#Интересно что за url, посмотрим...

raw_response = requests.get('https://api.hh.ru/employers/2571535')
response = raw_response.json()
response

{'id': '2571535',
 'trusted': True,
 'name': 'DR.CASH',
 'type': 'company',
 'description': '<p><strong>DR.CASH</strong> — CPA сеть,\xa0работающая на международном рынке лидогенерации и перформанс маркетинга. У нас самые современные технологии, высокие зарплаты, интересные задачи и амбициозные планы.</p> \xa0 <p>Кроме того, вы можете рассчитывать на:</p> <ul> <li>официальное\xa0оформление и всегда своевременную оплату</li> <li>индивидуальную систему бонусов для каждого сотрудника (по договоренности)</li> <li>адекватных руководителей и\xa0возможности для карьерного роста</li> <li>быстрорастущий проект, который нравится пользователям и хорошо зарабатывает</li> <li>дружелюбную атмосферу в\xa0молодом коллективе профессионалов</li> <li>рабочее место по вкусу, чай, кофе, печеньки</li> <li>гибкий график начала и окончания рабочего дня</li> <li>иногородним — помощь в релокации</li> </ul> \xa0 <p>Если вы хотели бы работать с нами, но в данный момент подходящие для вас вакансии не опубликованы —

In [29]:
# А на последок, вводим наш url в адресную строку браузера

raw_response.url

'https://api.hh.ru/employers/2571535'

In [None]:
# P.S: Особенно приятно это делать в Firefox