In [13]:
#https://hh.ru/oauth/authorize?response_type=code&client_id=YOUR_CLIENT_ID&redirect_uri=YOUR_REDIRECT_URI

In [14]:
url = 'https://hh.ru/oauth/authorize?response_type=code&client_id=' + client_id + '&redirect_uri=' + redirect_url
url

'https://hh.ru/oauth/authorize?response_type=code&client_id=GF7CCTJ1VEVD3C69BHDR2IB425DLQR1B7NIBMF88DO8G6E42LE8K314L2Q48NGT2&redirect_uri=https://t.me/bl3sk_soul'

In [None]:
import requests
import time
import json
from tqdm import tqdm  # Для отображения прогресса

# Список IT-позиций
it_positions = ['Swift']

# Получение списка вакансий по запросу
def get_vacancies_by_position(position, max_pages=70):
    """
    Получает список вакансий для указанной позиции с указанным количеством страниц.
    max_pages по умолчанию 50 для увеличения объема данных.
    """
    url = "https://api.hh.ru/vacancies"
    vacancies = []
    for page in range(max_pages):
        params = {
            "text": position,
            "per_page": 100,  # Максимальное количество вакансий на странице
            "page": page,
        }
        response = requests.get(url, params=params)
        response.raise_for_status()
        data = response.json()
        # Отфильтровываем только вакансии с указанной зарплатой
        vacancies.extend([item for item in data["items"] if item.get("salary") is not None])
        if page >= data["pages"] - 1:
            break  # Если страниц больше нет, выходим из цикла
        time.sleep(0.5)  # Задержка для соблюдения лимитов
    return vacancies

# Получение полной информации по вакансии
def get_vacancy_details(vacancy_id):
    """
    Получает полную информацию по вакансии, включая ключевые навыки и другие параметры.
    """
    url = f"https://api.hh.ru/vacancies/{vacancy_id}"
    response = requests.get(url)
    response.raise_for_status()
    vacancy = response.json()
    return {
        "id": vacancy.get("id"),
        "name": vacancy.get("name"),
        "area": vacancy.get("area", {}).get("name"),
        "salary": vacancy.get("salary"),
        "published_at": vacancy.get("published_at"),
        "schedule": vacancy.get("schedule", {}).get("name"),
        "professional_roles": [role["name"] for role in vacancy.get("professional_roles", [])],
        "experience": vacancy.get("experience", {}).get("name"),
        "employment": vacancy.get("employment", {}).get("name"),
        "key_skills": [skill["name"] for skill in vacancy.get("key_skills", [])]
    }

# Основная функция
def main():
    all_data = []
    for position in it_positions:
        print(f"Собираем данные для позиции: {position}")
        try:
            vacancies = get_vacancies_by_position(position)
            for vacancy in tqdm(vacancies, desc=f"Обработка вакансий для позиции '{position}'"):
                vacancy_id = vacancy["id"]
                try:
                    vacancy_details = get_vacancy_details(vacancy_id)
                    all_data.append(vacancy_details)
                except Exception as e:
                    print(f"Ошибка при получении данных вакансии {vacancy_id}: {e}")
                time.sleep(0.5)  # Задержка для API
        except Exception as e:
            print(f"Ошибка для позиции {position}: {e}")
    
    # Сохранение данных в JSON
    with open("vacancies_data_with_salary.json", "w", encoding="utf-8") as json_file:
        json.dump(all_data, json_file, ensure_ascii=False, indent=4)
    
    # Вывод количества сохраненных вакансий
    print(f"\nДанные успешно сохранены в 'vacancies_data_with_salary.json'.")
    print(f"Количество сохраненных вакансий: {len(all_data)}")

if __name__ == "__main__":
    main()

Собираем данные для позиции: Разработчик


Обработка вакансий для позиции 'Разработчик': 100%|██████████| 1007/1007 [15:17<00:00,  1.10it/s]


Собираем данные для позиции: Аналитик


Обработка вакансий для позиции 'Аналитик': 100%|██████████| 1201/1201 [17:56<00:00,  1.12it/s]


Собираем данные для позиции: Инженер


Обработка вакансий для позиции 'Инженер': 100%|██████████| 1290/1290 [19:17<00:00,  1.11it/s]


Собираем данные для позиции: Data


Обработка вакансий для позиции 'Data': 100%|██████████| 595/595 [08:47<00:00,  1.13it/s]


Собираем данные для позиции: Прграммист


Обработка вакансий для позиции 'Прграммист': 100%|██████████| 972/972 [13:49<00:00,  1.17it/s]


Собираем данные для позиции: Системный администратор


Обработка вакансий для позиции 'Системный администратор': 100%|██████████| 1532/1532 [22:17<00:00,  1.15it/s]


Собираем данные для позиции: Тестировщик


Обработка вакансий для позиции 'Тестировщик': 100%|██████████| 756/756 [11:30<00:00,  1.09it/s]


Собираем данные для позиции: DevOps


Обработка вакансий для позиции 'DevOps': 100%|██████████| 532/532 [07:40<00:00,  1.16it/s]


Собираем данные для позиции: Machine Learning Engineer


Обработка вакансий для позиции 'Machine Learning Engineer': 100%|██████████| 43/43 [00:38<00:00,  1.13it/s]


Данные успешно сохранены в 'vacancies_data_with_salary.json'.
Количество сохраненных вакансий: 7928



