In [1]:
import requests
import pprint
import pandas as pd
import asyncio
import aiohttp
import nest_asyncio
nest_asyncio.apply()

In [2]:
specializations = {
    'Администратор баз данных': {
        'specialization': '1.420', 
    },
    'Системный администратор информационно-коммуникационных систем': {
        'specialization': '25.383', 
    },
    
    'Программист': {
        'specialization': '1.221', 
    },
    
    'Специалист по тестированию в области информационных технологий': {
        'specialization': '1.117', 
    },
    
    'Специалист по информационным системам': {
        'specialization': '14.91', 
    },
    
    'Системный программист': {
       'specialization': ['1.272', '1.273'], 
    },
    
   'Специалист по администрированию сетевых устройств информационно-коммуникационных систем': {
       'specialization': '1.270',
       'text': 'администратор'
   },
    
    'Специалист по дизайну графических и пользовательских интерфейсов': {
        'text': 'дизайн интерфейсов',
    },
    
    'Системный аналитик': {
        'specialization': '1.25', 
    },
    
    'Руководитель проектов в области информационных технологий': {
        'specialization': '1.327', 
    },
}

soft_skills = [
    ['Коммуникативные навыки', 'Информаирование сотрудников', 'Проведение собеседований', 'Проводить интервью', 'Проводить презентации', 'Консультирование', 'Обратная связь с заказчиком', 'Переговоры'],
    ['Работа в команде', 'Распределение задач', 'Командная работа'],
    ['Самоорганизация','Самообразование', 'Способность к непрерывному обучению', 'Самостоятельность', 'Структурировать собственные знания'],
    ['Критическое мышление','Аналитическое мышление','Системное мышление', 'Выбор стратегии', 'Выявление значимых характеристик', 'Анализ'],
    ['Планирование', 'Управление проектами','Распределение задач'],
    ['Межкультурное взаимодействие'],
    ['Эмоциональный интеллект', 'Эмпатия', 'Сопереживание'],
    ['Адаптивность', 'Работа в условиях неопределенности'],
    ['Организованность', 'Тайм-менеджмент'],
    ['Достижение результатов', 'Ответственность', 'Принятие риска', 'Инициативность', 'Настойчивость', 'Достижение целей', 'Распределение задач', 'Принятие решений'],
    ['Обучение других', 'Наставничество'],
]

test = ' OR '.join([f'"{x}"' for x in soft_skills[1]])

default_params = {
    'experience': 'between1And3',
    'per_page': 3,
    'page':0
}
print(test)

"Работа в команде" OR "Распределение задач" OR "Командная работа"


In [3]:
async def async_request(url, params):
    async with aiohttp.request(method='GET', url=url, params=params) as response:
        result = await response.json()
    return result


In [4]:
async def get_count_by_soft_skill(skill, params):
    synonyms = ' OR '.join([str(x) for x in skill])
    if params.get('text') is not None:
        synonyms = f'({synonyms}) AND {params.get("text")}'
    params.update({'text': synonyms})
    r = await async_request("https://api.hh.ru/vacancies", params)
    found_by_skill_number = r['found']
    return skill[0], found_by_skill_number

async def get_vacancies_number(profession):
    current_params = default_params.copy()
    current_params.update(specializations[profession])
    r = await async_request("https://api.hh.ru/vacancies", current_params)
    found_number = r['found']
    return profession, current_params, found_number
        
async def get_matrix():
    matrix = dict()
    futures = [get_vacancies_number(k) for k, _ in specializations.items()]
    for future in asyncio.as_completed(futures):
        profession, params, found_number = await future
        matrix[profession] = dict()
        matrix[profession]['Всего'] = found_number
        furure_skills = [get_count_by_soft_skill(skill, params.copy()) for skill in soft_skills]
        for future_skill in asyncio.as_completed(furure_skills):
            skill, found_by_skill_number = await future_skill
            matrix[profession][skill] = found_by_skill_number
    return matrix

ioloop = asyncio.get_event_loop()
skill_matrix = ioloop.run_until_complete(get_matrix())
#ioloop.close()



In [5]:
df = pd.DataFrame(skill_matrix)
df

Unnamed: 0,Руководитель проектов в области информационных технологий,Программист,Системный аналитик,Специалист по дизайну графических и пользовательских интерфейсов,Системный администратор информационно-коммуникационных систем,Специалист по администрированию сетевых устройств информационно-коммуникационных систем,Администратор баз данных,Специалист по информационным системам,Системный программист,Специалист по тестированию в области информационных технологий
Всего,3862,15300,4367,796,462,1191,2057,706,6812,3496
Критическое мышление,1604,3352,2967,179,35,151,627,89,1790,1523
Обучение других,594,1983,621,102,51,84,221,130,842,432
Эмоциональный интеллект,14,14,15,7,0,0,14,4,13,3
Достижение результатов,1523,4038,1449,278,150,317,574,163,2037,973
Межкультурное взаимодействие,0,0,0,0,0,0,0,0,0,0
Адаптивность,54,555,33,71,0,3,7,8,74,29
Планирование,1822,2141,1158,130,37,95,211,56,1018,566
Коммуникативные навыки,1360,2050,1220,98,99,165,404,113,1609,721
Самоорганизация,632,1836,657,133,37,104,225,48,854,443


In [10]:
df.to_excel('prof.xlsx')