In [None]:
import requests
import pandas as pd
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import plotly.express as px
import plotly.graph_objects as go
import numpy as np

In [None]:
def get_key_skills(vacancy_id):
  """
  Извлекает ключевые навыки для данного HH.ru идентификатор вакансии.

  Аргументы:
  идентификатор вакансии (в): HH.ru идентификатор вакансии.

  Возвращается:
  список: Список ключевых навыков для данной вакансии.
  """
  url = f"https://api.hh.ru/vacancies/{vacancy_id}"

  response = requests.get(url)
  data = response.json()

  if 'key_skills' in data:
    key_skills = [skill['name'] for skill in data['key_skills']]
  else:
    key_skills = ['Нет навыков']

  return key_skills

In [None]:
def search_hh_vacancies_1C():
    """
    Ищет вакансии консультанта 1С на HH.ru .

    Аргументы:

    Возвращается:
    pd.DataFrame: Фрейм данных со следующими по
            - id
            - name
            - salary from
            - salary to
            - experience
            - alternate_url
    """

    vacancies = []

    page = 0
    while True:
        url = "https://api.hh.ru/vacancies?area=1&text=name:(Консультант 1C)&area=1&per+page=100&page=" + str(page)
        response = requests.get(url)

        if response.status_code == 200:
            data = response.json()
            items = data.get("items")

            if items:
                vacancies.extend(items)
            else:
                break

        else:
            print("Error executing the request:", response.status_code, "for page ", page)
            break

        page += 1
    vacancies_df = pd.DataFrame(vacancies)
    vacancies_df = vacancies_df[["id", "name", "salary", "experience", "alternate_url"]]

    vacancies_df.loc[:, "salary from"] = vacancies_df["salary"].apply(lambda x: x["from"] if x else None)
    vacancies_df["salary to"] = vacancies_df["salary"].apply(lambda x: x["to"] if x else None)
    vacancies_df.drop(columns="salary", inplace=True)
    vacancies_df["experience"] = vacancies_df["experience"].apply(lambda x: x["name"] if x else None)
    vacancies_df = vacancies_df[~vacancies_df['name'].str.contains('программист', case=False)]
    return vacancies_df

In [None]:
def search_hh_vacancies_acc():
    """
    Ищет вакансии главного бухгалтера на HH.ru .

    Аргументы:

    Возвращается:
    pd.DataFrame: Фрейм данных со следующими по
            - id
            - name
            - salary from
            - salary to
            - experience
            - alternate_url
    """

    vacancies = []

    page = 0
    while True:
        url = "https://api.hh.ru/vacancies?area=1&text=name:(Главный бухгалтер)&area=1&per+page=100&page=" + str(page)
        response = requests.get(url)

        if response.status_code == 200:
            data = response.json()
            items = data.get("items")

            if items:
                vacancies.extend(items)
            else:
                break

        else:
            print("Error executing the request:", response.status_code, "for page ", page)
            break

        page += 1
    vacancies_df = pd.DataFrame(vacancies)
    vacancies_df = vacancies_df[["id", "name", "salary", "experience", "alternate_url"]]

    vacancies_df.loc[:, "salary from"] = vacancies_df["salary"].apply(lambda x: x["from"] if x else None)
    vacancies_df["salary to"] = vacancies_df["salary"].apply(lambda x: x["to"] if x else None)
    vacancies_df.drop(columns="salary", inplace=True)
    vacancies_df["experience"] = vacancies_df["experience"].apply(lambda x: x["name"] if x else None)
    vacancies_df = vacancies_df[~vacancies_df['name'].str.contains('программист', case=False)]
    return vacancies_df

In [None]:
def replace_skills(skills):
  if skills is None:
    return skills
  return [skill.replace('1С;ERP', '1С:ERP') for skill in skills]

vacancies_1C['key_skills'] = vacancies_1C['key_skills'].apply(replace_skills)

Получаем вакансии для 1С консультанта

In [None]:
vacancies_1C = search_hh_vacancies_1C()
vacancies_1C

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  vacancies_df.loc[:, "salary from"] = vacancies_df["salary"].apply(lambda x: x["from"] if x else None)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  vacancies_df["salary to"] = vacancies_df["salary"].apply(lambda x: x["to"] if x else None)
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  vacancies_df.drop(columns="salary", inplace=True)
A value is trying t

Unnamed: 0,id,name,experience,alternate_url,salary from,salary to
0,88283709,Консультант поддержки 1С,От 1 года до 3 лет,https://hh.ru/vacancy/88283709,100000.0,
1,88734873,Консультант технической поддержки 1С,От 1 года до 3 лет,https://hh.ru/vacancy/88734873,175000.0,
2,88409460,Консультант 1C (CRM),От 1 года до 3 лет,https://hh.ru/vacancy/88409460,150000.0,
3,88093316,Консультант 1С (удаленно),От 1 года до 3 лет,https://hh.ru/vacancy/88093316,,
4,88822612,Стажер консультант-аналитик 1С,Нет опыта,https://hh.ru/vacancy/88822612,40000.0,
...,...,...,...,...,...,...
469,87845360,Консультант-аналитик 1С,От 1 года до 3 лет,https://hh.ru/vacancy/87845360,,230000.0
470,87893210,Старший консультант-аналитик 1С (регламентиров...,От 1 года до 3 лет,https://hh.ru/vacancy/87893210,,
471,86081935,Консультант 1С / Аналитик 1С (МСФО),От 3 до 6 лет,https://hh.ru/vacancy/86081935,,
472,87893062,Старший консультант 1С / Аналитик 1С (МСФО),От 3 до 6 лет,https://hh.ru/vacancy/87893062,,


Получаем навыки для 1С консультанта

In [None]:
vacancies_1C['key_skills'] = vacancies_1C['id'].apply(get_key_skills)

In [None]:
vacancies_1C

Unnamed: 0,id,name,experience,alternate_url,salary from,salary to,key_skills,analysis_field
0,88283709,Консультант поддержки 1С,От 1 года до 3 лет,https://hh.ru/vacancy/88283709,100000.0,,[],1C консультант
1,88734873,Консультант технической поддержки 1С,От 1 года до 3 лет,https://hh.ru/vacancy/88734873,175000.0,,"[ERP-системы на базе 1С, ERP, Бухгалтерский уч...",1C консультант
2,88409460,Консультант 1C (CRM),От 1 года до 3 лет,https://hh.ru/vacancy/88409460,150000.0,,"[1С: Предприятие 8, ERP-системы на базе 1С, Ра...",1C консультант
3,88093316,Консультант 1С (удаленно),От 1 года до 3 лет,https://hh.ru/vacancy/88093316,,,"[1С: Управление Торговлей, 1С: Комплексная авт...",1C консультант
4,88822612,Стажер консультант-аналитик 1С,Нет опыта,https://hh.ru/vacancy/88822612,40000.0,,[],1C консультант
...,...,...,...,...,...,...,...,...
469,87845360,Консультант-аналитик 1С,От 1 года до 3 лет,https://hh.ru/vacancy/87845360,,230000.0,"[1С: Бухгалтерия, 1С: Зарплата и управление пе...",1C консультант
470,87893210,Старший консультант-аналитик 1С (регламентиров...,От 1 года до 3 лет,https://hh.ru/vacancy/87893210,,,"[ERP, 1С: Бухгалтерия, 1С:ERP, 1С:УХ, регламен...",1C консультант
471,86081935,Консультант 1С / Аналитик 1С (МСФО),От 3 до 6 лет,https://hh.ru/vacancy/86081935,,,"[ERP-системы на базе 1С, 1С управление холдингом]",1C консультант
472,87893062,Старший консультант 1С / Аналитик 1С (МСФО),От 3 до 6 лет,https://hh.ru/vacancy/87893062,,,"[ERP-системы на базе 1С, 1С управление холдинг...",1C консультант


Уникальные навыки 1С консультанта

In [None]:
unique_skills = vacancies_1C['key_skills'].explode().unique()
unique_skills

array([nan, 'ERP-системы на базе 1С', 'ERP', 'Бухгалтерский учет',
       'Бухгалтерская отчетность', 'Техническая поддержка',
       'Тестирование пользовательского интерфейса', 'Консультирование',
       '1С: Предприятие 8', 'Разработка технических заданий',
       '1С: Управление Торговлей', '1С: Комплексная автоматизация',
       '1С программирование', '1C: ERP',
       '1С: Зарплата и управление персоналом', '1С: Документооборот',
       '1-я линия техноддержки', '1С: Бухгалтерия',
       '1С: Управление Производственным Предприятием',
       'Управление проектами', '1С: Склад', 'Пользователь ПК',
       '1С: Управление персоналом', 'Обучение персонала',
       'Работа в команде', '1С: Управление холдингом', 'Аналитика',
       'Atlassian Jira', 'Redmine', 'Постановка задач разработчикам',
       'Jira', 'Проведение тестирований', '2 линия поддержки',
       'Служба поддержки', 'Техническая поддержка 1с', 'Делопроизводство',
       'Автоматизация документооборота',
       'Разрабо

Создаем дополнительное поле

In [None]:
vacancies_1C['analysis_field'] = '1C консультант'

Получаем вакансии для бухгалтера

In [None]:
vacancies_acc = search_hh_vacancies_acc()
vacancies_acc

Unnamed: 0,id,name,experience,alternate_url,salary from,salary to
0,88870736,Старший бухгалтер по расчетам с поставщиками (...,От 1 года до 3 лет,https://hh.ru/vacancy/88870736,150000.0,
1,88841186,Главный бухгалтер,Более 6 лет,https://hh.ru/vacancy/88841186,200000.0,
2,88672079,Заместитель главного бухгалтера,Более 6 лет,https://hh.ru/vacancy/88672079,350000.0,
3,88670009,Главный бухгалтер,Более 6 лет,https://hh.ru/vacancy/88670009,300000.0,
4,88887042,Главный бухгалтер,Нет опыта,https://hh.ru/vacancy/88887042,,
...,...,...,...,...,...,...
1880,87592155,Ведущий бухгалтер по расчету заработной платы,От 3 до 6 лет,https://hh.ru/vacancy/87592155,85000.0,
1881,88594357,Заместитель главного бухгалтера,От 3 до 6 лет,https://hh.ru/vacancy/88594357,100000.0,
1882,84214467,Ведущий бухгалтер по брокерской деятельности (...,От 1 года до 3 лет,https://hh.ru/vacancy/84214467,,
1883,88791403,Заместитель главного бухгалтера,От 3 до 6 лет,https://hh.ru/vacancy/88791403,70000.0,


Получаем навыки для бухгалтера

In [None]:
vacancies_acc['key_skills'] = vacancies_acc['id'].apply(get_key_skills)
vacancies_acc

Unnamed: 0,id,name,experience,alternate_url,salary from,salary to,key_skills
0,88870736,Старший бухгалтер по расчетам с поставщиками (...,От 1 года до 3 лет,https://hh.ru/vacancy/88870736,150000.0,,"[1С: Предприятие 8, Работа с большим объемом и..."
1,88841186,Главный бухгалтер,Более 6 лет,https://hh.ru/vacancy/88841186,200000.0,,[]
2,88672079,Заместитель главного бухгалтера,Более 6 лет,https://hh.ru/vacancy/88672079,350000.0,,[]
3,88670009,Главный бухгалтер,Более 6 лет,https://hh.ru/vacancy/88670009,300000.0,,[]
4,88887042,Главный бухгалтер,Нет опыта,https://hh.ru/vacancy/88887042,,,"[Бухгалтерская отчетность, Бухгалтерский учет,..."
...,...,...,...,...,...,...,...
1880,87592155,Ведущий бухгалтер по расчету заработной платы,От 3 до 6 лет,https://hh.ru/vacancy/87592155,85000.0,,[Нет навыков]
1881,88594357,Заместитель главного бухгалтера,От 3 до 6 лет,https://hh.ru/vacancy/88594357,100000.0,,[Нет навыков]
1882,84214467,Ведущий бухгалтер по брокерской деятельности (...,От 1 года до 3 лет,https://hh.ru/vacancy/84214467,,,[]
1883,88791403,Заместитель главного бухгалтера,От 3 до 6 лет,https://hh.ru/vacancy/88791403,70000.0,,[Нет навыков]


Уникальные навыки бухгалтера

In [None]:
unique_skills = vacancies_acc['key_skills'].explode().unique()
unique_skills

array(['1С: Предприятие 8', 'Работа с большим объемом информации',
       'Бухгалтерская отчетность', '1С: Бухгалтерия',
       'Финансовая отчетность', nan, 'Бухгалтерский учет',
       'Первичная бухгалтерская документация', 'Основные средства',
       'прохождение налоговых проверок', 'Отчетность в ФСС',
       'Отчетность в ПФР', 'Управленческий учет',
       '1С: Управление Производственным Предприятием', 'Годовой баланс',
       'Российские стандарты бухгалтерского учета',
       'Налоговая отчетность', 'Расчет НДС', 'Авансовые отчеты',
       'Отчет о прибылях и убытках', 'Управленческая отчетность', 'ТМЦ',
       'Статистическая отчетность', '1С: Комплексная автоматизация',
       'Первичная документация', 'Контроль ведения налоговой отчетности',
       'Кадровое делопроизводство', '1C: Бухгалтерия',
       'Расчет заработной платы', 'Расчет зарплаты',
       'Налоговое законодательство', 'Управление бухгалтерией',
       'Налоговые декларации', 'Деловая переписка', 'Расчет нал

Создаем новое поле

In [None]:
vacancies_acc['analysis_field'] = 'Бухгалтер'

Объединяем датафреймы

In [None]:
combined_df = pd.concat([vacancies_1C, vacancies_acc])

Экспортируем датфрейм

In [None]:
combined_df.to_csv('vacancies.csv', index=False)