In [1]:
import os
import pandas as pd
from pathlib import Path
from tqdm import tqdm
from dotenv import load_dotenv
from professions_list import ALL_PROFESSIONS, PROFESSIONS_LIST
from hh_resume_parser_db import HHResumeParser
from clickhouse_driver import Client

In [2]:
load_dotenv()

CLICKHOUSE_HOST: str = os.getenv("CLICKHOUSE_HOST")
CLICKHOUSE_USER: str = os.getenv("CLICKHOUSE_USER")
CLICKHOUSE_PASSWORD: str = os.getenv("CLICKHOUSE_PASSWORD")
CLICKHOUSE_DATABASE: str = os.getenv("CLICKHOUSE_DATABASE")

In [3]:
clickhouse = Client(host=CLICKHOUSE_HOST, port='9000', user=CLICKHOUSE_USER, password=CLICKHOUSE_PASSWORD, database=CLICKHOUSE_DATABASE, settings={'use_numpy': True})

In [4]:
def get_unloaded_position(clickhouse):
    loaded_position = clickhouse.query_dataframe("""
    select search_query
    from hh_resumes
    """)
    loaded_position = set(loaded_position['search_query'].tolist())
    unloaded_position = list(set(PROFESSIONS_LIST['it_tech']) - loaded_position)
    return sorted(unloaded_position)

In [5]:
unloaded_position = get_unloaded_position(clickhouse)

In [6]:
resume_parser = HHResumeParser(timeout=60, max_retries=5)

In [None]:
for prof in tqdm(unloaded_position):
    df_resumes = resume_parser.load_resumes(
        search_terms=[prof],
        areas=['Москва'],
        pages=250,
        items_on_page=20,
        delay=2
    )

    resume_parser.save_to_clickhouse(df_resumes, clickhouse)

  0%|                                                                                                                                                                                                                                                                          | 0/63 [00:00<?, ?it/s]
Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                                | 1/250 [00:00<00:00, 1933.75it/s, Резюме=0, Запрос=1C-программист, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                         

=== ИТОГИ ===
Всего собрано резюме: 87
Распределение по поисковым запросам:
  1C-программист: 87
Успешно сохранено 87 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                                | 1/250 [00:00<00:00, 3816.47it/s, Резюме=0, Запрос=1C-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                               | 2/250 [00:32<1:06:14, 16.03s/it, Резюме=0, Запрос=1C-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 87
Распределение по поисковым запросам:
  1C-разработчик: 87
Успешно сохранено 87 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                              | 1/250 [00:00<00:00, 2857.16it/s, Резюме=0, Запрос=ABAP-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                             | 2/250 [00:31<1:04:55, 15.71s/it, Резюме=0, Запрос=ABAP-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 94
Распределение по поисковым запросам:
  ABAP-разработчик: 94
Успешно сохранено 94 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                           | 1/250 [00:00<00:00, 4670.72it/s, Резюме=0, Запрос=Android-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                          | 2/250 [00:31<1:04:25, 15.59s/it, Резюме=0, Запрос=Android-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▍                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 175
Распределение по поисковым запросам:
  Android-разработчик: 175
Успешно сохранено 175 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                           | 1/250 [00:00<00:00, 3718.35it/s, Резюме=0, Запрос=Angular-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                            | 2/250 [00:15<31:00,  7.50s/it, Резюме=0, Запрос=Angular-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 9
Распределение по поисковым запросам:
  Angular-разработчик: 9
Успешно сохранено 9 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                                 | 1/250 [00:00<00:00, 1475.31it/s, Резюме=0, Запрос=Automation QA, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                                | 2/250 [00:31<1:04:38, 15.64s/it, Резюме=0, Запрос=Automation QA, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 425
Распределение по поисковым запросам:
  Automation QA: 425
Успешно сохранено 425 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                                   | 1/250 [00:00<00:00, 3355.44it/s, Резюме=0, Запрос=BI-аналитик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                                  | 2/250 [00:31<1:04:17, 15.55s/it, Резюме=0, Запрос=BI-аналитик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 55
Распределение по поисковым запросам:
  BI-аналитик: 55
Успешно сохранено 55 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                            | 1/250 [00:00<00:00, 980.21it/s, Резюме=0, Запрос=Backend-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                          | 2/250 [00:29<1:01:38, 14.91s/it, Резюме=0, Запрос=Backend-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▍                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 291
Распределение по поисковым запросам:
  Backend-разработчик: 291
Успешно сохранено 291 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                                | 1/250 [00:00<00:00, 3320.91it/s, Резюме=0, Запрос=C#-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                                                                                                                               | 2/250 [00:31<1:04:28, 15.60s/it, Резюме=0, Запрос=C#-разработчик, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                     

=== ИТОГИ ===
Всего собрано резюме: 163
Распределение по поисковым запросам:
  C#-разработчик: 163
Успешно сохранено 163 записей в ClickHouse таблицу hh_resumes



Сбор резюме:   0%|                                                                                                                                                                                                                                                            | 0/250 [00:00<?, ?it/s][A
Сбор резюме:   0%|▊                                                                                                                                                                                                           | 1/250 [00:00<00:00, 2028.19it/s, Резюме=0, Запрос=CTO, Страница=1/250][A
Сбор резюме:   1%|█▋                                                                                                                                                                                                          | 2/250 [00:32<1:06:21, 16.05s/it, Резюме=0, Запрос=CTO, Страница=1/250][A
Сбор резюме:   1%|█▌                                                                                     

### 