Skip to content

azuresoup/hh-skills-parser

Repository files navigation

Vacancy Skills Analyzer 💅

Парсит вакансии с HeadHunter по поисковому запросу и анализирует самые востребованные навыки и ключевые слова.

⚠️⚠️⚠️ Внимание весь код с кринжовыми смайликами, потому что он навайбкожен за 5 минут тупо для достижения цели!!!!!!!! Ключ API хедхантера не нужен!!!

По всем вопросам можно написать мне в тг @azuresoup, помогу чем смогу! Но если у вас просто не запускается, лучше спросите у LLM (ChatGPT или Claude.ai) как там этот пайтон установить и запустить. А ещё хочу сказать, что я не карьерный коуч и не ментор!!!

TL;DR хочу готовое

Уже посчитанное для Go, JS, Python, Java, C#, C++, Rust в гугл табличке!! Если хотите добавить свой язык, напишите мне @azuresoup

Что тут есть

main.py:

  1. Ищет все вакансии с запросом DEFAULT_SEARCH_QUERY в названии вакансии.
  2. Идёт по списку вакансий и засовывает их в бд vacancies.db, если их нет. Фильтрует, если в названии есть слова из EXCLUDED_WORDS (так можно убрать из выборки всякие тимлидские вакансии или учителей в айти школах).

skills.py:

  1. Ходит по всем сохранённым в бд vacancies.db вакансиям и считает отдельно навыки (то, что в блоке навыки) и отдельно ключевые слова в самом тексте вакансии.
  2. Составляет рейтинг самых часто встречающихся.

vacancies.db:

  1. В эту бд main.py складывает вакансии. Из этой бд skills.py ищет данные для анализа.
  2. В бд лежат вакансии для Go. Если вы гошник, можно просто их оставить.
  3. Если у вас другой язык, вам нужно либо просто удалить файл бд из папки (main.py создаст новую пустую сам), либо почистить данные в табличке vacancies.

vacancies_XXX.db:

  1. БД с вакансиями XXX языка (поисковый запрос закомментирован в main.py).
  2. Если вы не хотите выгружать заново все вакансии с HH, можете переименовать её в vacancies.db и использовать.

Установка

pip install requests bleach

Использование

  1. Если вы не гошник, удалите или почистите vacancies.db
  2. Запускаем main.py и ждём, пока он выгрузит вам вакансии
  3. Запускаем skills.py и смотрим результатики
  4. Навыки засовываем в резюме в навыки и подтверждаем хотя бы 1 (для зелёной плашки около вас у hr), ключевые слова добавляем упоминания в тексте резюме (так вы будете выше в поиске)

Результат

🔧 НАВЫКИ ИЗ KEY_SKILLS (топ 50):
Всего упоминаний навыков: 1923
Уникальных навыков: 251

1. Golang: 281
2. PostgreSQL: 155
3. Go: 108
4. Docker: 90
5. Kubernetes: 79
... (50 штук и можно настроить больше в TOP_SKILLS_LIMIT)

📝 КЛЮЧЕВЫЕ СЛОВА ИЗ ОПИСАНИЙ (топ 50):
Всего слов найдено: 14156
Уникальных слов: 2612

1. go: 662
2. golang: 471
3. postgresql: 357
4. api: 302
5. docker: 286
... (50 штук и можно настроить больше в TOP_KEYWORDS_LIMIT)

Всем удачи!!!!! ♥

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages