Skip to content

danielmirrox/pg_case

Repository files navigation

PG_HQA: Яндекс Classic & Neuro Search Automation

Описание

В рамках хакатона Changellenge IT Cup 2026 реализован проект для сбора и подготовки данных из Yandex:

  • yandex_classic_search.py классический парсер выдачи;
  • yandex_neuro_selenium.py нейросетевой парсер через Selenium;
  • class_map.json карта парсинга;
  • requirements.txt зависимости;
  • .env.example шаблон конфигурации среды;

Быстрый старт

  1. Создайте виртуальное окружение:
    python -m venv .venv
    .venv\Scripts\activate
  2. Установите зависимости:
    pip install -r requirements.txt
  3. Запустите нужный скрипт:
    python yandex_classic_search.py
    # или
    python yandex_neuro_selenium.py

Файлы в репозитории

  • yandex_classic_search.py
  • yandex_neuro_selenium.py
  • class_map.json
  • requirements.txt
  • README.md
  • .env.example

Результаты выполнения

По умолчанию результаты сбора сохраняются в папку exports/.

  • exports/query_coverage.csv, exports/domain_summary.csv, exports/sources.csv и т.п. (формат файлов зависит от сценария запуска).

Примечание

Вам достаточно настроить .env локально по .env.example и запускать парсеры по шагам выше.

Лицензия MIT

About

Аналитический парсер Yandex Classic+Neuro по категориям Hair/Baby/Oral care: сбор, классификация доменов, экспорт покрытия.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages