In [1]:
import json
import sys
import os
from pathlib import Path

# Добавляем корневую директорию проекта в пути импорта
project_root = Path.cwd().parent  # Путь к корневой директории проекта (если notebook находится в папке tests)
sys.path.append(str(project_root))

# Импортируем наши парсеры
from src.parsers.resume_extractor import ResumeExtractor
from src.parsers.vacancy_extractor import VacancyExtractor

In [2]:
# Пути к файлам с данными
resume_file_path = Path("tests/fetched_resume_6d807532ff0ed6b79f0039ed1f63386d724a62.json")
vacancy_file_path = Path("tests/fetched_vacancy_120234346.json")

# Проверяем наличие файлов
print(f"Резюме файл существует: {resume_file_path.exists()}")
print(f"Вакансия файл существует: {vacancy_file_path.exists()}")

# Инициализируем парсеры
resume_parser = ResumeExtractor()
vacancy_parser = VacancyExtractor()

Резюме файл существует: True
Вакансия файл существует: True


In [3]:
# Загружаем данные
try:
    with open(resume_file_path, 'r', encoding='utf-8') as f:
        resume_data = json.load(f)
    print("Данные резюме успешно загружены")
except Exception as e:
    print(f"Ошибка при загрузке данных резюме: {e}")
    resume_data = None

try:
    with open(vacancy_file_path, 'r', encoding='utf-8') as f:
        vacancy_data = json.load(f)
    print("Данные вакансии успешно загружены")
except Exception as e:
    print(f"Ошибка при загрузке данных вакансии: {e}")
    vacancy_data = None

Данные резюме успешно загружены
Данные вакансии успешно загружены


In [4]:
# Парсим данные резюме
if resume_data:
    print("\n===== Парсинг резюме =====")
    parsed_resume = resume_parser.extract_resume_info(resume_data)
    if parsed_resume:
        print("🟢 Парсинг резюме прошел успешно!")
        print(f"\nЖелаемая должность: {parsed_resume.title}")
        print(f"\nКлючевые навыки ({len(parsed_resume.skill_set)}):")
        for skill in parsed_resume.skill_set:
            print(f"  • {skill}")
        print(f"\nОпыт работы ({len(parsed_resume.experience)}):")
        for i, exp in enumerate(parsed_resume.experience, 1):
            print(f"  {i}. Должность: {exp.position}")
            print(f"     Период: {exp.start or 'Н/Д'} - {exp.end or 'по настоящее время'}")
            print(f"     Описание: {exp.description[:100]}..." if len(exp.description) > 100 else f"     Описание: {exp.description}")
            print()
        print(f"\nЯзыки ({len(parsed_resume.languages)}):")
        for lang in parsed_resume.languages:
            print(f"  • {lang.name} - {lang.level.name}")
        
        print("\nМодель данных резюме (все поля):")
        print(parsed_resume.model_dump_json(indent=2))
    else:
        print("🔴 Ошибка при парсинге резюме")


===== Парсинг резюме =====
🟢 Парсинг резюме прошел успешно!

Желаемая должность: LLM Engineer

Ключевые навыки (17):
  • ChatGPT
  • AI
  • prompt
  • prompt engineering
  • Python
  • JSON API
  • Нейро-сотрудники
  • Умение работать в команде
  • Искусственный интеллект
  • Глубокое обучение
  • NLP
  • Машинное обучение
  • LLM
  • AI тренер
  • LangChain
  • Stable Diffusion
  • Чат-бот

Опыт работы (5):
  1. Должность: AI engineer
     Период: 2024-05-01 - по настоящее время
     Описание: ***ПРОЕКТ***: Telegram-бот для автоматизации поздравлений сотрудников (синтез речи)

СТЕК ТЕХНОЛОГИЙ...

  2. Должность: AI engineer
     Период: 2023-08-01 - 2024-05-01
     Описание: ***ПРОЕКТ***: Чат-боты-кураторы на базе LLM для автоматизации проверки заданий

СТЕК ТЕХНОЛОГИЙ: Pyt...

  3. Должность: Контент-менеджер
     Период: 2022-07-01 - 2023-07-01
     Описание: Создание и редактирование текстов, разработка стратегий коммуникации и маркетинговых кампаний, подде...

  4. Должность: авт

In [5]:
if vacancy_data:
    print("\n===== Парсинг вакансии =====")
    parsed_vacancy = vacancy_parser.extract_vacancy_info(vacancy_data)
    if parsed_vacancy:
        print("🟢 Парсинг вакансии прошел успешно!")
        
        print(f"\nКлючевые навыки ({len(parsed_vacancy.key_skills)}):")
        for skill in parsed_vacancy.key_skills:
            print(f"  • {skill}")
        
        # Получаем первые 500 символов описания для краткого просмотра
        description_preview = parsed_vacancy.description[:500] + "..." if len(parsed_vacancy.description) > 500 else parsed_vacancy.description
        print(f"\nОписание вакансии (превью):\n{description_preview}")
        
        print("\nМодель данных вакансии (все поля):")
        print(parsed_vacancy.model_dump_json(indent=2))
    else:
        print("🔴 Ошибка при парсинге вакансии")


===== Парсинг вакансии =====
🟢 Парсинг вакансии прошел успешно!

Ключевые навыки (4):
  • PyTorch
  • NLP
  • LLM
  • LangChain

Описание вакансии (превью):
Обязанности:  Взаимодействие с заказчиками для сбора и уточнения требований Проектирование и разработка моделей машинного обучения (NLP) Внедрение современных подходов (fine-tuning, prompt-engineering, RAG) Организация процессов валидации моделей Управление командой из 3 датасайнтистов, распределение задач Внедрение методологий MLOps Взаимодействие с Data Architect, Data Analyst, Agile-командами, Data Engineer по вопросам обеспечения потребностей бизнеса в моделях  Требования:   Знание и пониман...

Модель данных вакансии (все поля):
{
  "description": "Обязанности:  Взаимодействие с заказчиками для сбора и уточнения требований Проектирование и разработка моделей машинного обучения (NLP) Внедрение современных подходов (fine-tuning, prompt-engineering, RAG) Организация процессов валидации моделей Управление командой из 3 датасайнти

In [6]:
# Проверка совместимости - какие навыки из вакансии есть/отсутствуют в резюме
if parsed_resume and parsed_vacancy:
    print("\n===== Анализ совместимости навыков =====")
    vacancy_skills = set(skill.lower() for skill in parsed_vacancy.key_skills)
    resume_skills = set(skill.lower() for skill in parsed_resume.skill_set)
    
    matching_skills = vacancy_skills.intersection(resume_skills)
    missing_skills = vacancy_skills - resume_skills
    
    print(f"Совпадающие навыки ({len(matching_skills)}):")
    for skill in matching_skills:
        print(f"  ✅ {skill}")
    
    print(f"\nОтсутствующие навыки ({len(missing_skills)}):")
    for skill in missing_skills:
        print(f"  ❌ {skill}")
    
    match_percentage = len(matching_skills) / len(vacancy_skills) * 100 if vacancy_skills else 0
    print(f"\nПроцент совпадения навыков: {match_percentage:.1f}%")


===== Анализ совместимости навыков =====
Совпадающие навыки (3):
  ✅ langchain
  ✅ nlp
  ✅ llm

Отсутствующие навыки (1):
  ❌ pytorch

Процент совпадения навыков: 75.0%
