In [7]:
import datetime as dt
import typing as tp
import random
from dataclasses import dataclass
from tqdm import tqdm
import json
import asyncpg


filename = "vacancy.json"

def get_direction():
    # 14139 - разработка,
    # 14142 - аналитика,
    # 14151 - бэк офис,
    # 14172 - дизайн,
    # 14160 - информационная безопасность
    # 14148 - Инфраструктура
    # 14163 - производство и сервисное обслуживание
    # 14166 - развитие бизнеса и консалтинг
    # 14145 - тестирование
    # 14169 - управление продуктами
    # 14154 - управление проектами

    return random.choice(
        [
            "разработка",
            "аналитика",
            "бэк офис",
            "дизайн",
            "информационная безопасность",
            "инфраструктура",
            "производство и сервисное обслуживание",
            "развитие бизнеса и консалтинг",
            "тестирование",
            "управление продуктами",
        ]
    )


vacancy_titles = {
    "разработка": [
        "Python разработчик",
        "Java разработчик",
        "Go разработчик",
        "Frontend разработчик",
    ],
    "аналитика": [
        "Бизнес-аналитик",
        "Системный аналитик",
        "Data Analyst",
        "Product Analyst",
    ],
    "бэк офис": [
        "Офис-менеджер",
        "Администратор офиса",
        "Секретарь",
        "Координатор офиса",
    ],
    "дизайн": [
        "UI/UX дизайнер",
        "Графический дизайнер",
        "Веб-дизайнер",
        "Моушн-дизайнер",
    ],
    "информационная безопасность": [
        "Специалист по ИБ",
        "Аналитик ИБ",
        "Инженер по ИБ",
        "Консультант по ИБ",
    ],
    "инфраструктура": [
        "Системный администратор",
        "DevOps инженер",
        "Сетевой инженер",
        "Инженер по инфраструктуре",
    ],
    "производство и сервисное обслуживание": [
        "Инженер по обслуживанию",
        "Техник по ремонту",
        "Сервисный инженер",
        "Производственный инженер",
    ],
    "развитие бизнеса и консалтинг": [
        "Бизнес-консультант",
        "Консультант по развитию бизнеса",
        "Менеджер по развитию бизнеса",
        "Консультант по консалтингу",
    ],
    "тестирование": [
        "Тестировщик ПО",
        "QA инженер",
        "Автоматизатор тестирования",
        "Специалист по тестированию",
    ],
    "управление продуктами": [
        "Продуктовый менеджер",
        "Менеджер по продукту",
        "Product Owner",
        "Product Lead",
    ],
}


def get_area(direction: str) -> str:
    return random.choice(vacancy_titles[direction])


def get_city():
    return random.choice(["москва", "нижний новгород", "минск", "санкт-петербург"])


@dataclass
class Vacancy:
    name: str
    description: str

    profession: str
    area: str  # разработка / дизайн
    supervisor: str  # руководитель

    education: tp.Literal[
        "без образования", "не оконченное высшее", "высшее", "среднее"
    ]

    experience_from: int  # год опыта от
    experience_to: int  # год опыта до
    quantity: int
    city: str
    deadline: dt.datetime
    direction: str  # специализация (отдел)


def vacancy_from_dict(data: dict) -> Vacancy:
    direction = get_direction()
    area = get_area(direction)

    experience_from = random.randint(1, 5)
    experience_to = 0
    if experience_from > 3:
        experience_to = experience_from + random.randint(2, 3)
    else:
        experience_to = experience_from + random.randint(1, 2)

    return Vacancy(
        name=data["vacancy"]["name"],
        description=data["vacancy"]["description"],
        direction=get_direction(),
        deadline=dt.datetime.now() + dt.timedelta(random.randint(5, 30)),
        city=get_city(),
        area=area,
        profession=area,
        supervisor="Пунов Дмитрий",
        education=random.choice(
            ["без образования", "не оконченное высшее", "высшее", "среднее"]
        ),
        experience_from=experience_from,
        experience_to=experience_to,
        quantity=random.randint(1, 5),
    )


async def upload_vacancy_to_postgres(vacancies: list[Vacancy], db_url: str):
    conn = await asyncpg.connect(dsn=db_url)
    try:
        for vacancy in tqdm(vacancies):
            await conn.execute(
                """
                INSERT INTO vacancies(
                    name, description, direction, deadline, city, area, profession, supervisor, education, experience_from, experience_to, quantity, priority, type_of_employment
                ) VALUES($1, $2, $3, $4, $5, $6, $7, $8, $9, $10, $11, $12, $13, $14)
            """,
                vacancy.name,
                vacancy.description,
                vacancy.direction,
                vacancy.deadline,
                vacancy.city,
                vacancy.area,
                vacancy.profession,
                vacancy.supervisor,
                vacancy.education,
                vacancy.experience_from,
                vacancy.experience_to,
                vacancy.quantity,
                random.randint(1, 3),
                random.choice(["полная", "частичная"])
            )
    finally:
        await conn.close()


# Example usage
async def main():
    with open(filename, "r", encoding="utf-8") as file:
        data = json.load(file)

    vacancies = [vacancy_from_dict(record) for record in data]
    db_url = "postgresql://postgre:postgre-pass@localhost:5432/dev"
    await upload_vacancy_to_postgres(vacancies, db_url)

await main()

100%|██████████| 29/29 [00:00<00:00, 36.19it/s]


# Uploading resumes

In [10]:
with open(filename, "r", encoding="utf-8") as file:
    data = json.load(file)

len(data)

29

In [16]:
resumes = []
for record in data:
    # print(record.keys())
    resumes += record["confirmed_resumes"]
    resumes += record["failed_resumes"]
    
len(resumes)

656

In [18]:
resumes[0].keys()

dict_keys(['uuid', 'first_name', 'last_name', 'birth_date', 'country', 'city', 'about', 'key_skills', 'experienceItem', 'educationItem'])