# JSON encode ru: https://stackoverflow.com/questions/40054168/how-to-encode-cyrillic-characters-in-json

# ES: https://habr.com/ru/articles/280488/

In [223]:
from faker import Faker
import json
import random

fake = Faker('ru_RU')
master_id_set = set()

def generate_order_data():
    order_id = fake.pyint(min_value=1, max_value=1000000)
    # order_type = fake.word()
    # order_doc_type = fake.word()
    # order_index = fake.pyint(min_value=1, max_value=1000)
    order_customer_id = fake.pyint(min_value=1, max_value=1000000)
    order_customer_name = fake.name()

    smp = random.sample(["хрупкий", "тяжелый", "объемный", "ценный"], 2)
    order_details = f'{smp[0]}, {smp[1]}.'

    # order_details = fake.sentence(ext_word_list=["хрупкий", "тяжелый", "объемный", "ценный"], nb_words=2, variable_nb_words=True)
    order_date = fake.date_between(start_date="-30d", end_date="today")
    order_due_date = fake.date_between(start_date="+30d", end_date="+60d")
    order_completion_date = fake.date_between(start_date="+30d", end_date="+60d")
    order_parts = [fake.word(ext_word_list=['корпус', 'usb-разъем', 'дисплей', 'аккумулятор']) for _ in range(fake.pyint(min_value=1, max_value=3))]
    repair_types = [fake.word(ext_word_list=['замена компонентов', 'пайка', 'анализ неисправности', 'мелкие детали']) for _ in range(fake.pyint(min_value=1, max_value=2))]
    order_price = fake.pyfloat(min_value=1000, max_value=10000)
    order_master_id =  random.choice(list(master_id_set)) #fake.pyint(min_value=1, max_value=1000000)

    return {
        "index": "orders",
            # "doc_type": order_doc_type,
        "id": order_id,
        "body": {
            "id_заказа": order_id,
            "дата_заказа": order_date.strftime("%Y-%m-%d"),
            "id_заказчика": order_customer_id,
            "сведения_о_заказчике": order_customer_name,
            "данные_о_заказе": order_details,
            "срок_выполнения_заказа": order_due_date.strftime("%Y-%m-%d"),
            "фактическая_дата_выполнения": order_completion_date.strftime("%Y-%m-%d"),
            "запчасть": order_parts,
            "ремонт": repair_types,
            "стоимость": order_price,
            "id_мастера": order_master_id
        }
    }


def generate_master_data():
    master_id = fake.pyint(min_value=1, max_value=1000000)
    master_id_set.add(master_id)
    master_name = fake.name()

    master_feedbacks = []
    
    for _ in range(fake.pyint(min_value=1, max_value=3)):
        smp = random.sample(["аккуратный", "медлительный", "ворчливый"], 2)
        master_feedback = f'{smp[0]}, {smp[1]}.'
        master_feedbacks.append(master_feedback)
 
    master_xp = f'Стаж работы: {fake.random_int(min=1, max=15)} л./г.'
    if fake.random_int(min=1, max=5) == 2:     
        master_edu = 'Тип образования: высшее'  
    else :
        master_edu = 'Тип образования: среднее'  

    return {
        "index": "master",
            # "doc_type": "Master",
        "id": master_id,
        "body": {
            "сведения_о_мастере": f'{master_name}, {fake.sentence(ext_word_list=[master_xp, master_edu], nb_words=1, variable_nb_words=True)}',
            "отзывы_о_работе": master_feedbacks
        }
    }


def generate_json():

    masters = [generate_master_data() for _ in range(1)]
    orders = [generate_order_data() for _ in range(1)]
    

    json_data = {
        "Заказ": orders,
        "Мастер": masters
    }

    return json_data #json.dumps(json_data, indent=2)

In [224]:
# https://stackoverflow.com/questions/40054168/how-to-encode-cyrillic-characters-in-json

# https://habr.com/ru/articles/280488/

In [225]:
# print(json.dumps(generate_json(), indent=2, ensure_ascii=False))

In [226]:
# print(generate_json())

In [227]:
# s = b'"\xd7\x91\xd7\xa8\xd7\x99 \xd7\xa6\xd7\xa7\xd7\x9c\xd7\x94"'.decode()
# s = b'"\u043e\u0442\u0437\u044b\u0432_\u043e_\u0440\u0430\u0431\u043e\u0442\u0435": "\u0412\u043e\u0440\u0447\u043b\u0438\u0432\u044b\u0439 \u0430\u043a\u043a\u0443\u0440\u0430\u0442\u043d\u044b\u0439 \u043c\u0435\u0434\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0430\u043a\u043a\u0443\u0440\u0430\u0442\u043d\u044b\u0439 \u0432\u043e\u0440\u0447\u043b\u0438\u0432\u044b\u0439 \u0432\u043e\u0440\u0447\u043b\u0438\u0432\u044b\u0439."'.decode('unicode-escape')
# print(s)

In [228]:
with open('data.json','w') as f:
    json.dump(generate_json(),f)

with open('data.json') as f:
    data = json.load(f)
print(json.dumps(data, indent=2, ensure_ascii=False))

{
  "Заказ": [
    {
      "index": "orders",
      "id": 525735,
      "body": {
        "id_заказа": 525735,
        "дата_заказа": "2024-01-31",
        "id_заказчика": 216386,
        "сведения_о_заказчике": "Соболев Ювеналий Тимурович",
        "данные_о_заказе": "объемный, ценный.",
        "срок_выполнения_заказа": "2024-03-20",
        "фактическая_дата_выполнения": "2024-03-20",
        "запчасть": [
          "usb-разъем"
        ],
        "ремонт": [
          "замена компонентов",
          "пайка"
        ],
        "стоимость": 7673.48953761,
        "id_мастера": 430326
      }
    }
  ],
  "Мастер": [
    {
      "index": "master",
      "id": 430326,
      "body": {
        "сведения_о_мастере": "Лора Яковлевна Исаева, Стаж Работы: 13 Л./Г..",
        "отзывы_о_работе": [
          "аккуратный, медлительный.",
          "ворчливый, медлительный.",
          "медлительный, аккуратный."
        ]
      }
    }
  ]
}
