In [1]:
# Зчитуємо дані із збереженого нами файлу
import json
data_set = json.load(open("dataset.json"))

In [31]:
# data_set[0]

In [4]:
parents = set([x["category"]["parent"] for x in data_set])
# Відбираємо тільки батьківські категорії, та ініціалізовуємо список об'єктів моделі Category
parent_categories = [Category(**dict(name=x)) for x in parents]
# Виконуємо множинний INSERT в нашу таблицю за допомогою методу bulk_create
Category.objects.bulk_create(parent_categories)


[<Category: Category object (2)>,
 <Category: Category object (3)>,
 <Category: Category object (4)>]

In [18]:
# Отримужмо список дочірніх категорій, врахувавши унікальність імені категорій
child_categories = list({v['name']: v for v in [x["category"] for x in data_set]}.values())

# Словник для перетворення імен батьківських категорій в їх раніше створені ID в базі даних
# Має вигляд {"Все ноутбуки": 1, "Все планшет*": 2}
parent_ids = dict(Category.objects.filter(parent__isnull=True).values_list("name", "id"))

# Замінюємо назви на parentID
for child in child_categories:
    child["parent_id"] = parent_ids.get(child.pop("parent", None))

# Виконуємо множинну вставку
Category.objects.bulk_create([Category(**category) for category in child_categories])    

[<Category: Category object (14)>,
 <Category: Category object (15)>,
 <Category: Category object (16)>,
 <Category: Category object (17)>,
 <Category: Category object (18)>,
 <Category: Category object (19)>,
 <Category: Category object (20)>,
 <Category: Category object (21)>,
 <Category: Category object (22)>]

In [19]:
# Перейдемо до створення валют в нашій СУБД
# Ініціалізуємо об'єкт валюти Гривні
uan = Currency(name="Гривня", code="UAN")
uan.save()  # Зберігаємо її

# Також за допомогою методу create можна створювати записи
rub = Currency.objects.create(name="Рубль", code="RUB")
rub.delete()  # Видаляємо щойно створений об'єкт

# Створюємо ще один
Currency.objects.create(name="Долар", code="USD")


<Currency: Currency object (3)>

In [29]:
# Створюємо бренди
brands = [{"name": y} for y in set((x["brand"] for x in data_set)) if y]
Brand.objects.bulk_create([Brand(**x) for x in brands])


[<Brand: Brand object (5)>,
 <Brand: Brand object (6)>,
 <Brand: Brand object (7)>,
 <Brand: Brand object (8)>,
 <Brand: Brand object (9)>]

In [6]:
from django.core.files import File
import copy, tempfile
from urllib.request import urlopen

products = copy.deepcopy(list({v['name']: v for v in data_set}.values()))

category_ids = dict(Category.objects.filter(parent__isnull=False).values_list("name", "id"))
brand_ids = dict(Brand.objects.all().values_list("name", "id"))

for x in products:
    x.pop("prices", None)
    x["category_id"] = category_ids.get(x.pop("category")["name"])
    x["brand_id"] = brand_ids.get(x.pop("brand"))
    x["detail"] = x.pop("details")
    
    url = x.pop("photo")

    product = Product.objects.create(**x)

    img_temp = tempfile.NamedTemporaryFile(delete=False)
    img_temp.write(urlopen(url).read())
    img_temp.flush()
    photo = File(img_temp)
    product.photo.save(url.split('/')[-1], photo)
    product.save()


In [15]:
uan_id = Currency.objects.get(code="UAN")
usd_id = Currency.objects.get(code="USD")
product_ids = dict(Product.objects.all().values_list("name", "id"))

In [8]:
data_set[0]

{'reviews': 6,
 'category': {'name': 'Ноутбуки Acer', 'parent': 'Все ноутбуки'},
 'name': 'Ноутбук Acer Aspire 3 A315-21 (NX.GNVEU.014) Black Суперцена!!!',
 'prices': {'without_discount_grn': 6999,
  'with_discount_grn': 6199,
  'with_discount_usd': 233.92,
  'without_discount_usd': 264.11},
 'photo': 'https://i2.rozetka.ua/goods/4085311/copy_aser_aspire_3_a315_21g_nx_gq4eu_002_5ad06c83e87c4_images_4085311296.jpg',
 'brand': 'Acer',
 'sale': True,
 'details': 'https://rozetka.com.ua/aser_aspire_3_a315_21_nx_gnveu_014/p38506736/'}

In [21]:
product_prices = []

products = copy.deepcopy(list({v['name']: v for v in data_set}.values()))

for product in products:
    if not product_ids.get(product["name"]):
        continue
    if product.get("prices", {}).get("without_discount_grn"):
        product_prices.append(ProductPrice(product_id=product_ids[product["name"]],
                                          currency_id=uan_id.id, 
                                          original=product["prices"].get("without_discount_grn"),
                                          discount=product["prices"].get("with_discount_grn", 0),
                                          ))
    if product.get("prices", {}).get("without_discount_usd"):
        product_prices.append(ProductPrice(product_id=product_ids[product["name"]],
                                      currency_id=usd_id.id, 
                                      original=product["prices"].get("without_discount_usd"),
                                      discount=product["prices"].get("with_discount_usd", 0),
                                      ))

In [23]:
# ProductPrice.objects.bulk_create(product_prices)

In [13]:
products

[{'reviews': 6,
  'category': {'name': 'Ноутбуки Acer', 'parent': 'Все ноутбуки'},
  'name': 'Ноутбук Acer Aspire 3 A315-21 (NX.GNVEU.014) Black Суперцена!!!',
  'prices': {'without_discount_grn': 6999,
   'with_discount_grn': 6199,
   'with_discount_usd': 233.92,
   'without_discount_usd': 264.11},
  'photo': 'https://i2.rozetka.ua/goods/4085311/copy_aser_aspire_3_a315_21g_nx_gq4eu_002_5ad06c83e87c4_images_4085311296.jpg',
  'brand': 'Acer',
  'sale': True,
  'details': 'https://rozetka.com.ua/aser_aspire_3_a315_21_nx_gnveu_014/p38506736/'},
 {'reviews': 0,
  'category': {'name': 'Ноутбуки Acer', 'parent': 'Все ноутбуки'},
  'name': 'Ноутбук Acer Extensa EX2519-C313 (NX.EFAEU.054) Black',
  'prices': {'without_discount_grn': 6999,
   'with_discount_grn': 6399,
   'with_discount_usd': 241.47,
   'without_discount_usd': 264.11},
  'photo': 'https://i1.rozetka.ua/goods/2404491/copy_acer_nx_efaeu_042_5a27beeadb90e_images_2404491681.jpg',
  'brand': 'Acer',
  'sale': True,
  'details': 'ht