In [14]:
import faker 
import psycopg2
from datetime import datetime, timedelta
import random

In [15]:
# Подключение к базе данных
conn = psycopg2.connect(
    dbname="bookstore",
    user="postgres",
    password="postgres",
    host="localhost",
    port="5432"
)
cur = conn.cursor()

In [16]:
# Создание объекта Faker для генерации фальшивых данных
fake = faker.Faker()

In [17]:
# Жанры книг
genres = ['Science Fiction', 'Mystery', 'Romance', 'Adventure', 'Fantasy', 'Horror', 'Drama', 'Poetry', 'Popular Science', 'Historical Fiction', 'Biography', 'Thriller', 'Psychology', 'Philosophy', 'Classics', 'Non-fiction', 'Humor', 'Travel Guides', 'Self-help', 'Memoirs']


In [4]:

# Заполнение таблицы "genre"
for idx, genre in enumerate(genres, start=1):
    cur.execute("INSERT INTO public.genre (genre_id, name, description) VALUES (%s, %s, %s)", (idx, genre, f"Description for {genre}"))
conn.commit()

In [18]:
# Генерация авторов книг
authors = []
for i in range(1, 20001):  # Генерация 200 авторов
    last_name = fake.last_name()
    first_name = fake.first_name()
    rating = random.randint(1, 10)
    authors.append((i, last_name, first_name, rating))
# Заполнение таблицы "author"
cur.executemany("INSERT INTO public.author (author_id, last_name, first_name, rating) VALUES (%s, %s, %s, %s)", authors)
conn.commit()

UniqueViolation: ОШИБКА:  повторяющееся значение ключа нарушает ограничение уникальности "pk_author_id"
DETAIL:  Ключ "(author_id)=(1)" уже существует.


In [6]:
# Генерация издателей
publishers = []
for i in range(1, 1001):  # Генерация 50 издателей
    name = fake.company()
    city = fake.city()
    address = fake.address()
    contact_phone = fake.phone_number()
    purpose = fake.word()
    ownership = random.choice(['Public', 'Private'])
    publishers.append((i, name, city, address, contact_phone, purpose, ownership))
# Заполнение таблицы "publisher"
cur.executemany("INSERT INTO public.publisher (publisher_id, name, city, adress, contact_phone, purpose, ownership) VALUES (%s, %s, %s, %s, %s, %s, %s)", publishers)
conn.commit()

In [7]:
# Генерация контактных лиц складов
existing_warehouse_contacts = [i for i in range(1, 1501)]  # Существующие контактные лица складов
warehouse_contacts = []
for i in range(1, 1501):  # Генерация 100 контактных лиц складов
    contact_id = existing_warehouse_contacts.pop(random.randint(0, len(existing_warehouse_contacts) - 1))
    last_name = fake.last_name()
    first_name = fake.first_name()
    num_phone = fake.phone_number()
    sex = random.choice(['M', 'F'])
    warehouse_contacts.append((contact_id, last_name, first_name, num_phone, sex))
# Заполнение таблицы "warehouse_contact_person"
cur.executemany("INSERT INTO public.warehouse_contact_person (warehouse_contact_person_id, last_name, first_name, num_phone, sex) VALUES (%s, %s, %s, %s, %s)", warehouse_contacts)
conn.commit()


In [7]:
# Генерация складов
warehouses = []
for i in range(1, 1501):  # Генерация 1500 складов
    city = fake.city()
    address = fake.address()
    size = random.choice(['Small', 'Medium', 'Large'])
    fk_contact = random.randint(1, 1501)  # Ссылка на контактное лицо склада
    warehouses.append((i, city, address, size, fk_contact))
# Заполнение таблицы "warehouse"
cur.executemany("INSERT INTO public.warehouse (warehouse_id, city, adress, size, fk_contact) VALUES (%s, %s, %s, %s, %s)", warehouses)
conn.commit()

In [10]:
# Генерация книг
books = []
for i in range(1, 5000001):  # Генерация 5000000 книг
    title = fake.text(max_nb_chars=128)
    genre = random.choice(genres)
    rating = random.randint(1, 10)
    author = fake.name()
    price = round(random.uniform(5.99, 99.99), 2)
    num_sales = random.randint(100, 1000000)
    publisher_id = random.randint(1, 50)  # Ссылка на издателя книги
    author_id = random.randint(1, 200)  # Ссылка на автора книги
    books.append((i, title, genre, rating, author, price, num_sales, publisher_id, genres.index(genre) + 1))
# Заполнение таблицы "book"
cur.executemany("INSERT INTO public.book (book_id, title, genre, rating, author, price, num_sales, fk_publisher_id, fk_genre_id) VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s)", books)
conn.commit()

In [11]:
# Генерация связей книг с авторами
book_authors = []
for i in range(1, 1000001):  # Генерация 10000 связей книг с авторами
    book_id = random.randint(1, 5000001)
    author_id = random.randint(1, 20001)
    book_authors.append((book_id, author_id))
# Заполнение таблицы "book_author"
cur.executemany("INSERT INTO public.book_author (book_book_id, author_author_id) VALUES (%s, %s)", book_authors)
conn.commit()


In [12]:
# Генерация связей книг с складами
book_warehouses = []
for i in range(1, 5000001):  # Генерация 10000 связей книг с складами
    book_id = random.randint(1, 5000001)
    warehouse_id = random.randint(1, 1501)
    book_warehouses.append((book_id, warehouse_id))
# Заполнение таблицы "book_warehouse"
cur.executemany("INSERT INTO public.book_warehouse (book_book_id, warehouse_warehouse_id) VALUES (%s, %s)", book_warehouses)
conn.commit()

In [20]:
# Закрытие соединения
cur.close()
conn.close()