# Генерация синтетических данных

## Загрузка нужных пакетов

In [1]:
!pip install faker



In [2]:
!pip install psycopg2-binary



## Импорт нужных библиотек

In [3]:
from datetime import datetime
from faker import Faker
import pandas as pd
from sqlalchemy import create_engine, Column, Integer, String, Float, Text, Enum, ForeignKey, DateTime
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

## Инциализация Faker

In [4]:
fake = Faker('ru_RU')

## Определение базы данных и модели данных

In [5]:
Base = declarative_base()

class Supplier(Base):
    __tablename__ = 'suppliers'
    id = Column(Integer, primary_key=True, autoincrement=True)
    name = Column(String(255), nullable=False)
    contact_person = Column(String(255))
    phone = Column(String(50))
    email = Column(String(255))
    address = Column(Text)
    update_dttm = Column(DateTime, default=datetime.utcnow)

class Product(Base):
    __tablename__ = 'products'
    id = Column(Integer, primary_key=True, autoincrement=True)
    supplier_id = Column(Integer, ForeignKey('suppliers.id'), nullable=False)
    name = Column(String(255), nullable=False)
    price = Column(Float)
    quantity = Column(Integer)
    update_dttm = Column(DateTime, default=datetime.utcnow)

## Создание подключения к базе данных PostgreSQL

In [6]:
DATABASE_URL = 'postgresql+psycopg2://postgres:231805@localhost/supplier_management'
engine = create_engine(DATABASE_URL)
Base.metadata.create_all(engine)

## Создание сессии для взаимодействия с базой данных

In [7]:
Session = sessionmaker(bind=engine)
session = Session()

## Функция для генерации синтетических данных поставщиков и товаров

In [8]:
prod = ['Железная руда', 'Металлолом', 'Коксующийся уголь', 'Известняк', 'Марганец',
    'Флюсы', 'Легирующие добавки', 'Огнеупоры', 'Промышленные газы', 'Смазочные материалы',
    'Печи', 'Прокатные станы', 'Дробильное оборудование', 'Насосы', 'Лабораторное оборудование',
    'Подшипники', 'Электродвигатели', 'Режущие инструменты', 'Электроника', 'Конвейеры',
    'Защитные средства', 'Промышленные химикаты', 'Упаковочные материалы', 'Канцелярские товары']

In [9]:
def generate_data(num_suppliers, num_products):
    for _ in range(num_suppliers):
        supplier = Supplier(name = fake.company(),
                            contact_person=fake.name(),
                            phone=fake.phone_number(),
                            email=fake.email(),
                            address=fake.address(),
                            update_dttm=datetime.utcnow())
        session.add(supplier)
        session.commit()
        
        for _ in range(num_products):
            product = Product(supplier_id=supplier.id,
                name=fake.random_element(elements=(prod)),
                price=round(fake.random_number(digits=2), 2),
                quantity=fake.random_int(min=0, max=1000),
                update_dttm=datetime.utcnow())
            session.add(product)
    session.commit()

## Генерация данных

In [10]:
generate_data(num_suppliers=10, num_products=50)