In [None]:
!pip install Faker

In [4]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta
import random
from faker import Faker
import os
from google.colab import files

In [5]:

# Установка seed для воспроизводимости
np.random.seed(42)
fake = Faker('ru_RU')

# Создание базовых данных о продукции
products = [
    'Смартфон Model X', 'Ноутбук Pro Y', 'Планшет Z',
    'Наушники Alpha', 'Смарт-часы Beta', 'Камера Ultra'
]

defect_types = [
    'Дефект экрана', 'Проблема с батареей', 'Неисправность динамика',
    'Проблема с зарядкой', 'Программный сбой', 'Механическое повреждение'
]

# Генерация данных для PostgreSQL базы контроля качества
def generate_quality_control_data(start_date, num_records):
    data = []
    current_date = start_date

    for _ in range(num_records):
        product = random.choice(products)
        passed = random.random() > 0.15  # 85% проходят контроль качества

        record = {
            'inspection_id': f'QC{_+1:05d}',
            'date': current_date.strftime('%Y-%m-%d'),
            'product': product,
            'batch_number': f'B{random.randint(1000, 9999)}',
            'inspector': fake.name(),
            'quality_score': random.randint(75, 100) if passed else random.randint(50, 74),
            'passed_inspection': passed,
            'notes': 'Проверка пройдена' if passed else random.choice(defect_types)
        }
        data.append(record)
        current_date += timedelta(hours=random.randint(1, 8))

    return pd.DataFrame(data)

# Генерация данных о нормативах для Excel
def generate_quality_standards():
    data = []
    for product in products:
        record = {
            'product': product,
            'min_quality_score': random.randint(75, 85),
            'optimal_quality_score': random.randint(90, 98),
            'max_defect_rate': round(random.uniform(0.01, 0.05), 3),
            'inspection_frequency_hours': random.choice([4, 8, 12]),
            'sample_size_percent': random.randint(5, 15),
            'shelf_life_days': random.randint(365, 730),
            'storage_temp_min': random.randint(10, 15),
            'storage_temp_max': random.randint(25, 30),
            'humidity_percent': random.randint(40, 60)
        }
        data.append(record)
    return pd.DataFrame(data)

# Генерация данных о рекламациях для CSV
def generate_complaints_data(start_date, num_records):
    data = []
    current_date = start_date

    for _ in range(num_records):
        product = random.choice(products)
        defect = random.choice(defect_types)

        record = {
            'complaint_id': f'C{_+1:05d}',
            'date_received': current_date.strftime('%Y-%m-%d'),
            'product': product,
            'customer_id': f'CUS{random.randint(10000, 99999)}',
            'purchase_date': (current_date - timedelta(days=random.randint(1, 90))).strftime('%Y-%m-%d'),
            'defect_type': defect,
            'severity': random.choice(['Низкая', 'Средняя', 'Высокая']),
            'description': f'Обнаружен {defect.lower()} после {random.randint(1, 30)} дней использования',
            'status': random.choice(['Новая', 'В обработке', 'Решена', 'Отклонена']),
            'compensation_amount': random.choice([0, 1000, 2000, 5000, 10000])
        }
        data.append(record)
        current_date += timedelta(days=random.randint(0, 2))

    return pd.DataFrame(data)

# Генерация данных
start_date = datetime(2023, 1, 1)
quality_control_df = generate_quality_control_data(start_date, 1000)
standards_df = generate_quality_standards()
complaints_df = generate_complaints_data(start_date, 200)

# Сохранение данных в файлы
quality_control_df.to_csv('quality_control_data.csv', index=False, encoding='utf-8')
standards_df.to_excel('quality_standards.xlsx', index=False)
complaints_df.to_csv('customer_complaints.csv', index=False, encoding='utf-8')



# Вывод информации о созданных файлах
print("Созданные файлы:")
print(f"1. quality_control_data.csv - {len(quality_control_df)} записей")
print(f"2. quality_standards.xlsx - {len(standards_df)} записей")
print(f"3. customer_complaints.csv - {len(complaints_df)} записей")

# Вывод примера данных
print("Пример данных из каждого файла:")
print("Контроль качества (первые 3 записи):")
print(quality_control_df.head(3))
print("Нормативы качества (первые 3 записи):")
print(standards_df.head(3))
print("\Рекламации (первые 3 записи):")
print(complaints_df.head(3))


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

Созданные файлы:
1. quality_control_data.csv - 1000 записей
2. quality_standards.xlsx - 6 записей
3. customer_complaints.csv - 200 записей
Пример данных из каждого файла:
Контроль качества (первые 3 записи):
  inspection_id        date           product batch_number  \
0       QC00001  2023-01-01    Наушники Alpha        B8464   
1       QC00002  2023-01-01   Смарт-часы Beta        B9598   
2       QC00003  2023-01-01  Смартфон Model X        B1603   

                       inspector  quality_score  passed_inspection  \
0    Мариан Валерьянович Кабанов             95               True   
1  Святополк Харлампович Беляков             87               True   
2      Кира Афанасьевна Веселова             78               True   

               notes  
0  Проверка пройдена  
1  Проверка пройдена  
2  Проверка пройдена  
Нормативы качества (первые 3 записи):
            product  min_quality_score  optimal_quality_score  \
0  Смартфон Model X                 79                     93   
1 

In [6]:
# Скачивание файлов
files.download('quality_control_data.csv')


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [7]:
files.download('quality_standards.xlsx')


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [8]:
files.download('customer_complaints.csv')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>