In [2]:
import numpy as np
import pandas as pd
import os
from sklearn.datasets import make_regression, make_classification

# Кількість варіантів (кількість слухачів)
num_variants = 20  
n_samples = 1000

# Директорія для збереження файлів
output_dir = "variants"
os.makedirs(output_dir, exist_ok=True)

# Функція для генерації даних регресії
def generate_regression_data(seed, num_samples=n_samples, num_features=5):
    X, y = make_regression(n_samples=num_samples, 
                           n_features=num_features, 
                           noise=20,  # Додаємо шум
                           random_state=seed)
    
    # Перетворюємо у DataFrame
    df = pd.DataFrame(X, columns=[f"feature_{i+1}" for i in range(num_features)])
    df["category"] = np.random.choice(["A", "B", "C"], num_samples)  # Категоріальна ознака
    df["target"] = y  # Цільова змінна

    return df

# Функція для генерації даних класифікації
def generate_classification_data(seed, num_samples=n_samples, num_features=5):
    X, y = make_classification(n_samples=num_samples, 
                               n_features=num_features, 
                               n_informative=5,  # Всі ознаки важливі
                               n_redundant=0, 
                               n_classes=2, 
                               random_state=seed)
    
    # Перетворюємо у DataFrame
    df = pd.DataFrame(X, columns=[f"feature_{i+1}" for i in range(num_features)])
    df["category"] = np.random.choice(["A", "B", "C"], num_samples)  # Категоріальна ознака
    df["target"] = y  # Клас (0 або 1)

    return df

# Генерація файлів
for i in range(1, num_variants + 1):
    reg_data = generate_regression_data(seed=i)
    clf_data = generate_classification_data(seed=i)
    
    reg_filename = os.path.join(output_dir, f"variant_{i}_regression.csv")
    clf_filename = os.path.join(output_dir, f"variant_{i}_classification.csv")
    
    reg_data.to_csv(reg_filename, index=False)
    clf_data.to_csv(clf_filename, index=False)

    print(f"Файли збережено: {reg_filename}, {clf_filename}")

print("Генерація завершена ✅")


Файли збережено: variants\variant_1_regression.csv, variants\variant_1_classification.csv
Файли збережено: variants\variant_2_regression.csv, variants\variant_2_classification.csv
Файли збережено: variants\variant_3_regression.csv, variants\variant_3_classification.csv
Файли збережено: variants\variant_4_regression.csv, variants\variant_4_classification.csv
Файли збережено: variants\variant_5_regression.csv, variants\variant_5_classification.csv
Файли збережено: variants\variant_6_regression.csv, variants\variant_6_classification.csv
Файли збережено: variants\variant_7_regression.csv, variants\variant_7_classification.csv
Файли збережено: variants\variant_8_regression.csv, variants\variant_8_classification.csv
Файли збережено: variants\variant_9_regression.csv, variants\variant_9_classification.csv
Файли збережено: variants\variant_10_regression.csv, variants\variant_10_classification.csv
Файли збережено: variants\variant_11_regression.csv, variants\variant_11_classification.csv
Файли 