In [4]:
import numpy as np

# ------------------------
# 1) تابع one-hot
# ------------------------
def to_one_hot(y, num_classes=10):
    y = y.astype(int)
    one_hot = np.zeros((y.shape[0], num_classes), dtype=np.float32)
    one_hot[np.arange(y.shape[0]), y] = 1.0
    return one_hot


# ------------------------
# 2) تابع لود داده از CSV (نسخه با genfromtxt)
# ------------------------
def load_mnist_csv(path, test_ratio=0.2, shuffle=True):
    """
    ساختار CSV شما:

    col0 = estimated labels (خالی)  ❌ استفاده نمی‌کنیم
    col1 = label (0..9)             ✅
    col2... = pixel values          ✅

    خروجی:
        (X_train, y_train_oh), (X_test, y_test_oh)
    """

    # genfromtxt با filling_values باعث می‌شود سلول‌های خالی → 0 بشوند
    data = np.genfromtxt(
        path,
        delimiter=",",
        skip_header=1,   # اگر header نداری، این را بکن 0
        filling_values=0 # خالی‌ها را با 0 پر کن
    )

    # اگر فایل خیلی بزرگ باشد، بد نیست این را چک کنیم:
    print("Raw data shape:", data.shape)

    # ستون 0 → دور ریخته می‌شود
    labels = data[:, 1]          # ستون لیبل
    pixels = data[:, 2:]         # پیکسل‌ها

    # نرمال‌سازی 0..255 → 0..1
    pixels = pixels.astype(np.float32) / 255.0

    # شافل
    N = pixels.shape[0]
    indices = np.arange(N)
    if shuffle:
        np.random.shuffle(indices)

    test_size = int(N * test_ratio)
    test_indices = indices[:test_size]
    train_indices = indices[test_size:]

    X_train = pixels[train_indices]
    y_train = labels[train_indices]
    X_test = pixels[test_indices]
    y_test = labels[test_indices]

    # تبدیل به one-hot
    y_train_oh = to_one_hot(y_train, num_classes=10)
    y_test_oh = to_one_hot(y_test, num_classes=10)

    return (X_train, y_train_oh), (X_test, y_test_oh)


In [5]:
(X_train, y_train_oh), (X_test, y_test_oh) = load_mnist_csv(path="mnist.csv")

print("Train shape:", X_train.shape, y_train_oh.shape)
print("Test shape:", X_test.shape, y_test_oh.shape)


Raw data shape: (42000, 786)
Train shape: (33600, 784) (33600, 10)
Test shape: (8400, 784) (8400, 10)
