In [None]:
import os, tqdm
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from src import dataio, visualize, evaluate

In [None]:
# データセットの読み込み
df_test, images_test = dataio.read_data('../dataset/test')

In [None]:
visualize.plot_images(images_test[:25], df_test, ncols=5, figsize=(15, 15))

In [None]:
logistic_data = dataio.read_logistic_weights('../weights/logistic_dict.pkl')

In [None]:
def preprocessing(images: np.ndarray) -> np.ndarray:
    """画像の前処理を行う関数

    Parameters
    ----------
    images : np.ndarray
        前処理する画像

    Returns
    -------
    np.ndarray
        前処理後の画像
    """
    # shape = (n, height=28, width=28)
    images = images.astype(np.float32)
    images /= 255.0 
    return images

def standardize(images: np.ndarray, mean: np.ndarray, std: np.ndarray) -> np.ndarray:
    """画像の標準化を行う関数

    Parameters
    ----------
    images : np.ndarray
        標準化する画像
    mean : np.ndarray
        平均値
    std : np.ndarray
        標準偏差

    Returns
    -------
    np.ndarray
        標準化後の画像
    """
    images = (images - mean) / std
    return images

In [None]:
def predict(weights_dict: dict[str, np.ndarray], images: np.ndarray) -> np.ndarray:
    """ロジスティック回帰モデルを用いて画像のクラスを予測する関数

    Parameters
    ----------
    weights_dict : dict[str, np.ndarray]
        ロジスティック回帰モデルの重みと切片
    images : np.ndarray
        予測する画像

    Returns
    -------
    np.ndarray
        予測されたクラス
    """
    # shape = (10=ラベル数, 784=特徴量)
    weights = weights_dict['weights']
    # shape = (10=ラベル数,)
    intercept = weights_dict['intercept']
    
    # images: (n, height, width) -> (n, height*width=784)
    # images.reshape(len(images), -1) @ weights.T + intercept: (n, 10)
    # np.argmax: (n,)
    predictions = np.argmax(
        images.reshape(len(images), -1) @ weights.T + intercept,
        axis=1
    )

    return predictions



In [None]:
y_true = df_test["label"].values

In [None]:
def run():
    images_test_preprocessed = preprocessing(images_test)
    images_test_preprocessed = standardize(images_test_preprocessed,
                                            mean=logistic_data['mean'], 
                                            std=logistic_data['std'])
    predictions = predict(logistic_data, images_test_preprocessed)
    result = evaluate.calculate_accuracy(y_true, predictions)
    return result

result = evaluate.measure_runtime(run)
print(f"Accuracy: {result:.4f}")