In [24]:
# coding:UTF-8
import numpy as np
import os
cwd=os.getcwd()

导入测试集数据，这里我们随机生成测试样本

In [25]:
def load_predict(num,n):
    '''导入测试数据
    input:  num(int)生成测试样本的个数
            n(int)特征空间维数、特征个数
    output: test(mat)生成的测试样本
    '''
    test=np.mat(np.ones((num,n)))
    for i in range(num):
        test[i,0]=np.random.random()*6-3
        test[i,1]=np.random.random()*15
    return test

导入模型参数load_weights()函数

In [26]:
def load_weights(model_path):
    '''导入训练好的模型
    input:  model_path(str)模型文件路径地址
    output: weights(mat)权重矩阵(m,k)维数
            m(int)权重矩阵行数(特征空间维数、特征个数)
            k(int)标签个数、类数
    '''
    model_file=os.path.join(cwd,'model')
    file=open(model_file)
    w=[]
    for row in file.readlines():
        w_temp=[]
        rows=row.strip().split('\t')
        for weight in rows:
            w_temp.append(float(weight))
        w.append(w_temp)
    file.close()
    weights=np.mat(w)
    n,k=np.shape(weights)
    return weights,n,k

生成预测结果，概率$P(y_i=j|X_i;\theta)=\frac{e^{\theta_j^TX_i}}{\sum_{l=1}^ke^{\theta_l^TX_i}}$. 注意到分母是固定的，所以关键只需要求得$e^{\theta_j^TX_i}$的最大值所对应的$y_i$即可，也就是$\theta_j^TX_i$所对应的列

In [27]:
def predict(test,weights):
    '''利用已训练模型预测测试集
    input:  test(mat)测试集数据
            weights(mat)模型的权重
    output: h.argmax(axis=1)所属类别，分类到概率最大的那一类
    '''
    h=test*weights
    return h.argmax(axis=1)

保存预测结果

In [28]:
def save_result(file,result):
    '''保存最后预测的结果
    input:  file(str)保存最后结果的文件名和路径
            result(mat)最后的预测结果
    '''
    file_result=open(file,'w')
    num=np.shape(result)[0]
    for i in range(num):
        file_result.write(str(result[i,0])+'\n')
    file_result.close()

In [29]:
if __name__=='__main__':
    print('1.loading model')
    filename=os.path.join(cwd,'model')
    w,n,k=load_weights(filename)
    print('2.loading data')
    test=load_predict(4000,n)
    print('3.getting prediction')
    result=predict(test,w)
    print('4.saving result')
    savename=os.path.join(cwd,'result')
    save_result(savename,result)

1.loading model
2.loading data
3.getting prediction
4.saving result
