In [2]:
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore')
from numpy import sqrt 
import time

#Tien Xu Ly
from sklearn.preprocessing import MinMaxScaler

#Draw Flot
import matplotlib.pyplot as plt

#Cacuale error
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_absolute_percentage_error

#distance Libaray
from dtw import dtw
from scipy.spatial.distance import euclidean

#FFNN Libarary
from keras.models import Sequential
from keras.layers import Dense
from keras.callbacks import EarlyStopping
from sklearn.model_selection import GridSearchCV
from keras.wrappers.scikit_learn import KerasRegressor

In [5]:
# Đọc Dữ Liệu
# @param   filePath     Đường dẫn tập dữ liệu CSV
# @return  df           Tập dữ liệu csv dưới dạng df
def readData(filePath):
    # Load dữ liệu
    dataCSV = pd.read_csv(filePath)
    df=dataCSV[['Close']]
    return df

# Tiền Xử lý Dữ Liệu
# @param  Data   Tập dữ liệu
# @return df     Dữ liệu đã được tiền xử lý
def cleanData(df):
    # Replace null values with 0
    df.fillna(0, inplace=True)
    # Remove outliers by replacing values outside of 10 standard deviations with the mean
    std = df['Close'].std()
    mean = df['Close'].mean()
    df['Close'] = np.where(df['Close'] > (mean + 10*std), mean, df['Close'])
    df['Close'] = np.where(df['Close'] < (mean - 10*std), mean, df['Close'])
    # Scale data_AMZN to range [0, 1]
    scaler = MinMaxScaler()
    df['Close'] = scaler.fit_transform(df['Close'].values.reshape(-1, 1))
    # Fill in missing values with the mean of the previous and next values
    df['Close'] = df['Close'].interpolate(method='linear')
    return df

# Chia dữ liệu thành train set và test set
# @param  data                      Tập dữ liệu
# @param  percentTrain              Tỷ lệ Tập train
# @return train_data, test_data     Tập train và test   
def splitData(data, percentTrain):
    train_size = int(len(data) * (percentTrain/100))
    train = data.iloc[:train_size, :]
    test = data.iloc[train_size:, :]
    return train, test

# Xử lý dữ liệu thành dữ liệu đầu vào và đầu ra cho mô hình
# @param      data            Dữ liệu cần chia cửa sổ
# @param      size_window     Kích thước cửa sổ
# @param      size_predict    Kích thước cửa sổ dự đoán
# @param      stepWindow      số điểm dữ liệu trượt
# @return     X, y            mảng cửa sổ mẫu và mảng điểm dự đoán tương ứng
def prepare_data(data, size_window, size_predict, stepWindow):
    X, y = [], []
    startWindow = 0
    for i in range(len(data) - size_window - 1):
        if (len(data[(startWindow + size_window):(startWindow + size_window + size_predict) , 0]) != size_predict):
            break
        X.append(data[startWindow:(startWindow + size_window), :])
        y.append(data[(startWindow + size_window):(startWindow + size_window + size_predict) , 0])
        startWindow += stepWindow
    return np.array(X), np.array(y)

#---------KNN-----------
# Fucntion Tính khoảng cách giữa 2 chuỗi thời gian
# @param    ts1            Chuỗi thứ nhất
# @param    ts2            Chuỗi thứ hai
# @return   euclidean      Khoảng cách euclidean    
def euclidean_distance(ts1, ts2):
    ts1= ts1.flatten()
    ts2= ts2.flatten()
    return euclidean(ts1,ts2)

# Function lấy ra k chuỗi gần nhất
# @param    k             Số lượng chuỗi gần nhất
# @param    distanceArr   Mảng khoảng cách
# @return   argsort       Vị trí chuỗi gần nhất        
def kSimilarityTimeSeries(k, distanceArr):
    distances = np.array(distanceArr)
    return distances.argsort()[:k] 

# Tính khoảng cách DTW
# @param    ts1            Chuỗi thứ nhất
# @param    ts2            Chuỗi thứ hai
# @return   euclidean      Khoảng cách euclidean  
def dtw_dist(ts1, ts2):
    dist, _, _, _ = dtw(ts1, ts2, dist=lambda ts1, ts2: np.abs(ts1 - ts2))
    return dist

# Thêm Dữ liệu
# @param    X_train               Cửa sổ mẫu train
# @param    y_train               Cửa sổ dự đoán train
# @param    XTest                 Cửa sổ mẫu test
# @param    yTest                 Cửa sổ dự đoán test
# @return   X_train, y_train      Khoảng cách euclidean 
def toTrain(X_train, y_train, XTest, yTest):
    X_train.append(XTest)
    y_train.append(yTest)
    return np.array(X_train), np.array(y_train)

# Dự đoán Euclidean
# @param    nameData           Tên tập dữ liệu
# @param    k                  Số lượng chuỗi gần nhất
# @param    typeDistance       Độ đo sử dụng (Dtw, euclidean)
# @param    X_train            Cửa sổ mẫu train
# @param    y_train            Cửa sổ dự đoán train
# @param    X_test             Cửa sổ mẫu test
# @param    y_test             Cửa sổ dự đoán test
# @return   y_pred_arr         Mảng dự đoán
def predict_KNN(k, typeDistance, X_train, y_train, X_test, y_test):
    y_pred_arr=[]
    for iTest in range(len(X_test)):
        if(k>len(X_train)):
            k=len(X_train)
        distanceArr=[]
        for iTrain in range(len(X_train)-size_window+2):
            if(typeDistance == 'Dtw'):
                distance = dtw_dist(X_test[iTest],X_train[iTrain])
            else:
                distance = euclidean_distance(X_test[iTest],X_train[iTrain])
            distanceArr.append(distance)
        indexKNN= kSimilarityTimeSeries(k,distanceArr)
        y_pred = np.mean(y_train[indexKNN])
        y_pred_arr.append(y_pred)
        X_train, y_train = toTrain(X_train.tolist(), y_train.tolist(),X_test[iTest].tolist(), y_test[iTest].tolist())
        y_pred = np.array(y_pred_arr)
   
    return y_pred


#----------------FFNN--------------------------
# Khởi tạo mô hình FFNN
# @param    neuralInput         Kích thước Cửa sổ mẫu/ số neural lớp input
# @param    num_layers_hidden   Số lượng lớp ẩn
# @param    num_neural_hidden   Số neural lớp ẩn
# @param    neuralOutput         Số neural lớp ouput
# @return   model               Mô hình FFNN
def create_model_FFNN(neuralInput, num_layers_hidden=1, neuralHidden=1, neuralOutput=1):
    model = Sequential()
    for i in range(num_layers_hidden):
        if i == 0:
            model.add(Dense(neuralHidden, input_dim= neuralInput, activation='sigmoid'))
        else:
            model.add(Dense(neuralHidden, activation='sigmoid'))
    model.add(Dense(neuralOutput))
    model.compile(loss='mean_squared_error', optimizer='adam')
    return model


# Train FFNN 
# @param    nameData          Tên tập dữ liệu
# @param    size_window       Kích thước Cửa sổ mẫu/ số neural lớp input
# @param    X_train           cửa sổ mẫu tập train
# @param    y_train           Cửa sổ dự đoán tập train
# @param    neuralHidden      Số neural lớp ẩn
# @param    numHiddenLayer    Số lớp ẩn
# @param    size_predict      Kích thước Cửa sổ dự đoán/ Số neural lớp ouput
# @return   best_params_FFNN  Tham số tốt nhất cho mô hình FFNN                
def train_FFNN(nameData, typePredict, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict):
    #param search
    param_grid_FFNN = {'batch_size': [8, 16, 32, 64, 128],
              'epochs': [50, 100, 150, 200, 250, 300],
              'neuralHidden': [neuralHidden],
              'num_layers_hidden' : [numHiddenLayer],
              'neuralInput' : [size_window],
              'neuralOutput' : [size_predict]}

    # create the model
    model_FFNN = KerasRegressor(build_fn=create_model_FFNN, verbose=0)
    
    # perform the grid search
    grid_FFNN = GridSearchCV(estimator=model_FFNN, param_grid=param_grid_FFNN, cv=3)
    grid_result_FFNN = grid_FFNN.fit(X_train, y_train)
    
    # train the model with the best parameters
    best_params_FFNN = grid_result_FFNN.best_params_
    
    model_FFNN = create_model_FFNN( best_params_FFNN['neuralInput'], best_params_FFNN['num_layers_hidden'], best_params_FFNN['neuralHidden'],best_params_FFNN['neuralOutput'])
    model_FFNN.fit(X_train, y_train, epochs=best_params_FFNN['epochs'], batch_size=best_params_FFNN['batch_size'], verbose=2, callbacks=[EarlyStopping(monitor='loss', patience=10)], shuffle=False)
    
    if(typePredict=='FFNN_Find_NeuralHidden'):
        model_FFNN.save_weights('../BestParam/FFNN/'+nameData+'/FFNN_Find_NeuralHidden/'+str(int(best_params_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_params_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(best_params_FFNN['batch_size']))+'_BatchSize_'+str(int(best_params_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    elif (typePredict=='FFNN_Find_NumberHiddenLayer'):
        model_FFNN.save_weights('../BestParam/FFNN/'+nameData+'/FFNN_Find_NumberHiddenLayer/'+str(int(best_params_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_params_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(best_params_FFNN['batch_size']))+'_BatchSize_'+str(int(best_params_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    else:
        model_FFNN.save_weights('../BestParam/TuanTu/'+nameData+'/FFNN_Find_NumberHiddenLayer/'+str(int(best_params_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_params_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(best_params_FFNN['batch_size']))+'_BatchSize_'+str(int(best_params_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    return best_params_FFNN



# Train FFNN 
# @param    nameData          Tên tập dữ liệu
# @param    size_window       Kích thước Cửa sổ mẫu/ số neural lớp input
# @param    X_train           cửa sổ mẫu tập train
# @param    y_train           Cửa sổ dự đoán tập train
# @param    batchSize         Số lượng mẫu được đưa vào với mỗi lần lặp (epoch)
# @param    epoch             Số lần lặp cập nhật trọng số
# @param    neuralHidden      Số neural lớp ẩn
# @param    numHiddenLayer    Số lớp ẩn
# @param    size_predict      Kích thước Cửa sổ dự đoán/ Số neural lớp ouput
# @return   best_params_FFNN  Tham số tốt nhất cho mô hình FFNN                
def train_best_param_FFNN(nameData, typePredict, size_window, X_train, y_train, batchSize, epoch, neuralHidden, numHiddenLayer, size_predict):
    #param search
    param_grid_FFNN = {'batch_size': batchSize,
              'epochs': epoch,
              'neuralHidden': neuralHidden,
              'num_layers_hidden' : numHiddenLayer,
              'neuralInput' : size_window,
              'neuralOutput' : size_predict}
    
    model_FFNN = create_model_FFNN( param_grid_FFNN['neuralInput'], param_grid_FFNN['num_layers_hidden'], param_grid_FFNN['neuralHidden'],param_grid_FFNN['neuralOutput'])
    model_FFNN.fit(X_train, y_train, epochs=param_grid_FFNN['epochs'], batch_size=param_grid_FFNN['batch_size'], verbose=2, callbacks=[EarlyStopping(monitor='loss', patience=10)], shuffle=False)
    
    if(typePredict=='FFNN_Find_NeuralHidden'):
        model_FFNN.save_weights('../BestParam/FFNN/'+nameData+'/FFNN_Find_NeuralHidden/'+str(int(param_grid_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(param_grid_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(param_grid_FFNN['batch_size']))+'_BatchSize_'+str(int(param_grid_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    elif (typePredict=='FFNN_Find_NumberHiddenLayer'):
        model_FFNN.save_weights('../BestParam/FFNN/'+nameData+'/FFNN_Find_NumberHiddenLayer/'+str(int(param_grid_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(param_grid_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(param_grid_FFNN['batch_size']))+'_BatchSize_'+str(int(param_grid_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    elif (typePredict=='FFNN_Find_NumberHiddenLayer_SongSong'):
        model_FFNN.save_weights('../BestParam/SongSong/'+nameData+'/FFNN_Find_BestWeights/'+str(int(param_grid_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(param_grid_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(param_grid_FFNN['batch_size']))+'_BatchSize_'+str(int(param_grid_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    else:
        model_FFNN.save_weights('../BestParam/TuanTu/'+nameData+'/FFNN_Find_BestWeights/'+str(int(param_grid_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(param_grid_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(param_grid_FFNN['batch_size']))+'_BatchSize_'+str(int(param_grid_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
   
    return param_grid_FFNN

# Dự Đoán FFNN 
# @param    nameData          Tên tập dữ liệu
# @param    typePredict       Thực hiện loại dự đoán (FFNN_Find_NeuralHidden,FFNN_Find_NumberHiddenLayer,CombinePredict)
# @param    X_train           cửa sổ mẫu tập train
# @param    y_train           Cửa sổ dự đoán tập train
# @param    X_test            Cửa sổ dự đoán tập train
# @param    best_params_FFNN  Cửa sổ dự đoán tập train
# @return   predictions_FFNN  Mảng dự đoán
def predict_FFNN(nameData, typePredict, X_train, y_train, X_test, best_params_FFNN):
    model_FFNN1 = Sequential()
    for i in range(best_params_FFNN['num_layers_hidden']):
        if i == 0:
            model_FFNN1.add(Dense(best_params_FFNN['neuralHidden'], input_dim= best_params_FFNN['neuralInput'], activation='sigmoid'))
        else:
            model_FFNN1.add(Dense(best_params_FFNN['neuralHidden'], activation='sigmoid'))
    model_FFNN1.add(Dense(best_params_FFNN['neuralOutput']))
    
    if(typePredict=='FFNN_Find_NeuralHidden'):
        model_FFNN1.load_weights('../BestParam/FFNN/'+nameData+'/FFNN_Find_NeuralHidden/'+str(int(best_params_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_params_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(best_params_FFNN['batch_size']))+'_BatchSize_'+str(int(best_params_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    elif (typePredict=='FFNN_Find_NumberHiddenLayer'):
        model_FFNN1.load_weights('../BestParam/FFNN/'+nameData+'/FFNN_Find_NumberHiddenLayer/'+str(int(best_params_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_params_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(best_params_FFNN['batch_size']))+'_BatchSize_'+str(int(best_params_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    elif (typePredict=='FFNN_Find_NumberHiddenLayer_SongSong'):
        model_FFNN1.load_weights('../BestParam/SongSong/'+nameData+'/FFNN_Find_BestWeights/'+str(int(best_params_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_params_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(best_params_FFNN['batch_size']))+'_BatchSize_'+str(int(best_params_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
    else:
        model_FFNN1.load_weights('../BestParam/TuanTu/'+nameData+'/FFNN_Find_BestWeights/'+str(int(best_params_FFNN['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_params_FFNN['neuralHidden']))+'_NeuralHidden_'+str(int(best_params_FFNN['batch_size']))+'_BatchSize_'+str(int(best_params_FFNN['epochs']))+'_Epoch_'+nameData+'.h5')   
   
    model_FFNN1.compile(loss='mean_squared_error', optimizer='adam')
    
    predictions_FFNN = model_FFNN1.predict(X_test)
    return predictions_FFNN

#---------------------Song Song------------------------------#

# Lai Ghép Song Song
# @param    y_pred_FFNN     Mảng dự đoán của FFNN
# @param    y_pred_KNN      Mảng dự đoán của KNN
# @param    y_test          Mảng chuỗi thực tế
# @return   y_pred_combine  Mảng dự đoán kết hợp
def predictHybrid(y_pred_FFNN,y_pred_KNN,y_test):
    FFNNSubKNN=[]
    TestSubKNN=[]
    weightEl=[]
    for i in range(len(y_pred_FFNN)):
        FFNNSubKNN.append(y_pred_FFNN[i]-y_pred_KNN[i])
        TestSubKNN.append(y_test[i]-y_pred_KNN[i])

    for j in range(len(FFNNSubKNN)):
        weightEl.append(((FFNNSubKNN[j]*TestSubKNN[j])/ (FFNNSubKNN[j]*FFNNSubKNN[j])))
    
    weight = np.array(weightEl)
    
    y_pred_combine=[]
    for i in range(len(weight)):
        y_pred_combine.append(weight[i]*y_pred_FFNN[i]+(1-weight[i])*y_pred_KNN[i])
    y_pred_combine=np.array(y_pred_combine)
    return y_pred_combine

#---------------------Tuần Tự------------------------------#

# Tính Lỗi Theo Từng Ngày
# @param    y_pred_KNN      Mảng dự đoán của KNN
# @param    y_test          Mảng chuỗi thực tế
# @return   mseWithDay     Mảng lỗi theo ngày
def mseWithDay(y_pred_KNN, y_test):
    mseDay = []
    for i in range(len(y_pred_KNN)):
        mseDay.append([abs((y_test[i] - y_pred_KNN[i]))])
    mseDay=np.array(mseDay)
    return mseDay

def predictSum(y_pred_mse,y_pred_KNN):
    pred_knn_ffnn=[]
    for i in range(len(y_pred_mse)):
        pred_knn_ffnn.append(y_pred_KNN[i]+y_pred_mse[i])
    pred_knn_ffnn=np.array(pred_knn_ffnn)
    return pred_knn_ffnn

# Đánh Giá Ảnh Hưởng Tỷ Lệ

In [16]:
nameData= 'AVAL'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+'Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

AVALTỷ Lệ 80 20 Best Param: 1_HiddenLayer_13_NeuralHidden_8_BatchSize_200_Epoch_3290.6626110076904_Time


In [10]:
nameData= 'AVAL'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 70
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+' Tỷ Lệ 70 30 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

AVAL Tỷ Lệ 70 30 Best Param: 1_HiddenLayer_19_NeuralHidden_16_BatchSize_200_Epoch_3137.622344493866_Time


In [26]:
nameData= 'AGLE'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+' Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

AGLE Tỷ Lệ 80 20 Best Param: 1_HiddenLayer_19_NeuralHidden_8_BatchSize_300_Epoch_4550.312443494797_Time


In [27]:
nameData= 'AGLE'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 70
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+' Tỷ Lệ 70 30 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

AGLE Tỷ Lệ 70 30 Best Param: 1_HiddenLayer_20_NeuralHidden_8_BatchSize_250_Epoch_3153.6635518074036_Time


In [28]:
nameData= 'MDLY'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+' Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

MDLY Tỷ Lệ 80 20 Best Param: 1_HiddenLayer_19_NeuralHidden_8_BatchSize_300_Epoch_6084.028868198395_Time


In [29]:
nameData= 'MDLY'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 70
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+' Tỷ Lệ 70 30 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

MDLY Tỷ Lệ 70 30 Best Param: 1_HiddenLayer_20_NeuralHidden_8_BatchSize_300_Epoch_6259.933722257614_Time


In [11]:
nameData= 'GDDY'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+' Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

GDDY Tỷ Lệ 80 20 Best Param: 1_HiddenLayer_20_NeuralHidden_8_BatchSize_300_Epoch_6444.700438976288_Time


In [31]:
nameData= 'GDDY'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 70
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
numHiddenLayer=[1]
start_Train= time.time()
best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, numHiddenLayer, size_predict)
end_Train = time.time()
print(nameData+' Tỷ Lệ 70 30 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

GDDY Tỷ Lệ 70 30 Best Param: 1_HiddenLayer_14_NeuralHidden_8_BatchSize_300_Epoch_5600.134698867798_Time


# Đánh Giá Ảnh Hưởng Số Lượng Lớp Ẩn

In [33]:
nameData= 'AVAL'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
for i in range(1,6):
    start_Train= time.time()
    best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, [i], size_predict)
    end_Train = time.time()
    print('Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn '+nameData+'Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AVALTỷ Lệ 80 20 Best Param: 1_HiddenLayer_16_NeuralHidden_8_BatchSize_250_Epoch_4990.134747982025_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AVALTỷ Lệ 80 20 Best Param: 2_HiddenLayer_16_NeuralHidden_16_BatchSize_300_Epoch_4862.012566566467_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AVALTỷ Lệ 80 20 Best Param: 3_HiddenLayer_20_NeuralHidden_16_BatchSize_300_Epoch_4235.796914339066_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AVALTỷ Lệ 80 20 Best Param: 4_HiddenLayer_20_NeuralHidden_16_BatchSize_300_Epoch_3974.2578916549683_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AVALTỷ Lệ 80 20 Best Param: 5_HiddenLayer_19_NeuralHidden_8_BatchSize_250_Epoch_4185.7427361011505_Time


In [9]:
nameData= 'AGLE'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
for i in range(1,6):
    start_Train= time.time()
    best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, [i], size_predict)
    end_Train = time.time()
    print('Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn '+nameData+'Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AGLETỷ Lệ 80 20 Best Param: 1_HiddenLayer_15_NeuralHidden_8_BatchSize_300_Epoch_3513.624835729599_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AGLETỷ Lệ 80 20 Best Param: 2_HiddenLayer_20_NeuralHidden_8_BatchSize_250_Epoch_4393.595132112503_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AGLETỷ Lệ 80 20 Best Param: 3_HiddenLayer_19_NeuralHidden_8_BatchSize_200_Epoch_4580.063223361969_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AGLETỷ Lệ 80 20 Best Param: 4_HiddenLayer_15_NeuralHidden_8_BatchSize_250_Epoch_4115.2406713962555_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn AGLETỷ Lệ 80 20 Best Param: 5_HiddenLayer_18_NeuralHidden_8_BatchSize_250_Epoch_4338.5587430000305_Time


In [7]:
nameData= 'MDLY'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
for i in range(1,6):
    start_Train= time.time()
    best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, [i], size_predict)
    end_Train = time.time()
    print('Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn '+nameData+'Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn MDLYTỷ Lệ 80 20 Best Param: 1_HiddenLayer_19_NeuralHidden_8_BatchSize_300_Epoch_8003.195628404617_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn MDLYTỷ Lệ 80 20 Best Param: 2_HiddenLayer_16_NeuralHidden_8_BatchSize_300_Epoch_3923.034392595291_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn MDLYTỷ Lệ 80 20 Best Param: 3_HiddenLayer_16_NeuralHidden_8_BatchSize_300_Epoch_4312.10093832016_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn MDLYTỷ Lệ 80 20 Best Param: 4_HiddenLayer_20_NeuralHidden_8_BatchSize_250_Epoch_4850.220484256744_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn MDLYTỷ Lệ 80 20 Best Param: 5_HiddenLayer_16_NeuralHidden_8_BatchSize_300_Epoch_5803.882265329361_Time


In [8]:
nameData= 'GDDY'
filePath= '../../Dataset/'+nameData+'.csv'
timeSeries = readData(filePath)
timeSeries = cleanData(timeSeries)
percentTrain = 80
train_data, test_data = splitData(timeSeries, percentTrain)
size_window = 7
size_predict=1
stepWindow=1
X_train, y_train = prepare_data(train_data.values, size_window, size_predict, stepWindow)
X_test, y_test =   prepare_data(test_data.values, size_window, size_predict, stepWindow)
neuralHidden=[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
for i in range(1,6):
    start_Train= time.time()
    best_param = train_FFNN_not_save(nameData, size_window, X_train, y_train, neuralHidden, [i], size_predict)
    end_Train = time.time()
    print('Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn '+nameData+'Tỷ Lệ 80 20 Best Param: '+str(int(best_param['num_layers_hidden']))+'_HiddenLayer_'+str(int(best_param['neuralHidden']))+'_NeuralHidden_'+str(int(best_param['batch_size']))+'_BatchSize_'+str(int(best_param['epochs']))+'_Epoch_' + str(end_Train-start_Train)+'_Time')   

Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn GDDYTỷ Lệ 80 20 Best Param: 1_HiddenLayer_18_NeuralHidden_8_BatchSize_300_Epoch_3695.619271993637_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn GDDYTỷ Lệ 80 20 Best Param: 2_HiddenLayer_19_NeuralHidden_8_BatchSize_250_Epoch_4406.43390417099_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn GDDYTỷ Lệ 80 20 Best Param: 3_HiddenLayer_15_NeuralHidden_16_BatchSize_300_Epoch_4967.507395505905_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn GDDYTỷ Lệ 80 20 Best Param: 4_HiddenLayer_20_NeuralHidden_8_BatchSize_300_Epoch_5935.304007053375_Time
Đánh Giá Ảnh Hưởng Của Số Lượng Lớp Ẩn GDDYTỷ Lệ 80 20 Best Param: 5_HiddenLayer_19_NeuralHidden_8_BatchSize_250_Epoch_7014.6119837760925_Time
