The Homework 3 report from NTU102-1 DMIR course
by NTU Michael Hsu
- 新增欄位
index
:原本資料的排序( = sort byweek_index
andgroup
)。 - 排序與篩選
week_index
+week_return1
: - 定義分類標簽:
-
- 新增欄位
index_sort
:根據上一個步驟後的排序。
- 新增欄位
-
- 新增欄位
index_sort % 30
:mod(左邊, 30)
- 新增欄位
-
- 給予分類標籤
class
:=IF((左邊>0)*(左邊<=6),"1","0")
前六個為 1,剩下二十四個為 0。
- 給予分類標籤
-
- 新增欄位
random_sort
:最後依據這個欄位=RAND()
來做 10-fold classification。 - 最後整理資料為
data/ldpa30_train use.csv
R cmd:
> source("/path_to/generative_classification_model.r")
example: (可用拖曳方式取得路徑)
> source("/Users/michaelhsu/Dropbox/15.\ 碩一上課業/02.\ DMIR\ 資料探勘與資訊檢 索/hw3/generative_classification_model.r")
https://github.com/evenchange4/102-1_DMIR_Hw3_Generative-Classification-Models