This notebook is freely available for redistribution under the [GPL-3.0 license](https://choosealicense.com/licenses/gpl-3.0/).

Authors: 蘇嘉冠, 鄭宇伸, 喬彥翔

# 人工智慧與工程應用 2021 期中考

## 答題方式說明

1. 總共有六個題組，每個題組有數小題。總共 25 小題，每題 4 分。
2. 請將 `sid` 改為你的學號， `credential` 改為你拿到的密碼，並且先執行以下 3 個關於答案上傳、查詢的程式碼區塊。
3. 每個題組完成後，請記得執行該題組的答案上傳區。答案上傳的期限為  `2021/04/21 18:10`。
4. 執行答題狀況查詢的程式區塊，可以看到你目前的答題狀況。在 `2021/04/21 18:10` 之後，你還可以看到答對與答錯，以及得到的總分。
5. 請保存好你的這份檔案！

In [None]:
sid = "" # PLEASE MODIFY
credential = "" # PLEASE MODIFY

In [None]:
import json
import requests

def submit_answers(
    sid,
    credential,
    ordinal,
    answers,
    api_url="https://aintut2021.herokuapp.com",
    api_version="v1",
):
    request_url = "{}/{}/midterm".format(api_url, api_version)

    res = requests.post(request_url, data={
        "sid": sid,
        "ordinal": ordinal,
        "answers": answers,
        "credential": credential,
    })

    data = res.json()

    if res.status_code >= 400:
        print("\x1b[31m{}\x1b[0m".format(json.dumps(data, indent=4)))
        return

    print("You successully submit answers for section {}".format(
        ordinal,
    ))
    for idx, answer in enumerate(answers):
        print("{}-{}: {}".format(ordinal, idx + 1, answer))

In [None]:
import json
import requests

def query_midterm(
    sid,
    credential,
    api_url="https://aintut2021.herokuapp.com",
    api_version="v1",
):
    request_url = "{}/{}/midterm".format(api_url, api_version)

    answers_list = []
    correctnesses_list = []
    for ordinal in range(1, 6 + 1):
        res = requests.get(request_url, params={
            "sid": sid,
            "ordinal": ordinal,
            "credential": credential,
        })

        data = res.json()

        if res.status_code >= 400:
            print("\x1b[31m{}\x1b[0m".format(json.dumps(data, indent=4)))
            return

        answers_list.append(data["answers"])

        if "correctnesses" in data:
            correctnesses_list.append(data["correctnesses"])

    show_correctness = len(answers_list) == len(correctnesses_list)
    num_correctnesses = 0

    for ordinal_idx, answers in enumerate(answers_list):
        print("== Your submitted answers for section {} == ".format(
            ordinal_idx + 1,
        ))
        if not show_correctness:
            for answer_idx, answer in enumerate(answers):
                print("{}-{}: {}".format(
                    ordinal_idx + 1,
                    answer_idx + 1,
                    answer,
                ))
        else:
            correctnesses = correctnesses_list[ordinal_idx]
            for answer_idx, (answer, correctness) \
                in enumerate(zip(answers, correctnesses)):
                    if correctness:
                        correct_text = "\033[92mPASS\x1b[0m"
                        num_correctnesses += 1
                    else:
                        correct_text = "\x1b[31mFAIL\x1b[0m"
                    print("{} {}-{}: {}".format(
                        correct_text,
                        ordinal_idx + 1,
                        answer_idx + 1,
                        answer,
                    ))

    if show_correctness:
        print("Your total score for midterm: {}".format(4 * num_correctnesses))

### 答題狀況查詢

In [None]:
query_midterm(sid, credential)

## 題組（一）：基本觀念

這裡的題目皆為單選題，請將答案填為 `"A"`、`"B"`、`"C"` 或 `"D"`

(1) 小明想使用 Supervised Learning 訓練出模型以辨識圖片中的動物是貓或是狗，以下哪種資料會是小明所需要的訓練資料? （`answer_1_1`）

- (A) 貓狗的照片，且每張照片**有**標註是貓或狗
- (B) 貓狗的照片，但每張照片**沒有**標註是貓或狗
- (C) 貓狗的照片，但只有貓的照片**有**標註為貓，狗的照片則**沒有**標註
- (D) 貓狗的照片，但只有狗的照片**有**標註為狗，貓的照片則**沒有**標註
 


In [None]:
answer_1_1 = "" # PLEASE MODIFY

(2) 下列機器學習任務中，何者屬於 classification 的任務？（`answer_1_2`）

- (A) input：一隻狗的圖片檔，output：這隻狗的種類
- (B) input：天氣的資料，output：PM 2.5 的數值
- (C) input：股市的狀況，output：某檔股票的股價
- (D) input：一幅畫的圖片檔，output：這幅圖畫的分數

In [None]:
answer_1_2 = "" # PLEASE MODIFY

(3) 下列何者為 Deep Learning 的常用方法? （`answer_1_3`）

- (A) Linear regression
- (B) Logistic regression
- (C) K-nearest neighbors
- (D) Neutral networks

In [None]:
answer_1_3 = "" # PLEASE MODIFY

(4) 下列的機器學習任務中，何者的情境最可能為 Unsupervised Learning？（`answer_1_4`）

- (A) 某醫院蒐集了 30 年胸部 X 光的影像檔，包含有肺癌的、沒有肺癌的，並且根據這些資料來訓練模型，讓電腦做自動的肺癌辨識，作為醫生問診的輔助
- (B) 某農場為了導入農業自動化，將紀錄了五年各種給水紀錄（什麼時間、氣候、土讓性質該給多少水）整合，並且基於機器學習的方法開發出一套自動給水系統
- (C) 某圖書館的資訊系統為了加速新書分類的速度，調閱了所有過去館藏的書名以及相對應的分類資料，做出了一個預測書籍分類的系統
- (D) 某電商平台為了讓商品推薦更加準確，依照平台的使用者資料，依照性別、年齡、購買習慣等特徵，將使用者做分群


In [None]:
answer_1_4 = "" # PLEASE MODIFY

(5) 下列何者不是 Meachine Learning 的情境? （`answer_1_5`）

- (A) Supervised Learning 
- (B) Reinforcement Learning
- (C) Anti-Supervised Learning
- (D) Semi-Supervised Learning

In [None]:
answer_1_5 = "" # PLEASE MODIFY

(6) AlexNet 可以說是 Deep Learning 發展中重要的引爆點，請問 AlexNet 是在哪一年發表的? （`answer_1_6`）

- (A) 1992
- (B) 2002
- (C) 2012
- (D) 2021

In [None]:
answer_1_6 = "" # PLEASE MODIFY

(7) 為了要解決某個 regression 問題，我們總共訓練了 4 種模型，並且用 MSE 作為衡量指標。想請問這四種模型中，哪個最可能出現了 overfitting 的問題？（`answer_1_7`）

- (A) 模型一：training data 的 MSE = 13.21，testing data 的 MSE = 132.1
- (B) 模型二：training data 的 MSE = 125.87，testing data 的 MSE =  136.87
- (C) 模型三：training data 的 MSE = 14.22，testing data 的 MSE = 16.68
- (D) 模型四：training data 的 MSE = 52.12，testing data 的 MSE = 64.13

In [None]:
answer_1_7 = "" # PLEASE MODIFY

(8) 我們用 Python 定義了 function `enlarge()`，試問當參數 `number` 為以下何值時，會執行 `return number ** 3` 這行程式碼？（`answer_1_8`）

- (A) 6
- (B) 40
- (C) 99
- (F) 37

In [None]:
def enlarge(number):
    if number % 2 == 0:
        return number ** 2
    elif number % 3 == 0:
        return number ** 3
    else:
        return number ** 4

In [None]:
answer_1_8 = "" # PLEASE MODIFY

(9) 請問執行以下 Python 程式碼後，`total = total + number` 這行程式碼總共被執行過幾次？（`answer_1_9`）

- (A) 37
- (B) 35
- (C) 33
- (D) 31

In [None]:
total = 0
number = 37

while number > 0:
    total = total + number

    if number < 10:
        number = number - 2
    else:
        number = number - 1

In [None]:
answer_1_9 = "" # PLEASE MODIFY

(10) 請問執行下列 Python 程式碼後，`final_matrix` 的 shape 為多少？（`answer_1_10`）

- (A) (2, 3)
- (B) (2, 7)
- (C) (2, 5)
- (D) (5, 7)

In [None]:
!pip install numpy

In [None]:
import numpy as np

matrix_1 = np.ones((2, 3))
matrix_2 = np.ones((3, 5))
matrix_3 = np.ones((5, 7))

final_matrix = np.dot(np.dot(matrix_1, matrix_2), matrix_3)

In [None]:
answer_1_10 = "" # PLEASE MODIFY

### 題組（一）答案上傳區

In [None]:
submit_answers(sid, credential, 1, [
    answer_1_1,
    answer_1_2,
    answer_1_3,
    answer_1_4,
    answer_1_5,
    answer_1_6,
    answer_1_7,
    answer_1_8,
    answer_1_9,
    answer_1_10,
])

## 題組（二）：魔物獵人

![](https://www.monsterhunter.com/wp-content/themes/mha/assets/wallpaper_gift/img/wallpaper_rise_1920_1080.jpg)


([圖片來源](https://www.monsterhunter.com/mha/zh-tw/wallpaper_gift_zh-tw/))

魔物獵人（MONSTER HUNTER）為日本遊戲公司 CAPCOM 所製作的動作角色扮演系列遊戲，玩家在遊戲中扮演獵人，利用各式類型的武器狩獵魔物，取得素材用於強化裝備與武器。

某一天獵人良三一如既往的接取任務並討伐魔物，從白天打到黑夜，不過良三還不想休息，他想要了解今天的狩獵成果如何，以檢視自己的狩獵效率高不高。

這裡有一個 list 儲存他今日狩獵的所有魔物的體型（單位：公分），請你想辦法找出以下的數據:
1. 良三今天狩獵的魔物最大的體型是多大? (`max_monster_length`)
2. 良三今天總共狩獵了幾隻魔物? (`num_monster`)
3. 良三今天狩獵的魔物體型平均是多少?答案在誤差範圍 0.01 內都算對 (`avg_monster_length`)


In [None]:
monster_lengths = [
    413, 411, 207, 677, 112, 409, 302, 123, 661, 503, 442, 699, 149, 284, 237,
    613, 419, 463, 264, 285, 699, 290, 558, 685, 483, 431, 657, 170, 673, 546,
    192, 521, 407, 366, 252, 309, 434, 414, 205, 313, 448, 622, 405, 351, 319,
    98, 188, 379, 115, 560, 141, 641, 151, 357, 142, 186, 657, 207, 562, 492,
    298, 535, 209, 395, 117, 530, 637, 696, 536, 653, 564, 180, 565, 583, 698,
    394, 559, 274, 113, 342, 365, 95, 428, 401, 157, 553, 359, 296, 253, 237,
    94, 544, 619, 201, 415, 279, 347, 90, 242, 397, 525, 141, 257, 208, 528,
    106, 564, 201, 539, 212, 435, 470, 275, 623, 461, 542, 513, 304, 158, 671,
    508, 556, 564, 242, 365, 323, 563, 556, 308, 106, 423, 311, 537, 203, 660,
    278, 284, 425, 179, 482, 591, 358, 265, 442, 96, 258, 164, 322, 202, 654,
    506, 507, 534, 348, 582, 120, 369, 173, 132, 622, 434, 639, 279, 197, 493,
]

In [None]:
# PLEASE MODIFY CODE BELOW.

max_monster_length = 0
print("The length of largest monster = {} cm".format(max_monster_length))

In [None]:
# PLEASE MODIFY CODE BELOW.

num_monster = 0
print("Number of hunted monsters = {}".format(num_monster))

In [None]:
# PLEASE MODIFY CODE BELOW.

avg_monster_length = 0.0
print("Monster average length = {} cm".format(avg_monster_length))

### 題組（二）答案上傳區

In [None]:
submit_answers(sid, credential, 2, [
    max_monster_length,
    num_monster,
    avg_monster_length,
])

## 題組（三）話中有話

浩哥是學校的風雲人物，追求者眾。然而浩哥目前對於談戀愛還沒有興趣，但對於追求者又不好意思太過直接，因此只能常常用講反話的方式來婉拒對方。

今天，我們要來幫浩哥：
1. 將浩哥給學妹的一段話（`to_may`），轉成他真的想說的話，也就是將所有的 `可愛` 換成 `不可愛`，`高興` 換成 `難過`（`to_may_real`）
2. 算一下，浩哥給學妹的一段話（`to_may`），如果不包含標點符號，總共有幾個字？（`to_may_count`）

附註：
- 標點符號有：`，`、`。`、`！`、`？`
- 例如：`哈哈，我真的好帥！` 這段話總共有 7 個字

In [None]:
to_may = \
    "這世界上最可愛的就是你。我每次看到你，內心就高興到不行。好想好想要，" \
    "每天都跟你一起上學，牽著你可愛的小手，一起高興的轉圈圈。啊！到底要如何，" \
    "才能馬上就與你見面？讓我捏捏你可愛的小臉，摸摸可愛的秀髮，玩玩可愛的小貓咪呢？"

In [None]:
# PLEASE MODIFY CODE BELOW.

to_may_real = ""

print(to_may_real)

In [None]:
# PLEASE MODIFY CODE BELOW.

to_may_count = 0

print("Number of pure words = {}".format(to_may_count))

### 題組（三）答案上傳區

In [None]:
submit_answers(sid, credential, 3, [
    to_may_real,
    to_may_count,
])

## 題組（四）：PCS 選手數據計算

![](https://img.4gamers.com.tw/ckfinder/images/Panda/LOL/2020%20news/200225-pcs-1.png?versionId=DX6agpEUOtAa.VZzjhF2eD4tXBlF0vXb)
（[圖片來源](https://www.4gamers.com.tw/news/detail/42194/pcs-2020-lineup)）

PCS職業聯賽，為台灣、香港及東南亞各國的英雄聯盟電子競技職業聯賽。而PCS的2021賽季已於2月19日開打，並在4月開始進行季後賽。
目前聯賽的參賽隊伍有：

#### Berjaya Dragons、Beyond Gaming、BOOM Esports、Hong Kong Attitude、Impunity Esports、Taipei J Team、Machi Esports、PSG Talon

為了幫助觀眾了解選手的表現狀況，出現了所謂的 KDA 值，已知 KDA 值的計算方式如下:

$KDA = （擊殺數 + 助攻數）/ 死亡數$

下面有選手在季賽的相關數據（[來源](https://www.lolpcs.com/stats.php?Lan=2)），裡面資料分別有：
- `PLAYERS`：選手名稱
- `TEAM`：隊名
- `KILL`：擊殺數
- `DEATH`：死亡數
- `ASSIST`：助攻數

請試著回答以下問題:
1. KDA 最高的選手是誰？（`KDA_max_player`）
2. 全聯盟平均 KDA 為多少？答案在誤差範圍 0.01 內都算對（`average_KDA`）
3. KDA 平均最高的隊伍是？（`TEAM_most_average_KDA`）

In [None]:
!pip install pandas

In [None]:
import pandas as pd

In [None]:
data = pd.read_csv(
    "https://raw.githubusercontent.com/AINTUT/code_2021/main/datasets/kda.csv",
)

print(data)

In [None]:
def kda_calculate(KILL, ASSIST, DEATH):
    KDA = 0.0 # PLEASE MODIFY

    return KDA 

KDA_list = [] 
for index,player in data.iterrows():
    KDA = kda_calculate(player["KILL"], 0, 0) # PLEASE MODIFY
    KDA_list.append(KDA)

# Add a new column "KDA" into data.
data["KDA"] = KDA_list

print(data)

In [None]:
KILL_max_player = data.loc[data['KILL'].idxmax(), "PLAYERS"]
DEATH_max_player = data.loc[data['DEATH'].idxmax(), "PLAYERS"]
ASSIST_max_player = data.loc[data['ASSIST'].idxmax(), "PLAYERS"]
KDA_max_player = "" # PLEASE MODIFY

print("The player that has highest KILL is {}".format(KILL_max_player))
print("The player that has highest DEATH is {}".format(DEATH_max_player))
print("The player that has highest ASSIST is {}".format(ASSIST_max_player))
print("The player that has highest KDA is {}".format(KDA_max_player))

In [None]:
average_KDA = 0.0 # PLEASE MODIFY

print("Average KDA over the league = {}".format(average_KDA))

In [None]:
TEAMS = [
    "Berjaya Dragons",
    "Beyond Gaming",
    "BOOM Esports",
    "Hong Kong Attitude",
    "Impunity Esports",
    "Taipei J Team",
    "Machi Esports",
    "PSG Talon",
]

TEAM_most_average_KDA_score = 0
TEAM_most_average_KDA = ""

for team in TEAMS:
  KDA_sum = 0
  player_number = 0
  for index, player in data.iterrows():
      if player["TEAM"] == team:
         KDA_sum = 0.0 # PLEASE MODIFY
         player_number = player_number + 1
  TEAM_average_KDA_score = KDA_sum / player_number
  if TEAM_most_average_KDA_score < TEAM_average_KDA_score:
       TEAM_most_average_KDA_score = TEAM_average_KDA_score
       TEAM_most_average_KDA = "" # PLEASE MODIFY

print("The team that has highest average KDA is {}".format(
    TEAM_most_average_KDA,
))

### 題組（四）答案上傳區

In [None]:
submit_answers(sid, credential, 4, [
    KDA_max_player,
    average_KDA,
    TEAM_most_average_KDA,
])

## 題組（五）：決鬥！

![](https://i.imgur.com/F0RgRm0.png)

（[圖片來源](https://news.gamme.com.tw/917406)）

（這題稍微比較難，可以晚點再寫）

[《遊戲王－怪獸之決鬥》](https://en.wikipedia.org/wiki/Yu-Gi-Oh!_Duel_Monsters)是日本漫畫家高橋和希所創作的漫畫的改編電視動畫，以卡片怪獸（遊戲王卡）決鬥為主線。動畫其中的一位主要角色：城之內，受邀參加了海馬集團主辦的比賽「決鬥城市」。沒有神之卡的他，如何在這殘酷的比賽中優勝呢？因此我們將幫助城之內，蒐集卡牌的資料，並且做事前的戰術分析！

請試著分析以下資訊：
1. 當城之內召喚出怪獸：人造人電子機器人（`Jinzo`）之後，對手將無法使用陷阱卡。請問卡片種類為陷阱卡（`Trap Card`）的數量總共有多少？（`num_trap_cards`）
2. 在所有召喚等級為 7 的怪獸中，防禦力比真紅眼黑龍（`Red-Eyes Black Flare Dragon`）的攻擊力低至少（含） 500 點的怪獸總共有幾個？（`num_dragon_beats`）
3. 對所有屬性為暗（`DARK`）的怪獸而言，平均召喚一隻暗屬性怪獸需要犧牲幾隻怪獸？召喚怪獸的規則請看公式一。答案在誤差範圍 0.01 內都算對（`num_avg_summon`）
4. 在所有種族為獸戰士（`Beast-Warrior`）的怪獸中，綜合能力最高的怪獸名字為何？綜合能力的運算方式如公式二（`strongest_bw_monster`）

所有遊戲王卡的資料為一個 `DataFrame` 型態的物件（名稱為 `df`），各個 column name 的意義如下：
- `Name`：卡片的名字
- `Type`：卡片的種類（例如：一般怪獸 `Normal Monster`、陷阱卡 `Trap Card`）
- `Level`：卡片的召喚等級
- `Race`：卡片的種族（例如：戰士族 `Warrior`、龍族 `Dragon`）
- `Attribute`：卡片的屬性（例如：水屬性 `WATER`、火屬性 `FIRE`）
- `ATK`：卡片的攻擊力
- `DEF`：卡片的防禦力

（[資料來源](https://www.kaggle.com/tathor/yugioh-trading-cards-dataset)）

公式一：當要召喚怪獸時，依照怪獸的召喚等級，可能需要先犧牲掉一些數量的其他怪獸才能進行召喚
- 召喚等級 4 或以下：不須犧牲任何怪獸
- 召喚等級 5 或 6：犧牲 1 隻怪獸
- 召喚等級 7 或以上：犧牲 2 隻怪獸

公式二：怪獸綜合能力的運算方式如下：

$綜合能力 = 300 * \frac{1}{召喚等級} + 0.7 * 攻擊力 + 0.3 * 防禦力$

In [None]:
!pip install numpy pandas

In [None]:
import numpy as np
import pandas as pd

In [None]:
df = pd.read_csv(
    "https://raw.githubusercontent.com/AINTUT/code_2021/main/datasets/"
    "yugioh_cards.csv",
)

print(df)

In [None]:
num_trap_cards = 0 # PLEASE MODIFY

print("Number of trap cards = {}".format(num_trap_cards))

In [None]:
# PLEASE MODIFY CODE BELOW.

num_dragon_beats = 0

print("Number of monsters that dragon can beat = {}".format(num_dragon_beats))

In [None]:
# PLEASE MODIFY CODE BELOW.

num_avg_summon = 0.0

print("number of average summon = {}".format(num_avg_summon))

In [None]:
# PLEASE MODIFY CODE BELOW.

strongest_bw_monster = ""

print("The strongest Beast-Warrio is {}".format(strongest_bw_monster))

### 題組（五）答案上傳區

In [None]:
submit_answers(sid, credential, 5, [
    num_trap_cards,
    num_dragon_beats,
    num_avg_summon,
    strongest_bw_monster,
])

## 題組（六）：耗油量預測

市面上車子的各種型號，都會因為需求與功能的不同，擁有不同的性能與損耗率。今天我們蒐集到了各種車輛的資料（[來源](https://archive.ics.uci.edu/ml/datasets/Auto+MPG)），希望藉由這些資料，透過 linear regression 方法，用某個 feature 來去預測車輛耗油量（`mpg`，單位為每加侖汽油可以行走的英哩數）。

關於 regression 相關的定義如下：
- function set：$f(x) = b + w_{1}x_{1}$
- loss function：$L(b, w_{1}) = \frac{1}{2}\sum_{i=1}^{n}(\hat{y}^{(i)} - (b + w_{1}{x}^{(i)}_{1}))^2$

我們有以下可能的 input feature：
- `displacement`：排氣量
- `horsepower`：馬力
- `weight`：重量
- `acceleration`：加速度

請試著回答以下問題：
1. `mpg` 與 `horsepower` 的 correlation coefficient 值為多少？答案在誤差範圍 0.01 內都算對（`mpg_horsepower_cor`）
2. 如果我們今天以 `horsepower` 作為 input feature，訓練之後的 $w_{1}$ 會是多少？答案在誤差範圍 0.01 內都算對（`horsepower_w1`）
3. 在 4 個可能的 input feature 之中，會使得訓練出來的結果， testing data 的 MSE 最小的 input feature 會是哪個？（`smallest_mse_feature`）


In [None]:
!pip install numpy pandas matplotlib scikit-learn

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error

In [None]:
df = pd.read_csv(
    "https://raw.githubusercontent.com/AINTUT/code_2021/main/datasets/mpg.csv",
)

In [None]:
# PLEASE MODIFY CODE BELOW.

mpg_horsepower_cor = 0.0

print("Correlation coefficient between mpg and horsepower = {}".format(
    mpg_horsepower_cor,
))

In [None]:
def predict(x, weights):
    return np.dot(x, weights[1:]) + weights[0]

def calculate_loss(y_gt, y_pred):
    loss = ((y_gt - y_pred) ** 2).sum() / 2.0

    return loss

def apply_scaling(x_train, x_test):
    scaler = StandardScaler()

    x_train_std = scaler.fit_transform(x_train)
    x_test_std = scaler.transform(x_test)

    return x_train_std, x_test_std

def fit(x_train, y_train, epoches, learning_rate):
    weights = np.zeros(x_train.shape[1] + 1)
    losses = []

    for _ in range(epoches):
        y_pred = predict(x_train, weights)

        diff = y_train - y_pred
        weights[0] = weights[0] - learning_rate * -diff.sum()
        weights[1:] = weights[1:] - learning_rate * -x_train.T.dot(diff)

        losses.append(calculate_loss(y_train, y_pred))

    return weights, losses

# This is a helper function, you may not need to call it.
def losses_plot(losses):
    plt.plot(range(1, len(losses) + 1), losses)
    plt.ylabel("SSE")
    plt.xlabel("Epoch")
    plt.show()

# This is a helper function, you may not need to call it.
def reg_plot(x, y_gt, y_pred):
    plt.scatter(x, y_gt, c="steelblue", edgecolor="white")
    plt.plot(x, y_pred, c="black")

    plt.xlabel("x")
    plt.ylabel("y")

    plt.show()

In [None]:
test_size = 0.15
random_state = 0

epoches = 40
learning_rate = 0.001

In [None]:
x_data = df[["horsepower"]].to_numpy()
y_data = df["mpg"].to_numpy()

x_train, x_test, y_train, y_test = train_test_split(
    x_data,
    y_data,
    test_size=test_size,
    random_state=random_state,
)

x_train_std, x_test_std = apply_scaling(x_train, x_test)

# PLEASE MODIFY CODE BELOW.

horsepower_w1 = 0.0

print("W1 when input feature is horsepower = {}".format(horsepower_w1))

In [None]:
# PLEASE MODIFY CODE BELOW.

smallest_mse_feature = ""

print("The input feature that has smallest MSE is {}".format(
    smallest_mse_feature,
))

### 題組（六）答案上傳區

In [None]:
submit_answers(sid, credential, 6, [
    mpg_horsepower_cor,
    horsepower_w1,
    smallest_mse_feature,
])