<a href="https://colab.research.google.com/github/ailab-nda/ML/blob/main/AI_test_2024_ans.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 人工知能試験問題 2024

解答は本ノートに直接記述の上、出来上がったファイルをダウンロードして提出すること。
（解答欄はクリックすると書き込めます）

### 使用するライブラリのインストール

In [None]:
import numpy as np

## 1. Python 基礎知識

(1) Python における「タプル」、「辞書」、「集合」について、それぞれがどのようなものかを、リストとの違いを中心に説明しなさい。

解答欄（ダブルクリックすると書き込めます）

(2) ２つの文章について、共通する単語の数を、どちらかに入っている単語の数で割ることで、どの程度似ているかを計算することができる。この手続きを関数として表現せよ。ただし、単語の重複は考慮しない（何回出てきても１回とみなす）とする。

In [None]:
# 解答欄
def similarity(x, y):
    # 以下に処理を書く。
    xx = x.split()
    yy = y.split()
    a = set(xx)
    b = set(yy)
    result = len(set.intersection(a,b))/len(set.union(a,b))
    return result

print(similarity("This is a pen", "That is a girl"))
print(similarity("This is a pen", "How are you doing"))


(3) すべての要素が 0 である 10x10 の行列を作成し、A という変数に代入せよ。

In [None]:
# 解答欄
A = np.zeros((10,10))
print(A)

(4) n x n の行列 のうちランダムに m 箇所を選び、その値を 1 に置き換える関数 replace(n, m) を作成せよ。

In [None]:
# 解答欄
def replace(n, m):
    Z = np.zeros((n,n))
    np.put(Z, np.random.choice(range(n*n), m, replace=False),1)
    return Z

replace(4, 1)

## 2. 機械学習の理論

サポートベクターマシンに関する以下の問いに答えよ。

数式の書き方はこちら→ https://qiita.com/namoshika/items/63db972bfd1030f8264a

(1) サポートベクターマシンの特徴に「マージン最大化」と「カーネル法」がある。この２つの言葉についてそれぞれ説明せよ。

解答欄：

(2) $\boldsymbol{x}$ = ($x_1$, $x_2$, $x_3$) としたときに、
$$
k = (\boldsymbol{x}, \boldsymbol{x'}) = (\boldsymbol{x}^T \boldsymbol{x'} + 2)^3
$$
とする。このカーネルにより、問題空間は何次元に高次元化されるか？計算結果とともに答えよ。

解答欄：

(3) $xyz = C$ （Cは定数）という条件のもとで $f(x, y, z) = x + y + z$ を最小化したい。$L(x, y, z, \lambda) = f(x) + \lambda (xyz - C)$ とし、$f$ の最小値を求めよ。

解答欄：


# 3. 機械学習実践
### ベイジアンネットワーク（chap4.pdf 参照）

In [None]:
!pip install -U pgmpy

ライブラリのインポート

In [None]:
from pgmpy.models import BayesianModel
from pgmpy.models import BayesianNetwork
from pgmpy.factors.discrete import TabularCPD
from pgmpy.inference import VariableElimination
from pgmpy.estimators import HillClimbSearch, BayesianEstimator

地頭の良さ(Intel (I))、ある科目の試験の難しさ(Diff (D))、ある科目の成績(Grade (G))、センター試験の成績(SAT (S))、および内申点 (Letter (L)) の間に以下の関係があるとする。



In [None]:
from IPython.display import Image
Image('https://pgmpy.org/_images/detailed_notebooks_2._Bayesian_Networks_4_0.png')

(1) 上の図から、P(D, I, G, L, S) を求めよ。

解答欄：$ P(D, I, G, L, S) = $

これらの関係をベイジアンネットワークとして入力する。

In [None]:
model = BayesianModel([('D', 'G'), ('I', 'G'), ('G', 'L'), ('I', 'S')])

cpd_d_sn = TabularCPD(variable='D', variable_card=2, values=[[0.6], [0.4]], state_names={'D': ['Easy', 'Hard']})
cpd_i_sn = TabularCPD(variable='I', variable_card=2, values=[[0.7], [0.3]], state_names={'I': ['Dumb', 'Intelligent']})
cpd_g_sn = TabularCPD(variable='G', variable_card=3,
                      values=[[0.3, 0.05, 0.9,  0.5],
                              [0.4, 0.25, 0.08, 0.3],
                              [0.3, 0.7,  0.02, 0.2]],
                      evidence=['I', 'D'],
                      evidence_card=[2, 2],
                      state_names={'G': ['A', 'B', 'C'],
                                   'I': ['Dumb', 'Intelligent'],
                                   'D': ['Easy', 'Hard']})

cpd_l_sn = TabularCPD(variable='L', variable_card=2,
                      values=[[0.1, 0.4, 0.99],
                              [0.9, 0.6, 0.01]],
                      evidence=['G'],
                      evidence_card=[3],
                      state_names={'L': ['Bad', 'Good'],
                                   'G': ['A', 'B', 'C']})

cpd_s_sn = TabularCPD(variable='S', variable_card=2,
                      values=[[0.95, 0.2],
                              [0.05, 0.8]],
                      evidence=['I'],
                      evidence_card=[2],
                      state_names={'S': ['Bad', 'Good'],
                                   'I': ['Dumb', 'Intelligent']})

# These defined CPDs can be added to the model. Since, the model already has CPDs associated to variables, it will
# show warning that pmgpy is now replacing those CPDs with the new ones.
model.add_cpds(cpd_d_sn, cpd_i_sn, cpd_g_sn, cpd_l_sn, cpd_s_sn)
model.check_model()

ある条件におけるある変数の確率は infer.query() 関数による求めることができる。

(2) 何も条件が仮定されない場合に、ある科目の成績の確率 P(G) を計算によって求めよ。

In [None]:
infer = VariableElimination(model)
g_dist = infer.query(['G'])
print(g_dist)

(3) 地頭がよく、ある科目の試験が難しかった場合の、ある科目の成績の確率 P(G| D='Easy', I='Intelligent')を計算によって求めよ。

In [None]:
print(infer.query(['G'], evidence={'D': 'Hard', 'I': 'Intelligent'}))

(4) 自分で条件を設定し、何らかの確率を計算によって求めよ。

In [None]:
# ここに確率の式を書いてからプロググラムを書いてください。

## 4. 本講義に関するコメント
感想、苦情、なぜこの科目の単位が必要なのか、等

解答欄：