<a href="https://colab.research.google.com/github/udlbook/udlbook/blob/main/Notebooks/Chap01/1_1_BackgroundMathematics.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# **ノートブック 1.1 -- 背景となる数学**

このPythonノートブックの目的は、CoLabを使用できることを確認し、ディープラーニングを理解するために必要な背景となる数学的概念に慣れることです。<br><br>これは難しいものではなく、すでにこの情報の一部またはすべてを知っているかもしれません。<br><br>数学は観戦スポーツでは*ありません*。講義を聞いたり本を読んだりするだけでは学べません。実際に触れて、自分で探求することが本当に役立ちます。<br><br>以下のセルを順番に実行しながら進めてください。様々な場所で**「TODO」**という言葉が表示されます。これらの場所の指示に従って、関数を完成させるコードを書いてください。テキストには質問も散りばめられています。

間違いを見つけたり、提案がある場合は、udlbookmail@gmail.comまでご連絡ください。

In [None]:
# Imports math library
import numpy as np
# Imports plotting library
import matplotlib.pyplot as plt

**線形関数**<br>本書では、*線形方程式*という用語を、入力の加重和とオフセットの和を意味するものとして使用します。入力が1つだけ $x$ の場合、これは直線になります：

\begin{equation}y=\beta+\omega x,\end{equation}

ここで、$\beta$ は線形のy切片であり、$\omega$ は直線の傾きです。2つの入力 $x_{1}$ と $x_{2}$ がある場合、次のようになります：

\begin{equation}y=\beta+\omega_1 x_1 + \omega_2 x_2.\end{equation}

その他の関数は定義により**非線形**です。




In [None]:
# Define a linear function with just one input, x
def linear_function_1D(x,beta,omega):
  # TODO -- replace the code line below with formula for 1D linear equation
  y = x

  return y

In [None]:
# 1次元線形関数をプロット

# 0から10まで0.01刻みでx値の配列を定義
# https://numpy.org/doc/stable/reference/generated/numpy.arange.html
x = np.arange(0.0,10.0, 0.01)
# 上で記述した関数を使ってyを計算
beta = 0.0; omega = 1.0

y = linear_function_1D(x,beta,omega)

# この関数をプロット
fig, ax = plt.subplots()
ax.plot(x,y,'r-')
ax.set_ylim([0,10]);ax.set_xlim([0,10])
ax.set_xlabel('x'); ax.set_ylabel('y')
plt.show()

# TODO -- betaとomegaの値を変更して実験し、
# それらが何をするかを理解しましょう。y軸をy=10で交差し、
# x軸をx=5で交差する線を作ってみてください

それでは、2次元線形関数を調べてみましょう

In [None]:
# 2次元関数を描画するコード -- 何が起こっているか理解するために読んでください。変更する必要はありません
def draw_2D_function(x1_mesh, x2_mesh, y):
    fig, ax = plt.subplots()
    fig.set_size_inches(7,7)
    pos = ax.contourf(x1_mesh, x2_mesh, y, levels=256 ,cmap = 'hot', vmin=-10,vmax=10.0)
    fig.colorbar(pos, ax=ax)
    ax.set_xlabel('x1');ax.set_ylabel('x2')
    levels = np.arange(-10,10,1.0)
    ax.contour(x1_mesh, x2_mesh, y, levels, cmap='winter')
    plt.show()

In [None]:
# Define a linear function with two inputs, x1 and x2
def linear_function_2D(x1,x2,beta,omega1,omega2):
  # TODO -- replace the code line below with formula for 2D linear equation
  y = x1

  return y

In [None]:
# 2次元関数をプロット

# xとyの点の2次元配列を作成
x1 = np.arange(0.0, 10.0, 0.1)
x2 = np.arange(0.0, 10.0, 0.1)
x1,x2 = np.meshgrid(x1,x2)  # https://www.geeksforgeeks.org/numpy-meshgrid-function/

# omega1、omega2の値に対して2次元関数を計算
beta = 0.0; omega1 = 1.0; omega2 = -0.5
y  = linear_function_2D(x1,x2,beta, omega1, omega2)

# 関数を描画
# 色はy値を表します（明るい = 高い値）
# 黒 = -10以下、白 = +10以上
# 0 = 中間のオレンジ
# 線は値が等しい等高線です
draw_2D_function(x1,x2,y)

# TODO
# omega_1をゼロに設定した場合、このプロットがどのように見えるか予測してください
# コードを変更して、正しいか確認してください。

# TODO
# omega_2をゼロに設定した場合、このプロットがどのように見えるか予測してください
# コードを変更して、正しいか確認してください。

# TODO
# betaを-5に設定した場合、このプロットがどのように見えるか予測してください
# コードを変更して、正しいか確認してください


多くの線形関数を同時に計算したい場合がよくあります。例えば、3つの入力 $x_1$、$x_2$、$x_3$ があり、$y_1$ と $y_2$ を与える2つの線形関数を計算したいとします。もちろん、各方程式を個別に実行することでこれを行うことができます、<br><br>

\begin{align}y_1 &=& \beta_1 + \omega_{11} x_1 + \omega_{12} x_2 + \omega_{13} x_3\\
y_2 &=& \beta_2 + \omega_{21} x_1 + \omega_{22} x_2 + \omega_{23} x_3.
\end{align}

ただし、ベクトルと行列を使用すると、よりコンパクトに書くことができます：

\begin{equation}
\begin{bmatrix} y_1\\ y_2 \end{bmatrix} = \begin{bmatrix}\beta_{1}\\\beta_{2}\end{bmatrix}+ \begin{bmatrix}\omega_{11}&\omega_{12}&\omega_{13}\\\omega_{21}&\omega_{22}&\omega_{23}\end{bmatrix}\begin{bmatrix}x_{1}\\x_{2}\\x_{3}\end{bmatrix},
\end{equation}
または

\begin{equation}
\mathbf{y} = \boldsymbol\beta +\boldsymbol\Omega\mathbf{x}.
\end{equation}

と短く表記できます。ここで、小文字の太字記号はベクトルに使用されます。大文字の太字記号は行列に使用されます。



In [None]:
# Define a linear function with three inputs, x1, x2, and x_3
def linear_function_3D(x1,x2,x3,beta,omega1,omega2,omega3):
  # TODO -- replace the code below with formula for a single 3D linear equation
  y = x1

  return y

個別の方程式とベクトル/行列形式の両方を使用して2つの線形方程式を計算し、同じ結果が得られることを確認しましょう

In [None]:
# Define the parameters
beta1 = 0.5; beta2 = 0.2
omega11 =  -1.0 ; omega12 = 0.4; omega13 = -0.3
omega21 =  0.1  ; omega22 = 0.1; omega23 = 1.2

# Define the inputs
x1 = 4 ; x2 =-1; x3 = 2

# Compute using the individual equations
y1 = linear_function_3D(x1,x2,x3,beta1,omega11,omega12,omega13)
y2 = linear_function_3D(x1,x2,x3,beta2,omega21,omega22,omega23)
print("Individual equations")
print('y1 = %3.3f\ny2 = %3.3f'%((y1,y2)))

# Define vectors and matrices
beta_vec = np.array([[beta1],[beta2]])
omega_mat = np.array([[omega11,omega12,omega13],[omega21,omega22,omega23]])
x_vec = np.array([[x1], [x2], [x3]])

# Compute with vector/matrix form
y_vec = beta_vec+np.matmul(omega_mat, x_vec)
print("Matrix/vector form")
print('y1= %3.3f\ny2 = %3.3f'%((y_vec[0][0],y_vec[1][0])))


# 質問

1. 3つの入力を持つ単一の線形方程式（つまり **linear_function_3D()**）は、3次元空間 ($x_1$,$x_2$,$x_3$) の各点に値yを関連付けます。これを視覚化することは可能ですか？位置(0,0,0)での値は何ですか？

2. 個別の方程式と行列形式の両方を使用して、2つの入力 ($x_1$, $x_2$) を持つ3つの線形方程式を計算するコードを書いてください（入力 $\beta_{i}$ と傾き $\omega_{ij}$ には任意の値を設定できます）。

# 特殊関数

本書全体を通して、いくつかの特殊関数を使用します（付録B.1.3を参照）。その中で最も重要なのは、対数関数と指数関数です。それらの性質を調べてみましょう。

まず、実数直線 $[-\infty,+\infty]$ を非負の数 $[0,+\infty]$ に写像する指数関数 $y=\exp[x]=e^x$ から始めましょう。

In [None]:
# 指数関数を描画

# -5から5まで0.01刻みでx値の配列を定義
x = np.arange(-5.0,5.0, 0.01)
y = np.exp(x) ;

# この関数をプロット
fig, ax = plt.subplots()
ax.plot(x,y,'r-')
ax.set_ylim([0,100]);ax.set_xlim([-5,5])
ax.set_xlabel('x'); ax.set_ylabel('exp[x]')
plt.show()

# 質問

1. $\exp[0]$ は何ですか？
2. $\exp[1]$ は何ですか？
3. $\exp[-\infty]$ は何ですか？
4. $\exp[+\infty]$ は何ですか？
5. 関数が凸である（convex）とは、関数上の任意の2点間に直線を引いたとき、その直線がこれら2点間のどこでも関数の上にある場合です。同様に、関数が凹である（concave）とは、任意の2点間の直線がこれら2点間のどこでも関数の下にある場合です。指数関数は凸、凹、またはどちらでもないのでしょうか？


次に、対数関数 $y=\log[x]$ を考えてみましょう。本書では常に自然（底 $e$）対数を使用します。対数関数は非負の数 $[0,\infty]$ を実数 $[-\infty,\infty]$ に写像します。これは指数関数の逆関数です。したがって、$\log[x]$ を計算するとき、実際には「$e^y=x$ となる数 $y$ は何か？」と尋ねているのです。

In [None]:
# 対数関数を描画

# -5から5まで0.01刻みでx値の配列を定義
x = np.arange(0.01,5.0, 0.01)
y = np.log(x) ;

# この関数をプロット
fig, ax = plt.subplots()
ax.plot(x,y,'r-')
ax.set_ylim([-5,5]);ax.set_xlim([0,5])
ax.set_xlabel('x'); ax.set_ylabel('$\log[x]$')
plt.show()

# 質問

1. $\log[0]$ は何ですか？
2. $\log[1]$ は何ですか？
3. $\log[e]$ は何ですか？
4. $\log[\exp[3]]$ は何ですか？
5. $\exp[\log[4]]$ は何ですか？
6. $\log[-1]$ は何ですか？
7. 対数関数は凹または凸のどちらですか？
