# 力試しタイム

P.293の総合添削問題をやってみてはいかが？

# Chapter10　データ可視化のための準備

# 10.1 様々なグラフ（P.298）

### 10.1.1 折れ線グラフ

* 平面上にデータをプロットし、プロットされたデータ間を直線で結んだグラフ
* 時間や位置（距離）によって推移する量を視覚化するのに適している

<img src=".\fig_10_01.png" width="400" alt="折れ線グラフ">

### 10.1.2 棒グラフ
* 項目を横軸に並べ、その項目が取る値を図形の長さで縦に表したグラフ
* 2つ以上の項目が持つ値を比較する際に適している視覚化の方法
* あるデータの視覚化に棒グラフが適しているとき、円グラフによる視覚化も有効な場合がある

<img src=".\fig_10_02.png" width="400" alt="棒グラフ">

### 10.1.3 ヒストグラム

* データを階級ごとに分けてから階級内の度数（同じ階級に含まれるデータの個数）を高さで表したグラフ
* 度数分布図ともいう
* 1次元のデータ（ある製品の長さを何回も測定したデータなど）の分布を可視化する際に最も適している

<img src=".\fig_10_03.png" width="400" alt="ヒストグラム">

### 10.1.4 散布図

* あるデータの2つの項目を平面上のx軸とy軸にそれぞれ対応させ、点を打ったグラフ
* 点の色や大きさを活用することで**合計3つの項目を平面上に可視化** することもできる

<img src=".\fig_10_04.png" width="400" alt="散布図">

### 10.1.5 円グラフ

* 円形の図形に、全体に占める割合に応じて中心からの角度を割り当てるグラフ
* ある項目の割合を全体と比較したい時に最も適している
* あるデータの可視化に円グラフが適しているとき、棒グラフによる可視化も有効な場合がある


<img src=".\fig_10_05.png" width="400" alt="円グラフ">

## 10.2 乱数の生成

### 10.2.1 シードを設定する
* コンピュータはシード（seed）を元に乱数を生成する
* **シード** 
    * 乱数生成の元となる初期値
* シードを固定することで、常に同じ乱数列を生成することができる
    * 同じ乱数列を使用することで、同じ条件であれば乱数を使っても同様の計算結果を再現できる
* シードを設定しない場合、コンピュータの現在時刻を初期値として使用する
    * 実行ごとに異なる乱数が出力される
* シードの設定方法
    * **`numpy.ramdom.seed()`** にシード（整数）を与える

**リスト10.1：問題**

In [1]:
import numpy as np

# シードを設定しない場合
# X,Yにそれぞれ5つの乱数を格納
X = np.random.randn(5)
Y = np.random.randn(5)
# X,Yの値を出力
print("シードを設定しない場合")
print("X:",X)
print("Y:",Y)

# シードを設定した場合
np.random.seed(0)
# xに乱数を格納
x = np.random.randn(5)
# 同じシードを与えて初期化
np.random.seed(0)
# 再び乱数を作りyに代入
y = np.random.randn(5)
# x,yの値を出力
print("シードを設定した場合")
print("x:",x)
print("y:",y)

シードを設定しない場合
X: [-0.3440375  -0.01130835 -1.24647322  0.81248046  2.35897359]
Y: [-0.26539681  0.57888247 -0.18885387 -0.02369235  0.01642524]
シードを設定した場合
x: [1.76405235 0.40015721 0.97873798 2.2408932  1.86755799]
y: [1.76405235 0.40015721 0.97873798 2.2408932  1.86755799]


### 10.2.2 正規分布に従う乱数を生成する
* （標準）正規分布に従う乱数を発生させる関数
    * **`numpy.random.randn()`**
* **`numpy.random.normal()`** との違い
    * **`numpy.random.normal()`** は分布の平均と標準偏差を指定できる
    * **`numpy.random.randn()`** は平均0、標準偏差1の正規分布（標準正規分布）

#### 正規分布に従う乱数を発生させる例

In [1]:
import numpy as np

# シードの値を0に設定
np.random.seed(0)

# 正規分布に従う乱数を5個生成し、xに代入
x = np.random.randn(5)

# 可視化します
print(x)

[1.76405235 0.40015721 0.97873798 2.2408932  1.86755799]


### 10.2.3 二項分布に従う乱数を生成する
* **`numpy.random.binomial(n, p)`**
    * n：試行回数
    * p：成功率（0～1）
    * 成功率pの試行をn回行い、成功した回数を返す
    * 第3引数に**`size=整数値`** を渡すと、n回試行したときの成功数を、指定した数だけ返す
    * 戻り値：成功する回数


#### （例）100回コインを投げた場合に表が出る回数を出力する

In [4]:
import numpy as np

# シードを設定
np.random.seed(0)
print("=== 0.5の確率で成功する試行を100回行った時の成功数を求めて出力 ===")
num1 = np.random.binomial(100, 0.5)
print(num1)

print("=== 0.5の確率で成功する試行を100回行った時の成功数を5回求めて出力 ===")
num2 = np.random.binomial(100, 0.5, 5)
print(num2)

=== 0.5の確率で成功する試行を100回行った時の成功数を求めて出力 ===
52
=== 0.5の確率で成功する試行を100回行った時の成功数を5回求めて出力 ===
[51 61 51 43 47]


### 10.2.4 リストからランダムに選択する
* **`numpy.random.choice(x, n)`**
    * x：リスト型データ
    * n：選択個数
    * 渡したリスト型データの中からランダムに選んだ結果を、nの数だけ返す
    * 選択は重複を許す形で行われる
        * 重複を許さない選択をしたい場合は引数に **`replace=False`** を渡す

#### リストからのランダム選択の例

In [3]:
import numpy as np

x = list(range(10))
print("=== x ===")
print(x)

# シードを設定
np.random.seed(0)
# xの中からランダムに5個選んでyに代入
y = np.random.choice(x, 5)
print("=== y ===")
print(y)

=== x ===
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
=== y ===
[5 0 3 3 7]


## 10.3 時系列データ（P.310）

### 10.3.1 datetime型
* 時を表すデータ型：**datetime型**
* 生成方法
    * **`datetime.datetime(年, 月, 日, 時, 分, 秒, ミリ秒)`**
    * 引数の渡し方は順番通りでなく **`day=日`** といった渡し方も可能（キーワード引数）

#### datatime型オブジェクト生成の例

In [4]:
import datetime as dt

# 2019年12月1日10時30分を表すオブジェクトを作成
x = dt.datetime(2019, 12, 1, 10, 30)

# 出力
print(x)

2019-12-01 10:30:00


### 10.3.2 timedelta型
* 時間の長さを表すデータ型：**timedelta型**
* [pythonリファレンスの記述](https://docs.python.org/ja/3/library/datetime.html)  
**`class datetime.timedelta(days=0, seconds=0, microseconds=0, milliseconds=0, minutes=0, hours=0, weeks=0)`**
```
全ての引数がオプションで、デフォルト値は 0 です。 引数は整数、浮動小数点数でもよく、正でも負でもかまいません。
days, seconds, microseconds だけが内部的に保持されます。 引数は以下のようにして変換されます:
　・1 ミリ秒は 1000 マイクロ秒に変換されます。
　・1 分は 60 秒に変換されます。
　・1 時間は 3600 秒に変換されます。
　・1 週間は 7 日に変換されます。
さらに、値が一意に表されるように days, seconds, microseconds が以下のように正規化されます
　・0 <= microseconds < 1000000
　・0 <= seconds < 3600*24 (一日中の秒数)
　・-999999999 <= days <= 999999999
```


#### timedelta型オブジェクト生成の例

In [5]:
import datetime as dt

# 2時間5分50秒を表すtimedeltaオブジェクトを作成
x = dt.timedelta(hours=2, minutes=5, seconds=50)

# 出力
print(x)

2:05:50


### 10.3.3 datetime型とtimedelta型の演算
* datetime型オブジェクトとtimedelta型オブジェクトは足したり引いたりすることができる
* timedelta型オブジェクトは整数倍することが可能、オブジェクト同士の演算も可能

#### 演算の例

In [6]:
import datetime as dt


# 2020年7月24日を表すdatetimeオブジェクトを作成
x = dt.datetime(2020, 7, 24)
print("=== x ===")
print(x)

# xから100日前を表すdatetimeオブジェクトを計算
delta = dt.timedelta(100)
y = x - delta

# 出力
print("=== y ===")
print(y)

=== x ===
2020-07-24 00:00:00
=== y ===
2020-04-15 00:00:00


### 10.3.4 時を表す文字列からdatetimeオブジェクトを作成する
* 時を表す文字列からdatetimeオブジェクトを作成する
    * **`dateime.datetime.strptime(文字列, "書式")`**
        * 文字列 **s** が **\"年-月-日 時-分-秒\"** の形式の場合
            * **`datetime.datetime.strptime(s, "%Y-%m-%d %H-%M-%S")`**

#### 文字列からdatetimeオブジェクトを作成する例

In [8]:
import datetime as dt

# sに2019年12月1日10時20分30秒を表す文字列を"年/月/日 時:分:秒"の形式で代入
s = "2019/12/1 10:20:30"
print("=== s ===")
print(s)
# sを変換して、datetimeオブジェクトをxに代入
x = dt.datetime.strptime(s, "%Y/%m/%d %H:%M:%S")

# 出力
print("=== x ===")
print(x)

=== s ===
2019/12/1 10:20:30
=== x ===
2019-12-01 10:20:30


## 10.4 データの操作（P.315）

### 10.4.1 文字列型から数値型へ型変換する
* 数字のみの文字列を数値型に変換する
    * **`int()`**
        * 整数型に変換
    * **`float()`**
        * 浮動小数点型に変換

#### 文字列型から数値型への変換の例

In [1]:
# 文字列型で代入
x = "10"
y = "5.5"

# x, yを数値型に変換し計算する
z = int(x) + float(y)

# zの値を出力
print(z)

15.5


### 10.4.2 等間隔の数列を生成する①
* 等間隔の数列が欲しいケース
    * リストの要素に順番をつける、偶数列（0, 2, 4,...）が欲しいときなど
    * **`numpy.arange(始まりの値, 終わりの値, 間隔の値)`** が便利
        * 始まりから終わりの直前までの数値を指定した間隔で返す

#### numpy.arangeの例

In [4]:
import numpy as np

## 0から4までの偶数列をxに代入する
## 終わりの値は4ではなく、5と指定する
x = np.arange(0, 5, 2)
# 出力
print("x : ", x)

#### （参考）range()を使用してリスト型変数を作成する場合
y = list(range(0, 5, 2))
print("y : ", y)

x :  [0 2 4]
y :  [0, 2, 4]


### 10.4.3 等間隔の数列を生成する②
* ある範囲を指定した個数に分割したいケース
    * **`numpy.linspace(始まりの値, 終わりの値, 分割したい個数)`**
        * 指定した個数に分割する点を返す
        * **終わりの値の直前の値までで処理をするのではない**ので注意
            * 引数endpointがデフォルトTrue

#### numpy.linspaceの例

In [1]:
import numpy as np

# 0から15までの範囲を等間隔にわける4点をxに代入
x = np.linspace(0, 15, 5)

# 出力します
print(x)

[ 0.    3.75  7.5  11.25 15.  ]


# ほげ要望

第１０章の添削問題をやってくれたら工藤が喜びます

# エクストラほげ問題⑩
## Pythonで学ぶ線形代数
## 単位行列と逆行列
大学に進学をした理系学生が１年生の最初に習うのが線形代数です。その知識を使い今習っているPythonの技術向上を目指しましょう。   
※ヒントのようなもの  
①https://oguemon.com/topic/study/linear-algebra/  
②https://mathtrain.jp/category/senkei  
③https://python.atelierkobato.com/linear/  
④https://examist.jp/category/mathematics/  
⑤http://www.geisya.or.jp/~mwm48961/koukou/index_m.htm  
  
# もんだいだよん(^ω^)
## 単位行列と逆行列
### 単位行列 
### numpy.identity()
　下記の行列$A$と単位行列Iの行列積$A・I$を求めなさい  
 $
  \mathrm|A| = \left|
    \begin{array}{ccc}
           -1& 5\\
            7& 0
    \end{array}
  \right|
$  


### 逆行列と正則行列
### numpy.linalg.inv()
行列Aの逆行列$A^{-1}$と$A・A^{-1}$を求めなさい  
 $
  \mathrm|A| = \left|
    \begin{array}{ccc}
            1& 2\\
            3& 4
    \end{array}
  \right|
$  