# 視覺化

## 郭耀仁

## 視覺化的力量

- [Hans Rosling](https://www.youtube.com/watch?v=jbkSRLYSojo)

> He rose to international celebrity status after producing a [Ted Talk](https://www.ted.com/talks/hans_rosling_shows_the_best_stats_you_ve_ever_seen?language=zh-tw) in which he promoted the use of data to explore development issues.
> [Hans Rosling - Wikipedia](https://en.wikipedia.org/wiki/Hans_Rosling)

## Matplotlib

- Python 基礎的繪圖套件

```python
%matplotlib inline # 讓圖能夠在 Notebook 中顯示
import matplotlib.pyplot as plt
```

## 使用 `scatter()` 方法畫散佈圖

- 探索兩個數值的關係
- 畫好以後利用 `plt.show()` 把圖顯示出來

```python
import matplotlib.pyplot as plt
import numpy as np

x = np.arange(1, 11)
y = 2*x
plt.scatter(x, y)
plt.show()
```

## 使用 `scatter()` 方法畫散佈圖（2）

- `xlabel()` 編輯 X 軸標籤
- `ylabel()` 編輯 Y 軸標籤
- `title()` 編輯圖標題

```python
import matplotlib.pyplot as plt
import numpy as np

x = np.arange(1, 11)
y = 2*x
plt.scatter(x, y)
plt.xlabel("x")
plt.ylabel("y")
plt.title("y = 2x")
plt.show()
```

## 使用 `plot()` 畫線圖

- `plt.grid(True)` 加入格線

```python
import matplotlib.pyplot as plt
import numpy as np
import math

x = np.arange(-math.pi, math.pi, 0.01)
y = np.sin(x)

plt.plot(x, y)
plt.xlabel("x")
plt.ylabel("y")
plt.title("y = sin(x)")
plt.grid(True)
plt.show()
```

## 使用 `plot()` 畫線圖（2）

- 練習畫出 $f(x) = x^3$

## 使用 `plot()` 畫線圖（3）

- 將兩個線圖疊在一起

```python
import matplotlib.pyplot as plt
import numpy as np
import math

x = np.arange(-math.pi*3, math.pi*3, 0.01)
y_sin = np.sin(x)
y_cos = np.cos(x)

plt.plot(x, y_sin)
plt.plot(x, y_cos)
plt.xlabel("x")
plt.ylabel("y")
plt.title("y = sin(x) & y = cos(x)")
plt.grid(True)
plt.show()
```

## 使用 `plot()` 畫線圖（4）

- 在左邊與右邊各畫一個線圖

```python
import matplotlib.pyplot as plt
import numpy as np
import math

x = np.arange(-math.pi*3, math.pi*3, 0.01)
y_sin = np.sin(x)
y_cos = np.cos(x)

plt.subplot(1, 2, 1) # 要畫 (1, 2) 中的第一個
plt.plot(x, y_sin, "r--") # 紅色虛線
plt.ylabel("y")
plt.title("y = sin(x)")
plt.subplot(1, 2, 2) # 要畫 (1, 2) 中的第二個
plt.plot(x, y_cos, "b") # 藍色實線
plt.title("y = cos(x)")
plt.show()
```

## 直方圖

- 使用 `numpy.random` 產生隨機變數
- 用 `hist()` 方法視覺化

```python
import numpy as np
import matplotlib.pyplot as ply

normal_samples = np.random.normal(size = 1000)

plt.hist(normal_samples)
plt.title("Normal Dist")
plt.show()
```

## 直方圖（2）

- 練習畫左右各一個直方圖
    - 均勻分布
    - 標準常態分配

## 長條圖

- `bar()` 與 `barh()` 方法

```python
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np

url = "http://archive.ics.uci.edu/ml/machine-learning-databases/iris/bezdekIris.data"
iris = pd.read_csv(url, names = ["sepal_length", "sepal_width", "petal_length", "petal_width", "species"])
average = np.mean(iris.values[:, 0:4], axis = 0)
category = range(iris.shape[1] - 1)

plt.subplot(1, 2, 1)
plt.barh(category, average, color = "b", alpha = 0.5, align = "center")
plt.title("Horizontal Bar Chart")
plt.yticks(category, iris.columns[0:4])
plt.subplot(1, 2, 2)
plt.bar(category, average, color = "r", alpha = 0.5, align = "center")
plt.title("Vertical Bar Chart")
plt.xticks(category, iris.columns[0:4], rotation='vertical')
plt.show()
```

## 等高線圖

- `numpy.meshgrid()` 可以幫我們把一維數列分別往水平/垂直方向延伸為矩陣

```python
import numpy as np

u = np.arange(start = -5, stop = 5, step = 0.1)
x, y = np.meshgrid(u, u)
print(x)
print("------")
print(y)
```

## 等高線圖（2）

- 等高線圖需要第三個維度：`z` 來表示高度（顏色）

```python
import numpy as np

u = np.arange(start = -5, stop = 5, step = 0.1)
x, y = np.meshgrid(u, u)
z = x**2 + y**2
```

## 等高線圖（3）

- `contour()` 是沒有填色的

```python
import numpy as np

u = np.arange(start = -5, stop = 5, step = 0.1)
x, y = np.meshgrid(u, u)
z = x**2 + y**2
plt.contour(x, y, z)
plt.show()
```

## 等高線圖（4）

- `contourf()` 是有填色的

```python
import numpy as np
import matplotlib.pyplot as plt

u = np.arange(start = -5, stop = 5, step = 0.1)
x, y = np.meshgrid(u, u)
z = x**2 + y**2
plt.contourf(x, y, z)
plt.show()
```

## 等高線圖（5）

- 為什麼要知道等高線圖怎麼畫？

## 延伸閱讀

- [Matplotlib Gallery](http://matplotlib.org/gallery.html)
- [Seaborn: statistical data visualization](https://seaborn.pydata.org/)
- [Bokeh](http://bokeh.pydata.org/en/latest/)