## Numpy建立與計算
- 注意numpy的ndarray所放的都是相同的資料類型
- ndarray是一個多維度的陣列,提供以陣列為導向的快速算數運算和有彈性的廣播能力 
- ndarray提供在整個陣列的數學運算不需使用python的迴圈功能
- 線性代數,亂數產生,傅立葉轉換能力
- numpy提供的由C,C++,FORTRAN的資源庫

### 陣列初始與規劃
1. 陣列初始化
2. 陣列重新規劃
3. 計算與取代

### 指定與重設
1. 一個整數指定
2. tuple 或 list 指定
3. 重設陣列

### 數值計算與處理
1. 數值計算
2. 總和最大與最小
3. 中位數與平均

###  NP 陣列的基本屬性
1. ndarray.ndim - 維度的數量。
2. ndarray.shape - 顯示出陣列在每個維度上的整數值。
3. ndarray.size - 陣列內元素的總數。
4. ndarray.dtype - 來描述陣列中元素類型的對象。

### 為何需要ndArray

In [None]:
#建立50位學生的中文和英文的分數
import random
chinese = [random.randint(60,100) for _ in range(50)]
english = [random.randint(60,100) for _ in range(50)]
print('chinese', chinese)
print('english', english)

In [None]:
#中文和英文的總合
result = []
for i in range(50):
    total = chinese[i] + english[i]
    result.append(total)
result

#使用comprehension來建立中文和英文的總合
result = [chinese[i]+english[i] for i in range(50)]
result

### 使用array function 建立ndarray

In [None]:
# 建立ndArray
# num2.py
# 請不要使用 from numpy import *,容易和其它module衝突,例如(max,min)
# 語法np.array(任何的串列資料)

import numpy as np
l = [[1, 2, 3],
    [2, 3, 4]]
a = np.array(l)
a
#Out[]:array([[1, 2, 3],[2, 3, 4]])


a.ndim #維度
#Out[]: 2

a.shape #形狀
#Out[6]: (2, 3)

a.size #總元素數量
#Out[7]: 6

a.dtype #ndarray的資料型別
#Out[8]: dtype('int64')



In [None]:
#產生亂數陣列

import numpy as np
data = np.random.randn(2, 3)
data
'''
Out[10]: 
array([[ 0.70551524,  0.21944356, -0.82746749],
       [ 0.21731092, -0.56973001,  0.89778134]])
'''

#數學運算
data * 10

'''
Out[11]: 
array([[ 7.05515239,  2.19443556, -8.2746749 ],
       [ 2.17310921, -5.69730008,  8.97781339]])
'''

data += data
data

'''
Out[13]: 
array([[ 1.41103048,  0.43888711, -1.65493498],
       [ 0.43462184, -1.13946002,  1.79556268]])
'''

In [None]:
#每個陣列都有shape,使用tuple來表示每個維度的大小
data.shape

#Out[14]: (2, 3)

In [None]:
#使用dtype屬性來顯示目前陣列內的資料型態(相同型態)
data.dtype

#Out[15]: dtype('float64')

In [None]:
#建立1維ndarray
data1 = [6, 7.5, 8, 0, 1]
arr1 = np.array(data1)
arr1

#Out[16]: array([6. , 7.5, 8. , 0. , 1. ])

In [None]:
#建立2維ndarray
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
arr2

'''
Out[17]: 
array([[1, 2, 3, 4],
       [5, 6, 7, 8]])
'''

In [None]:
#ndim屬性查詢維度
arr2.ndim

#Out[18]: 2

In [None]:
#shape查詢每個維度大小
arr2.shape

#Out[19]: (2, 4)

In [None]:
arr1.dtype

#Out[20]: dtype('float64')

In [None]:
arr2.dtype

#Out[21]: dtype('int64')

In [None]:
#使用ones(),zeros(),empty(),arange()function建立ndarray
np.zeros(10)
#Out[22]: array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

np.zeros((3, 6))
'''
Out[23]: 
array([[0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.]])
'''

np.empty((2, 3, 2))#value都是garbage

'''
Out[24]: 
array([[[ 1.28822975e-231, -1.29074421e-231],
        [ 1.28822975e-231,  4.34305647e-311],
        [ 6.94889310e-310,  6.94889310e-310]],

       [[ 6.94886647e-310,  6.94886647e-310],
        [ 6.94889301e-310,  6.94889300e-310],
        [ 6.94889300e-310,  9.03891627e-309]]])
'''

In [None]:
#使用arange()function建立,類似於python range()
np.arange(15)

### ndarray的資料型別
|型別|型別碼|
|:-- |:-- |
|int8, uint8|i1, u1|
|int32, uint32|i3, u3|
|int64, uint64|i4, u4|
|float16|f2|
|float32|f4 or f|
|float64|f8 or d|
|float128|f16 or g|
|complex64|c8|
|complex128|c16|
|complex256|c32|
|bool|?|
|object|O|
|string_|S|
|unicode)|U|

In [None]:
#建立自訂資料類型的ndarrays
arr1 = np.array([1, 2, 3], dtype=np.float64)
arr2 = np.array([1, 2, 3],dtype=np.int32)
arr1.dtype
#Out[26]: dtype('float64')

arr2.dtype
#Out[27]: dtype('int32')

In [None]:
#使用astype() 轉變資料類型
#使用astype(),將會建立一個新的array()

arr = np.array([1, 2, 3, 4, 5])
arr.dtype
#Out[29]: dtype('int64')

float_arr = arr.astype(np.float64)
float_arr.dtype
#Out[31]: dtype('float64')

In [None]:
#如果將浮點數轉換為整數,則小數將被刪除
arr = np.array([3.7, -1.2, -2.6, 0.5, 12.9, 10.1])
arr
#Out[33]: array([ 3.7, -1.2, -2.6,  0.5, 12.9, 10.1])

arr.astype(np.int32)
#Out[34]: array([ 3, -1, -2,  0, 12, 10], dtype=int32)

In [None]:
#string轉為number
numeric_strings = np.array(['1.25', '-9.6', '42'],dtype=np.string_)
numeric_strings.astype(float)

#Out[35]: array([ 1.25, -9.6 , 42.  ])

### 使用數學運算子的數學運算
1 陣列重要的原因在於,數學運算不需使用for loop迴圈

In [None]:
#相同size的運算
arr = np.array([[1., 2., 3.],[4., 5., 6.]])
arr

'''
Out[36]: 
array([[1., 2., 3.],
       [4., 5., 6.]])
'''


arr * arr

'''
Out[37]: 
array([[ 1.,  4.,  9.],
       [16., 25., 36.]])
'''


arr - arr

'''
Out[38]: 
array([[0., 0., 0.],
       [0., 0., 0.]])
'''

In [None]:
#和純值的運算
arr = np.array([[1., 2., 3.],[4., 5., 6.]])
1/arr

'''
Out[40]: 
array([[1.        , 0.5       , 0.33333333],
       [0.25      , 0.2       , 0.16666667]])
'''


arr ** 0.5

'''
Out[41]: 
array([[1.        , 1.41421356, 1.73205081],
       [2.        , 2.23606798, 2.44948974]])
'''

In [None]:
#使用比較運算子,比較2個array
#使用相同shape做比對

import numpy as np
arr2 = np.array([[0., 4., 1.],[7., 2., 12.]])
arr2

'''
Out[43]: 
array([[ 0.,  4.,  1.],
       [ 7.,  2., 12.]])
'''


arr2 > arr
'''
Out[44]: 
array([[False,  True, False],
       [ True, False,  True]])
'''

#不同數量的運算,採用的是廣播(broadcasting),超出本章範圍

###  使用ndarray方法做數值計算
1. 數值計算函數內放入參與計算的兩個陣列。
2. 進行計算的陣列第一維數量必須是相同。
3. add( ) 方法代表「加」，也可以使用「+」。
4. subtract( ) 方法代表「減」，也可以使用「-」。
5. multiply( )方法代表「乘」，也可以使用「*」。
6. divide( ) 方法代表「除」，也可以使用「/」。

In [None]:
# 操作範例:數值計算
# 不同size的運算稱為broadcasting
# add(), subtract(),multiply

import numpy as np
a = np.array([[1,2,3],[4,5,6],[7,8,9]]) 
b = np.array([10,10,10]) 
c=np.add(a,b)
c

'''
Out[46]: 
array([[11, 12, 13],
       [14, 15, 16],
       [17, 18, 19]])
'''

d= np.subtract(a,b)
d

'''
Out[48]: 
array([[-9, -8, -7],
       [-6, -5, -4],
       [-3, -2, -1]])
'''

f=np.multiply(a,b) 
f 

'''
Out[50]: 
array([[10, 20, 30],
       [40, 50, 60],
       [70, 80, 90]])
'''

g=np.divide(a,b)
g

'''
Out[52]: 
array([[0.1, 0.2, 0.3],
       [0.4, 0.5, 0.6],
       [0.7, 0.8, 0.9]])
'''

In [None]:
# 操作範例:數值計算
# 使用運算子+, - , *, /

import numpy as np
a = np.array([[1,2,3],[4,5,6],[7,8,9]]) 
b = np.array([10,10,10])

a+b

'''
Out[54]: 
array([[11, 12, 13],
       [14, 15, 16],
       [17, 18, 19]])
'''

a-b

'''
Out[55]: 
array([[-9, -8, -7],
       [-6, -5, -4],
       [-3, -2, -1]])
'''

a*b 

'''
Out[56]: 
array([[10, 20, 30],
       [40, 50, 60],
       [70, 80, 90]])
'''

a/b 

'''
Out[57]: 
array([[0.1, 0.2, 0.3],
       [0.4, 0.5, 0.6],
       [0.7, 0.8, 0.9]])
'''


###  數值計算
1. np.power(a,n) 代表 a 陣列的 n 次方。
2. a 陣列的 n 次方也可以使用 a ** n 方式表示。
3. N 可以是陣列，但兩陣列第一維數量必須是相同。
4. np. Reciprocal( ) 代表倒數的計算，倒數是指a*b=1，輸入 a 後求 b。

In [None]:
# 操作範例:數值計算
# power(),**

import numpy as np 
a = np.array([4,5,6]) 
a
#Out[59]: array([4, 5, 6])


np.power(a,2) 
#Out[60]: array([16, 25, 36])

c = np.array([1,2,3]) 
np.power(a,c) 
#Out[62]: array([  4,  25, 216])

a**c
#Out[63]: array([  4,  25, 216])


In [None]:
# 操作範例:數值計算
# 運算子 / , reciprocal()

import numpy as np
a = np.array([0.25, 1.33, 1, -0.1, 100]) 
1/a
#Out[65]: array([  4.       ,   0.7518797,   1.       , -10.       ,   0.01     ])

b=np.reciprocal(a)
b
#Out[66]: array([  4.       ,   0.7518797,   1.       , -10.       ,   0.01     ])

In [None]:
# 操作範例:餘數處理
# mod(),remainder()

import numpy as np
a = np.array([10,20,30]) 
b = np.array([3,5,7]) 
a
#Out[68]: array([10, 20, 30])

c=np.mod(a,b)
c
#Out[69]: array([1, 0, 2])


d=np.remainder(a,b) 
d
#Out[70]: array([1, 0, 2])

###  除法計算與小數處理
1. python 是使用round(),4捨5入
2. np.around() numpy的4捨5入
3. np.around(array,decimals) 方法代表您要將浮點數資料整數位取四捨五入到第幾個位置，小數位取最接近的偶數，這個方法內需要兩個參數:
    - array:進行分析的陣列。
    - decimals小數位數:
        - 預設為 0。
        - 如果為正數，代表小數位數有幾個位子。
        - 如果為負數，代表小數點左邊的正整數將依序四捨五入進位。

In [None]:
# 操作範例:除法計算與小數處理
# num12d.py

import numpy as np
a = np.array([1.0,5.45, 123, 0.567, 25.532])
a
#Out[72]: array([  1.   ,   5.45 , 123.   ,   0.567,  25.532])

np.around(a)
#Out[73]: array([  1.,   5., 123.,   1.,  26.])

np.around(a, decimals = 1)
#Out[74]: array([  1. ,   5.4, 123. ,   0.6,  25.5])

np.around(a, decimals = -1)
#Out[75]: array([  0.,  10., 120.,   0.,  30.])

np.around(a, decimals = -2)
#Out[76]: array([  0.,   0., 100.,   0.,   0.])

###  計算機浮點數問題
1. numpy [官網原文](https://docs.scipy.org/doc/numpy/reference/generated/numpy.around.html)
2. 關於計算機浮點數問題的文章
3. [“Lecture Notes on the Status of IEEE 754”, William Kahan](https://people.eecs.berkeley.edu/~wkahan/ieee754status/IEEE754.PDF)
4. 對於正好在舍入小數值之間的值，NumPy舍入到最接近的偶數值。 因此，1.5和 2.5捨入後為2.0，-0.5和0.5捨入後為到0.0等。由於IEEE浮點標準中的小數部分 的不精確表示以及當以10的冪進行縮放時產生的誤差。

In [None]:
# 操作範例:np.around 函數數值計算
# num_np_around.py

import numpy as np 
np.around([1.5, 2.5], decimals=0)
#Out[77]: array([2., 2.])

np.around([-0.5, 0.5], decimals=0) #0.5,-0.5會被捨去,0.6和-0.6不會進位
#Out[78]: array([-0.,  0.])

###  除法計算與小數處理
1. np.floor( ) 方法代表回傳「小於」輸入參數的最大整數。
2. np.ceil( ) 方法代表回傳「大於」輸入參數的最小整數。

In [None]:
# 操作範例:除法計算與小數處理
# num12e.py
import numpy as np
a = np.array([-1.7, 1.5, -0.2, 0.6, 10]) 
a
#out[]:array([-1.7 , 1.5, -0.2 , 0.6, 10. ])

np.floor(a)
#out[]:array([-2. , 1., -1.,  0., 10.])

np.ceil(a)
#out[]:array([-1., 2., -0. , 1. ,10.])

### 基本索引和分割


In [None]:
#1維陣列的index and slice
arr = np.arange(10)
arr
#Out[]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

arr[5]
#Out[]: 5

arr[5:8]
#Out[]: array([5, 6, 7])

arr[5:8] = 12
arr
#Out[]: array([ 0,  1,  2,  3,  4, 12, 12, 12,  8,  9])

In [None]:
#array slice are views
arr = np.arange(10)
arr_slice = arr[5:8]
arr_slice
#Out[83]: array([5, 6, 7])

arr_slice[1] = 12345
arr
#Out[84]:array([    0,     1,     2,     3,     4,     5, 12345,     7,     8,     9])

arr_slice[:] = 64
arr
#Out[86]: array([ 0,  1,  2,  3,  4, 64, 64, 64,  8,  9])
    
#明確指定copy一分
arr[5:8].copy()
#Out[87]: array([64, 64, 64])

![numpy索引](b1.png)
![2維陣列的切割](b2.png)

In [None]:
#2維陣列index 和 slice
arr2d = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
arr2d[2]
#Out[80]: array([7, 8, 9])

#想像第1維為列,第2維為欄
arr2d[0][2]
#Out[88]: 3

#使用「,」號
arr2d[0, 2]
#Out[90]: 3


In [None]:
#3維陣列
#2*2*3
arr3d = np.array([[[1, 2, 3],[4,5,6]],[[7, 8, 9],[10, 11, 12]]])
arr3d
'''
Out[4]: 
array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])
'''

arr3d[0]
'''
Out[5]: 
array([[1, 2, 3],
       [4, 5, 6]])
'''

old_values = arr3d[0].copy()
arr3d[0] = 42
arr3d[0]
'''
array([[42, 42, 42],
       [42, 42, 42]])
'''

arr3d[0] = old_values
arr3d

'''
Out[7]: 
array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])
'''

arr3d[1, 0]
#Out[8]: array([7, 8, 9])

In [None]:
# 陣列切割
arr = np.arange(10)
arr[1:6]
#Out[9]: array([1, 2, 3, 4, 5])

arr2d = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
arr2d[:2]
'''
Out[10]: 
array([[1, 2, 3],
       [4, 5, 6]])
'''

arr2d[:2, 1:]
'''
Out[11]: 
array([[2, 3],
       [5, 6]])
'''

arr2d[1, :2]
#Out[12]: array([4, 5])

arr2d[:2,2]
#Out[13]: array([3, 6])

arr2d[:,:1]
'''
Out[15]: 
array([[1],
       [4],
       [7]])
'''

arr2d[:2, 1:] = 0
arr2d
'''
Out[16]: 
array([[1, 0, 0],
       [4, 0, 0],
       [7, 8, 9]])
'''

###  陣列指定位置取值
1. 間隔選取[::C]
    - 以 1 維陣列來說明 x[a:b:c]  
    - a:選取資料的起始索引
    - b:選取資料的結束索引 +1
    - c:選取資料間隔，以索引值可以被此值整除的元素，不指定表示 1
2. 倒序 [::-1]
    - 只是單純的把順序反過來

###  陣列指定位置-給予一個整數
1. 關於指定位置 [row,column]
2. 假設給予一個整數為 N
    - 如果是給固定的 N，那就代表 row 或 column 等於 N。
    - 如果是 N:，那就代表 row 或 column 大於等於 N 的區域。
    - 如果是:N，那就代表 row 或 column 小於 N 的區域。
    - 如果是:，那就代表 row 或 column 是任意欄位。

  

In [None]:
# 陣列指定位置取值
# num1a.py

import numpy as np
a = np.array([[1, 2, 3], [3, 6, 9], [2, 4, 6]]) 
a

'''
Out[2]: 
array([[1, 2, 3],
       [3, 6, 9],
       [2, 4, 6]])
'''

a[0]
#Out[3]: array([1, 2, 3])

a[1, 2]
#Out[4]: 9

a[1, 1:3]
#Out[6]: array([6, 9])

a[:,1]
#Out[7]: array([2, 6, 4])

a[1, 2] = 7
a
'''
array([[1, 2, 3],
       [3, 6, 7],
       [2, 4, 6]])
'''

a[:, 0] = [0, 9, 8]
a

'''
Out[10]: 
array([[0, 2, 3],
       [9, 6, 7],
       [8, 4, 6]])
'''

In [None]:
# 陣列指定位置取值
# num1c.py

import numpy as np 
a = np.array([
[0,1, 2, 3,4,5],
[10,11,12,13,14,15],
[20,21,22,23,24,25],
[30,31,32,33,34,35],
[40,41,42,43,44,45],
[50,51,52,53,54,55], 
])

 
b = a[0,3:5]
b
#Out[12]: array([3, 4])

b.shape
#Out[14]: (2,)

b = a[4:,4:]
b
'''
Out[16]: 
array([[44, 45],
       [54, 55]])
'''
b.shape
#(2, 2`) 

b = a[:3,:3] 
b
'''
Out[18]: 
array([[ 0,  1,  2],
       [10, 11, 12],
       [20, 21, 22]])
'''

b.shape
#Out[19]: (3, 3)

b = a[:,2]
b

'''
Out[22]: array([ 2, 12, 22, 32, 42, 52])
'''

b.shape
#Out[23]: (6,)

a[(0,1,2,3,4),(1,2,3,4,5)]
#Out[11]: array([ 1, 12, 23, 34, 45])

In [None]:
# 陣列指定位置取值
# num1d.py
import numpy as np 
a = np.array([
[0,1, 2, 3,4,5],
[10,11,12,13,14,15],
[20,21,22,23,24,25],
[30,31,32,33,34,35],
[40,41,42,43,44,45],
[50,51,52,53,54,55], 
])


b = a[(0,1,2,3,4),(1,2,3,4,5)]
'''
Out[26]: array([ 1, 12, 23, 34, 45])
'''
b.shape
#Out[27]: (5,)

b = a[3:,[0, 2, 5]]
b
'''
Out[28]: 
array([[30, 32, 35],
       [40, 42, 45],
       [50, 52, 55]])
'''

b.shape
#Out[29]: (3, 3)


## 指定與重設
1. 一個整數指定
2. tuple 或 list 指定
3. 重設陣列


###  重設新陣列
1. resize 這個動作會依據原本的陣列再設定指定大小的新陣列。
2. resize 動作的參數如下:
    - numpy.resize(arr1，shape1)
    - arr1:原本的陣列
    - shape1:新規劃的大小  

3. 如果規劃的新陣列比較大，將會重新複製原有陣列的資料，填滿新的儲存格。
4. resize 這個動作建立新的陣列，而 reshape 則是依據原有的重新規劃，仍會受到原有陣列影響。

###  陣列初始化與重新規劃
- ndarray 的size和shape的思維
```
>>> a = np.arange(12)
>>> a
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])
>>> a.size
12
```
![array](c1.png)


```
>>> a.shape
(12,)
```
![array](c2.png)

```
>>> b = reshape((3, 4))
```
![array](c3.png)

```
>>> b[2,1]
9
```

```
>>> c = a.reshape((3, 4), order='F')

```
![array](c4.png)

```
>>> c[2,1]
5
```

```
>>> d = a.reshape((12, 1))
```
![array](c5.png)

```
>>> d[10, 0]
10
```

```
>>> e = a.reshape((1, 2, 1, 6, 1))
```
![array](c6.png)

```
>>> e[0, 1, 0, 0, 0]
6
```

#### 針對初始化這部分提供了多種方式:
- 不做初始化 - 例如:np.empty((2,4))
- 全部規劃為 0 - 例如:np.zeros((3,4))
- 全部規劃為 1 - 例如: np.ones((5,2))
- 全部規劃/填滿為某數，例如 6 - 例如: np.full((3,3),6)
- 建立對角矩陣，對角皆為 1，其他為 0 - 例如: np.eye(3)
- 建立對角矩陣，對角為 1,2,3,4，其他為 0 - 例如: np.diag([1,2,3,4])
- reshape((x,y)) 這個指令就可以將現有的陣列重新規劃為 x 乘以 y 的陣列。
- np.arange(起始值, 結束值, 固定間隔):也是產生一維陣列，和 np.array( ) 的差別在於 arange 擁有較大的彈性，而且元素數值是自 動化產生。
- np.linspace(起始值, 結束值, 起始與結束的區間內要產生幾個元素 ): 只要給定陣列的區間(起始值、結束值)，就可以要求在這個區間內產 生幾個元素。
- arange(a,b,c) - 不包含 b 由 a 開始 以固定間隔 c 來取值
- linspace(a,b,c,) - 包含 b 由 a 開始 切割成 c 個資料
- linspace(a,b,c,endpoint=False) - 不包含 b 由 a 開始 切割成 c 個資料

In [None]:
# 操作範例
# reshape()
import numpy as np
a = np.array([[1,2,3],[4,5,6]]) 
a
'''
Out[54]: 
array([[1, 2, 3],
       [4, 5, 6]])
'''


a.shape
#Out[55]: (2, 3)

b = a.reshape(3,2)
b
'''
Out[57]: 
array([[1, 2],
       [3, 4],
       [5, 6]])
'''

b.shape
#Out[59]: (3, 2)

a[0,1]=100
b
'''
Out[61]: 
array([[  1, 100],
       [  3,   4],
       [  5,   6]])
'''

b.shape
#Out[62]: (3, 2)


In [None]:
# 操作範例
# resize()
import numpy as np
a = np.array([[1,2,3],[4,5,6]]) 
a
'''
Out[64]: 
array([[1, 2, 3],
       [4, 5, 6]])
'''

a.shape
#Out[65]: (2, 3)

b = np.resize(a, (3,2)) 
b
'''
Out[67]: 
array([[1, 2],
       [3, 4],
       [5, 6]])
'''


b.shape
#Out[68]: (3, 2)


a[0,1]=100
b
'''
Out[70]: 
array([[1, 2],
       [3, 4],
       [5, 6]])
'''

b.shape
#Out[71]: (3, 2)

a.shape
#Out[72]: (2, 3)

In [None]:
# 操作範例 1:陣列初始化與重新規劃
# num2b.py
import numpy as np
x=np.empty((2,4))
x
'''
Out[33]: 
array([[0.60907583, 0.19131954, 0.25194186, 0.99647229],
       [0.39512944, 0.69576236, 1.17448774, 1.32231417]])
'''


x =np.zeros((3,4))
x
'''
Out[35]: 
array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])
'''

c = np.ones((5,2))
c
'''
Out[36]: 
array([[1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.],
       [1., 1.]])
'''

In [None]:
# 操作範例 2:陣列初始化與重新規劃
# num2c.py
import numpy as np
x=np.eye(3)
x
'''
Out[37]: 
array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])
'''

x =np.diag([1,2,3,4]) 
x
'''
Out[38]: 
array([[1, 0, 0, 0],
       [0, 2, 0, 0],
       [0, 0, 3, 0],
       [0, 0, 0, 4]])
'''


In [None]:
# 操作範例 3:陣列初始化與重新規劃
# num2c1.py
import numpy as np
x = np.linspace(1,10,6).reshape((3,2)) 
x
'''
Out[39]: 
array([[ 1. ,  2.8],
       [ 4.6,  6.4],
       [ 8.2, 10. ]])
'''

x = np.linspace(1,10,6).reshape((2,3)) 
x
'''
Out[40]: 
array([[ 1. ,  2.8,  4.6],
       [ 6.4,  8.2, 10. ]])
'''

x =np.arange(8).reshape((2,4)) 
x
'''
Out[41]: 
array([[0, 1, 2, 3],
       [4, 5, 6, 7]])
'''

x =np.arange(8).reshape((4,2)) 
x
'''
Out[42]: 
array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7]])
'''

####  請問以下的程式執行後,例印出來的最後一個值是多少?(選擇題)

```python
import numpy as np
r1 = np.arange(25, 30, .5) 
print("r1=>",r1)
```
(1) 30  
(2) 29.5  
(3) 25  
(4) 27  


####  請問以下的程式執行後,例印出來的最後一個值是多少?(選擇題)

```python
import numpy as np
lin = np.linspace(3, 5, 9) 
print("r1=>",lin)
```
(1) 9   
(2) 8.5   
(3) 8  
(4) 5   



In [None]:
# 操作範例:陣列初始化與重新規劃
# num2e.py
import numpy as np
a = np.array( [6, 7, 8, 9] ) 
a
#Out[44]: array([6, 7, 8, 9])

b = np.arange( 4 )
b
#Out[46]: array([0, 1, 2, 3])

c=a-b
c
#Out[49]: array([6, 6, 6, 6])

d = b**2
d
#out[50]: array([0, 1, 4, 9])

f = np.array([5, -1, 3, 9, 0]) 
f[f<=3] = 1
f
#Out[51]: array([5, 1, 1, 9, 1])

####  請問以下的程式執行後,例印的值是那一個?(選擇題)

```python
import numpy as np
a = np.array( [6, 7, 8, 9] ) 
a += 2
print(a)
```
(1) [2 8 9 10 11]  
(2) [8 9 10 11 2]  
(3) [8 9 10 11]  
(4) [6 7 8 9 6 7 8 9]  

### 列,欄對調

In [None]:
#使用.T
arr = np.arange(15).reshape((3, 5))
arr
'''
Out[52]: 
array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

'''

arr.T
'''
Out[53]: 
array([[ 0,  5, 10],
       [ 1,  6, 11],
       [ 2,  7, 12],
       [ 3,  8, 13],
       [ 4,  9, 14]])
'''

### Boolean的索引

In [None]:
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
data = np.random.randn(7, 4)
names
#Out[17]: array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'], dtype='<U4')

data
'''
Out[18]: 
array([[ 0.60907583,  0.19131954, -0.25194186,  0.99647229],
       [-1.56102192,  2.05164575, -0.09102026, -0.73511943],
       [-0.72814531,  0.84937071, -0.84445201, -0.07008299],
       [ 0.39512944,  0.69576236,  1.17448774, -1.32231417],
       [-0.20797083,  0.08058573,  0.43271911,  0.52449347],
       [ 0.95282382,  1.1963591 ,  0.2106623 ,  0.58270528],
       [-1.38948461, -0.30768398, -1.01534924,  0.2634323 ]])
'''

names == 'Bob'
#Out[19]: array([ True, False, False,  True, False, False, False])

names.shape
#Out[20]: (7,)

data[names == 'Bob']
'''
Out[22]: 
array([[ 0.60907583,  0.19131954, -0.25194186,  0.99647229],
       [ 0.39512944,  0.69576236,  1.17448774, -1.32231417]])
'''

data[names == 'Bob', 2:]

'''
Out[23]: 
array([[-0.25194186,  0.99647229],
       [ 1.17448774, -1.32231417]])
'''

data[names == 'Bob', 3]
#Out[24]: array([ 0.99647229, -1.32231417])

names != 'Bob'
#Out[25]: array([False,  True,  True, False,  True,  True,  True])

mask = (names == 'Bob') | (names == 'Will')
mask
#Out[26]: array([ True, False,  True,  True,  True, False, False])

data[mask]
'''
Out[27]: 
array([[ 0.60907583,  0.19131954, -0.25194186,  0.99647229],
       [-0.72814531,  0.84937071, -0.84445201, -0.07008299],
       [ 0.39512944,  0.69576236,  1.17448774, -1.32231417],
       [-0.20797083,  0.08058573,  0.43271911,  0.52449347]])
'''

data[data < 0] = 0
data
'''
Out[29]: 
array([[0.60907583, 0.19131954, 0.        , 0.99647229],
       [0.        , 2.05164575, 0.        , 0.        ],
       [0.        , 0.84937071, 0.        , 0.        ],
       [0.39512944, 0.69576236, 1.17448774, 0.        ],
       [0.        , 0.08058573, 0.43271911, 0.52449347],
       [0.95282382, 1.1963591 , 0.2106623 , 0.58270528],
       [0.        , 0.        , 0.        , 0.2634323 ]])
'''

data[names != 'Joe'] = 7
data
'''
Out[31]: 
array([[7.        , 7.        , 7.        , 7.        ],
       [0.        , 2.05164575, 0.        , 0.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [7.        , 7.        , 7.        , 7.        ],
       [0.95282382, 1.1963591 , 0.2106623 , 0.58270528],
       [0.        , 0.        , 0.        , 0.2634323 ]])
'''

### 全域函式(Universal Functions)

In [None]:
#universal functions
#np.sqrt()
#np.exp()

arr = np.arange(10)
arr
#Out[3]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

np.sqrt(arr)
'''
Out[4]: 
array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])
'''

np.exp(arr)
'''
Out[5]: 
array([1.00000000e+00, 2.71828183e+00, 7.38905610e+00, 2.00855369e+01,
       5.45981500e+01, 1.48413159e+02, 4.03428793e+02, 1.09663316e+03,
       2.98095799e+03, 8.10308393e+03])
'''

In [None]:
#np.maximum
x = np.random.randn(8)
y = np.random.randn(8)
x
'''
array([-1.19298219,  0.39772364,  0.525209  , -1.76023599,  0.62419633,
        1.2794656 ,  0.17282695,  1.28620254])
'''


y
'''
array([ 1.43538402, -1.3017819 ,  1.36576674, -0.03780711,  0.35628056,
        0.13356569, -0.39867509,  0.01283254])
'''

np.maximum(x, y)
'''
Out[9]: 
array([ 1.43538402,  0.39772364,  1.36576674, -0.03780711,  0.62419633,
        1.2794656 ,  0.17282695,  1.28620254])
'''

In [None]:
#np.modf()

arr = np.random.randn(7) * 5
arr
'''
Out[11]: 
array([ 2.12343926, -2.5907676 , -3.51003275,  4.02145355,  0.9551592 ,
       -1.6035888 , -5.58909959])
'''

remainder, whole_part = np.modf(arr)
remainder
'''
Out[13]: 
array([ 0.12343926, -0.5907676 , -0.51003275,  0.02145355,  0.9551592 ,
       -0.6035888 , -0.58909959])
'''

whole_part
#Out[14]: array([ 2., -2., -3.,  4.,  0., -1., -5.])

### 陣列的判斷式
- np.where()

In [None]:
#np.where() 相等於python-> x if condition else y

xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])

cond = np.array([True, False, True, True, False])

#python comprehension(串列綜合表達式)
result = [(x if c else y) for x, y, c in zip(xarr, yarr, cond)]
result
#Out[18]: [1.1, 2.2, 1.3, 1.4, 2.5]

result = np.where(cond, xarr, yarr)
result
#Out[19]: array([1.1, 2.2, 1.3, 1.4, 2.5])


In [None]:
#np.where()
arr = np.random.randn(4, 4)
arr
'''
Out[20]: 
array([[-0.25697086,  0.29835001, -0.30934064, -0.41240099],
       [ 2.7173719 ,  1.1565484 , -1.20826629, -0.78476934],
       [-0.0700153 , -2.02805783, -1.15712567, -0.02594797],
       [ 0.08442415, -0.95785465,  0.4437    , -1.03179068]])
'''

arr>0
'''
Out[21]: 
array([[False,  True, False, False],
       [ True,  True, False, False],
       [False, False, False, False],
       [ True, False,  True, False]])
'''

np.where(arr>0, 2, -2)
'''
Out[22]: 
array([[-2,  2, -2, -2],
       [ 2,  2, -2, -2],
       [-2, -2, -2, -2],
       [ 2, -2,  2, -2]])
'''

np.where(arr>0, 2, arr)
'''
Out[23]: 
array([[-0.25697086,  2.        , -0.30934064, -0.41240099],
       [ 2.        ,  2.        , -1.20826629, -0.78476934],
       [-0.0700153 , -2.02805783, -1.15712567, -0.02594797],
       [ 2.        , -0.95785465,  2.        , -1.03179068]])
'''

## 統計方法
1. 總和,最大與最小
2. 中位數與平均

###  總和,最大與最小
1. np.sum( ) 代表某一個陣列內容的總和，也可以指定這個陣列的哪一軸 (axis) 內容總和。
2. np.min( ) 代表某一個陣列內容的最小值，也可以指定這個陣列的哪一軸 (axis) 內容的最小值。
3. np.max( ) 代表某一個陣列內容的最大值，也可以指定這個陣列的哪一軸 (axis) 內容的最大值。
4. amin 與 min 是相同功能的方法。
5. amax 與 max 是相同功能的方法。

In [None]:
# mean(),sum(),std()
arr = np.random.randn(5, 4)
arr
'''
Out[24]: 
array([[-0.87657246, -0.45393482,  0.34807592, -1.41805024],
       [-0.90979787, -0.67787023,  2.72365299, -0.9703908 ],
       [ 0.67378964,  1.04778486,  1.42791751,  0.56874105],
       [-0.61030909, -0.69810526, -0.91950047, -0.45827228],
       [-0.27713788,  0.18207067, -0.63626743, -0.89147511]])
'''

arr.mean()
#Out[25]: -0.14128256480061502

np.mean(arr)
#Out[26]: -0.14128256480061502

arr.sum()
#Out[27]: -2.8256512960123
    
#axis
arr.mean(axis=1)
#Out[28]: array([-0.6001204 ,  0.04139852,  0.92955827, -0.67154677, -0.40570244])

arr.sum(axis=0)
#Out[29]: array([-2.00002766, -0.60005478,  2.94387852, -3.16944738])

In [None]:
#cumsum()累計
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7])
arr.cumsum()
#Out[30]: array([ 0,  1,  3,  6, 10, 15, 21, 28])

arr = np.array([[0, 1, 2],[3, 4, 5],[6, 7, 8]])
arr
'''
Out[31]: 
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
'''

#傳回同樣shape
arr.cumsum(axis=0)
'''
Out[32]: 
array([[ 0,  1,  2],
       [ 3,  5,  7],
       [ 9, 12, 15]])
'''

#累乘
arr.cumprod(axis=1)
'''
Out[33]: 
array([[  0,   0,   0],
       [  3,  12,  60],
       [  6,  42, 336]])
'''

In [None]:
# 操作範例:總和最大與最小
#np.sum()

import numpy as np
a = np.array([[0, 30,45],[60,75,90]]) 
a
'''
Out[35]: 
array([[ 0, 30, 45],
       [60, 75, 90]])
'''
#傳回值
np.sum(a)
#Out[36]: 300 

#傳回一個軸
np.sum(a,axis=0)
#Out[37]: array([ 60, 105, 135])

np.sum(a,axis=1)
#Out[38]: array([ 75, 225])

In [None]:
# 操作範例:總和最大與最小
# np.max()

import numpy as np
a = np.array([[0, 30,45],[60,75,90]]) 
a
'''
Out[39]: 
array([[ 0, 30, 45],
       [60, 75, 90]])
'''
#傳回值
np.max(a)
#Out[40]: 90

 
#傳回一個軸
np.max(a,axis=0)
#Out[41]: array([60, 75, 90]) 

np.max(a,axis=1)
#Out[43]: array([45, 90])

###  中位數與平均
1. median( ) 方法可取出陣列或陣列中指定的軸之中位數。
2. 把所有值高低排序後找出正中間的一個作爲中位數。如果資料數量為偶數，則中位數取最中間的兩個數值的平均數。
3. 參數:
    - array:陣列
    - axis:軸
    
4. mean( ) 方法可取出陣列或陣列中指定的軸之平均數。 
5. 平均值就是把陣列或指定軸的所有資料除以數量後的數值。
6. 參數:
    - array:陣列
    - axis:軸

7. average( ) 方法與 mean( ) 方法相似，但可以加入權重進行計算。
8. 計算公式為 ((資料*權重)相加)/(權重相加)
9. 參數:
    - array:陣列
    - axis:軸
    - weights:權重，若沒有則設定為 1
    - returned:若設定為 true，代表返回計算結果與權重相加總合，若沒有設定或設定 false 則只有計算結果
10. 沒有指定權重時與一般平均值相同。
11. 加權平均值是由每個資料乘以權重以反映加上重要性因素後產生的平均值。
12. average( ) 使用時若沒有指定軸，則陣列將被平坦化。 
13. 假設有個陣列資料為 [1,2,3,4]，相應的權重 [40,30,20,10]，加權 平均數是這樣:
    -  (1*40+2*30+3*20+4*10)/(40+30+20+10)

In [None]:
# 操作範例:中位數與平均
#axis = 0 計算列
#axis = 1 計算欄

import numpy as np
a = np.array([[0, 30,45],[60,75,90]]) 
a
'''
Out[44]: 
array([[ 0, 30, 45],
       [60, 75, 90]])
'''

np.median(a)
#Out[45]: 52.5


np.median(a, axis = 0)
#Out[46]: array([30. , 52.5, 67.5])


np.median(a, axis = 1)
#Out[47]: array([30., 75.])

In [None]:
# 操作範例:中位數與平均
# num14a.py

import numpy as np
a = np.array([[0, 30,45],[60,75,90]]) 
a
'''
Out[48]: 
array([[ 0, 30, 45],
       [60, 75, 90]])
'''

np.mean(a)
#Out[49]: 50.0

np.mean(a, axis = 0)
#Out[50]: array([30. , 52.5, 67.5])

np.mean(a, axis = 1)
#Out[51]: array([25., 75.])

In [None]:
# 操作範例:中位數與平均
#np.average()

import numpy as np
a = np.array([1,2,3,4])
np.average(a)
#Out[52]: 2.5

wts = np.array([4,3,2,1])
np.average(a,weights = wts)
#Out[53]: 2.0

np.average([1,2,3,4],weights = [4,3,2,1], returned = True)
#Out[54]: (2.0, 10.0)

### 模擬每天的運動量
- 每天最小的運動量是0,每天最大的運量是1,增量值是0.1
- 計算1000天的運動量

In [2]:
#python
%matplotlib notebook
import matplotlib.pyplot as plt
import random

days = 1000
amount = 0
exerciseAmount = list()
for i in range(days):
    day_amount = random.randrange(0, 10, 1) / 10.0
    amount += day_amount    
    exerciseAmount.append(float("{0:.1f}".format(amount)))
exerciseAmount
'''
Out[17]: 
[0.9,
 1.6,
 2.4,
 2.4,
 2.8,
 3.6,

 .
 .
 .

 441.3,
 442.0,
 442.9,
 442.9,
 442.9,
 443.6]
'''

plt.plot(exerciseAmount[:100])

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7f90f8370a50>]

In [71]:
#numpy
%matplotlib notebook
import numpy as np
import matplotlib.pyplot as plt
exerciseAmount = np.random.rand(1000)
cumsum=exerciseAmount.cumsum()
plt.plot(cumsum[:100])

<IPython.core.display.Javascript object>

[<matplotlib.lines.Line2D at 0x7f8058812810>]

#### Homework 人數統計

1 從106年1月到107年5月每個月人口總數如下：  
[8397,8393,8389,8376,8378,8395,8411,8409.8406,8413,8408,8408,8414,8421,8411,8392,8404]  

2 接著請您:
    - 利用迴圈跑出 17 個月各月的總人數。
    - 計算 17 個月的人口平均值、中位數、最大值與最小值。
    
 [解題](https://github.com/roberthsu2003/PythonForDataAnalysis/blob/master/Numpy%E5%BB%BA%E7%AB%8B%E8%88%87%E8%A8%88%E7%AE%97/homework1.ipynb)