In [None]:
import numpy as np

In [None]:
import matplotlib.pyplot as plt


def show_hist(x):
    # 1.画布
    plt.figure(figsize=(20, 8), dpi=100)

    # 2.绘制
    plt.hist(x, bins=1000)

    # 3.显示
    plt.show()

# 创建数组

In [None]:
arr = np.array([[1, 2, 3, 4], [5, 6, 7, 8]])

In [None]:
arr

# ndarray属性

In [None]:
arr.shape          # 数组维度组成的元组

In [None]:
arr.ndim           # 数组维数

In [None]:
arr.size           # 元素数量

In [None]:
arr.itemsize       # 元素所占的字节数

In [None]:
arr.dtype          # 元素类型

In [None]:
type(arr)          # 数组类型

# 生成均匀分布数组

In [None]:
# x = np.random.uniform(0, 1, 10000000)
x = np.random.uniform(low=0, high=1, size=(10000000,))
show_hist(x)

# 生成正态分布数组

In [None]:
# x = np.random.uniform(0, 1, 10000000)
x = np.random.normal(loc=0.0, scale=1.0, size=(10000000,))  # 标准正态分布:均值为 0，方差为 1
show_hist(x)

# 对比计算效率

In [None]:
# python列表采用分离式存储，可以存储不同类型的元素
a = [i for i in range(1000000)]
%time sum1 = sum(a)

# numpy数组采用连续内存块存储，只能存储相同类型的元素
b = np.array(a)
%time sum2 = np.sum(b)

# 数组索引、切片

In [None]:
arr

In [None]:
arr[0, 0]     # 索引

In [None]:
arr[0:2, 0:2] # 切片

# 改变形状

In [None]:
arr.reshape(4, 2)  # 不会改变 arr 的形状

In [None]:
arr.resize()      # 改变 arr 的形状
arr

In [None]:
arr.T            # 转置

# 转换函数

In [None]:
arr.astype(np.float_)  # 转换元素类型，不会修改原数组

In [None]:
arr.tobytes()         # 转换为字符串，不会修改原数组

# 数组去重

In [None]:
a = np.array([[1, 2, 3, 4],
              [1, 2, 5, 6]])
np.unique(a)                       # 不会修改原数组

# ndarrary运算

In [None]:
ar = np.random.uniform(0, 10, (3, 3))
ar

## 逻辑运算

In [None]:
ar > 1,         # 数组元素比较

In [None]:
ar[ar > 1]      # 筛选满足条件的元素，组成一个新的数组

In [None]:
ar[ar > 1] = 9  # 满足要求的元素，直接赋值
ar

In [None]:
(ar > 1) & (ar < 9)  # 逻辑与，注意: python中使用的是and

In [None]:
(ar > 1) | (ar < 9)  # 逻辑或，注意: python中使用的是or

In [None]:
~(ar > 1)            # 逻辑非，注意: python中使用的是not

In [None]:
(ar > 1) ^ (ar > 9)  # 逻辑异或

## 通用判断

In [None]:
(
    np.all(ar > 1),  # 数组所有元素满足条件
    np.any(ar > 1),  # 数组任一元素满足条件
)

## 三元运算符

In [None]:
(
    np.where(ar > 1, 1, 0),
    np.where(np.logical_and(ar > 0.5, ar < 1), 0.5, ar),
    np.where(np.logical_or(ar < 0.5, ar > 1), 0, 1),
)

## 统计运算

In [None]:
(
    ar.max(),       # 最大值
    ar.min(),       # 最小值
    ar.mean(),      # 平均值
    np.median(ar),  # 中位数
    ar.std(),       # 标准差
    ar.var(),       # 方差 = 标准差 ^ 2
    ar.argmax(),    # 最大值所在下标
    ar.argmin(),    # 最小值所在下标
)

# 数组间的运算

In [None]:
ar = np.arange(9).reshape(3, 3)
ar

## 数组与数的运算

In [None]:
(
    ar + 1,
    ar / 3,
)

## 数组与数组运算

**广播机制** - 只有满足以下条件之一，两个数组才能进行数组与数组的运算
- sharp(相对的维度相同)
- sharp(相对的维度中，一个维度为1)

**example:**
```
A       (3d array): 256 × 256 × 3
B       (1d array):               3
Result  (3d array): 256 × 256 × 3

A       (4d array): 9 × 1 × 7 × 1
B       (3d array):      8 × 1 × 5
Result  (4d array): 9 × 8 × 7 × 5

A       (3d array): 15 × 3 × 1
B       (3d array): 15 × 1 × 5
Result  (3d array): 15 × 3 × 5

A       (1d array): 10
B       (1d array): 12
Result                                         Error(对应维度不相等，且没有为1的)

A       (2d array):      2 × 1
B       (3d array): 8 × 4 × 3
Result                                         Error(对应维度不相等，且没有为1的)
```

In [None]:
ar1 = np.arange(3).reshape(1, 3)
ar2 = np.arange(6).reshape(2, 3)
ar3 = np.arange(9).reshape(1, 3, 3)

In [None]:
# ar2 + ar3  # 不能运算
ar1 + ar3  # ok

# 矩阵运算

## 矩阵乘法

 - np.dot - 点乘
 - np.matmul - 矩阵相乘

两者在进行矩阵相乘时，没有区别。
但是, **dot支持矩阵和数字相乘, matmul不支持**

### 验证 dot 和 matmul 相同点

In [None]:
# 学生成绩
scores = np.array([
 #  期中 期末
    [80, 86],
    [82, 80],
    [85, 78],
    [90, 90],
    [86, 82],
    [82, 90],
    [78, 80],
    [92, 94]
])

# 学生成绩占比:    期中30% 期末70%
ratio = np.array([[0.3], [0.7]])

In [None]:
# 计算总成绩
(
    np.matmul(scores, ratio),
    np.dot(scores, ratio)
)

### 验证 dot 和 matmul 区别

In [None]:
a = np.arange(9).reshape(3, 3)
(
    a,
    np.dot(a, 10),
#     np.matmul(a, 10)  # 不支持矩阵和数字的相乘
)

## 方阵运算

### 求行列式

In [None]:
a = np.arange(1, 5).reshape(2, 2)
(
    a,
    np.linalg.det(a)
)

### 求逆矩阵

In [None]:
a = np.arange(1, 5).reshape(2, 2)
(
    a,
    np.linalg.inv(a)
)