<font size=14>[Numpy](https://numpy.org/):**Python科学计算的基本包**</font>The fundamental package for scientific computing with Python

<div align='center'><img src="pics/库层.png" width=80%></div>

# 导入numpy 

<img src="pics/Numpy/Numpy-logo.png" align="right" width=40%>**Numpy**是**Python**和PyData生态系统的核心，很多其他科学计算的第三方库都是以**Numpy**为基础建立的.
Numpy api广泛地用于Pandas、SciPy、Matplotlib、sciket learn、scikit image和大多数其他数据科学和科学Python包中。

NumPy库包含多维数组和矩阵数据结构。它为ndarray（一个均匀的n维数组对象）提供了有效操作的方法。

NumPy可以用于对数组执行各种各样的数学运算。它为Python添加了强大的数据结构，保证了数组和矩阵的高效计算，并提供了一个庞大的高级数学函数库，这些函数可以对这些数组和矩阵进行操作。

在使用**Numpy**之前，需要导入`numpy`包：

In [None]:
import numpy as np

使用前一定要先导入 Numpy 包，导入的方法有以下几种：
```python    
    import numpy
    import numpy as np
    from numpy import *
    from numpy import array, sin
```
**简称**为了方便，统一(约定俗成)的简称便于共享、识读

In [None]:
np.arange(1,100,1)

In [None]:
np.linspace(1, 100, 5000)

# numpy.ndarray对象

假如我们想将列表中的每个元素增加`1`，但**列表**不支持这样的操作（报错）

此外，列表看起来可以构建多维数组，但是访问起来很麻烦……

In [None]:
a = [ 1, 3, 5, 7, 9, 11]
a+1

In [None]:
[ x+1 for x in a ]

In [None]:
a

In [None]:
[*map(lambda x:x+5, a)]

## 声明 `array` 

In [None]:
a = np.array([1, 3, 5, 7, 9, 11])
a

![image.png](attachment:ea3c68d8-b2a4-45c2-8946-6bdcaf3ab652.png)
*`np.zeros()`  `np.ones()`  `np.empty()` `np.eyes()`可以生成特殊的矩阵*

In [None]:
a?

In [None]:
type(a)

- “ndarray”，是“N维数组”(N-Dimensional Array)的缩写。
- numpy.ndarray类用于表示矩阵和向量。
- 向量是一维数组（行向量和列向量没有区别），而矩阵是二维数组。
- 对于三维或更高维数组，张量一词也常用。
- 在Numpy中，维度dimension被称为axes轴

`array` 数组支持每个元素加 `1` 这样的操作：

In [None]:
a + 1

与另一个 `array` 相加，得到对应元素相加的结果：

In [None]:
b = np.array([ 0, 2, 4, 6, 8, 10])
a + b

In [None]:
a * b

In [None]:
a ** b

## 索引切片
和list同样的索引、切片方式

位置索引

In [None]:
a[0]

位置切片

In [None]:
a[:2]

负索引

In [None]:
a[-2:]

将它们相加：

In [None]:
a[:2] + a[-2:]

## 修改数组形状

In [None]:
a.reshape(3,2)

In [None]:
a.shape = 2,3
a

In [None]:
a.max()

In [None]:
a.min()

In [None]:
a.sum()

# 多维数组

In [None]:
data = np.array([[1, 2], [3, 4], [5, 6]])
data

![image.png](attachment:3352db84-347f-41b1-93eb-be360e77f3c4.png)

## 属性

In [None]:
data.ndim  #维度数

In [None]:
data.shape #形状

In [None]:
data.size #（总）尺寸

In [None]:
len(data) #长度/行数

## 索引切片

In [None]:
data[0, 1]

In [None]:
data[1:3]

In [None]:
data[0:2, 0]

![image.png](attachment:ed1879df-463e-4a4e-853b-dccb6ed2ed63.png)

## 数组统计

In [None]:
data.max()

In [None]:
data.min()

In [None]:
data.sum()

![image.png](attachment:d720613a-beec-44f1-8fcd-813ae3ff9c12.png)

In [None]:
data.max(axis=0)

In [None]:
data.max(axis=1)

![image.png](attachment:c290da9b-0ce9-4b18-8855-26dc5d5f84ea.png)

## 数组运算

In [None]:
data = np.array([[1, 2], [3, 4]])
ones = np.array([[1, 1], [1, 1]])
data + ones

![image.png](attachment:f69d87f0-0fbe-4d12-b94a-61dee1cc9e31.png)

In [None]:
>>> data = np.array([[1, 2], [3, 4], [5, 6]])
>>> ones_row = np.array([[1, 1]])
>>> data + ones_row

![image.png](attachment:4ee0c6c7-288e-4ee8-b941-12583c8985fa.png)

## 数组形状

In [None]:
data.T

![image.png](attachment:bb28ab39-70ff-4020-9357-b68457ec5ee6.png)

In [None]:
data.reshape(2, 3)

In [None]:
data.reshape(3, 2)

![image.png](attachment:7f369342-06e3-4c78-8e34-bb507ce3c381.png)

In [None]:
data.flatten()

# 数组操作

## 数组操作：拼接

In [None]:
a = np.array([1, 2, 3, 4])
b = np.array([5, 6, 7, 8])
np.concatenate((a, b))

In [None]:
x = np.array([[1, 2], [3, 4]])
y = np.array([[5, 6]])
np.concatenate((x, y), axis=0)

## 数组操作：排序

In [None]:
arr = np.array([2, 1, 5, 3, 7, 4, 6, 8])
arr = np.sort(arr)
arr

## 数组操作：输入输出I/O

In [None]:
a = np.array([1, 2, 3, 4, 5, 6])
np.save('filename', a)
b = np.flip(np.load('filename.npy'))  #保存为notebook变量文件
b

In [None]:
np.savetxt('new_file.csv', b)

In [None]:
np.loadtxt('new_file.csv')

Numpy 中导入数据方式有多种，其中函数之一为 genfromtxt ，genformtxt 相对其他函数有自己的优势和劣势，

- 劣势：相对其它函数数据加载慢，从数据读入到返回需要两个迭代循环，第一个迭代将文件中每一行转化为一个字符串序列，第二个循环迭代对每个字符串序列指定合适的数据类型；源于这两个迭代原因，相对其它函数会慢一点.

- 优势：更灵活，数据加载时会能够处理丢失数据，**例如对某些 missing_values 做一些数据填充，或将某一列数据从一中形式转化为另一种形式.**

In [None]:
g=np.genfromtxt("data/data.TXT")

In [None]:
g.shape

In [None]:
# x = pd.read_csv('music.csv', header=0).values  见下一章节

## *掩码数组Masked Array*


- 数据完整性：缺测？无记录
- 数据可用性：质控？无效值 999999 99999 9999 -1  65535

        掩码数组Masked Array 是标准numpy.ndarray和 masked的组合。
        满足某个条件的位置为True，其他的为False
时间序列中的“断线”：

In [None]:
import numpy as np
import os
filepath = 'data/pandas'
filename = os.path.join(filepath, "who_covid_19_sit_rep_time_series.csv")
filename

In [None]:
dates = np.genfromtxt(filename, dtype=np.unicode_, delimiter=",",
                      max_rows=1, usecols=range(4, 17),
                      encoding="utf-8-sig")

In [None]:
dates

In [None]:
locations = np.genfromtxt(filename, dtype=np.unicode_, delimiter=",",
                          skip_header=6, usecols=(0, 1),
                          encoding="utf-8-sig")

In [None]:
locations

In [None]:
nbcases = np.genfromtxt(filename, dtype=np.int_, delimiter=",",
                        skip_header=6, usecols=range(4, 17),filling_values=0, #默认的“填空”为-1，初步使用按照+/-区分没问题，但是后期如果要统计计数就会出现问题……
                        encoding="utf-8-sig")

In [None]:
nbcases

In [None]:
import matplotlib.pyplot as plt
selected_dates = [0, 3, 11, 12]
plt.plot(dates, nbcases.T, '--');
plt.xticks(selected_dates, dates[selected_dates]);
plt.title("COVID-19 cumulative cases from Jan 21 to Feb 3 2020");

In [None]:
china_total = nbcases[locations[:, 1] == 'China'].sum(axis=0)
china_total

In [None]:
from numpy import ma
nbcases_ma = ma.masked_values(nbcases, 0)
nbcases_ma

In [None]:
plt.plot(dates, nbcases_ma[1:].T, '--')
plt.xticks(selected_dates, dates[selected_dates])
plt.title("COVID-19 cumulative cases from Jan 21 to Feb 3 2020")

## *图片也是数组……*

- 狭义的图片：RGB(A)
- 广义（我遇到的）：srtm_58_06_Clip1_1.tif 地形高程值（转化后）

```python
>>> conda install opencv
```

In [None]:
import cv2
img = cv2.imread("shp/natural-earth-1_large8192px.png", cv2.IMREAD_UNCHANGED)
type(img)

4096 × 8192像素  ×3通道

In [None]:
img.shape

R通道

In [None]:
img[:,:,0]

In [None]:
import matplotlib.pyplot as plt
plt.imshow(img)

转为0-1，灰度图

色彩0-255    0-1   #00-#FF

In [None]:
img_array = img / 255
img_array.max()

In [None]:
img_gray = img_array @ [0.2126, 0.7152, 0.0722]   #矩阵乘法运算符
plt.imshow(img_gray, cmap="gray")
img_gray.max()

In [None]:
import cv2 as cv
img = cv.imread("shp/srtm_58_06_Clip1_1.tif",2) 
plt.imshow(img,cmap='terrain')

'''
IMREAD_UNCHANGED = -1#不进行转化，比如保存为了16位的图片，读取出来仍然为16位。
IMREAD_GRAYSCALE = 0#进行转化为灰度图，比如保存为了16位的图片，读取出来为8位，类型为CV_8UC1。
IMREAD_COLOR = 1#进行转化为RGB三通道图像，图像深度转为8位
IMREAD_ANYDEPTH = 2#保持图像深度不变，进行转化为灰度图。
IMREAD_ANYCOLOR = 4#若图像通道数小于等于3，则保持原通道数不变；若通道数大于3则只取取前三个通道。图像深度转为8位
'''