# numpy矩阵及其运算
## 一.矩阵的创建
## 二.矩阵的运算
# numpy统计分析
## 三.NumPy读取和存储文件
## 四.NumPy常用统计函数
## 知识目标：掌握矩阵的创建方法及运算
## 技能目标：掌握通用函数的使用
## 重点：矩阵的创建及通用函数的使用
## 难点：矩阵的运算

=========================================================

【上周回顾】
#NumPy的引用：import numpy as np
#ndarray的属性：ndim、shape、size、dtype、itemsize  
#ndarray数组的创建：np.array()、np.arange(n) 、np.ones(shape)、np.zeros(shape)、
                                 np.full(shape,val) 、np.linspace() 、np.logspace() ……
#ndarray数组的变换：.reshape(shape) 、.ravel () 、.hstack()、.vstack()
#ndarray数组的索引和切片：

一维 a[n]、     a[起止编号：终止编号（不含）：步长]    
                                          
                                          
多维 a[x,y,z]     a[x:x1:步长,  y:y1:步长,  z:z1:步长]   


## 一.矩阵的创建
### 1.使用mat或matrix函数创建矩阵

In [None]:
matr1 = np.mat("1,2,3;4,5,6;7,8,9")   #数据之间用分号隔开
matr1

In [None]:
matr2 = np.matrix([[9,8,7],[6,5,4],[3,2,1]])
matr2

mat与matrix的区别：
使用mat函数创建矩阵时，若输入ndarray对象时，则不会为它们创建副本，因此，调用mat函数和调用matrix(data,copy=False)等价

### 2.使用bmat函数创建矩阵
将小矩阵组合成大矩阵

In [None]:
np.bmat("matr1,matr2")

#### *矩阵与数组的区别：
#数组array与矩阵matrix是NumPy中两种不同的类型，Numpy arrays 可以是多维的，但是 Numpy matrices必须是二维的。matrix是array的一个小的分支，包含于Array。所以matrix 拥有array的所有特性。
#array与matrix执行相同的数学运算会得到不同的结果： 数组之间相乘，是元素与对应位置的元素逐一相乘；矩阵之间相乘得到的是矩阵积。
#运算符 ** 表示的含义也不同，对于maxtrix来说，a ** 2表示a * a，对于array来说，a ** 2表示数组里的数的平方。

In [None]:
#数组相乘
a1=np.array([[1,2],[3,4]])
a2=np.array([[5,6],[7,8]])
a3 = a1 * a2

In [None]:
#矩阵相乘
m1=np.mat("1,2;3,4")
m2=np.mat("5,6;7,8")
m3 = m1 * m2

拓展：矩阵积怎么运算出来的？（详见word文档）

## 二.矩阵的运算

In [None]:
#矩阵与数相乘 
m1*3
#矩阵相加减 
m1+m2
m1-m2
#矩阵相乘 
m1*m2

In [None]:
#矩阵对应元素相乘
np.multiply(m1,m2)

In [None]:
#数组相乘，若想得到矩阵积
a1.dot(a2)

In [None]:
#矩阵转置
matrix.T    #返回自身的转置（m行n列变成n行m列）
matrix.H   #返回自身的共轭转置
matrix.I   #返回自身的逆矩阵
matrix.A   #返回自身数据的二维数组的一个视图

## 三.NumPy读取和存储文件
### 1.读/存 二进制文件
#### （1）存储二进制文件
np.sava(file, arr) 或 np.savez(file, arr1, arr2)

file：文件名，单个数组以.npy为扩展名，存储多个数组压缩拓展名为.npz

存储时扩展名可以省，但读取时不能省。

In [None]:
arr1 = np.arange(50).reshape(5, 2, 5)
np.save('D:/pyData/a1', arr1)

In [None]:
arr2 = np.array([[1,2],[3,4]])
np.savez('D:/pyData/b1', arr1, arr2)

#### (2)读取二进制文件
np.load(file)      注意：读取时不能省扩展名

In [None]:
np.load('D:/pyData/a1.npy')

In [None]:
np.load('D:/pyData/b1.npz')

In [None]:
data1 = np.load('D:/pyData/b1.npz')
data1['arr_0']     #arr_0表示压缩文件中第一个数组

### 2.读/存 csv或txt文件
#### （1）存储csv或txt文件
CSV（逗号分隔值）只能存一维和二维数组

np.savetxt ( fname, array, fmt='%.18e', delimiter=None )

fname：文件或字符串的名字，可以是.gz或.bz2的压缩文件的名字。

array：存入文件的数组。

fmt：写入文件中每个元素使用的格式，如：%d 、%.2f、%1.8e

delimiter：字符串之间的分隔符，默认是空格

In [None]:
arr3 = np.arange(50).reshape(5,10)
np.savetxt ( 'D:/pyData/c3', arr3, fmt='%d', delimiter=',' )

#### (2) 读取csv或txt文件
np.loadtxt( fname, dtype=np.float, delimiter=None, unpack=False )

unpack：读入属性将分别写入不同数组变量，一列数据会组成一行，相当于转置的效果，False读入数据只写入一个数组变量，有多少条数据就有多少行，默认False

In [None]:
np.loadtxt ('D:/pyData/c3',  delimiter=',' , unpack=True )

## 四.NumPy常用统计函数
### 1.排序（sort函数）
np.sort(arr, axis=1, kind='quicksort', order=None)

arr：需要排序的数组

axis：指定数据排序的轴；axis=1为沿横轴排序； axis=0为沿纵轴排序

kind：数组排序时使用的方法，默认kind= 'quicksort' 为快排

order：一个字符串或列表，可以设置按照某个属性进行排序

In [None]:
#不加任何参数的直接排列
np.random.seed(1)   #设置随机种子  伪随机
arr4=np.random.randint(1, 42, size=10)
arr4

In [None]:
np.sort(arr4)

In [None]:
#参数axis的使用，按指定轴排列
arr5=np.random.randint(1,40,size=(3,3))
arr5

In [None]:
arr5.sort(axis=0)
arr5

In [None]:
arr5.sort(axis=1)
arr5

思考：如果先按axis=1排序，再按axis=0排序，结果是一样吗？

In [None]:
#参数order的使用，指定排列规则
list1 = [('Name', 'S10'), ('Height', float), ('Age', int)]
values = [('Li', 1.8, 41), ('Wang', 1.9, 38),('Duan', 1.7, 38)]
arr6 = np.array(values, dtype=list1)
np.sort(a, order='Height')      # 按照属性Height进行排序,此时参数为字符串

In [None]:
np.sort(a, order=['Age', 'Height'])    
# 先按照属性Age排序,如果Age相等，再按照Height排序，此时参数为列表

### 2.去重 （unique函数）
np.unique()

In [None]:
names = np.array(['张三风','张五忌','李达','王其木','张五忌','李达'])
np.unique(names)

### 3.常用统计函数
np.sum (a, axis =None或0或1) :      计算数组的和

np.mean (a, axis =None或0或1) :     计算数组的平均值

np.std (a, axis =None或0或1) ：     计算数组的标准差

np.var (a, axis =None或0或1) :      计算数组的方差

np.min (a, axis =None或0或1)：      计算数组的最小值

np.max (a, axis =None或0或1)：      计算数组的最大值

np.cumsum (a, axis =None或0或1)：    计算数组的累计和

np.cumprod (a, axis =None或0或1)：   计算数组的累计积

np.average(a, axis =None或0或1,weights=None或[指定权重])：计算数组a相关元素的加权平均值

In [None]:
arr7 = np.arange(15).reshape(3, 5) 
np.sum(arr7,axis=0)
np.mean(arr7,axis=1)
np.std(arr7,axis=0)
np.var(arr7,axis=0)

In [None]:
np.average(arr7, axis =0, weights =[10, 5, 1])
#解析：1.对a在0轴上各元素加权求平均，weights中为权重，注意要和a的第一维匹配
   #  2.以4.1875为例，(2*10+7*5+12*1)  /  (10+5+1)=4.1875