# Numpu基础：数组和矢量计算

## 一. ndarray：一种多维数组对象

### 1. 创建ndarray
* 最简单的方式是使用array函数，它接受一切**序列型**的对象，产生一个新的含有传入数据Numpy数组

In [2]:
import numpy as np
data1 = [6,.6,3,.1,2]
arr1 = np.array(data1)
arr1

array([6. , 0.6, 3. , 0.1, 2. ])

In [3]:
data2 = [[1,2,3,4],[5,6,7,8]]
arr2 = np.array(data2)
arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [4]:
arr2.ndim

2

In [5]:
arr2.shape

(2, 4)

np.array会为这个数组自动推断出较为适合的数据类型,数据类型保存在一个特殊的`dtype`对象中

In [8]:
arr1.dtype

dtype('float64')

In [9]:
arr2.dtype

dtype('int64')

* 除了np.array,也可以用函数新建数组
    * zeros,ones创建制定长度或形状的0/1数组
    * empty可以创建没有任何具体值的数组(返回一些未初始化的垃圾值)
    * arrange返回列表
    * eye,identity返回单位矩阵

In [10]:
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [11]:
np.zeros((3,6))

array([[0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.]])

In [12]:
np.empty((2,3,3))

array([[[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]],

       [[0., 0., 0.],
        [0., 0., 0.],
        [0., 0., 0.]]])

In [13]:
np.arange(15)

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

### 2. ndarray的数据类型
dtype对象含有ndarray将内存解释为特定数据类型所需的信息

In [5]:
arr1 = np.array([1,2,3],dtype=np.float64)
arr1

array([1., 2., 3.])

In [7]:
arr2 = np.array([1,2,3],dtype=np.int32)
arr2

array([1, 2, 3], dtype=int32)

可以通过ndarray的`astype`方法显式地转换dtype  
**调用astype方法会创建出一个新的数组**

In [12]:
arr = np.array([1,2,3,4,5])
arr.dtype

dtype('int64')

In [13]:
float_arr = arr.astype(np.float64)
float_arr.dtype

dtype('float64')

In [17]:
arr = np.array([1.3,-2,3,4.6,7.8])
arr

array([ 1.3, -2. ,  3. ,  4.6,  7.8])

In [24]:
arr.astype(np.int32)

array([ 1, -2,  3,  4,  7], dtype=int32)

In [4]:
numeric_strings = np.array(['1.3','234','12.45'],dtype=np.string_)
numeric_strings.astype(float)

array([  1.3 , 234.  ,  12.45])

这里如果写float而不是np.float64,numpy就会自动把python类型映射到等价的dtype上

还可以用**类型代码简写**来表示dtype

In [8]:
empty_uint32 = np.empty(8,dtype='u4')
empty_uint32

array([         0,          0,   30823888,          0, 2288869832,
            32633,     222209,         83], dtype=uint32)

###  3. 数组和标量之间的运算

In [12]:
arr = np.array([[1.,2.,3.],[4.,5.,6.]])
arr

array([[1., 2., 3.],
       [4., 5., 6.]])

In [13]:
arr * arr

array([[ 1.,  4.,  9.],
       [16., 25., 36.]])

In [14]:
arr - arr

array([[0., 0., 0.],
       [0., 0., 0.]])

In [15]:
arr ** 0.5

array([[1.        , 1.41421356, 1.73205081],
       [2.        , 2.23606798, 2.44948974]])

不同大小的数组之间的运算叫**广播**

### 4. 基本的索引和切片

In [17]:
arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [18]:
arr[5:8]

array([5, 6, 7])

In [19]:
arr[5:8] = 12

In [21]:
arr

array([ 0,  1,  2,  3,  4, 12, 12, 12,  8,  9])

当将一个**标量值**赋值给一个切片时,该值会自动广播到整个选区.  
注意**np数组切片是原始数组的视图**,也就是原始地址的引用.对切片对象进行操作也会影响到源数组  
除非显示地进行`copy`操作:`copy_array = arr[5:8].cope()`

In [24]:
arr_slice = arr[5:8]
arr_slice

array([12, 12, 12])

In [25]:
arr_slice[1] = 12345

In [29]:
arr
# 更改切片对象的值,源数组的值也改变了

array([ 0,  1,  2,  3,  4, 64, 64, 64,  8,  9])

In [30]:
arr_slice[:] = 64

In [31]:
arr

array([ 0,  1,  2,  3,  4, 64, 64, 64,  8,  9])

对于高维数组,可以传入逗号分隔的**索引列表**来选取单个元素

In [34]:
arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])

In [35]:
arr2d[2,2]

9

在多维数组中,如果省略了完整索引,将会返回一个含有高一级维度上的所有数据的ndarray

In [36]:
# 2 * 2 * 3 dim
array3d = np.array([[[1,2,3],[4,5,6]],[[7,8,9],[10,11,12]]])
array3d

array([[[ 1,  2,  3],
        [ 4,  5,  6]],

       [[ 7,  8,  9],
        [10, 11, 12]]])

In [38]:
# array3d[0]就是在最高维度上取一个值,返回一个低一个维度的数组.这里是一个2 * 3维度的数组
array3d[0]

array([[1, 2, 3],
       [4, 5, 6]])

标量值和数组都可以被赋值给`array3d[0]`

In [40]:
array3d[0] = 1111
array3d

array([[[1111, 1111, 1111],
        [1111, 1111, 1111]],

       [[   7,    8,    9],
        [  10,   11,   12]]])

In [43]:
# array3d[1,0] 就会降至一维数组
array3d[1,0]

array([7, 8, 9])

在以上所有选取数组子集的例子中,返回的数组都是**视图**(引用)

**高维度数组切片索引**:

In [46]:
arr2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [47]:
arr2d[:2]

array([[1, 2, 3],
       [4, 5, 6]])

可以像传入多个索引一样传入多个切片,进行高维数组的选择操作  
这样可以获取**相同维度**的数组视图

In [48]:
# 前两行,后两列
arr2d[:2,1:]

array([[2, 3],
       [5, 6]])

通过将**整数索引和切片混合**,可以获取低维度的切片  
**只有冒号表示选取整个轴,而不会降低维度**

In [53]:
arr2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [65]:
# 选取第一维度: 1行(从0计数),前两列,这样就降了一个最高维度(行)
arr2d[1,:2]

array([4, 5])

In [77]:
arr2d[1,:2].shape

(2,)

In [78]:
# reshape会升高一维
arr2d[1,:2].reshape((1,2))

array([[4, 5]])

In [62]:
arr2d[2,:1]

array([7])

In [67]:
arr2d[2,:1].shape

(1,)

In [54]:
# : 表示选取所有行,:1 选取第一列
arr2d[:,:1]

array([[1],
       [4],
       [7]])

In [75]:
arr2d[:,:1].shape

(3, 1)

### 5.布尔型索引

In [79]:
names = np.array(['Bob','Joe','Will','Bob','Joe','Will','Joe'])

In [80]:
# randn生成正态分布的随机数据
data = np.randn

NameError: name 'randn' is not defined