# 快速开始

## 基础

numpy 的主要对象是同类型的n维数组。在numpy中，每个维度称为axe，维度的数量称为rank。

numpy 的数组类被称为 ```ndarray```，别名也是```array```。 注意```numpy.array```和python标准库的```array.array```是不同的。```ndarray```的重要属性如下：  
* ndarray.ndim   
    axes的数量
* ndarray.shape  
    返回的数据结构是元组（n, m） n是axes的数量， m是每个axe的size
* ndarray.size  
    包含元素的个数，shape的元素的乘积
* ndarray.dtype  
    返回数组元素的对象类型
* ndarray.itemsize  
    数组元素的大小（byte）
* ndarray.data  
    包含真实元素数据的缓冲。通常不需要

In [2]:
import numpy as np
a = np.arange(15).reshape(3, 5)

In [6]:
a


array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [10]:
a.ndim
a.dtype.name
a.size

15

## 创建数组

有几种方式可以创建数组

In [15]:
# 通过array函数
b = np.array([1, 2, 3])
print(b)
c = np.array((1, 2, 3))
print(c)

d = np.array(([1, 2, 3], [4, 6, 6]))
print(d)

e = np.array([1, 2 ,3], dtype=complex)
print(e)

[1 2 3]
[1 2 3]
[[1 2 3]
 [4 6 6]]
[ 1.+0.j  2.+0.j  3.+0.j]


In [19]:
# 通过函数创建初始化的array
f = np.zeros((3, 4), dtype=np.int16)
print(f)

g = np.ones((2, 3, 4), dtype=np.int64)
print(g)

h = np.empty((2, 3))
print(h)

[[0 0 0 0]
 [0 0 0 0]
 [0 0 0 0]]
[[[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]

 [[1 1 1 1]
  [1 1 1 1]
  [1 1 1 1]]]
[[ 0.  0.  0.]
 [ 0.  0.  0.]]


In [20]:
# 通过arange函数
i = np.arange(1, 10, 0.5)
print(i)


[ 1.   1.5  2.   2.5  3.   3.5  4.   4.5  5.   5.5  6.   6.5  7.   7.5  8.
  8.5  9.   9.5]


In [21]:
# 通过linspace函数
j = np.linspace(0, 2*np.pi, 100)
k = np.sin(j)
print(k)

[  0.00000000e+00   6.34239197e-02   1.26592454e-01   1.89251244e-01
   2.51147987e-01   3.12033446e-01   3.71662456e-01   4.29794912e-01
   4.86196736e-01   5.40640817e-01   5.92907929e-01   6.42787610e-01
   6.90079011e-01   7.34591709e-01   7.76146464e-01   8.14575952e-01
   8.49725430e-01   8.81453363e-01   9.09631995e-01   9.34147860e-01
   9.54902241e-01   9.71811568e-01   9.84807753e-01   9.93838464e-01
   9.98867339e-01   9.99874128e-01   9.96854776e-01   9.89821442e-01
   9.78802446e-01   9.63842159e-01   9.45000819e-01   9.22354294e-01
   8.95993774e-01   8.66025404e-01   8.32569855e-01   7.95761841e-01
   7.55749574e-01   7.12694171e-01   6.66769001e-01   6.18158986e-01
   5.67059864e-01   5.13677392e-01   4.58226522e-01   4.00930535e-01
   3.42020143e-01   2.81732557e-01   2.20310533e-01   1.58001396e-01
   9.50560433e-02   3.17279335e-02  -3.17279335e-02  -9.50560433e-02
  -1.58001396e-01  -2.20310533e-01  -2.81732557e-01  -3.42020143e-01
  -4.00930535e-01  -4.58226522e-01

## 基本操作

数组之间的数学操作直接应用到元素层面

In [23]:
l = np.array([100, 101, 102, 103])
m = np.arange(4)
n = l - m
print(n)
print(m**2)
print(10*np.sin(m))
print(l < 102)

[100 100 100 100]
[0 1 4 9]
[ 0.          8.41470985  9.09297427  1.41120008]
[ True  True False False]


注意：\* 直接应用到元素上，点乘使用dot函数

In [24]:
o = np.array(([1, 1], [0, 1]))
p = np.array(([2, 0], [3, 4]))
print(o*p)
print(o.dot(p))

[[2 0]
 [0 4]]
[[5 4]
 [3 4]]


```+=``` 和 ```*=```是再原来的变量基础上操作，而非生成一个新对ndarray对象

In [27]:
q = np.ones((2, 3), dtype=int)
r = np.random.random((2,3))
# q += r TypeError: Cannot cast ufunc add output from dtype('float64') to dtype('int32') with casting rule 'same_kind'
print(r)
r += q
print(r)

[[ 0.3442341   0.43592826  0.03914188]
 [ 0.61907824  0.86660338  0.14278096]]
[[ 1.3442341   1.43592826  1.03914188]
 [ 1.61907824  1.86660338  1.14278096]]


还有一些一元的函数，定义在ndarray类中

In [29]:
s = np.random.random((2, 3))
print(s.sum())
print(s.min())
print(s.max())

t = np.arange(12).reshape(3, 4)
print(t)
print(t.sum(axis=0))
print(t.sum(axis=1))


3.41643045923
0.0439326705789
0.973893966743
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[12 15 18 21]
[ 6 22 38]


## 通用函数

通用函数是定义在np模块上的，而非在ndarray上。所以调用方法是np.sin()

In [5]:
b = np.arange(3)

np.exp(b) # sqrt add 

array([ 1.        ,  2.71828183,  7.3890561 ])

## 索引、切片、迭代

In [6]:
a = np.arange(10)**3
print(a)
# 索引
print(a[2])
# 切片
print(a[2:5])
print(a[::3])
# 迭代
for i in a:
    print(i**(1/3), end=" ")

[  0   1   8  27  64 125 216 343 512 729]
8
[ 8 27 64]
[  0  27 216 729]
0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0 9.0 

In [11]:
def f(x, y):
    return 10*x + y

b = np.fromfunction(f, (5, 4), dtype=int)
print(b)
# 多维数组的索引与切片
print(b[2, 3])
print(b[0:5, 2])

print(b[: ,1])
print(b[1:3, :])

print(b[-1])

[[ 0  1  2  3]
 [10 11 12 13]
 [20 21 22 23]
 [30 31 32 33]
 [40 41 42 43]]
23
[ 2 12 22 32 42]
[ 1 11 21 31 41]
[[10 11 12 13]
 [20 21 22 23]]
[40 41 42 43]


dots(...)代表适当数量的冒号：  
The dots (...) represent as many colons as needed to produce a complete indexing tuple. 

In [17]:
c = np.arange(12).reshape(2, 2, 3)
print(c)

print(c[1, ...])
print(c[..., 2])
for x in c:
    print(x)


[[[ 0  1  2]
  [ 3  4  5]]

 [[ 6  7  8]
  [ 9 10 11]]]
[[ 6  7  8]
 [ 9 10 11]]
[[ 2  5]
 [ 8 11]]
[[0 1 2]
 [3 4 5]]
[[ 6  7  8]
 [ 9 10 11]]


## 变形操作

一个数组的shape由每个轴（axis）上的元素个数给出。

In [20]:
a = np.floor(10*np.random.random((3, 4)))
print(a)
print(a.shape)

[[ 8.  1.  7.  7.]
 [ 5.  3.  9.  7.]
 [ 5.  0.  4.  1.]]
(3, 4)


一个数组的形状可以通过一些命令改变，一下几个命令（ravel，reshape, T）返回一个修改后的数组，而不会改变原数组

In [24]:
a = np.floor(10*np.random.random((3, 4)))
print(a)
print(a.ravel())
print(a.reshape(4,-1))
print(a.T)
print(a.ravel('F')) # ravel函数reshape函数遵循C风格顺序，即右边的索引变化的最快，如果使用Fortran风格（左边索引变得最快），则需要传入参数‘F’

[[ 3.  6.  3.  8.]
 [ 5.  5.  4.  1.]
 [ 1.  8.  6.  1.]]
[ 3.  6.  3.  8.  5.  5.  4.  1.  1.  8.  6.  1.]
[[ 3.  6.  3.]
 [ 8.  5.  5.]
 [ 4.  1.  1.]
 [ 8.  6.  1.]]
[[ 3.  5.  1.]
 [ 6.  5.  8.]
 [ 3.  4.  6.]
 [ 8.  1.  1.]]
[ 3.  5.  1.  6.  5.  8.  3.  4.  6.  8.  1.  1.]


rezise函数是在原数组基础上变形

In [28]:
a = np.arange(12)
print(a)
a.reshape(3, 4)
print(a)
a.resize(2, 6)
print(a)

[ 0  1  2  3  4  5  6  7  8  9 10 11]
[ 0  1  2  3  4  5  6  7  8  9 10 11]
[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]


## 不同的数组的堆叠

几个数组可以通过不同的轴向堆叠起来

In [32]:
a = np.floor(10*np.random.random((2, 2)))
print(a)
b = np.floor(10*np.random.random((2, 2)))
print(b)
print('*'*15)
print(np.vstack((a, b)))
print(np.hstack((a, b)))

[[ 3.  4.]
 [ 6.  1.]]
[[ 0.  8.]
 [ 8.  3.]]
***************
[[ 3.  4.]
 [ 6.  1.]
 [ 0.  8.]
 [ 8.  3.]]
[[ 3.  4.  0.  8.]
 [ 6.  1.  8.  3.]]


把一个数组切分成多个小数组

In [35]:
a = np.arange(12).reshape(2,6)
print(a)
print(np.hsplit(a, 3))
print(np.hsplit(a, (3, 4)))

[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]
[array([[0, 1],
       [6, 7]]), array([[2, 3],
       [8, 9]]), array([[ 4,  5],
       [10, 11]])]
[array([[0, 1, 2],
       [6, 7, 8]]), array([[3],
       [9]]), array([[ 4,  5],
       [10, 11]])]


## 拷贝和视图

### 完全没有拷贝的情况

In [40]:
# 赋值不会拷贝
a = np.arange(10)
b = a
print(a is b)
a.shape = 2, 5
print(b.shape)
print(b)

True
(2, 5)
[[0 1 2 3 4]
 [5 6 7 8 9]]


In [41]:
# python的函数传可变类型的参数 不会拷贝
def f(x): return id(x)
print(id(a))
print(f(a))

1886911739744
1886911739744


### 视图和浅拷贝

不同的array对象可以共享相同的数据，view函数就创建一个新对象和源对象拥有相同的数据（looks at）（就是数据是同步的）

In [46]:
a = np.floor(10*np.random.random((3, 4)))
print(a)
c = a.view()
print(c)
print(c is a)
print(c.base is a)
print(c.flags.owndata)

c.shape = 2, 6
print(c)
print(a.shape) # c改变形状，不会改变a的形状
c[0, 0] = 1000
print(a) # 改变c的数据，会影响a的数据

[[ 4.  8.  7.  9.]
 [ 2.  9.  5.  5.]
 [ 0.  5.  8.  5.]]
[[ 4.  8.  7.  9.]
 [ 2.  9.  5.  5.]
 [ 0.  5.  8.  5.]]
False
True
False
[[ 4.  8.  7.  9.  2.  9.]
 [ 5.  5.  0.  5.  8.  5.]]
(3, 4)
[[ 1000.     8.     7.     9.]
 [    2.     9.     5.     5.]
 [    0.     5.     8.     5.]]


分片后返回的是一个视图

In [50]:
a = np.arange(12).reshape(3, 4)
print(a)
s = a[1:, 0:2]
print(s)
s[:] = 100
print(a)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[[4 5]
 [8 9]]
[[  0   1   2   3]
 [100 100   6   7]
 [100 100  10  11]]


### 深度拷贝

copy函数完全拷贝一个对象，包括它的数据。

In [51]:
a = np.arange(12).reshape(3, 4)
b = a.copy()
print(b is a )
print(b.base is a)

False
False
