# CHAPTER 4
## NumPy Basics: Arrays and Vectorized Computation
 在数值计算领域，说Numpy是python最重要的包也不为过。在numpy中有下面这些东西：

* ndarray, 一个有效的多维数组，能提供以数组为导向的快速数值计算和灵活的广播功能（broadcasting）

* 便利的数学函数

* 用于读取/写入(reading/writing)数据到磁盘的便利工具

* 线性代数，随机数生成，傅里叶变换能力

* 可以用C API来写C，C++，或FORTRAN

* 通过学习理解numpy中数组和数组导向计算，能帮我们理解pandas之类的工具。

In [1]:
import numpy as np

In [10]:
data = np.random.randn(2,3)

* numpy中有一些常用的用来产生随机数的函数，randn()和rand()就属于这其中. *
numpy.random.randn(d0, d1, …, dn)是从标准正态分布中返回一个或多个样本值。 
numpy.random.rand(d0, d1, …, dn)的随机样本位于[0, 1)中。 

In [11]:
data

array([[ 1.03990684, -0.97236336, -0.35527314],
       [ 0.40804713, -0.10750018, -0.36278641]])

In [12]:
data1 = np.random.rand(2,3)

In [13]:
data1

array([[ 0.05518123,  0.51251567,  0.92030486],
       [ 0.37930488,  0.63937136,  0.40907264]])

randn 是正态分布，所以有负值。而rand是在[0，1)范围中。

In [14]:
data *100

array([[ 103.99068414,  -97.23633596,  -35.52731425],
       [  40.80471341,  -10.75001827,  -36.27864144]])

In [15]:
data+data

array([[ 2.07981368, -1.94472672, -0.71054629],
       [ 0.81609427, -0.21500037, -0.72557283]])

每一个数组都有一个shape，来表示维度大小。而dtype，用来表示data type：

In [16]:
data.shape

(2, 3)

In [18]:
data.dtype

dtype('float64')

## 1 Greating ndarrays (创建n维数组)
最简单的方法使用array函数，输入一个序列即可，比如list：

In [22]:
data2 = [6,7.8,8,0,2]
arr1 = np.array(data2)
arr1

array([ 6. ,  7.8,  8. ,  0. ,  2. ])

嵌套序列能被转换为多维数组：

In [23]:
data3=[[1,2,3,4],[5,6,7,8]]
arr2 = np.array(data3)
arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

因为data2是一个list of lists, 所以arr2维度为2。我们能用ndim和shape属性来确认一下

In [24]:
arr2.ndim

2

In [25]:
arr2.shape

(2, 4)

除非主动声明，否则np.array会自动给data搭配适合的类型，并保存在dtype里：

In [26]:
arr1.dtype

dtype('float64')

In [27]:
arr2.dtype

dtype('int32')

除了np.array，还有一些其他函数能创建数组。比如zeros,ones,另外还可以在一个tuple里指定shape：

In [28]:
np.zeros(11)

array([ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.])

In [29]:
np.zeros((2,8))

array([[ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.]])

In [30]:
np.empty((2,3,2))

array([[[  1.26158289e-311,   3.16202013e-322],
        [  0.00000000e+000,   0.00000000e+000],
        [  0.00000000e+000,   7.87135903e-071]],

       [[  1.16440535e+165,   8.03395177e-042],
        [  1.68849162e-051,   1.46474394e-075],
        [  4.55815151e-037,   1.27938417e+161]]])

np.empty并不能保证返回所有是0的数组，某些情况下，会返回为初始化的垃圾数值，比如上面。

arange是一个数组版的python range函数：

In [31]:
np.arange(15)

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])