## Numpy

NumPy（Numerical Python的简称）是Python数值计算最重要的基础包。大多数提供科学计算的包都是用NumPy的数组作为构建基础。

NumPy的部分功能如下：

* ndarray，一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组。
* 用于对整组数据进行快速运算的标准数学函数（无需编写循环）。
* 用于读写磁盘数据的工具以及用于操作内存映射文件的工具。
* 线性代数、随机数生成以及傅里叶变换功能。
* 用于集成由C、C++、Fortran等语言编写的代码的API。

#### ndarray
ndarray是一个快速而灵活的大数据集容器。你可以利用这种数组对整块数据执行一些数学运算，其语法跟标量元素之间的运算一样。

1. ndarray是一个通用的同构数据多维容器，也就是说，其中的所有元素必须是相同类型的。


In [2]:
import numpy as np
data = np.random.randn(2, 3)
data

array([[-0.55293953, -0.33370117, -0.49055942],
       [ 0.46494389,  1.35918073,  0.42527305]])

In [3]:
data * 10

array([[-5.52939532, -3.33701175, -4.90559423],
       [ 4.64943894, 13.59180734,  4.25273049]])

2. 创建数组最简单的办法就是使用array函数。它接受一切序列型的对象（包括其他数组），然后产生一个新的含有传入数据的NumPy数组。


* ndim shape 用来获取维度
* dtype数据类型
* zeros和ones分别可以创建指定长度或形状的全0或全1数组
* arange是Python内置函数range的数组版


In [8]:
data1 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr1 = np.array(data1)
arr1



array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [7]:
arr1.ndim

2

In [9]:
arr1.shape

(2, 4)

In [10]:
np.zeros((3, 6))

array([[0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0., 0.]])

In [15]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

#### ndarray的数据类型
dtype（数据类型）是一个特殊的对象，它含有ndarray将一块内存解释为特定数据类型所需的信息

数值型dtype的命名方式相同：一个类型名（如float或int），后面跟一个用于表示各元素位长的数字。

通过ndarray的astype方法明确地将一个数组从一个dtype转换成另一个dtype

In [16]:
arr = np.array([3.7, -1.2, -2.6, 0.5, 12.9, 10.1])
arr.astype(np.int32)

array([ 3, -1, -2,  0, 12, 10])

#### NumPy数组的运算

NumPy用户称其为矢量化（vectorization）。大小相等的数组之间的任何算术运算都会将运算应用到元素级


In [17]:
arr = np.array([[1., 2., 3.], [4., 5., 6.]])
arr * arr

array([[ 1.,  4.,  9.],
       [16., 25., 36.]])

#### 基本的索引和切片

一维数组跟Python列表的功能差不多

一次传入多个切片，就像传入多个索引

“只有冒号”表示选取整个轴


In [30]:
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
arr2d

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [31]:
arr2d[0]

array([1, 2, 3])

In [33]:
arr2d[:2, 1:]

array([[2, 3],
       [5, 6]])

In [35]:
arr2d[:, :1]

array([[1],
       [4],
       [7]])

#### 通用函数

通用函数（即ufunc）是一种对ndarray中的数据执行元素级运算的函数。你可以将其看做简单函数（接受一个或多个标量值，并产生一个或多个标量值）的矢量化包装器。

In [36]:
arr = np.arange(10)
np.sqrt(arr)

array([0.        , 1.        , 1.41421356, 1.73205081, 2.        ,
       2.23606798, 2.44948974, 2.64575131, 2.82842712, 3.        ])

In [38]:
x = np.random.randn(8)
x

array([ 0.43701271, -0.27560461,  1.67817746,  0.29564045,  1.48777322,
        2.49870944,  0.7151606 ,  1.74622618])

In [39]:
y = np.random.randn(8)
y

array([ 0.2474562 , -0.1583259 ,  2.53468013, -0.67687577, -2.34954036,
        0.04608491,  1.2591207 , -1.64462988])

In [40]:
 np.maximum(x, y)

array([ 0.43701271, -0.1583259 ,  2.53468013,  0.29564045,  1.48777322,
        2.49870944,  1.2591207 ,  1.74622618])

In [41]:
np.sum(x+y)

7.841065479601114

In [43]:
x.sort()
x

array([-0.27560461,  0.29564045,  0.43701271,  0.7151606 ,  1.48777322,
        1.67817746,  1.74622618,  2.49870944])