In [1]:
import numpy
numpy.__version__

'1.14.3'

**对内置文档的提醒**
* 当你阅读本章时，不要忘记IPython 提供了快速探索包的内容的方法（用Tab 键自动补全），以及各种函数的文档（用? 符号）。如果你还需要回顾一下，可以翻回1.2 节。
    * 例如，要显示numpy 命名空间的所有内容，可以用如下方式：
    <br>`In [3]: np.<TAB>`
    * 要显示NumPy 内置的文档，可以用如下方式：
    <br>`In [4]: np?`
    * 要获取更详细的文档以及教程和其他资源，可以访问http://www.numpy.org。

## 2.1 理解Python中的数据类型

在C 语言中，每个变量的数据类型被明确地声明；而在Python中，类型是动态推断的。这意味着可以将任何类型的数据指定给任何变量：

In [None]:
# Python代码
x = 4
x = "four"

同样的操作在C 语言中将会导致（取决于编译器设置）编译错误或其他未知的后果：

```C
/* C代码 */
int x = 4;
x = "four"; // 编译失败
```

### 2.1.1　Python整型不仅仅是一个整型

标准的Python 实现是用C 语言编写的。这意味着每一个Python 对象都是一个聪明的伪C语言结构体，该结构体不仅包含其值，还有其他信息。例如，当我们在Python 中定义一个整型，例如x = 10000 时，x 并不是一个“原生”整型，而是一个指针，指向一个C 语言的复合结构体，结构体里包含了一些值。查看Python 3.4 的源代码，可以发现整型（长整型）的定义，如下所示（C 语言的宏经过扩展之后）：
```c
struct _longobject {
long ob_refcnt;
PyTypeObject *ob_type;
size_t ob_size;
long ob_digit[1];
};
```

由于Python 的整型结构体里面还包含了大量额外的信息，所以Python 可以自由、动态地编码。
<br>但是，Python 类型中的这些额外信息也会成为负担，在多个对象组合的结构体中尤其明显。

### 2.1.2　Python列表不仅仅是一个列表

Python 中的标准可变多元素容器是列表。可以用如下方式创建一个整型值列表：

In [2]:
L = list(range(10))
print(type(L[0]))

<class 'int'>


或者创建一个字符串列表：

In [3]:
L2 = [str(c) for c in L]
print(type(L2[0]))

<class 'str'>


因为Python 的动态类型特性，甚至可以创建一个异构的列表：

In [4]:
L3 = [True, "2", 3.0, 4]
[type(item) for item in L3]

[bool, str, float, int]

但是想拥有这种灵活性也是要付出一定代价的：为了获得这些灵活的类型，列表中的每一项必须包含各自的类型信息、引用计数和其他信息；也就是说，每一项都是一个完整的Python 对象。

如果列表中的所有变量都是同一类型的，那么很多信息都会显得多余——将数据存储在固定类型的数组中应该会更高效。
<br>如动态类型的列表和固定类型的（NumPy 式）数组间的区别

### 2.1.3　Python中的固定类型数组

Python 提供了几种将数据存储在有效的、固定类型的数据缓存中的选项。
<br>内置的数组（array）模块（在Python 3.3 之后可用）可以用于创建统一类型的密集数组：

In [6]:
import array
L = list(range(10))
A = array.array('i', L)
A

array('i', [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

这里的'i' 是一个数据类型码，表示数据为整型。

**更实用的是NumPy 包中的ndarray 对象。**
<br>Python 的数组对象提供了数组型数据的有效存储，而NumPy 为该数据加上了高效的操作。

In [7]:
import numpy as np

### 2.1.4　从Python列表创建数组

首先，可以用np.array 从Python 列表创建数组：

In [10]:
# 整型数组:
np.array([1, 4, 2, 5, 3])

array([1, 4, 2, 5, 3])

请记住，不同于Python 列表，NumPy 要求数组必须包含同一类型的数据。
<br>如果类型不匹配，NumPy 将会向上转换（如果可行）。
<br>这里整型被转换为浮点型：

In [11]:
np.array([3.14, 4, 2, 3])

array([3.14, 4.  , 2.  , 3.  ])

如果希望明确设置数组的数据类型，可以用dtype 关键字：

In [12]:
np.array([1, 2, 3, 4], dtype='float32')

array([1., 2., 3., 4.], dtype=float32)

最后，不同于Python 列表，NumPy 数组可以被指定为多维的。
<br>以下是用列表的列表初始化多维数组的一种方法：

In [13]:
# 嵌套列表构成的多维数组
np.array([range(i, i + 3) for i in [2, 4, 6]])

array([[2, 3, 4],
       [4, 5, 6],
       [6, 7, 8]])

内层的列表被当作二维数组的行。

### 2.1.5　从头创建数组

面对大型数组的时候，用NumPy 内置的方法从头创建数组是一种更高效的方法。

In [None]:
# 创建一个长度为10的数组，数组的值都是0
np.zeros(10, dtype=int)

In [None]:
# 创建一个3×5的浮点型数组，数组的值都是1
np.ones((3, 5), dtype=float)

In [None]:
# 创建一个3×5的浮点型数组，数组的值都是3.14
np.full((3, 5), 3.14)

In [None]:
# 创建一个3×5的浮点型数组，数组的值是一个线性序列
# 从0开始，到20结束，步长为2
# （它和内置的range()函数类似）
np.arange(0, 20, 2)

In [None]:
# 创建一个5个元素的数组，这5个数均匀地分配到0~1
np.linspace(0, 1, 5)

In [None]:
# 创建一个3×3的、在0~1均匀分布的随机数组成的数组
np.random.random((3, 3))

In [None]:
# 创建一个3×3的、均值为0、方差为1的
# 正态分布的随机数数组
np.random.normal(0, 1, (3, 3))

In [None]:
# 创建一个3×3的、[0, 10)区间的随机整型数组
np.random.randint(0, 10, (3, 3))

In [None]:
# 创建一个3×3的单位矩阵
np.eye(3)

In [None]:
# 创建一个由3个整型数组成的未初始化的数组
# 数组的值是内存空间中的任意值
np.empty(3)

### 2.1.6　NumPy标准数据类型

NumPy 数组包含同一类型的值，因此详细了解这些数据类型及其限制是非常重要的。因为NumPy 是在C 语言的基础上开发的，所以C、Fortran 和其他类似语言的用户会比较熟悉这些数据类型。

表2-1 列出了标准NumPy 数据类型。
<br>请注意，当构建一个数组时，你可以用一个字符串参数来指定数据类型：

In [None]:
np.zeros(10, dtype='int16')

或者用相关的NumPy 对象来指定：

In [None]:
np.zeros(10, dtype=np.int16)

表2-1：NumPy标准数据类型

|数据类型|描述|
|:-|:-|
|bool_ |布尔值（真、True 或假、False），用一个字节存储|
|int_ |默认整型（类似于C 语言中的long，通常情况下是int64 或int32）|
|intc |同C 语言的int 相同（通常是int32 或int64）|
|intp |用作索引的整型（和C 语言的ssize_t 相同，通常情况下是int32 或int64）|
|int8 |字节（byte，范围从–128 到127）|
|int16 |整型（范围从–32768 到32767）|
|int32 |整型（范围从–2147483648 到2147483647）|
|int64 |整型（范围从–9223372036854775808 到9223372036854775807）|
|uint8 |无符号整型（范围从0 到255）|
|uint16 |无符号整型（范围从0 到65535）|
|uint32 |无符号整型（范围从0 到4294967295）|
|uint64 |无符号整型（范围从0 到18446744073709551615）|
|float_ |float64 的简化形式|
|float16 |半精度浮点型：符号比特位，5 比特位指数（exponent），10 比特位尾数（mantissa）|
|float32 |单精度浮点型：符号比特位，8 比特位指数，23 比特位尾数|
|float64 |双精度浮点型：符号比特位，11 比特位指数，52 比特位尾数|
|complex_ |complex128 的简化形式|
|complex64 |复数，由两个32 位浮点数表示|
|complex128 |复数，由两个64 位浮点数表示|

还可以进行更高级的数据类型指定，例如指定高位字节数或低位字节数；更多的信息可以
在NumPy 文档（http://numpy.org/）中查看。NumPy 也支持复合数据类型，这一点将会在
2.9 节中介绍。