array creation
====

# 概述

有5种常规的创建数组的机制：

- 从其他Python结构转换（如，列表，元组）
- numpy内置的特定函数创建 array 对象（例如，arange，one，zeros等）
- 从标准的或自定义格式的磁盘上读取 array
- 通过使用字符串或缓冲区数据从原始字节创建数组
- 使用特殊库函数（例如，random()）

复制，加入或以其他方式扩展或改变现有 array 的方法不是严格的创建 array，将专门讨论。

创建**对象** array 或结构化 array 也专题讨论。

# 将Python类似 array 的对象转换为 NumPy array

通常，在Python中以类似 array 结构排列的数字数据可以通过使用 array() 函数转换为 array。最明显的例子是列表和元组。某些对象可能支持 array 协议，并允许以这种方式转换为 array。可以以交互方式，使用 array() 函数尝试将对象转换为 array，看它是否有效，以检测该对象是否支持 array 协议。（Python方式）。

In [86]:
import numpy as np

x = np.array([2,3,1,0])
x

array([2, 3, 1, 0])

In [87]:
x = np.array([2, 3, 1, 0])
x

array([2, 3, 1, 0])

In [88]:
x = np.array([[1,2.0],[0,0],(1+1j,3.)]) # note mix of tuple and lists,and types
x

array([[ 1.+0.j,  2.+0.j],
       [ 0.+0.j,  0.+0.j],
       [ 1.+1.j,  3.+0.j]])

In [89]:
x = np.array([[ 1.+0.j, 2.+0.j], [ 0.+0.j, 0.+0.j], [ 1.+1.j, 3.+0.j]])
x

array([[ 1.+0.j,  2.+0.j],
       [ 0.+0.j,  0.+0.j],
       [ 1.+1.j,  3.+0.j]])

# 特定的内置函数创建 array 

NumPy具有从头开始创建数组的内置函数：

## zeros()

将创建一个填充了具有指定形状的0值的数组。默认的dtype是float64。

In [90]:
np.zeros((2, 3))

array([[ 0.,  0.,  0.],
       [ 0.,  0.,  0.]])

## ones（shape）
将创建一个具有指定形状的填充了 1 的 array。在所有其他方面它与零相同。

In [91]:
np.ones((3,2)) #注意：英文(()),shape是一个元组。

array([[ 1.,  1.],
       [ 1.,  1.],
       [ 1.,  1.]])

## arange()
创建值有规律递增的数组。

**numpy.arange**

`numpy.arange([start, ]stop, [step, ]dtype=None)`

在给定的区间内返回均匀间距的值。

值在半开区间 `[start，stop]` 内生成（换句话说，包括 start 但不包括 stop 的区间）。对于整数参数，该函数等效于Python内置范围函数，但返回的是 ndarray 而不是列表。

使用非整数步骤（例如0.1）时，结果通常不一致。最好在这类情况下使用linspace（numpy.linspace()）。

***Parameters:***

**start : ** 数字，可选参数。区间的开始值。区间包括这个值，默认是 0。

**stop :** 数字，区间的结束。区间一般不包括这个值，除非在 step 不是整数，并且浮点运算影响到输出的长度。

**step :** 数字，可选参数。两个值的间距，即步长。对于任何输出，这是两个相邻值之间的距离，out [i + 1] - out [i]。 默认步长为1。如果要通过位置指定 step 参数，则还必须给出start（即：如果不是通过关键字参数，如 step = 2，意图根据位置提供 step 参数，前面必须给出start，否则位置就不正确）。

**dtype :** dtype，输出的array的类型。如果不提供该参数，将根据输入的其它数据推断数据类型。

**Returns：** 返回值在区间内的 ndarray。值有均匀间距的array。

对于浮点参数，结果的长度为 `ceil((stop - start)/ step)`。 由于浮点溢出，此规则可能导致out的最后一个元素大于stop。

In [92]:
np.arange(3,7,0.5)

array([ 3. ,  3.5,  4. ,  4.5,  5. ,  5.5,  6. ,  6.5])

Note that there are some subtleties regarding the last usage that the user should be aware of that are described in the arange docstring.

linspace() will create arrays with a specified number of elements, and spaced equally between the specified beginning and end values. For example:

**注意**，最终用户应该注意 arange docstring 中描述的一些微妙之处。

## linspace()

linspace() 将创建具有指定数量元素的数组，并在指定的开始值和结束值之间平均间隔。 例如：

In [93]:
np.linspace(1., 4., 6)

array([ 1. ,  1.6,  2.2,  2.8,  3.4,  4. ])

## numpy.linspace

`numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)`

在指定的区间内返回均匀间隔的数字。

返回‘num’ 个均匀间隔的值，在[start，stop]区间内计算。

可以选择是否排除区间的结束（stop）值。

**注意：linspace()与arange()的区别。**

### 参数

- **num** 返回值的个数，默认50个；
- **endpoint** 是否包含结束值，默认是 True。
- **retstep** 默认为False。如果是 True, 返回 (samples, step), 

In [94]:
np.linspace(1.,4,6,retstep=True)

(array([ 1. ,  1.6,  2.2,  2.8,  3.4,  4. ]), 0.59999999999999998)

linspace()函数的优点是可以保证元素的数量以及起点和终点。
arange()函数通常对一些随意的start，stop 和 step 值执行创建。

## indices()

将创建一组数组（堆叠为一个更高维度的数组），每个维度有一个代表该维度的变化。用例子说明比口头描述更清晰：

In [95]:
x=np.indices((2,3,4,5))
x

array([[[[[0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0]],

         [[0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0]],

         [[0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0]]],


        [[[1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1]],

         [[1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1]],

         [[1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1]]]],



       [[[[0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0],
          [0, 0, 0, 0, 0]],

         [[1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1],
          [1, 1, 1, 1, 1]],

         [[2, 2, 2, 2, 2],
          [2, 2, 2, 2, 2],
          [2, 2, 2, 2, 2],
          [2, 2, 2, 2, 2]]],


  

In [96]:
np.shape(x)

(4, 2, 3, 4, 5)

## numpy.indices

`numpy.indices(dimensions, dtype=<class 'int'>)`

返回一个数组，显示网格的索引（变化）。

计算一个数组，它的子数组包含0，1...不同的索引值，仅沿着相应的轴变化。

### 参数

**dimensions :** 整数序列。风格的形状。

**dtype :** dtype, 可选参数。结果的数据类型。

**Returns:** grid : ndarray

数组的网格索引， grid.shape = (len(dimensions),) + tuple(dimensions).

**注意：**

输出shape是通过在维度元组前面加上维数来获得的，即如果维度是长度为N的元组（r0，...，rN-1），则输出shape为（N，r0，......，RN-1）。

子数组 grid[k] 包含的数组，是沿第 k 轴，索引为 N-D 。明确地表示方法：

`grid[k,i0,i1,...,iN-1] = ik`

Examples

>>>
>>> grid = np.indices((2, 3))
>>> grid.shape
(2, 2, 3)
>>> grid[0]        # row indices
array([[0, 0, 0],
       [1, 1, 1]])
>>> grid[1]        # column indices
array([[0, 1, 2],
       [0, 1, 2]])
The indices can be used as an index into an array.

>>>
>>> x = np.arange(20).reshape(5, 4)
>>> row, col = np.indices((2, 3))
>>> x[row, col]
array([[0, 1, 2],
       [4, 5, 6]])
Note that it would be more straightforward in the above example to extract the required elements directly with x[:2, :3].

In [130]:
grid = np.indices((2,3))
grid

array([[[0, 0, 0],
        [1, 1, 1]],

       [[0, 1, 2],
        [0, 1, 2]]])

In [131]:
grid.shape

(2, 2, 3)

In [132]:
grid[0]

array([[0, 0, 0],
       [1, 1, 1]])

In [133]:
grid[1]

array([[0, 1, 2],
       [0, 1, 2]])

The indices can be used as an index into an array.

indices生成的数组可以用作数组的索引来检索数据。

**注：**用两个数组作为索引源，从另一个数组中检索出需要的数据，在数据分析实践中会经常用到，可以避免使用循环。大数据集中速度优势明显，并且代码简洁。

In [136]:
x = np.arange(20).reshape(5, 4)
x

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19]])

In [139]:
row, col = np.indices((2, 3))
row

array([[0, 0, 0],
       [1, 1, 1]])

In [140]:
col

array([[0, 1, 2],
       [0, 1, 2]])

In [141]:
x[row,col]

array([[0, 1, 2],
       [4, 5, 6]])

**注意：**在上面的这个例子中直接使用 `x[:2,:3]`更加简单清晰。

In [143]:
x[col,row]

array([[0, 4, 8],
       [1, 5, 9]])