定义在numpy中最重要的对象是ndarray,它是一个N维数组类型，描述的是相同类型元素的集合。集合中的元素可以使用从零开始的索引进行访问。  
在一个ndarray对象中，每一个元素占据相同大小的内存块，并且都是数据类型对象（称为dtype）的对象。
任何从ndarray对象中提取的项目（通过切片）都由数组标量类型之一的Python对象表示。下图显示了ndarray，数据类型对象（dtype）和数组标量类型之间的关系：
![image](https://www.tutorialspoint.com/numpy/images/ndarray.jpg)

### Example 1

In [1]:
import numpy as np
a = np.array([1,2,3])
print a

[1 2 3]


### Example 2

In [7]:
a = np.array([[1,2],[3,4]])
print a

[[1 2]
 [3 4]]


### Example 3

In [3]:
a = np.array([1,2,3,4,5],ndmin=2)
print a

[[1 2 3 4 5]]


### Example 4

In [4]:
a = np.array([1,2,3],dtype=complex)
print a 

[ 1.+0.j  2.+0.j  3.+0.j]


The ndarray object consists of contiguous one-dimensional segment of computer memory, combined with an indexing scheme that maps each item to a location in the memory block. The memory block holds the elements in a row-major order (C style) or a column-major order (FORTRAN or MatLab style).

# dtype

NumPy支持比Python更多的数值类型。

<table class="table table-bordered">
<tbody><tr>
<th style="text-align:center;">No.</th>
<th style="text-align:center;">Data Types &amp; Description</th>
</tr>
<tr>
<td class="ts">1</td>
<td><p><b>bool_</b></p>
<p>Boolean (True or False) stored as a byte</p>
</td>
</tr>
<tr>
<td class="ts">2</td>
<td><p><b>int_</b></p>
<p>Default integer type (same as C long; normally either int64 or int32)</p>
</td>
</tr>
<tr>
<td class="ts">3</td>
<td><p><b>intc</b></p>
<p>Identical to C int (normally int32 or int64)</p>
</td>
</tr>
<tr>
<td class="ts">4</td>
<td><p><b>intp</b></p>
<p>Integer used for indexing (same as C ssize_t; normally either int32 or int64)</p>
</td>
</tr>
<tr>
<td class="ts">5</td>
<td><p><b>int8</b></p>
<p>Byte (-128 to 127)</p>
</td>
</tr>
<tr>
<td class="ts">6</td>
<td><p><b>int16</b></p>
<p>Integer (-32768 to 32767)</p>
</td>
</tr>
<tr>
<td class="ts">7</td>
<td><p><b>int32</b></p>
<p>Integer (-2147483648 to 2147483647)</p>
</td>
</tr>
<tr>
<td class="ts">8</td>
<td><p><b>int64</b></p>
<p>Integer (-9223372036854775808 to 9223372036854775807)</p>
</td>
</tr>
<tr>
<td class="ts">9</td>
<td><p><b>uint8</b></p>
<p>Unsigned integer (0 to 255)</p>
</td>
</tr>
<tr>
<td class="ts">10</td>
<td><p><b>uint16</b></p>
<p>Unsigned integer (0 to 65535)</p>
</td>
</tr>
<tr>
<td class="ts">11</td>
<td><p><b>uint32</b></p>
<p>Unsigned integer (0 to 4294967295)</p>
</td>
</tr>
<tr>
<td class="ts">12</td>
<td><p><b>uint64</b></p>
<p>Unsigned integer (0 to 18446744073709551615)</p>
</td>
</tr>
<tr>
<td class="ts">13</td>
<td><p><b>float_</b></p>
<p>Shorthand for float64</p>
</td>
</tr>
<tr>
<td class="ts">14</td>
<td><p><b>float16</b></p>
<p>Half precision float: sign bit, 5 bits exponent, 10 bits mantissa</p>
</td>
</tr>
<tr>
<td class="ts">15</td>
<td><p><b>float32</b></p>
<p>Single precision float: sign bit, 8 bits exponent, 23 bits mantissa</p>
</td>
</tr>
<tr>
<td class="ts">16</td>
<td><p><b>float64</b></p>
<p>Double precision float: sign bit, 11 bits exponent, 52 bits mantissa</p>
</td>
</tr>
<tr>
<td class="ts">17</td>
<td><p><b>complex_</b></p>
<p>Shorthand for complex128</p>
</td>
</tr>
<tr>
<td class="ts">18</td>
<td><p><b>complex64</b></p>
<p>Complex number, represented by two 32-bit floats (real and imaginary components)</p>
</td>
</tr>
<tr>
<td class="ts">19</td>
<td><p><b>complex128</b></p>
<p>Complex number, represented by two 64-bit floats (real and imaginary components)</p>
</td>
</tr>
</tbody></table>

### 数据类型对象(dtype)

数据类型对象根据以下方面描述对应于数组的固定内存块的解释:
- 数据类型（整型，浮点型或者python对象）
- 数据大小
- 字节顺序（大小端）
- 在结构化类型的情况下，字段的名称，每个字段的数据类型及每个字段占用的存储器块的一部分
- 如果数据类型是子数组，则考虑它的形状和数据类型  

dtype对象结构如下：
numpy.dtype(object,align,copy) 
- object: 被转换为数据类型对象
- align: 如果为true，则向该字段添加填充以使其类似C结构
- copy: 制作dtype对象的新副本。如果为false，则结果是引用内置数据类型的对象

#### Example 1

In [8]:
# using array-scalar type
import numpy as np
dt = np.dtype(np.int32)
print dt

int32


#### Example 2 
The following examples define a structured data type called student with a string field 'name', an integer field 'age' and a float field 'marks'. This dtype is applied to ndarray object.

In [9]:
student = np.dtype([('name','S20'),('age','i1'),('marks','f4')])
print student

[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')]


# 数组属性
这一节讨论numpy的各种数组属性
### ndarray.shape
这个数组属性返回一个由数组维度组成的元组，它也可以用于调整数组大小。

In [10]:
import numpy as np
a = np.array([[1,2,3],[4,5,6]])
print a.shape

(2L, 3L)


In [12]:
# 调整ndarray大小
a.shape = (3,2)
print a

[[1 2]
 [3 4]
 [5 6]]


In [14]:
# numpy中的reshape函数也提供了相同的功能
a = np.array([[1,2,3],[4,5,6]]) 
b = a.reshape(3,2) 
print b

[[1 2]
 [3 4]
 [5 6]]


### ndarray.ndim
这个数组属性返回数组维数

In [20]:
# a现在是一个一维数组
a = np.arange(24)
print a.ndim

# 应用reshape(),现在b为三维数组
b = a.reshape(2,4,3)
print b.ndim

1
3


### numpy.itemsize
这个数组属性以字节为单位返回数组中每个元素的长度

In [22]:
# 数组的dtype是int8（一个字节）
x = np.array([1,2,3,4,5],dtype=np.int8)
print x.itemsize

1


In [23]:
# 数组的dtype是float32（四个字节）
x = np.array([1,2,3,4,5],dtype=np.float32)
print x.itemsize

4


### numpy.flags
ndarray对象具有以下属性,它的当前值是由这个函数返回的

<table class="table table-bordered">
<tbody><tr>
<th style="text-align:center;">Sr.No.</th>
<th style="text-align:center;">Attribute &amp; Description</th>
</tr>
<tr>
<td class="ts">1</td>
<td><p><b>C_CONTIGUOUS (C)</b></p>
<p>The data is in a single, C-style contiguous segment</p>
</td>
</tr>
<tr>
<td class="ts">2</td>
<td><p><b>F_CONTIGUOUS (F)</b></p>
<p>The data is in a single, Fortran-style contiguous segment</p>
</td>
</tr>
<tr>
<td class="ts">3</td>
<td><p><b>OWNDATA (O)</b></p>
<p>The array owns the memory it uses or borrows it from another object</p>
</td>
</tr>
<tr>
<td class="ts">4</td>
<td><p><b>WRITEABLE (W)</b></p>
<p>The data area can be written to. Setting this to False locks the data, making it read-only</p>
</td>
</tr>
<tr>
<td class="ts">5</td>
<td><p><b>ALIGNED (A)</b></p>
<p>The data and all elements are aligned appropriately for the hardware</p>
</td>
</tr>
<tr>
<td class="ts">6</td>
<td><p><b>UPDATEIFCOPY (U)</b></p>
<p>This array is a copy of some other array. When this array is deallocated, the base array will be updated with the contents of this array</p>
</td>
</tr>
</tbody></table>

下面的例子展示了标识的当前值

In [24]:
x = np.array([1,2,3,4,5])
print x.flags

  C_CONTIGUOUS : True
  F_CONTIGUOUS : True
  OWNDATA : True
  WRITEABLE : True
  ALIGNED : True
  UPDATEIFCOPY : False


# 数组创建
一个新的ndarray对象可以通过下面的数组创建例程或者使用低级别的ndarray构造器进行创建

### numpy.empty
它创建了一个未初始化的指定形状和元素类型的数组。结构如下：
```python
numpy.empty(shape,dtype=float,order='C')
```
构造的参数具体意义：
<table class="table table-bordered">
<tbody><tr>
<th style="text-align:center;">Sr.No.</th>
<th style="text-align:center;">Parameter &amp; Description</th>
</tr>
<tr>
<td class="ts">1</td>
<td><p><b>Shape</b></p>
<p>Shape of an empty array in int or tuple of int</p>
</td>
</tr>
<tr>
<td class="ts">2</td>
<td><p><b>Dtype</b></p>
<p>Desired output data type. Optional</p>
</td>
</tr>
<tr>
<td class="ts">3</td>
<td><p><b>Order</b></p>
<p>'C' for C-style row-major array, 'F' for FORTRAN style column-major array</p>
</td>
</tr>
</tbody></table>

下面的代码展现了一个空数组的例子

In [26]:
import numpy as np
a = np.empty([3,2],dtype=int)
print a

[[1 2]
 [3 4]
 [5 6]]


**注意：**由于数组未初始化，所以其中的元素是随机的

### numpy.zeros
创建一个指定大小，元素全为0的新数组
```python
numpy.zeros(shape,dtype=float,order='C')
```
参数具体意义与上述内容相似，不再赘述。注意dtype默认为浮点型

In [30]:
x = np.zeros(5)
print x,'\n'

# 指定元素类型
x = np.zeros((5,),dtype=np.int)
print x,'\n'

x = np.zeros((2,2),dtype=[('x','i4'),('y','i4')])
print x

[ 0.  0.  0.  0.  0.] 

[0 0 0 0 0] 

[[(0, 0) (0, 0)]
 [(0, 0) (0, 0)]]


### numpy.ones
创建一个指定大小，元素全为1的新数组
```python
numpy.ones(shape,dtype=None,order='C')
```

In [35]:
# 5个元素都为1的数组。默认元素类型为float
x = np.ones(5)
print x,'\n'

x = np.ones((2,2),dtype=[('x','a4'),('y','a4')]) # 'a'表示元素为字符类型
print x

[ 1.  1.  1.  1.  1.] 

[[('1', '1') ('1', '1')]
 [('1', '1') ('1', '1')]]


# 从现有数据中创建数组
### numpy.asarray
这个函数与np.array类似，除了它有更少的参数。这个规则在将python序列转换为ndarray类型数据时很有用途
```python
numpy.asarray(a,dtype=None,order=None)
```
参数具体意义：
<table class="table table-bordered">
<tbody><tr>
<th style="text-align:center;">Sr.No.</th>
<th style="text-align:center;">Parameter &amp; Description</th>
</tr>
<tr>
<td class="ts">1</td>
<td><p><b>a</b></p>
<p>Input data in any form such as list, list of tuples, tuples, tuple of tuples or tuple of lists</p>
</td>
</tr>
<tr>
<td class="ts">2</td>
<td><p><b>dtype</b></p>
<p>By default, the data type of input data is applied to the resultant ndarray</p>
</td>
</tr>
<tr>
<td class="ts">3</td>
<td><p><b>order</b></p>
<p>C (row major) or F (column major). C is default</p>
</td>
</tr>
</tbody></table>

下面的例子将介绍asarray函数的使用

In [36]:
# 将列表转换为ndarray
import numpy as np

x = [1,2,3]
a = np.asarray(x)
print a

[1 2 3]


In [37]:
# 设定dtype为集合类型
a = np.asarray(x,dtype=float)
print a

[ 1.  2.  3.]


In [46]:
# 元组类型
x = (1,2,3)
a = np.asarray(x)
print a,'\n'

# 元组列表类型
x = [(1,2,3),(4,5)]
a = np.asarray(x)
print a

[1 2 3] 

[(1, 2, 3) (4, 5)]


### numpy.frombuffer
该函数将缓冲区解释为一维数组。公开缓冲区接口的任何对象都被用作返回一个ndarray的参数
```python
numpy.frombuffer(buffer,dtype=float,count=-1,offset=0)
```
参数具体意义：
<table class="table table-bordered">
<tbody><tr>
<th style="text-align:center;">Sr.No.</th>
<th style="text-align:center;">Parameter &amp; Description</th>
</tr>
<tr>
<td class="ts">1</td>
<td><p><b>buffer</b></p>
<p>Any object that exposes buffer interface</p>
</td>
</tr>
<tr>
<td class="ts">2</td>
<td><p><b>dtype</b></p>
<p>Data type of returned ndarray. Defaults to float</p>
</td>
</tr>
<tr>
<td class="ts">3</td>
<td><p><b>count</b></p>
<p>The number of items to read, default -1 means all data</p>
</td>
</tr>
<tr>
<td class="ts">4</td>
<td><p><b>offset</b></p>
<p>The starting position to read from. Default is 0</p>
</td>
</tr>
</tbody></table>

下面的例子介绍frombuffer函数使用

In [47]:
s = 'Hello World'
a = np.frombuffer(s,dtype='S1')
print a

['H' 'e' 'l' 'l' 'o' ' ' 'W' 'o' 'r' 'l' 'd']


### numpy.fromiter
这个函数从一个可迭代对象构建一个ndarray对象。返回一个新的一维数组
```python
numpy.fromiter(iterable,dtype,count=-1)
```
参数具体意义：
<table class="table table-bordered">
<tbody><tr>
<th style="text-align:center;">Sr.No.</th>
<th style="text-align:center;">Parameter &amp; Description</th>
</tr>
<tr>
<td class="ts">1</td>
<td><p><b>iterable</b></p>
<p>Any iterable object</p>
</td>
</tr>
<tr>
<td class="ts">2</td>
<td><p><b>dtype</b></p>
<p>Data type of resultant array</p>
</td>
</tr>
<tr>
<td class="ts">3</td>
<td><p><b>count</b></p>
<p>The number of items to be read from iterator. Default is -1 which means all data to be read</p>
</td>
</tr>
</tbody></table>

下面的例子展示了怎样使用内置的range()函数返回列表对象。这个列表的迭代器被用来构造一个ndarray对象


In [50]:
# 使用range函数创建列表对象
lst = range(5)
print lst

# 从列表获取迭代对象
it = iter(lst)

# 使用迭代器创建ndarray
x = np.fromiter(it,dtype=float)
print x

[0, 1, 2, 3, 4]
[ 0.  1.  2.  3.  4.]


# 从数值范围创建数组
### numpy.arange
这个函数返回一个包含给定范围内均匀间隔值的ndarray对象。结构如下：
```python
numpy.arange(start,stop,step,dtype)
```
函数参数意义很明显，要注意的有两点：
- 间隔的结束值(stop)通常不被包括在内
- 间隔的开始和结束默认时分别是0和1  

举例如下：

In [59]:
import numpy as np
x = np.arange(5) 
print x

[0 1 2 3 4]


**注意：**  
要将np.arange()与python内置的range()和xrange()函数区分开，虽然功能相同，但是需要创建的数组很大时，在你使用恰当的情况下，numpy的范围函数的高效性就体现出来了

In [62]:
size = int(1E6)

%timeit for x in range(size): x ** 2
# xrange()与range()用法相同，区别是range()返回列表，而xrange()返回生成器
# 在迭代生成大量数字的序列时，后者因为每次只调用返回一个元素，
# 不必一次性占用大量内存空间，所以性能优于前者很多
%timeit for x in xrange(size): x ** 2
    
# 避免使用
%timeit for x in np.arange(size): x ** 2
# 使用下面这种形式，效率大大提升
%timeit np.arange(size) ** 2

1 loop, best of 3: 978 ms per loop
1 loop, best of 3: 963 ms per loop
10 loops, best of 3: 179 ms per loop
100 loops, best of 3: 3.34 ms per loop


In [61]:
# 设置开始和结束参数
x = np.arange(10,20,2)
print x

[10 12 14 16 18]


### numpy.linspace
这个函数与arange()相似。此函数中在start和stop后的第三个参数不表示步长，而是指定间隔之间均匀间隔值的数量。用法如下：
```python
numpy.linspace(start,stop,num,endpoint,restep,dtype)
```
下面给出示例：

In [63]:
x = np.linspace(10,20,5)
print x

[ 10.   12.5  15.   17.5  20. ]


In [64]:
# 设置endpoint为false
x = np.linspace(10,20,5,endpoint=False)
print x

[ 10.  12.  14.  16.  18.]
