<!--BOOK_INFORMATION-->
<img align="left" style="padding-right:10px;" src="figures/PHydro-cover-small.png">
*This is the Jupyter notebook version of the [Python in Hydrology](http://www.greenteapress.com/pythonhydro/pythonhydro.html) by Sat Kumar Tomer.*
*Source code is available at [code.google.com](https://code.google.com/archive/p/python-in-hydrology/source).*

*The book is available under the [GNU Free Documentation License](http://www.gnu.org/copyleft/fdl.html). If you have comments, corrections or suggestions, please send email to satkumartomer@gmail.com.*

<!--NAVIGATION-->
< [Data Types](02.01-Data-Types.ipynb) | [Contents](Index.ipynb) | [Choosing the Name of Variable](02.03-Choosing-the-Name-of-Variable.ipynb) >

## 2.2 数据结构

数据结构能够在其中包含多个数据。Python中有四种内嵌的数据结构：列表(list)、元组(tuple)、字典(dictionary)和集合(set)。除了这些内嵌的数据结构，你可以像`numpy.array`一样用`numpy`定义你自己的数据类型，这是非常有用的。我并不觉得有必要在水文学中使用集合，所以我在这里略过集合，如果你有兴趣，你可以从其它渠道学习。

## 2.2.1 列表

列表是项(值)的序列。其中的项可以属于任何数据类型，并且可以在同一个列表中包含不同的数据类型。

In [1]:
a = ['Ram','Sita','Bangalore','Delhi']
b = [25, 256, 2656, 0]
c = [25,'Bangalore']

列表中的项使用索引访问。变量a和b容纳类似数据类型的项，而c容纳不同数据类型的项。在Python中，索引从0开始。因此，要得到第一和第三项，索引应该是0和2。 

In [2]:
a = ['Ram','Sita','Bangalore','Delhi']

In [4]:
print(a[0])

Ram


In [5]:
print(a[2])

Bangalore


Python中负数索引也是允许的。列表中最后一项的索引是`-1`,类似地，倒数第二项的索引为`-2`等。

In [6]:
a = ['Ram','Sita','Bangalore','Delhi']
print(a[-1])

Delhi


### 2.2.3 字典

在列表中，索引只是整数。字典具有将任何数据类型作为索引的能力。当索引名称等时，字典的这一特性使它非常适合。例如，在水文中，每个站点都有字段站点的名称及其相应的变量。让我们先使用列表检索变量的值，然后使用字典。我们可以使用一个列表来存储站点的名称，用另一个列表存储变量的名称。首先，我们需要查找站点的索引，然后使用这些索引从变量列表中访问变量。

同样，可以使用索引`-2`访问列表中倒数第二项。

In [7]:
a = ['Delhi','Bangalore','Kolkata']
rainfall = [0, 5, 10]
print(rainfall[a.index('Bangalore')])

5


现在，让我们使用字典，

In [8]:
rainfall = {'Delhi':0,'Bangalore':5,'Kolkata':10}
rainfall['Bangalore']

5

同样的事情也可以在一行中使用，但是字典提供了一个整洁的方法来完成这个任务。

### 2.2.3 元组

元组是一些列的值，类似于列表，除了元组是不可变(它们的值不能被修改)外。

In [10]:
foo = 5,15,18
foo[2]

18

In [11]:
foo[1] = 10

TypeError: 'tuple' object does not support item assignment

当尝试修改元组中的项时，Python会出错误。元组在需要指定某些常量，并确保这些变量保持不变时很有用。元组的不可变属性确保在程序执行过程中常量的值不会改变。

只有一个项的元组是通过在之后使用`,`来定义的，例如：

In [12]:
foo = 5
type(foo)

int

In [13]:
foo = 5,
type(foo)

tuple

你可能注意到，如果不使用冒号(,)，Python就不会把它当作元组。

### 2.2.4 Numpy.array

NumericalPython (NumPy)是一个主要用C语言写的库/包，但为Python提供了应用程序接口(API)。该库提供的`numpy.array`数据类型在数组的数值计算中非常有用，这是我们大多数时候最常处理的数据类型。该库并非标准的Python发行版的一部分，因此在使用前，必须先在系统中安装Numpy。我们可以通过下面的命令来检查Numpy是否已安装在我们的系统中。
```
$ python -c'import numpy'
```
如果这个指令没有输出(没有错误)，则表明Numpy已被安装了。如果在系统中Numpy没有被安装，你会看到如下消息(错误)：

```
$ python -c'import numpy'
Traceback (most recent call last):
File "<string>", line 1, in <module>
ImportError: No module named numpy
```

这意味着，在系统中numpy没有被安装。你可以按照1.3节提供的步骤进行安装。`python -c'import numpy' `是一种运行一些简单代码而不调用Python的方法，当你想要做一些小事时，这是非常有用。当你想要检查某些包是否在系统中已被安装也是非常有用的。

在使用任何库之前，应该将其导入到程序中。`import`可以用来导入库。有三种方法从库中导入完整的库或一些函数。通过如下方式导入完整的库：

In [3]:
import numpy
x = [1,2,5,9.0,15] #列表只包含数字(浮点数或整数)
type(x)

list

In [4]:
x = numpy.array(x) #将列表转换为numpy数组
type(x)

numpy.ndarray

我们将完整的`numpy`库导入后，每当我们需要使用该库中的任何函数(例如`array`)时，只需要提供mi函数名和对应的库名即可(例如，`numpy.array`)。数据函数将整数或/和浮点数列表转化为numpy数组。通常程序库名相当长，可以通过以下方式缩写：

In [5]:
import numpy as np
x = np.array(x) #将列表转化为numpy数组
type(x)

numpy.ndarray

如果只需要使用很少的功能，那么可以通过明确定义它们的名称来导入它们：

In [7]:
from numpy import array
x = array(x) #将列表转化为numpy数组
type(x)

numpy.ndarray

如果需要使用所有的函数，并且不想在它们之前使用`numpy`或`np`，那么可以按照以下方式导入：

In [12]:
from numpy import *
x = array(x) #将列表转化为numpy数组
type(x)

numpy.ndarray

`#`之后写的任何东西都是对程序的注释，Python不会执行它们。注释对于提高代码的可读性非常有用。注释也可以占用一整行。一个numpy数组是一个齐次的多维数组。它只能够容纳整数、浮点数、整数和浮点数的组合、复数和字符串。如果在`numpy.ndarray`中指定了整数和浮点数的组合，那么将整数视为浮点数。`numpy.ndarray`的数据类型可以使用其属性`dtype`进行检查：

In [8]:
import numpy as np
x = np.array([1,5,9.0,15]) #可直接定义np.array
x.dtype

dtype('float64')

In [9]:
x = np.array([1,5,9,15]) #该数组只容纳整型
x.dtype

dtype('int32')

In [10]:
x = np.array(['Delhi','Paris']) #该数组只容纳字符串
x.dtype

dtype('<U5')

数组的平均值可以使用`mean`方法来计算，方法如下：

In [11]:
import numpy as np
x = np.array([1,5,9.0,15])
x.mean()

7.5

你注意到调用属性和方法的区别吗？这些方法对对象执行一些操作,通常操作需要一些输入，所以方法用`()`调用。若需要将一些输入传入给方法，则可以在括号内给出。如果没有输入，则直接使用空括号。尝试使用方法(例如,sum)而不提供括号，你将只会看到关于该方法的细节，而没有输出。

由于Python是面向对象编程(OOP)语言，所以属性和方法的使用相当普遍。在直接进入Python之前，最好先对它们有个简要的了解。`Attributes`代表了对象的属性，可以是任何类型，即便是对象的类型也包含它。`methods`代表了对象能做什么。一个属性只能有一个值或一个状态，而一个方法则可以做某些事情或执行一个操作。