数据类型和数据结构
=============================

这是什么类型？
----------------

Python知道不同的数据类型。要查找变量的类型，可以使用`type（）`函数：

In [1]:
a = 45
type(a)

int

In [2]:
b = 'This is a string'
type(b)

str

In [3]:
c = 2 + 1j
type(c)

complex

In [4]:
d = [1, 3, 56]
type(d)

list

数字
-------

##### 更多的信息

- 数字的非正式介绍。 [Python教程，第3.1.1节](http://docs.python.org/tutorial/introduction.html#using-python-as-a-calculator)

- Python库参考：数字类型的正式概述,<http://docs.python.org/library/stdtypes.html#numeric-types-int-float-long-complex>

- Think Python，[第2.1节](http://www.greenteapress.com/thinkpython/html/book003.html)

内置的数字类型是整数和浮点数（请参见[浮点数]（#Floating-Point-numbers））和复数浮点数（[complex number]（#Complex-numbers））。

### 整数

我们已经在[第2章](02-powerful-calculator.ipynb)中看到了整数的使用。注意整数除法问题（[整数除法](02-powerful-calculator.ipynb＃Integer-division)）。

如果需要将包含整数的字符串转换为整数，可以使用`int( )`函数：

In [5]:
a = '34'       # a is a string containing the characters 3 and 4
x = int(a)     # x is in integer number

函数`int()`还将浮点数转换为整数：

In [6]:
int(7.0)

7

In [7]:
int(7.9)

7

注意，`int`将截断浮点数的任何非整数部分。要将浮点数“舍入”为整数，请使用“ round()”函数：

In [8]:
round(7.9)

8

### 整数的极限

Python 3中的整数是无限的。随着数字的增加，Python将自动根据需要分配更多的内存。这意味着我们无需特殊步骤即可计算非常大的数字。

In [9]:
35**42

70934557307860443711736098025989133248003781773149967193603515625

在许多其他编程语言中，例如C和FORTRAN，整数是固定大小的——最常见的是4个字节，允许$2^{32}$个不同的值——但具有多种不同大小的数据类型可用。对于适合这些限制的数字，计算可能会更快，但是您可能需要检查数字是否超出限制。计算超出限制的数字称为*整数溢出*，可能会产生奇怪的结果。

即使在Python中，使用numpy时也需要注意这一点（请参阅[第14章](14-numpy.ipynb)）。 Numpy使用固定大小的整数，因为它会将许多整数存储在一起，并且需要高效地进行计算。 [Numpy数据类型](http://docs.scipy.org/doc/numpy/user/basics.types.html)包括一系列以其大小命名的整数类型，例如int16是一个16位整数，可能的值的个数为$2^{16}$。

整数类型也可以是*signed*或*unsigned*。有符号整数允许使用正或负值，无符号整数仅允许使用正值。例如：

* uint16（无符号）的范围从0到$2^{16}-1$
* int16（带符号）的范围从$-2^{15}$到$2^{15}-1$

### 浮点数

可以使用`float()`命令将包含浮点数的字符串转换为浮点数：

In [10]:
a = '35.342'
b = float(a)
b

35.342

In [11]:
type(b)

float

### 复数

Python（跟Fortran和Matlab类似）具有内置的复数。以下是如何使用复数的例子：

In [12]:
x = 1 + 3j
x

(1+3j)

In [13]:
abs(x)               # 计算绝对值

3.1622776601683795

In [14]:
x.imag

3.0

In [15]:
x.real

1.0

In [16]:
x * x

(-8+6j)

In [17]:
x * x.conjugate()

(10+0j)

In [18]:
3 * x

(3+9j)

请注意，如果您想执行更复杂的操作（例如取平方根等），则必须使用`cmath`模块（Complex MATHematics）：

In [19]:
import cmath
cmath.sqrt(x)

(1.442615274452683+1.0397782600555705j)

### 适用于所有数字类型的函数

函数abs()返回数字的绝对值（也称为模数）：

In [20]:
a = -45.463
abs(a)

45.463

注意，`abs()`也适用于复数（请参见上文）。

序列
---------

字符串、列表和元组是一种*序列*。它们可以用相同的方式*索引*和*切片*。

元组和字符串是“不可变的”（这基本上意味着我们不能更改元组中的单个元素，也不能更改字符串中的单个字符），而列表是“可变的”（*例如*，我们可以更改列表中的元素。）

序列共享以下操作

* `a[i]` 返回`a`的第i个元素
* `a[i：j]` 返回元素i直到j-1
* `len(a)` 按返回元素的个数
* `min（a）` 返回最小值
* `max(a)` 返回最大值
* `x in a` 如果x是a中的元素，则a中的x返回True。
* `a + b` 连接`a`和`b`
* `n * a` 创建序列`a`的`n`个副本

### 序列类型1：字符串

##### 更多的信息

- 字符串简介，[Python教程3.1.2](http://docs.python.org/tutorial/introduction.html#strings)

字符串是（不可变的）字符序列。可以使用单引号定义一个字符串：

In [21]:
a = 'Hello World'

双引号：

In [22]:
a = "Hello World"

或任何一种的三重引号

In [23]:
a = """Hello World"""
a = '''Hello World'''

字符串的类型为`str`，空字符串由`""`给出：

In [24]:
a = "Hello World"
type(a)

str

In [25]:
b = ""
type(b)

str

In [26]:
type("Hello World")

str

In [27]:
type("")

str

字符串中的字符数（即*length*）可以使用`len()`函数获得：

In [28]:
a = "Hello Moon"
len(a)

10

In [29]:
a = 'test'
len(a)

4

In [30]:
len('another test')

12

您可以使用`+`运算符组合（“连接”）两个字符串：

In [31]:
'Hello ' + 'World'

'Hello World'

字符串有许多有用的方法，例如`upper()`以大写形式返回字符串：

In [32]:
a = "This is a test sentence."
a.upper()

'THIS IS A TEST SENTENCE.'

可用的字符串函数列表可以在Python参考文档中找到。如果有Python提示，则应使用`dir`和`help`函数来检索此信息，*例如*`dir()`提供函数列表，`help()`可用于学习关于每一种函数。

一个特别有用的函数是`split()`，它将一个字符串转换为一个字符串列表：

In [33]:
a = "This is a test sentence."
a.split()

['This', 'is', 'a', 'test', 'sentence.']

`split()`函数将在找到*空格*的地方将字符串进行分隔。空格可以是打印成空格的任何字符，例如一个空格、多个空格或一个制表符。

通过将分隔符作为参数传递给`split()`函数，把字符串分成不同的部分。例如，假设我们要获取每一个完整句子的列表：

In [34]:
a = "The dog is hungry. The cat is bored. The snake is awake."
a.split(".")

['The dog is hungry', ' The cat is bored', ' The snake is awake', '']

与`split`相反的字符串函数是`join`，可以按下面这种方法使用：

In [35]:
a = "The dog is hungry. The cat is bored. The snake is awake."
s = a.split('.')
s

['The dog is hungry', ' The cat is bored', ' The snake is awake', '']

In [36]:
".".join(s)

'The dog is hungry. The cat is bored. The snake is awake.'

In [37]:
" STOP".join(s)

'The dog is hungry STOP The cat is bored STOP The snake is awake STOP'

### 序列类型2：列表

##### 更多的信息

- 列表简介，[Python教程，第3.1.4节](http://docs.python.org/tutorial/introduction.html#lists)

列表是一个对象序列。对象可以是任何类型，例如整数：

In [38]:
a = [34, 12, 54]

或者字符串：

In [39]:
a = ['dog', 'cat', 'mouse']

一个空列表由`[]`表示：

In [40]:
a = []

类型是`list`：

In [41]:
type(a)

list

In [42]:
type([])

list

与字符串一样，可以使用len()函数获得列表中元素的个数：

In [43]:
a = ['dog', 'cat', 'mouse']
len(a)

3

也可以在同一列表中*混合*不同类型：

In [44]:
a = [123, 'duck', -42, 17, 0, 'elephant']

在Python中，列表是一个对象，因此列表可能包含其他列表（因为列表保留了对象序列）：

In [45]:
a = [1, 4, 56, [5, 3, 1], 300, 400]

您可以使用“ +”运算符组合（“连接”）两个列表：

In [46]:
[3, 4, 5] + [34, 35, 100]

[3, 4, 5, 34, 35, 100]

或者，您可以使用`append()`函数将一个对象添加到列表的末尾：

In [47]:
a = [34, 56, 23]
a.append(42)
a

[34, 56, 23, 42]

您可以把一个对象作为参数传递给`remove()`函数，通过`remove()`函数把列表中的这个对象删除。
例如：

In [48]:
a = [34, 56, 23, 42]
a.remove(56)
a

[34, 23, 42]

#### range()函数

有一种特殊的列表是经常被使用的（通常与`for-loops`一起使用），因此存在一个用于生成该列表的函数：`range(n)`命令生成从0开始一直到n的整数序列*但不是包括n* 。这里有一些例子：

In [49]:
list(range(3))

[0, 1, 2]

In [50]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

这个函数通常与for循环一起使用。例如，要打印数字0<sup>2</sup>,1<sup>2</sup>,2<sup>2</sup>,3<sup>2</sup>,…,10<sup>2</sup>，可以使用以下程序：

In [51]:
for i in range(11):
    print(i ** 2)

0
1
4
9
16
25
36
49
64
81
100


range命令对于整数序列的产生采用采选参数的方法，序列的开头（开始）采用一个可选参数，对于步长采用另一可选参数。这通常写为`range（[start]，stop，[step]）`，其中方括号（start和step）中的参数是可选的。这里有几个例子：

In [52]:
list(range(3, 10))            # start=3

[3, 4, 5, 6, 7, 8, 9]

In [53]:
list(range(3, 10, 2))         # start=3, step=2

[3, 5, 7, 9]

In [54]:
list(range(10, 0, -1))        # start=10,step=-1

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]

我们为什么需要调用函数`list(range())`？

在Python 3中，`range()`根据需要生成数字。当在for循环中使用`range()`时，这样做会更有效，因为它不会占用数字列表来占用内存。将其传递给list()会强制其生成所有数字，因此我们可以看到它的作用。

为了在Python 2中获得相同的有效行为，请使用`xrange()`而不是`range()`。

### 序列类型3：元组

*元组*是一种（不可变的）序列对象。元组的行为与列表非常相似，但它们不能被修改（即是不可变的）。

例如，序列中的对象可以是任何类型：

In [55]:
a = (12, 13, 'dog')
a

(12, 13, 'dog')

In [56]:
a[0]

12

定义一个元组不是一定需要圆括号的：仅用逗号分隔的一系列对象就足以定义一个元组：

In [57]:
a = 100, 200, 'duck'
a

(100, 200, 'duck')

尽管在实际的使用中，最好使用圆括号来定义元组，因为这样可以清楚的表明这是一个元组的定义。

元组也可以用于对两个变量进行赋值：

In [58]:
x, y = 10, 20
x

10

In [59]:
y

20

这种用法可以用于在一行代码内*交换*两个不同的对象，例如

In [60]:
x = 1
y = 2
x, y = y, x
x

2

In [61]:
y

1

空元组由`()`给出

In [62]:
t = ()
len(t)

0

In [63]:
type(t)

tuple

对于只包含一个值的元组，一开始看起来可能有些奇怪：

In [64]:
t = (42,)
type(t)

tuple

In [65]:
len(t)

1

额外的逗号是用来区分（42，）与（42），在后一种情况下，括号将被理解为定义运算符优先级：（42）简化为`42`，这只是一个数字：

In [66]:
t = (42)
type(t)

int

这个例子表明了元组的不变性：

In [67]:
a = (12, 13, 'dog')
a[0]

12

In [68]:
# NBVAL_RAISES_EXCEPTION
a[0] = 1

TypeError: 'tuple' object does not support item assignment

不变性是元组和列表（后者是可变的）之间的主要区别。当我们不想更改内容时，应使用元组。

请注意，返回多个值的Python函数以元组返回这些值（这很有意义，因为您不希望更改这些值）。

### 索引序列

##### 更多信息

-在[Python教程，第3.1.2节](http://docs.python.org/tutorial/introduction.html#strings)中介绍了字符串和索引，相关部分在引入字符串之后开始。

可以使用对象的索引和方括号（`[`和`]`）访问列表中的各个对象：

In [69]:
a = ['dog', 'cat', 'mouse']
a[0]

'dog'

In [70]:
a[1]

'cat'

In [71]:
a[2]

'mouse'

请注意Python从零开始计算索引（与C类似，但与Fortran和Matlab不同）！

Python提供了一个方便的快捷方式来检索列表中的最后一个元素：使用索引“ -1”，其中的减号表示它是列表的从后面往前计算的元素。同样，索引“ -2”将返回倒数第二个元素：

In [72]:
a = ['dog', 'cat', 'mouse']
a[-1]

'mouse'

In [73]:
a[-2]

'cat'

如果您愿意，可以将索引`a [-1]`当作`a[len(a) - 1]`的简写。

请记住字符串（如列表）也是序列类型，可以用相同的方式索引：

In [74]:
a = "Hello World!" 
a[0]

'H'

In [75]:
a[1]

'e'

In [76]:
a[10]

'd'

In [77]:
a[-1]

'!'

In [78]:
a[-2]

'd'

### 切片顺序

##### 更多信息

- [Python教程，第3.1.2节](http://docs.python.org/tutorial/introduction.html#strings)可以找到字符串，索引和切片的简介

序列中的*切片*可用于检索多个元素。例如：

In [79]:
a = "Hello World!"
a[0:3]

'Hel'

通过编写`a[0:3]`，我们请求从元素0开始的前三个元素。类似地：

In [80]:
a[1:4]

'ell'

In [81]:
a[0:2]

'He'

In [82]:
a[0:6]

'Hello '

我们可以使用负索引来引用序列的结尾：

In [83]:
a[0:-1]

'Hello World'

也可以省略开始或结束索引，这将返回从第一个元素开始的所有元素或者直到序列结束为止的所有元素。这里有一些例子可以使这一点更加清楚：

In [84]:
a = "Hello World!"
a[:5]

'Hello'

In [85]:
a[5:]

' World!'

In [86]:
a[-2:]

'd!'

In [87]:
a[:]

'Hello World!'

请注意，`a[:]`将生成`a`的一份*复制*。某些经验丰富的人在切片中使用索引是非常直观的。如果您对切片感到不舒服，请查看[Python教程（第3.1.2节）]（http://docs.python.org/tutorial/introduction.html#strings）中的引文：

> 记住切片工作原理的最佳方法是将索引视为指向字符之间，第一个字符的左边缘编号为0。然后，由5个字符组成的字符串的最后一个字符的右侧边缘具有索引5，对于例：
>
>      +---+---+---+---+---+ 
>      | H | e | l | l | o |
>      +---+---+---+---+---+ 
>      0   1   2   3   4   5   <-- 用于切片
>     -5  -4  -3  -2  -1       <-- 用于从结束开始的切片 
>
> 第一行数字给出切片索引0 ... 5在字符串中的位置；第二行给出相应的负索引。从i到j的切片由分别标记为i和j的边之间的所有字符组成。

因此重要的声明是，对于*切片*，我们应该考虑指向字符之间的索引。

对于*索引*，最好考虑引用字符的索引。这是一个总结这些规则的小图：

       0   1   2   3   4    <-- 用于索引 
      -5  -4  -3  -2  -1    <-- 用于从结束开始计算的索引 
     +---+---+---+---+---+          
     | H | e | l | l | o |
     +---+---+---+---+---+ 
     0   1   2   3   4   5  <-- 用于切片
    -5  -4  -3  -2  -1      <-- 用于从结束开始的切片 
                             

如果您不确定正确的索引是什么，那么在编写程序之前或同时，在Python提示符下尝试一个小的示例来测试事物始终是一种比较好的技巧。

### 字典

字典也称为“关联数组”和“哈希表”。字典是一种*键值对*的*无序*组。

可以使用大括号创建一个空字典：

In [88]:
d = {}

关键字-值对可以这样添加：

In [89]:
d['today'] = '22 deg C'    # 'today' is the keyword

In [90]:
d['yesterday'] = '19 deg C'

d.keys()返回所有键的列表：

In [91]:
d.keys()

dict_keys(['today', 'yesterday'])

我们可以通过使用关键字作为索引来检索值：

In [92]:
d['today']

'22 deg C'

如果在创建字典时已经知道数据的大小，则填充字典的其他方法是：

In [93]:
d2 = {2:4, 3:9, 4:16, 5:25}
d2

{2: 4, 3: 9, 4: 16, 5: 25}

In [94]:
d3 = dict(a=1, b=2, c=3)
d3

{'a': 1, 'b': 2, 'c': 3}

函数`dict()`创建一个空字典。

其他有用的字典方法包括`values()`、`items()`和`get()`。您可以使用`in`来检查值的存在。

In [95]:
d.values()

dict_values(['22 deg C', '19 deg C'])

In [96]:
d.items()

dict_items([('today', '22 deg C'), ('yesterday', '19 deg C')])

In [97]:
d.get('today','unknown')

'22 deg C'

In [98]:
d.get('tomorrow','unknown')

'unknown'

In [99]:
'today' in d

True

In [100]:
'tomorrow' in d

False

如果该键存在，则方法`get(key,default)`将提供给定`key`的值，否则将返回`default`对象。

这是一个更复杂的示例：

In [101]:
# NBVAL_IGNORE_OUTPUT
order = {}        # 创建一个空字典

#按照客人到来的顺序添加订单
order['Peter'] = 'Pint of bitter'
order['Paul'] = 'Half pint of Hoegarden'
order['Mary'] = 'Gin Tonic'

#在酒吧下达订单
for person in order.keys():
    print(person, "requests", order[person])

Peter requests Pint of bitter
Paul requests Half pint of Hoegarden
Mary requests Gin Tonic


更多的技术：

- 关键字可以是任何（不可变的）Python对象。这包括：

    - 数字

    - 字符串

    - 元组。

- 字典在检索值时非常快（在提供键的情况下）

另一个示例展示了使用字典胜过列表对的优势：

In [102]:
# NBVAL_IGNORE_OUTPUT
dic = {}                        #创建空字典

dic["Hans"]   = "room 1033"     #填写字典
dic["Andy C"] = "room 1031"     #"Andy C" 是一个键
dic["Ken"]    = "room 1027"     #"room 1027" 是一个值

for key in dic.keys():
    print(key, "works in", dic[key])

Hans works in room 1033
Andy C works in room 1031
Ken works in room 1027


不使用字典：

In [103]:
people = ["Hans","Andy C","Ken"]
rooms  = ["room 1033","room 1031","room 1027"]

#由于我们有两个列表，在这里列表的长度可能会不一致
if not len( people ) == len( rooms ):
    raise RuntimeError("people and rooms differ in length")

for i in range( len( rooms ) ):
    print(people[i],"works in",rooms[i])

Hans works in room 1033
Andy C works in room 1031
Ken works in room 1027


将参数传递给函数
------------------------------

本节包含一些更高级的想法，并使用了仅在本文后面介绍的概念。该部分在以后的阶段可能更容易理解。

当对象传递给函数时，Python始终将对对象的引用（值）传递给函数。实际上，这是通过引用调用函数，尽管可以将其称为通过（引用的）值调用。

在更详细地讨论Python的情况之前，我们将回顾按值和引用传递的参数。

### 按值调用

可能有人希望，如果我们按值将对象传递给函数，则在函数内部对该值的修改将不会影响该对象（因为我们不传递对象本身，而只传递其值（即副本））。这是此行为的示例（在C中）：

```c
#include <stdio.h>

void pass_by_value(int m) {
  printf("in pass_by_value: received m=%d\n",m);
  m=42;
  printf("in pass_by_value: changed to m=%d\n",m);
}

int main(void) {
  int global_m = 1;
  printf("global_m=%d\n",global_m);
  pass_by_value(global_m);
  printf("global_m=%d\n",global_m);
  return 0;
}
```

连同相应的输出：

    global_m=1
    in pass_by_value: received m=1
    in pass_by_value: changed to m=42
    global_m=1


当函数`pass_by_value`将其输入参数更改为`42`时，不会修改全局变量`global_m`的值`1`。

### 通过引用调用函数

另一方面，通过引用调用函数意味着赋予该函数的对象是对该对象的引用。这意味着该函数将看到与调用代码中相同的对象（因为它们引用的是同一对象：我们可以将引用视为指向该对象所在的内存位置的指针）。作用在函数内部对象上的任何更改都将在调用级别在对象中可见（因为该函数实际上是在同一个对象上操作，而不是对它的副本操作）。

这是一个使用C语言中的指针显示此示例：

```c
#include <stdio.h>

void pass_by_reference(int *m) {
  printf("in pass_by_reference: received m=%d\n",*m);
  *m=42;
  printf("in pass_by_reference: changed to m=%d\n",*m);
}

int main(void) {
  int global_m = 1;
  printf("global_m=%d\n",global_m);
  pass_by_reference(&global_m);
  printf("global_m=%d\n",global_m);
  return 0;
}
```

连同相应的输出：

    global_m=1
    in pass_by_reference: received m=1
    in pass_by_reference: changed to m=42
    global_m=42

C++通过在函数定义的参数名称前面添加“＆”号来提供将参数作为引用传递的功能：

```cpp
#include <stdio.h>

void pass_by_reference(int &m) {
  printf("in pass_by_reference: received m=%d\n",m);
  m=42;
  printf("in pass_by_reference: changed to m=%d\n",m);
}

int main(void) {
  int global_m = 1;
  printf("global_m=%d\n",global_m);
  pass_by_reference(global_m);
  printf("global_m=%d\n",global_m);
  return 0;
}
```

连同相应的输出：

    global_m=1
    in pass_by_reference: received m=1
    in pass_by_reference: changed to m=42
    global_m=42

### Python中参数传递

在Python中，对象作为对对象的引用（可以认为是一个指针）的值传递。根据引用在函数中的使用方式以及引用的对象的类型，这可能导致不同的传递引用行为（其中，作为函数参数接收的对象的任何更改都将立即反映在调用级别中）。

这里是三个例子来讨论这一点。我们首先将一个列表传递给一个函数，该列表对序列中的所有元素进行迭代，并使每个元素的值加倍：

In [1]:
def double_the_values(l):
    print("in double_the_values: l = %s" % l)
    for i in range(len(l)):
        l[i] = l[i] * 2
    print("in double_the_values: changed l to l = %s" % l)

l_global = [0, 1, 2, 3, 10]
print("In main: s=%s" % l_global)
double_the_values(l_global)
print("In main: s=%s" % l_global)

In main: s=[0, 1, 2, 3, 10]
in double_the_values: l = [0, 1, 2, 3, 10]
in double_the_values: changed l to l = [0, 2, 4, 6, 20]
In main: s=[0, 2, 4, 6, 20]


变量`l`是对列表对象的引用。行`l[i] = l[i] * 2`首先计算右侧，并读取索引为`i`的元素，然后将其乘以2。然后对该新对象的引用存储在列表对象`l`中索引为`i`的位置。因此，我们修改了通过`l`引用的列表对象。

对列表对象的引用永远不会改变：行`l[i] = l[i]* 2`会更改列表`l`的元素`l[i]`，但不会更改引用`l`为列表。因此，函数和调用级别都分别通过引用`l`和`global_l`在同一对象上进行操作。

相反，这是一个示例，其中不修改函数内列表的元素：产生以下输出：

In [105]:
def double_the_list(l):
    print("in double_the_list: l = %s" % l)
    l = l + l
    print("in double_the_list: changed l to l = %s" % l)

l_global = "Hello"
print("In main: l=%s" % l_global)
double_the_list(l_global)
print("In main: l=%s" % l_global)

In main: l=Hello
in double_the_list: l = Hello
in double_the_list: changed l to l = HelloHello
In main: l=Hello


这里究竟发生了什么呢？在评估`l = l + l`的过程中，创建了一个新的对象，其中包含`l + l`，然后将名称`l`绑定到该对象。在此过程中，我们将丢失对赋予该功能的列表对象`l`的引用（因此，我们不会更改赋予该功能的列表对象）。

最后，让我们看看产生此输出的是：

In [106]:
def double_the_value(l):
    print("in double_the_value: l = %s" % l)
    l = 2 * l
    print("in double_the_values: changed l to l = %s" % l)

l_global = 42
print("In main: s=%s" % l_global)
double_the_value(l_global)
print("In main: s=%s" % l_global)

In main: s=42
in double_the_value: l = 42
in double_the_values: changed l to l = 84
In main: s=42


在此示例中，我们还将函数中的值加倍（从42到84）。但是，当我们将对象84绑定到python名称`l`（即行`l = l * 2`）时，我们创建了一个新对象（84），并将新对象绑定到`l`。在此过程中，我们会丢失对函数中对象42的引用。这不影响对象42本身，也不影响对象的引用`l_global`。

总而言之，Python将参数传递给函数的行为似乎有所不同（如果我们从按值传递与按引用传递的角度来看）。但是，它总是按值调用，其中值是对所讨论对象的引用，并且可以在每种情况下通过相同的推理来解释其行为。

### 对性能考虑

按值调用函数调用要求在将值传递给函数之前先对其进行复制。从性能角度（执行时间和内存要求）来看，如果该值很大，那么这可能是一个昂贵的过程。 （想象一下，该值是一个`numpy.array`对象，其大小可能为几兆字节或几千兆字节。）

人们通常更喜欢通过引用来调用大型数据对象，因为在这种情况下，仅传递指向数据对象的指针，而与对象的实际大小无关，因此通常比按值调用要快。

因此，Python的（有效）通过引用进行调用的方法非常有效。但是，我们需要注意，我们的函数不要在不需要的地方修改它们给出的数据。

### 数据的无意修改

通常，函数不应修改作为输入的数据。

例如，以下代码演示了确定列表最大值的尝试，并且 – 在无意间 – 修改了过程中的列表：

In [107]:
def mymax(s):  # demonstrating side effect
    if len(s) == 0:
        raise ValueError('mymax() arg is an empty sequence')
    elif len(s) == 1:
        return s[0]
    else:
        for i in range(1, len(s)):
            if s[i] < s[i - 1]:
                s[i] = s[i - 1]
        return s[len(s) - 1]

s = [-45, 3, 6, 2, -1]
print("in main before caling mymax(s): s=%s" % s)
print("mymax(s)=%s" % mymax(s))
print("in main after calling mymax(s): s=%s" % s)

in main before caling mymax(s): s=[-45, 3, 6, 2, -1]
mymax(s)=6
in main after calling mymax(s): s=[-45, 3, 6, 6, 6]


`mymax()`函数的用户不会期望函数执行时修改输入参数。我们通常应该避免这种情况。有几种方法可以找到针对给定问题的更好的解决方案：

- 在这种情况下，我们可以使用Python内置函数`max()`来获取序列的最大值。

- 如果我们觉得需要坚持在列表\[实际上这不是必须的\]中存储临时值，则可以先创建传入列表`s`的副本，然后继续执行算法（请参见[下面](#复制-对象)）。

- 使用另一种算法，该算法使用额外的临时变量，而不是为此滥用列表。例如：

- 我们可以将一个元组（而不是一个列表）传递给该函数：一个元组是*不变的*，因此永远不能被修改（这将导致在函数尝试向其中的元素写入内容时引发异常。）。

### 复制对象

Python提供了`id()`函数，该函数返回每个对象唯一的整数。（在当前的CPython实现中，这是内存地址。）我们可以使用它来识别两个对象是否相同。

要复制序列对象（包括列表），我们可以对其进行切片，*例如*如果a是列表，则`a[]`将返回a的副本。这是一个示范：

In [108]:
a = list(range(10))
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [109]:
b = a
b[0] = 42
a              # changing b changes a

[42, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [110]:
# NBVAL_IGNORE_OUTPUT
id(a)

2221553095560

In [111]:
# NBVAL_IGNORE_OUTPUT
id(b)

2221553095560

In [112]:
# NBVAL_IGNORE_OUTPUT
c = a[:] 
id(c)          # c is a different object

2221553065352

In [113]:
c[0] = 100       
a              # changing c does not affect a

[42, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Python的标准库提供了`复制`模块，该模块提供了可用于创建对象副本的复制功能。我们本可以使用`import copy; c = copy.deepcopy（a）替代`c = a [:]`。

平等与同一性
------------------------------

一个相关的问题涉及对象的相等性。

### 平等

运算符`<`、 `>`、`==`、`>=`、`<=`以及`!=`比较两个对象的*数值*。这些对象不必具有相同的类型。例如：

In [114]:
a = 1.0; b = 1
type(a)

float

In [115]:
type(b)

int

In [116]:
a == b

True

因此，`==`运算符检查两个对象的值是否相等。

### 身份/相同性

要查看两个对象a和b是否相同（即`a`和`b`是指向内存中相同位置的引用），我们可以使用`is`运算符（上例继续）：

In [117]:
a is b

False

当然，它们在这里是不同的，因为它们不是同一类型。

我们还可以询问`id`函数，该函数根据Python 2.7中的文档字符串“ *返回对象的身份”。这可以保证在同时存在的对象之间是唯一的。 （提示：这是对象的内存地址。）*”

In [118]:
# NBVAL_IGNORE_OUTPUT
id(a)

2221553122320

In [119]:
# NBVAL_IGNORE_OUTPUT
id(b)

140732614418832

这表明` a`和`b`分别存储在内存中的不同位置。

### 示例：等价与特征

我们以一个涉及列表的示例结束：

In [120]:
x = [0, 1, 2]
y = x
x == y

True

In [121]:
x is y

True

In [122]:
# NBVAL_IGNORE_OUTPUT
id(x)

2221553705224

In [123]:
# NBVAL_IGNORE_OUTPUT
id(y)

2221553705224

这里，`x`和`y`是对同一块内存的引用，因此它们是相同的，`is`运算符对此进行了确认。要记住的重要一点是，第2行（`y = x`）创建了一个新的引用`y`，该引用与`x`所引用的列表对象相同。

因此，我们可以更改`x`的元素，并且`y`将同时更改，因为`x`和`y`都引用同一个对象：

In [124]:
x

[0, 1, 2]

In [125]:
y

[0, 1, 2]

In [126]:
x is y

True

In [127]:
x[0] = 100
y

[100, 1, 2]

In [128]:
x

[100, 1, 2]

相反，如果我们使用`z=x [:]`（而不是`z=x`）来创建新名称`z`，则切片操作`x[:]`实际上会创建列表的副本`x`，新的参考`z`指向副本。 `x`和`z`的*value*相等，但是`x`和`z`不是同一对象（它们是不相同的）：

In [129]:
x

[100, 1, 2]

In [130]:
z = x[:]            # create copy of x before assigning to z
z == x              # same value

True

In [131]:
z is x              # are not the same object

False

In [132]:
# NBVAL_IGNORE_OUTPUT
id(z)               # confirm by looking at ids

2221553735816

In [133]:
# NBVAL_IGNORE_OUTPUT
id(x)

2221553705224

In [134]:
x

[100, 1, 2]

In [135]:
z

[100, 1, 2]

因此，我们可以更改`x`而不更改`z`，例如（续）

In [136]:
x[0] = 42
x

[42, 1, 2]

In [137]:
z

[100, 1, 2]