## CH1 IPython: 超越Python

### 1.1　shell还是Notebook

1. 你可以在命令行中输入`ipython` 启动IPython 解释器(shell)

2. 在你系统的命令行中输入`jupyter notebook`启动Jupyter Notebook

### 1.2　IPython的帮助和文档

#### 1.2.1　用符号?获取文档

每一个Python 对象都有一个字符串的引用，该字符串即docstring。大多数情况下，该字符串包含对象的简要介绍和使用方法。Python 内置的help() 函数可以获取这些信息，并且能打印输出结果。

In [1]:
help(len)

Help on built-in function len in module builtins:

len(obj, /)
    Return the number of items in a container.



IPython 引入了? 符号作为获取这个文档和其他相关信息的缩写：

In [2]:
len?

这种表示方式几乎适用于一切，包括对象方法：

In [None]:
L = [1, 2, 3]
L.insert?

甚至对于对象本身以及相关类型的文档也适用：

In [None]:
L?

这种方法也适用于你自己创建的函数或者其他对象！下面定义一个带有docstring 的小函数：

In [1]:
def square(a):
    """Return the square of a."""
    return a ** 2

In [None]:
square?

#### 1.2.2　通过符号??获取源代码

由于Python 非常易读，所以你可以通过阅读你感兴趣的对象的源代码得到更高层次的理解。
<br>IPython 提供了获取源代码的快捷方式（使用两个问号??）：

In [None]:
square??

如果你经常使用?? 后缀，就会发现它有时不能显示源代码。这是因为你查询的对象并不是用Python 实现的，而是用C 语言或其他编译扩展语言实现的。
<br>在这种情况下，?? 后缀将等同于? 后缀。

你将会在很多Python 内置对象和类型中发现这样的情况，例如上面示例中提到的len 函数：

In [None]:
len??

#### 1.2.3　用Tab补全的方式探索模块

##### 1. 对象内容的Tab自动补全

尽管Python 没有严格区分公共/ 外部属性和私有/ 内部属性，但是按照惯例，前面带有下划线表示私有属性或方法。为了清楚起见，这个列表中默认省略了这些私有方法和特殊方法。大部分是Python 特殊的双下划线方法（昵称叫作“dunder 方法”）。
<br>不过，你可以通过明确地输入一条下划线来把这些私有的属性或方法列出来：

In [None]:
L._<TAB>

##### 2. 导入时的Tab自动补全

Tab 自动补全在从包中导入对象时也非常有用。下面用这种方法来查找itertools 包中以co 开头的所有可导入的对象：

In [None]:
from itertools import co<TAB>

同样，你也可以用Tab 自动补全来查看你系统中所有可导入的包（这将因你的Python 会话中有哪些第三方脚本和模块可见而不同）：

In [None]:
import <TAB>
import h<TAB>

##### 3. 超越Tab自动补全：通配符匹配

当你想匹配中间或者末尾的几个字符时,IPython提供了用* 符号来实现的通配符匹配方法。

可以用它列举出命名空间中以Warning 结尾的所有对象：

In [None]:
*Warning?

注意，这里的* 符号匹配任意字符串，包括空字符串

假设我们在寻找一个字符串方法，它的名称中包含find，则可以这样做：

In [None]:
str.*find*?

### 1.3　IPython shell中的快捷键

### 1.4　IPython魔法命令

本节将介绍一些IPython 在普通Python 语法基础之上的增强功能。这些功能被称作IPython 魔法命令，并且都以% 符号作为前缀。这些魔法命令设计用于简洁地解决标准数据分析中的各种常见问题。
<br>魔法命令有两种形式：**行魔法（line magic）**和**单元魔法（cell magic）**。
<br>行魔法以单个`%`字符作为前缀，作用于单行输入；
<br>单元魔法以两个`%%`作为前缀，作用于多行输入。
<br>下面将展示和讨论一些简单的例子，本章后面会更详细地讨论一些有用的魔法命令。

#### 1.4.1　粘贴代码块：%paste和%cpaste

当你使用IPython 解释器时，有件事经常让你头疼，那就是粘贴多行代码块可能会导致不可预料的错误，尤其是其中包含缩进和解释符号时。
<br>一个常见的情况是，你在一个网站中找到了一些示例代码，并想将它们粘贴到你的解释器中，例如下面这个简单函数：
```python
>>> def donothing(x):
... return x
```
虽然这些代码和Python 解释器中的显示是一样的，但是如果你将它直接复制并粘贴到IPython 中，就会出现错误。

IPython 的`%paste` 魔法函数可以解决这个包含符号的多行输入问题：

In [None]:
%paste
>>> def donothing(x):
... return x
## -- End pasted text --

`%paste` 命令同时输入并执行该代码

另外一个作用类似的命令是`%cpaste`。该命令打开一个交互式多行输入提示，你可以在这个提示下粘贴并执行一个或多个代码块：

In [None]:
%cpaste
Pasting code; enter '--' alone on the line to stop or use Ctrl-D.
:>>> def donothing(x):
:... return x
:--

#### 1.4.2　执行外部代码：%run

假设你创建了一个myscript.py 文件，该文件包含以下内容：
```python
#-------------------------------------
# file: myscript.py
def square(x):
"""求平方"""
return x ** 2
for N in range(1, 4):
print(N, "squared is", square(N))
```
你可以在像下面这样在IPython 会话中运行该程序：

In [None]:
%run myscript.py

注意，当你运行了这段代码之后，该代码中包含的所有函数都可以在IPython 会话中
使用

IPython 提供了几种方式来调整代码如何执行。你可以在IPython 解释器中输入%run? 查看
帮助文档。

#### 1.4.3　计算代码运行时间：%timeit

In [2]:
%timeit L = [n ** 2 for n in range(1000)]

718 µs ± 28.2 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


`%timeit` 的好处是，它会自动多次执行简短的命令，以获得更稳定的结果。

对于多行语句，可以加入第二个% 符号将其转变成单元魔法，以处理多行输入。

例如，下面是for 循环的同等结构：

In [3]:
%%timeit
L = []
for n in range(1000):
    L.append(n ** 2)

756 µs ± 7.23 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


#### 1.4.4　魔法函数的帮助：?、%magic和%lsmagic

和普通的Python 函数一样，IPython 魔法函数也有文档字符串，并且可以通过标准的方式获取这些有用的文档注释。

In [None]:
%timeit?

为了获得可用魔法函数的通用描述以及一些示例，可以输入以下命令：

In [None]:
%magic

为了快速而简单地获得所有可用魔法函数的列表，可以输入以下命令：

In [None]:
%lsmagic

更直接的方式是按照你的意愿定义你自己的魔法函数

### 1.5　输入和输出历史

我们在前面看到，IPython shell 允许用上下方向键或Ctrl + p / Ctrl + n 快捷键获取历史命令。
<br>另外，IPython 在shell 和Notebook 中都提供了几种获取历史命令的输出方式，以及这些命令本身的字符串形式。

#### 1.5.1　IPython的输入和输出对象

目前为止，我想你应该特别熟悉IPython 用到的`In[1]:/Out[1]:` 形式的提示了。但实际上，它们并不仅仅是好看的装饰形式，还给出了在当前会话中如何获取输入和输出历史的线索。

假设你用以下形式启动了一个会话：

In [4]:
import math

In [5]:
math.sin(2)

0.9092974268256817

In [6]:
math.cos(2)

-0.4161468365471424

我们导入了一个内置的math 程序包，然后计算2 的正弦函数值和余弦函数值。
<br>这些输入和输出在shell 中带有In/Out 标签，但是不仅如此——IPython 实际上创建了叫作In 和Out的Python 变量，这些变量自动更新以反映命令历史：

In [7]:
print(In)

['', 'def square(a):\n    """Return the square of a."""\n    return a ** 2', "get_ipython().run_line_magic('timeit', 'L = [n ** 2 for n in range(1000)]')", "get_ipython().run_cell_magic('timeit', '', 'L = []\\nfor n in range(1000):\\n    L.append(n ** 2)')", 'import math', 'math.sin(2)', 'math.cos(2)', 'print(In)']


In [8]:
Out

{5: 0.9092974268256817, 6: -0.4161468365471424}

In 对象是一个列表，按照顺序记录所有的命令（列表中的第一项是一个占位符，以便In[1] 可以表示第一条命令）：

In [9]:
print(In[1])

def square(a):
    """Return the square of a."""
    return a ** 2


Out 对象不是一个列表，而是一个字典。它将输入数字映射到相应的输出（如果有的话）：

In [10]:
print(Out[2])

KeyError: 2

请注意，不是所有操作都有输出，例如import 语句和print 语句就不影响输出。
<br>但是仔细想想，print 是一个函数，它的返回值是None，这样就能说通了。总的来说，任何返回值是None 的命令都不会加到Out 变量中。

如果想利用之前的结果，理解以上内容将大有用处。
<br>例如，利用之前的计算结果检查sin(2) ** 2 和cos(2) ** 2 的和，结果如下：

In [None]:
Out[2] ** 2 + Out[3] ** 2

如果你执行一个非常复杂的计算并且希望重复利用运算结果，那么该方法就会非常有用。

#### 1.5.2　下划线快捷键和以前的输出

标准的Python shell 仅仅包括一个用于获取以前的输出的简单快捷键。
<br>变量_（单下划线）用于更新以前的输出，而这种方式在IPython 中也适用：

In [11]:
print(_)

-0.4161468365471424


但是IPython 更进了一步——你可以用两条下划线获得倒数第二个历史输出，用三条下划线获得倒数第三个历史输出（跳过任何没有输出的命令）：

In [12]:
print(__)

0.9092974268256817


In [13]:
print(___)




IPython 的这一功能就此停止：超过三条下划线开始变得比较难计数，并且在这种情况下通过行号来指定输出更方便。

另外一个快捷键——Out[X] 的简写形式是_X（即一条下划线加行号）：

In [18]:
Out[5]

0.9092974268256817

In [19]:
_5

0.9092974268256817

#### 1.5.3　禁止输出

有时你可能希望禁止一条语句的输出（在第4 章将介绍的画图命令中最常见）。或者你执行的命令生成了一个你并不希望存储到输出历史中的结果，这样当其他引用被删除时，该空间可以被释放。要禁止一个命令的输出，最简单的方式就是在行末尾处添加一个分号：

In [None]:
In [14]: math.sin(2) + math.cos(2);

注意，这个结果被默默地计算了，并且输出结果既不会显示在屏幕上，也不会存储在Out 路径下：

In [None]:
In [15]: 14 in Out
Out[15]: False

#### 1.5.4　相关的魔法命令

如果想一次性获取此前所有的输入历史，%history 魔法命令会非常有用。
<br>在下面的示例中可以看到如何打印前4 条输入命令：

In [None]:
%history -n 1-4

1: import math
2: math.sin(2)
3: math.cos(2)
4: print(In)

按照惯例，可以输`入%history`? 来查看更多相关信息以及可用选项的详细描述。其他类似的魔法命令还有`%rerun`（该命令将重新执行部分历史命令）和`%save`（该命令将部分历史命令保存到一个文件中）。如果想获取更多相关信息，建议你使用? 帮助功能（详情请参见1.2 节）。

### 1.6　IPython和shell命令

如果不熟悉shell 命令，建议你查看Software Carpentry Foundation的shell 教程（http://swcarpentry.github.io/shell-novice/ ）。

#### 1.6.1　shell快速入门

在这个例子中，仅仅通过几个简单的命令（pwd、ls、cd、mkdir 和cp）就可以完成大多数常见的文件操作。当你执行一些高级任务时，shell 方法将变得非常有用。

```shell
osx:~ $ echo "hello world" # echo类似于Python的打印函数
hello world
osx:~ $ pwd # pwd=打印工作路径
/home/jake # 这就是我们所在的路径
osx:~ $ ls # ls=列出当前路径的内容
notebooks projects
osx:~ $ cd projects/ # cd=改变路径
osx:projects $ pwd
/home/jake/projects
osx:projects $ ls
datasci_book mpld3 myproject.txt
osx:projects $ mkdir myproject # mkdir=创建新的路径
osx:projects $ cd myproject/
osx:myproject $ mv ../myproject.txt ./ # mv=移动文件。这里将
# 文件myproject.txt从上一级
# 路径(../)移动到当前路径(./)
osx:myproject $ ls
myproject.txt
```

#### 1.6.2　IPython中的shell命令

你可以通过将`!` 符号作为前缀在IPython 中执行任何命令行命令。

In [None]:
In [1]: !ls
myproject.txt
In [2]: !pwd
/home/jake/projects/myproject
In [3]: !echo "printing from the shell"
printing from the shell

#### 1.6.3　在shell中传入或传出值

shell 命令不仅可以从IPython 中调用，还可以和IPython 命名空间进行交互。
<br>例如，你可以通过一个赋值操纵符将任何shell 命令的输出保存到一个Python 列表：

In [None]:
In [4]: contents = !ls
In [5]: print(contents)
['myproject.txt']
In [6]: directory = !pwd
In [7]: print(directory)
['/Users/jakevdp/notebooks/tmp/myproject']

注意，这些结果并不以列表的形式返回，而是以IPython 中定义的一个特殊shell 返回类型的形式返回：

In [None]:
In [8]: type(directory)
IPython.utils.text.SList

但是这种类型还有其他功能，例如grep 和fields 方法以及s、n 和p 属性，允许你轻松地搜索、过滤和显示结果。

另一个方向的交互，即将Python 变量传入shell，可以通过{varname} 语法实现：

In [None]:
In [9]: message = "hello from Python"
In [10]: !echo {message}
hello from Python

变量名包含在大括号内，在shell 命令中用实际的变量替代

### 1.7　与shell相关的魔法命令

操作IPython shell 一段时间后，你可能会注意到你不能通过!cd 来导航文件系统：

In [None]:
In [11]: !pwd
/home/jake/projects/myproject

In [12]: !cd ..
    
In [13]: !pwd
/home/jake/projects/myproject

原因是Notebook 中的shell 命令是在一个临时的分支shell 中执行的。
<br>如果你希望以一种更持久的方式更改工作路径，可以使用`%cd` 魔法命令：

In [14]:
%cd ..

E:\OneDrive\文档\阅读


事实上，默认情况下你甚至可以不用% 符号实现该功能：

In [None]:
cd myproject

这种方式被称作自动魔法（automagic）函数，可以通过`%automagic` 魔法函数进行翻转。

除了%cd，其他可用的类似shell 的魔法函数还有`%cat`、`%cp`、`%env`、`%ls`、`%man`、`%mkdir`、`%more`、`%mv`、`%pwd`、`%rm` 和`%rmdir`。
<br>如果automagic 被打开，以上任何一个魔法命令都可以省略`%` 符号，这使得你可以将IPython 提示符当作普通shell 一样使用：

In [None]:
In [16]: mkdir tmp
    
In [17]: ls
myproject.txt tmp/

In [18]: cp myproject.txt tmp/
    
In [19]: ls tmp
myproject.txt

In [20]: rm -r tmp

这种在和Python 会话相同的窗口中访问shell 的方式，意味着你在编辑Python 代码时，可以减少在Python 解释器和shell 之间来回切换的次数。

### 1.8　错误和调试

#### 1.8.1　控制异常：%xmode

大多数时候，当一个Python 脚本未执行通过时，会抛出一个异常。当解释器捕获到这些异常中的一个时，可以在轨迹追溯（traceback）中找到引起这个错误的原因。利用`%xmode` 魔法函数，IPython 允许你在异常发生时控制打印信息的数量。以下面的代码为例：

In [20]:
def func1(a, b):
    return a / b
def func2(x):
    a = x
    b = x - 1
    return func1(a, b)

In [21]:
func2(1)

ZeroDivisionError: division by zero

利用`%xmode` 魔法函数（简称异常模式），可以改变打印的信息。
<br>`%xmode` 有一个输入参数，即模式。模式有3 个可选项：Plain、Context 和Verbose。
<br>默认情况下是Context，该模式的输出结果我们已经见过。
<br>Plain 更紧凑，给出的信息更少：

In [22]:
%xmode Plain

Exception reporting mode: Plain


In [23]:
func2(1)

ZeroDivisionError: division by zero

Verbose 模式加入了一些额外的信息，包括任何被调用的函数的参数：

In [24]:
%xmode Verbose

Exception reporting mode: Verbose


In [25]:
func2(1)

ZeroDivisionError: division by zero

这些额外的信息可以帮助你发现为什么会出现异常。
<br>那么为什么不在所有场景中都使用Verbose 模式呢？这是因为如果代码变得更复杂，这种方式的轨迹追溯会变得非常长。根据不同情境，有时默认模式的简要描述更容易处理。

#### 1.8.2　调试：当阅读轨迹追溯不足以解决问题时

标准的Python 交互式调试工具是pdb，它是Python 的调试器。这个调试器允许用户逐行运行代码，以便查看可能导致错误的原因。

IPython 增强版本的调试器是ipdb，它是IPython专用的调试器。

IPython 中最方便的调试界面可能就是`%debug` 魔法命令了。
<br>如果你在捕获异常后调用该调试器，它会在异常点自动打开一个交互式调试提示符。
<br>ipdb 提示符让你可以探索栈空间的当前状态，探索可用变量，甚至运行Python 命令！

来看看最近的异常，然后执行一些简单的任务——打印a 和b 的值，然后输入quit 来结束调试会话：

In [27]:
%debug

> [1;32m<ipython-input-20-40bcd8ad1a75>[0m(2)[0;36mfunc1[1;34m()[0m
[1;32m      1 [1;33m[1;32mdef[0m [0mfunc1[0m[1;33m([0m[0ma[0m[1;33m,[0m [0mb[0m[1;33m)[0m[1;33m:[0m[1;33m[0m[0m
[0m[1;32m----> 2 [1;33m    [1;32mreturn[0m [0ma[0m [1;33m/[0m [0mb[0m[1;33m[0m[0m
[0m[1;32m      3 [1;33m[1;32mdef[0m [0mfunc2[0m[1;33m([0m[0mx[0m[1;33m)[0m[1;33m:[0m[1;33m[0m[0m
[0m[1;32m      4 [1;33m    [0ma[0m [1;33m=[0m [0mx[0m[1;33m[0m[0m
[0m[1;32m      5 [1;33m    [0mb[0m [1;33m=[0m [0mx[0m [1;33m-[0m [1;36m1[0m[1;33m[0m[0m
[0m
ipdb> print(a)
1
ipdb> print(b)
0
ipdb> quit


这个交互式调试器的功能不止如此，我们甚至可以设置单步入栈和出栈来查看各变量的值：

In [28]:
%debug

> [1;32m<ipython-input-20-40bcd8ad1a75>[0m(2)[0;36mfunc1[1;34m()[0m
[1;32m      1 [1;33m[1;32mdef[0m [0mfunc1[0m[1;33m([0m[0ma[0m[1;33m,[0m [0mb[0m[1;33m)[0m[1;33m:[0m[1;33m[0m[0m
[0m[1;32m----> 2 [1;33m    [1;32mreturn[0m [0ma[0m [1;33m/[0m [0mb[0m[1;33m[0m[0m
[0m[1;32m      3 [1;33m[1;32mdef[0m [0mfunc2[0m[1;33m([0m[0mx[0m[1;33m)[0m[1;33m:[0m[1;33m[0m[0m
[0m[1;32m      4 [1;33m    [0ma[0m [1;33m=[0m [0mx[0m[1;33m[0m[0m
[0m[1;32m      5 [1;33m    [0mb[0m [1;33m=[0m [0mx[0m [1;33m-[0m [1;36m1[0m[1;33m[0m[0m
[0m
ipdb> up
> [1;32m<ipython-input-20-40bcd8ad1a75>[0m(6)[0;36mfunc2[1;34m()[0m
[1;32m      2 [1;33m    [1;32mreturn[0m [0ma[0m [1;33m/[0m [0mb[0m[1;33m[0m[0m
[0m[1;32m      3 [1;33m[1;32mdef[0m [0mfunc2[0m[1;33m([0m[0mx[0m[1;33m)[0m[1;33m:[0m[1;33m[0m[0m
[0m[1;32m      4 [1;33m    [0ma[0m [1;33m=[0m [0mx[0m[1;33m[0m[0m
[0m[1;32m      5 [1;33m   

这让你可以快速找到导致错误的原因，并且知道是哪一个函数调用导致了错误。

如果你希望在发生任何异常时都自动启动调试器，可以用`%pdb` 魔法函数来启动这个自动过程：

In [4]:
%xmode Plain
%pdb on
func2(1)

Exception reporting mode: Plain
Automatic pdb calling has been turned ON


ZeroDivisionError: division by zero

> [1;32m<ipython-input-1-40bcd8ad1a75>[0m(2)[0;36mfunc1[1;34m()[0m
[1;32m      1 [1;33m[1;32mdef[0m [0mfunc1[0m[1;33m([0m[0ma[0m[1;33m,[0m [0mb[0m[1;33m)[0m[1;33m:[0m[1;33m[0m[0m
[0m[1;32m----> 2 [1;33m    [1;32mreturn[0m [0ma[0m [1;33m/[0m [0mb[0m[1;33m[0m[0m
[0m[1;32m      3 [1;33m[1;32mdef[0m [0mfunc2[0m[1;33m([0m[0mx[0m[1;33m)[0m[1;33m:[0m[1;33m[0m[0m
[0m[1;32m      4 [1;33m    [0ma[0m [1;33m=[0m [0mx[0m[1;33m[0m[0m
[0m[1;32m      5 [1;33m    [0mb[0m [1;33m=[0m [0mx[0m [1;33m-[0m [1;36m1[0m[1;33m[0m[0m
[0m
ipdb> print(b)
0
ipdb> quit


最后，如果你有一个脚本，并且希望以交互式模式运行，则可以用`%run -d` 命令来运行，并利用next 命令单步向下交互地运行代码。

**部分调试命令**

|命令|描述|
|:|:|
|list| 显示文件的当前路径|
|h(elp)| 显示命令列表，或查找特定命令的帮助信息|
|q(uit)| 退出调试器和程序|
|c(ontinue)| 退出调试器，继续运行程序|
|n(ext)| 跳到程序的下一步|
|`<enter>`| 重复前一个命令|
|p(rint)| 打印变量|
|s(tep)| 步入子进程|
|r(eturn)| 从子进程跳出|

在调试器中使用help 命令，或者查看ipdb 的在线文档（https://github.com/gotcha/ipdb）获
取更多的相关信息。

### 1.9　代码的分析和计时

在开发代码和创建数据处理管道的过程中，经常需要在各种实现方式之间取舍，但在开发算法的早期就考虑这些事情会适得其反。
<br>正如高德纳的名言所说：“大约97% 的时间，我们应该忘记微小的效率差别；过早优化是一切罪恶的根源。”

不过，一旦代码运行起来，提高代码的运行效率总是有用的。有时候查看给定命令或一组命令的的运行时间非常有用，有时候深入多行进程并确定一系列复杂操作的效率瓶颈也非常有用。
<br>IPython 提供了很多执行这些代码计时和分析的操作函数。我们将讨论以下IPython 魔法命令。

`%time`
    对单个语句的执行时间进行计时。
    
`%timeit`
    对单个语句的重复执行进行计时，以获得更高的准确度。
    
`%prun`
    利用分析器运行代码。
    
`%lprun`
    利用逐行分析器运行代码。
    
`%memit`
    测量单个语句的内存使用。
    
`%mprun`
    通过逐行的内存分析器运行代码。

最后4 条魔法命令并不是与IPython 捆绑的， 你需要安装line_profiler 和memory_profiler 扩展。我们将在接下来的部分介绍这些扩展。

#### 1.9.1　代码段计时：%timeit和%time

1.4 节对魔法函数进行了简单的介绍，我们了解了`%timeit` 行魔法和`%%timeit` 单元魔法，其中`%%timeit` 可以让代码段重复运行来计算代码的运行时间：

注意，因为这个操作很快，所以`%timeit` 自动让代码段重复运行很多次。对于较慢的命令，`%timeit` 将自动调整并减少重复执行的次数：

有时候重复一个操作并不是最佳选择。例如，如果有一个列表需要排序，我们可能会被重复操作误导。对一个预先排好序的列表进行排序，比对一个无序的列表进行排序要快，所以重复运行将使结果出现偏差：

In [30]:
%%timeit
total = 0
for i in range(1000):
    for j in range(1000):
        total += i * (-1) ** j

835 ms ± 9.11 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [29]:
import random
L = [random.random() for i in range(100000)]
%timeit L.sort()

3.62 ms ± 299 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


对于这种情况，`%time` 魔法函数可能是更好的选择。
<br>对于运行时间较长的命令来说，如果较短的系统延迟不太可能影响结果，那么`%time` 魔法函数也是一个不错的选择。

下面对一个无序列表排序和一个已排序列表排序分别计时：

In [6]:
import random
L = [random.random() for i in range(100000)]
print("sorting an unsorted list:")
%time L.sort()

sorting an unsorted list:
Wall time: 78 ms


In [7]:
print("sorting an already sorted list:")
%time L.sort()

sorting an already sorted list:
Wall time: 9 ms


可以看出，虽然对已排序的列表进行排序比对未排序的列表进行排序快很多，但是即使同样对已排序的列表进行排序，用`%time` 计时也比用`%timeit` 计时花费的时间要长。
<br>这是由于`%timeit` 在底层做了一些很聪明的事情来阻止系统调用对计时过程的干扰。
<br>例如，`%timeit` 会阻止清理未利用的Python 对象（即垃圾回收），该过程可能影响计时。
<br>因此，`%timeit` 通常比`%time` 更快得到结果。

和`%timeit` 一样，`%time` 魔法命令也可以通过双百分号语法实现多行代码的计时：

In [8]:
%%time
total = 0
for i in range(1000):
    for j in range(1000):
        total += i * (-1) ** j

Wall time: 1.09 s


关于%time 和%timeit 的更多信息以及它们可用的参数选项，可以通过IPython 的帮助功能（如在IPython 提示符中输入%time?）获取。

#### 1.9.2　分析整个脚本：%prun

一个程序是由很多单个语句组成的，有时候对整个脚本计时比对单个语句计时更重要。
<br>Python 包含一个内置的代码分析器（你可以在Python 文档中了解更多相关信息），但是IPython 提供了一种更方便的方式来使用这个分析器，即通过魔法函数`%prun` 实现。

在以下例子中，我们将定义一个简单的函数，该函数会完成一些计算：

In [31]:
def sum_of_lists(N):
    total = 0
    for i in range(5):
        L = [j ^ (j >> i) for j in range(N)]
        total += sum(L)
    return total

现在用`%prun` 和一个函数调用来看分析结果：

In [33]:
%prun sum_of_lists(1000000)

 

In [None]:
     14 function calls in 1.609 seconds

Ordered by: internal time

ncalls  tottime  percall  cumtime  percall filename:lineno(function)
    5    1.312    0.262    1.312    0.262 <ipython-input-9-f105717832a2>:4(<listcomp>)
    5    0.216    0.043    0.216    0.043 {built-in method builtins.sum}
    1    0.063    0.063    1.591    1.591 <ipython-input-9-f105717832a2>:1(sum_of_lists)
    1    0.018    0.018    1.609    1.609 <string>:1(<module>)
    1    0.000    0.000    1.609    1.609 {built-in method builtins.exec}
    1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}

结果是一个表格，该表格按照每个函数调用的总时间，显示了哪里的执行时间最长。
<br>在这个例子中，大部分执行时间用在sum_of_lists 的列表综合中。
<br>通过观察这个数据，我们可以开始考虑通过调整哪里来提升算法的性能。

关于`%prun` 的更多信息以及它们可用的参数选项，可以通过IPython 的帮助功能（在IPython 提示符中输入`%prun?`）获取。

#### 1.9.3　用%lprun进行逐行分析

用%prun 对代码中的每个函数进行分析非常有用，但有时逐行代码分析报告更方便。该功能并没有内置于Python 或IPython，但是可以通过安装line_profiler 包来实现。首先利用Python 的包管理工具pip 安装line_profiler 包：
<br>$ pip install line_profiler

接下来可以用IPython 导入line_profiler 包提供的IPython 扩展：

In [34]:
%load_ext line_profiler

现在%lprun 命令就可以对所有函数进行逐行分析了。在下面的例子中，我们需要明确指出要分析哪些函数：
<br>和前面的性能分析过程一样，Notebook 会在页面上返回结果，如下所示：

In [35]:
%lprun -f sum_of_lists sum_of_lists(5000)

In [None]:
Timer unit: 4.88726e-07 s

Total time: 0.0198032 s
File: <ipython-input-31-f105717832a2>
Function: sum_of_lists at line 1

Line #      Hits         Time  Per Hit   % Time  Line Contents
==============================================================
     1                                           def sum_of_lists(N):
     2         1         40.0     40.0      0.1      total = 0
     3         6         33.0      5.5      0.1      for i in range(5):
     4         5      39279.0   7855.8     96.9          L = [j ^ (j >> i) for j in range(N)]
     5         5       1166.0    233.2      2.9          total += sum(L)
     6         1          2.0      2.0      0.0      return total

最上面的信息给出了阅读这些结果的关键：报告中的运行时间单位是微秒，我们可以看到程序中哪些地方最耗时。可以通过这些信息修改代码，使其更高效地实现我们的目的。

更多关于`%lprun` 的信息以及相关的参数选项，可以通过IPython 的帮助功能（在IPython提示符中输入`%lprun?`）获取。

#### 1.9.4　用%memit和%mprun进行内存分析

另一种分析是分析一个操作所用的内存量，这可以通过IPython 的另一个扩展来评估，即memory_profiler。和line_profiler 一样，首先用pip 安装这个扩展：
<br>$ pip install memory_profiler

然后用IPython 导入该扩展：

In [36]:
%load_ext memory_profiler

内存分析扩展包括两个有用的魔法函数：`%memit` 魔法函数（它提供的内存消耗计算功能类似于`%timeit`）和`%mprun` 魔法函数（它提供的内存消耗计算功能类似于%lprun）。
<br>`%memit`函数用起来很简单：

In [37]:
%memit sum_of_lists(1000000)

peak memory: 124.80 MiB, increment: 77.40 MiB


可以看到，这个函数大概消耗了100MB 的内存。

对于逐行代码的内存消耗描述，可以用`%mprun` 魔法函数。但不幸的是，这个魔法函数仅仅对独立模块内部的函数有效，而对于Notebook 本身不起作用。
<br>所以首先用`%%file` 魔法函数创建一个简单的模块，将该模块命名为`mprun_demo.py`。它包含`sum_of_lists` 函数，该函数中包含一次加法，能使内存分析结果更清晰：

In [38]:
%%file mprun_demo.py
def sum_of_lists(N):
    total = 0
    for i in range(5):
        L = [j ^ (j >> i) for j in range(N)]
        total += sum(L)
        del L # remove reference to L
    return total

Writing mprun_demo.py


In [None]:
Overwriting mprun_demo.py

现在可以重新导入函数，并运行逐行内存分析器：

In [40]:
from mprun_demo import sum_of_lists

%mprun -f sum_of_lists sum_of_lists(1000000)

*** KeyboardInterrupt exception caught in code being profiled.


页面中打印的结果概述了该函数的内存消耗情况，如下所示：

In [None]:
Filename: E:\OneDrive\文档\阅读\Notes\Python Data Science Handbook\mprun_demo.py

Line #    Mem usage    Increment   Line Contents
================================================
     1     47.4 MiB     47.4 MiB   def sum_of_lists(N):
     2     47.4 MiB      0.0 MiB       total = 0
     3     48.2 MiB      0.0 MiB       for i in range(5):
     4     86.8 MiB -58812169.8 MiB        L = [j ^ (j >> i) for j in range(N)]
     5     86.8 MiB     -0.0 MiB           total += sum(L)
     6     48.2 MiB   -162.1 MiB           del L # remove reference to L
     7     48.2 MiB      0.0 MiB       return total

Increment 列告诉我们每行代码对总内存预算的影响：创建和删除列表L 时用掉了25MB
的内存。这是除了Python 解释器本身外最消耗内存资源的部分。

关于`%menit` 和`%mprun` 的更多信息以及相关的参数选项，可以通过IPython 的帮助功能（在IPython 提示符中输入%memit?）获取。