# 一、编译型语言与解释型语言

## 1、编译型语言与解释型语言的区别

我们编写的源代码是人类语言，我们自己能够轻松理解；但是对于计算机硬件（CPU），源代码就是天书，根本无法执行，计算机只能识别某些特定的二进制指令，在程序真正运行之前必须将源代码转换成二进制指令。

所谓的二进制指令，也就是机器码，是 CPU 能够识别的硬件层面的“代码”，简陋的硬件（比如古老的单片机）只能使用几十个指令，强大的硬件（PC 和智能手机）能使用成百上千个指令。

然而，究竟在什么时候将源代码转换成二进制指令呢？不同的编程语言有不同的规定：

• 有的编程语言要求必须提前将所有源代码一次性转换成二进制指令，也就是生成一个可执行程序（Windows 下的 .exe），比如C语言、C++、Golang、Pascal（Delphi）、汇编等，这种编程语言称为编译型语言，使用的转换工具称为编译器。

• 有的编程语言可以一边执行一边转换，需要哪些源代码就转换哪些源代码，不会生成可执行程序，比如 Python、JavaScript、PHP、Shell、MATLAB 等，这种编程语言称为解释型语言，使用的转换工具称为解释器。

简单理解，编译器就是一个“翻译工具”，类似于将中文翻译成英文、将英文翻译成俄文。但是，翻译源代码是一个复杂的过程，大致包括词法分析、语法分析、语义分析、性能优化、生成可执行文件等五个步骤，期间涉及到复杂的算法和硬件架构。

Java 和 C# 是一种比较奇葩的存在，它们是半编译半解释型的语言，源代码需要先转换成一种中间文件（字节码文件），然后再将中间文件拿到虚拟机中执行。Java 引领了这种风潮，它的初衷是在跨平台的同时兼顾执行效率；C# 是后来的跟随者，但是 C# 一直止步于 Windows 平台，在其它平台鲜有作为。
![image-2.png](attachment:image-2.png)
图 1 编译型语言和解释型语言的执行流程

那么，编译型语言和解释型语言各有什么特点呢？它们之间有什么区别？

### 编译型语言

对于编译型语言，开发完成以后需要将所有的源代码都转换成可执行程序，比如 Windows 下的.exe文件，可执行程序里面包含的就是机器码。只要我们拥有可执行程序，就可以随时运行，不用再重新编译了，也就是“一次编译，无限次运行”。

在运行的时候，我们只需要编译生成的可执行程序，不再需要源代码和编译器了，所以说编译型语言可以脱离开发环境运行。

编译型语言一般是不能跨平台的，也就是不能在不同的操作系统之间随意切换。

编译型语言不能跨平台表现在两个方面：

#### 1) 可执行程序不能跨平台

可执行程序不能跨平台很容易理解，因为不同操作系统对可执行文件的内部结构有着截然不同的要求，彼此之间也不能兼容。不能跨平台是天经地义，能跨平台反而才是奇葩。

比如，不能将 Windows 下的可执行程序拿到 Linux 下使用，也不能将 Linux 下的可执行程序拿到 Mac OS 下使用（虽然它们都是类 Unix 系统）。

另外，相同操作系统的不同版本之间也不一定兼容，比如不能将 x64 程序（Windows 64 位程序）拿到 x86 平台（Windows 32 位平台）下运行。但是反之一般可行，因为 64 位 Windows 对 32 位程序作了很好的兼容性处理。

#### 2) 源代码不能跨平台

不同平台支持的函数、类型、变量等都可能不同，基于某个平台编写的源代码一般不能拿到另一个平台下编译。我们以C语言为例来说明。

【实例1】在C语言中要想让程序暂停可以使用“睡眠”函数，在 Windows 平台下该函数是 Sleep()，在 Linux 平台下该函数是 sleep()，首字母大小写不同。其次，Sleep() 的参数是毫秒，sleep() 的参数是秒，单位也不一样。

以上两个原因导致使用暂停功能的C语言程序不能跨平台，除非在代码层面做出兼容性处理，非常麻烦。

【实例2】虽然不同平台的C语言都支持 long 类型，但是不同平台的 long 的长度却不同，例如，Windows 64 位平台下的 long 占用 4 个字节，Linux 64 位平台下的 long 占用 8 个字节。

我们在 Linux 64 位平台下编写代码时，将 0x2f1e4ad23 赋值给 long 类型的变量是完全没有问题的，但是这样的赋值在 Windows 平台下就会导致数值溢出，让程序产生错误的运行结果。

让人苦恼的，这样的错误一般不容易察觉，因为编译器不会报错，我们也记不住不同类型的取值范围。

### 解释型语言

对于解释型语言，每次执行程序都需要一边转换一边执行，用到哪些源代码就将哪些源代码转换成机器码，用不到的不进行任何处理。每次执行程序时可能使用不同的功能，这个时候需要转换的源代码也不一样。

因为每次执行程序都需要重新转换源代码，所以解释型语言的执行效率天生就低于编译型语言，甚至存在数量级的差距。计算机的一些底层功能，或者关键算法，一般都使用 C/C++ 实现，只有在应用层面（比如网站开发、批处理、小工具等）才会使用解释型语言。

在运行解释型语言的时候，我们始终都需要源代码和解释器，所以说它无法脱离开发环境。

当我们说“下载一个程序（软件）”时，不同类型的语言有不同的含义：

• 对于编译型语言，我们下载到的是可执行文件，源代码被作者保留，所以编译型语言的程序一般是闭源的。

• 对于解释型语言，我们下载到的是所有的源代码，因为作者不给源代码就没法运行，所以解释型语言的程序一般是开源的。

相比于编译型语言，解释型语言几乎都能跨平台，“一次编写，到处运行”是真是存在的，而且比比皆是。那么，为什么解释型语言就能快平台呢？

这一切都要归功于解释器！

我们所说的跨平台，是指源代码跨平台，而不是解释器跨平台。解释器用来将源代码转换成机器码，它就是一个可执行程序，是绝对不能跨平台的。

官方需要针对不同的平台开发不同的解释器，这些解释器必须要能够遵守同样的语法，识别同样的函数，完成同样的功能，只有这样，同样的代码在不同平台的执行结果才是相同的。

解释型语言之所以能够跨平台，是因为有了解释器这个中间层。在不同的平台下，解释器会将相同的源代码转换成不同的机器码，解释器帮助我们屏蔽了不同平台之间的差异。


### 关于Python

Python 属于典型的解释型语言，所以运行 Python 程序需要解释器的支持，只要你在不同的平台安装了不同的解释器，你的代码就可以随时运行，不用担心任何兼容性问题，真正的“一次编写，到处运行”。

Python 几乎支持所有常见的平台，比如 Linux、Windows、Mac OS、Android、FreeBSD、Solaris、PocketPC 等，Python 代码无需修改就能在这些平台上正确运行。也就是说，Python 的可移植性是很强的。

### 总结

我们将编译型语言和解释型语言的差异总结为下表：

![image-2.png](attachment:image-2.png)

## Python底层是用什么语言实现的？

平时我们所讨论的 Python，指的其实就是 CPython。

随着编程语言的不断发展，Python 的实现方式也发生了变化，除了用 C 语言实现外，Python 还有其他的实现方式。例如，用 Java 语言实现的 Python 称为 JPython，用 .net 实现的 Python 称为 IronPython 等等。

Python 的这些实现方式虽然诞生比 CPython 晚，但一直在努力地跟上主流，并在不同的生产环境中不断地使用并推广 Python。

Python 的实现方式有很多种，Python 官网上介绍了 20 多种语言变体、方言或 C 语言之外的 Python 解释器实现。其中一些只是实现了语言核心语法、功能和内置扩展的一个子集，但至少有几个与 CPython 几乎完全兼容。更重要的是，在这些不同的实现方式中，虽然有些只是玩具项目或实验，但大部分都是为了解决某些实际问题而创建的，这些问题要么使用 CPython 无法解决，要么需要开发人员花费巨大的精力，这里举几个例子：

• 在嵌入式系统中运行 Python 代码。

• 与运行框架（如 Java 或 .NET）或其他语言做代码集成。

• 在 Web 浏览器中运行 Python 代码。

由于受到篇幅的限制，这里仅介绍几种 Python 开发人员最常用的几种 Python 实现方式。

### Stackless Python

Stackless Python 自称 Python 增强版。之所以名为 Stackless（无栈），是因为它没有依赖 C 语言的调用栈，实际上就是对 CPython 做了一些修改，添加了一些新的功能。

在新添加的功能中，最重要就是由解释器管理的微线程，用来替代依赖系统内核上下文切换和任务调度的普通线程，既轻量化又节约资源。

Stackless Python 最新可用的版本是 2.7.9 和 3.3.5，分别实现的是 Python 2.7 和 3.3。在 Stackless Python 中，所有的额外功能都是内置 stackless 模块内的框架。

Stackless Python 并不是最有名的 Python 实现，但很值得一提，因为它引入的思想对编程语言社区有很大的影响。例如，将 Stackless Python 中的内核切换功能提取出来并作为一个独立包发布，名为 greenlet，是许多有用的库和框架的基础。

此外，Stackless Python 的大部分功能都在 PyPy 中重新实现，PyPy 是另一个 Python 实现。

### JPython

Jython 是 Python 语言的 Java 实现。它将代码编译为 Java 字节代码，开发人员在 Python 模块中可以无缝使用 Java 类。

Jython 允许人们在复杂应用系统（例如 J2EE）中使用 Python 作为顶层脚本语言，它还将 Java 应用引入到 Python 中，一个很好的例子就是，在 Python 程序中可以使用 Apache Jackrabbit（这是一个基于 JCR 的文档仓库 API）。

Jython 最新可用的版本是 Jython 2.7，对应的是 Python 2.7 版。它宣称几乎实现了 Python 所有的核心标准库，并使用相同的回归测试套件。Jython 3.x 版正在开发中。

Jython 与 CPython 实现的主要区别如下所示：

• 真正的 Java 垃圾回收，而不是引用计数。

• 没有全局解释器锁（GlobakInterpreter Lock，GIL），在多线程应用中可以充分利用多个内核。

这一语言实现的主要缺点是缺少对 C/Python 扩展 API 的支持，因此用 C 语言编写的 Python 扩展在 Jython 中无法运行。这种情况未来可能会发生改变，因为 Jython 3.x 计划支持 C/Python 扩展 API。

某些 Python Web 框架（例如 Pylons）被认为是促进 Jython 的开发，使其可用于 Java 世界。

### IronPython

IronPython 将 Python 引入 .NET 框架中，这个项目受到微软的支持，因为 IronPython 的主要开发人员都在微软工作。可以这么说，IronPython 是推广语言的一种重要实现。

除了 Java，.NET社区是最大的开发者社区之一。

值得一提的是，微软提供了一套免费开发工具，名为 PTVS（Python Tools for Visual Studio，用于Visual Studio 的 Python 工具），可以将 Visual Studio 转换为成熟的 Python IDE。这是作为 Visual Studio 的插件发布的，在 GitHub 可以找到其开源代码。

IronPython 最新的稳定版本是 2.7.5，与 Python 2.7 兼容。与 Jython 类似，Python 3.x 的实现也在开发中，但还没有可用的稳定版本。

虽然 .NET 主要在微软 Windows 系统上运行，但是 IronPython 也可以在 Mac OS X 和 Linux 系统上运行，这一点要感谢 Mono，一个跨平台的开源 .NET 实现。

与 CPython 相比，IronPython 的主要区别或优点如下：

• 与 Jython 类似，没有全局解释器锁（Global Interpreter Lock，GIL），在多线程应用中可以充分利用多个内核。

• 用 C# 和其他 .NET 语言编写的代码可以轻松集成到 IronPython 中，反之亦然。

• 通过 Silverlight，在所有主流 Web 浏览器中都可以运行。

说到弱点，IronPython 也与 Jython 非常类似，因为它也不支持 C/Python 扩展 API。对于想要使用主要基于 C 扩展的 Python 包（例如 NumPy）的开发人员来说，这一点很重要。

有一个叫作 ironclad 的项目，其目的是在 IronPython 中无缝使用这些扩展，其最新支持的版本是2.6，开发已经停止。

### PyPy

PyPy 可能是最令人兴奋的 Python 实现，因为其目标就是将 Python 重写为 Python。在 PyPy 中，Python 解释器本身是用 Python 编写的。

在 Python 的 CPython 实现中，有一个 C 代码层来实现具体细节。但在 PyPy 实现中，这个 C 代码层用 Python 完全重写。这样，你可以在代码运行期间改变解释器的行为，并实现 CPython 难以实现的代码模式。

目前 PyPy 的目的是与 Python 2.7 完全兼容，而 PyPy3 则与 Python 3.2.5 版兼容。

以前对 PyPy 感兴趣主要是理论上的原因，只有喜欢深入钻研语言细节的人才会对它感兴趣。PyPy 通常不用于生产环境，但这些年来这种状况己经发生改变，PyPy 通常比 CPython 实现要快得多。基于这一特性，使得越来越多的开发人员决定在生产环境中切换到 PyPy。

PyPy 与 CPython 实现的主要区别在于以下几个方面：

• 使用垃圾回收，而不是引用计数。

• 集成跟踪 JIT 编译器，可以显著提高性能。

• 借鉴 Stackless Python 在应用层的无栈特性。

与几乎所有其他的 Python 实现类似，PyPy 也缺乏对 C/Python 扩展 API 的完全官方支持。但它至少通过 CPyExt 子系统为 C 扩展提供了某种程度的支持，虽然文档不完整，功能也尚未完善。此外，社区正在努力将 NumPy 迁移到 PyPy 中，因为这是最需要的功能。

## 3、Jupyter Notebook

### 什么是Jupyter Notebook

到底什么是 Jupyter Notebook 呢？按照 Jupyter 创始人的说法，起初他是想做一个综合 Ju（Julia）、Py（Python）和 R 三种科学运行语言的计算工具平台，所以将其命名为 Jupyter。

Jupyter 发展到现在，已经成为了一个几乎支持所有语言，能够把软件代码、计算输出、解释文档、多媒体资源整合在一起的多功能科学运行平台。Jupyter Notebook 的工作界面如图 1 所示。

![image.png](attachment:image.png)

图 1 Jupyter Notebook界面

如图 1 所示，只要直接输入代码并运行，它就会直接在代码下面显示输出结果。

### Jupyter Notebook的影响力

衡量一个技术的影响力，或者说想利用自己的技术影响世界时，必定绕不开技术对教育界的影响力。

以微软的 Word 文本处理系统为例，从纯技术角度来讲，它的单机设计理念早已过时，但以 Google Doc 为代表的在线文档系统，并没有想象中实现对 Word 的降维打击。最直接的原因归咎于用户习惯，多数用户已经习惯使用 Word 来编辑、修改文档，之所以会这样，是因为我们从小学、中学，一直到大学期间，都在学习使用 Word。而且到了工作中，老员工还会带着新员工继续使用 Word。

从 2017 年开始，已经有大量的北美顶尖计算机课程开始使用 Jupyter Notebook 作为教学工具，而在这之前，一直使用的都是 Python 命令行的形式。不仅如此，Jupyter Notebook 在工业界的影响力更大。

例如，在 Facebook 中，几乎所有的中小型程序（比如内部的线下分析软件，机器学习模块的训练等）都是借助与Jupyter Notebook完成。同时，在硅谷其他的一线大厂中，也全部使用 Jupyter Notebook（他们用的是改进定制型的Jupyter Notebook，名称 Google Colab）。

但需要注意的是，不是说那个技术流行，就盲目跟从。对于技术的选择，要学习独立的思考，切勿人云亦云。以 Facebook 为例，之所以它选择 Jupyter Notebook 等技术，很大程序上因为它有几百个产品线，几万个工程师，而如果是几个人的团队，使用同样的技术反倒成了拖累。

### Jupyter Notebook的优势

这里总结了几点 Jupyter Notebook 的优势：

#### 1) 整合了所有资源

在软件开发过程中，频繁地进行上下文切换，会影响生产效率。举个例子，假设你需要切换窗口去看一些文档，再切换窗口去用另一个工具画图，不断地切换窗口就会成为影响效率的因素。

而 Jupyter Notebook 则不同，它会将所有和软件编写的资源全部放在一个地方，无需切换窗口就可以轻松找到。

#### 2) 交互性编程体验

在机器学习和数据统计领域，Python 编程的实验性特别强，比如为了测试 100 种不同的方法，有时就需要将一小块代码重写 100 遍，在这种情况下，如果使用传统的 Python 开发流程，每一次测试都要将所有代码重新跑一遍，会花费开发者很多时间。

Jupyter Notebook 引进了 Cell 的概念。每次测试可以只跑一小块的代码，并且在代码下方立刻就能看到运行结果。

如此强的交互性，满足了 Python 程序员可以专注于问题本身，不会被频繁的工具链拖累，也不用在命令行之间来回切换，所有工作都能在 Jupyter Notebook 上完成。

#### 3) 轻松运行他人编写的代码

同样是在机器学习和数学统计领域，我们可能会借鉴他人分享的代码，但当我们拷贝过来想要运行时，却需要使用 pip 安装一大堆依赖的库，足以让人抓狂。而 Jupyter Notebook 就可以解决这个问题。

例如，Jupyter 官方的 Binder 平台以及 Google 提供的 Google Colab 环境，它们可以让 Jupyter Notebook 变得和 Google Doc 在线文档一样。比如用 Binder 打开一份 GitHub 上的 Jupyter Notebook 时，就不需要安装任何 Python 库，直接在打开代码就能运行。