# 第二讲：Python 基础：值、变量、类型

**2022-09-11 v2.0**

**2022-03-24 v1.1**

**2022-03-17 v1.0**

**yeh@czust.edu.cn**

In [1]:
import io
import uuid
from pathlib import Path
from IPython.display import IFrame

TEMPLATE_MERMAIDJS='''<html>
    <body>
        <script src="https://cdn.jsdelivr.net/npm/mermaid/dist/mermaid.min.js"></script>
        <script>
            mermaid.initialize({{ startOnLoad: true }});
        </script>
        <div class="mermaid">
            {src}
        </div>
    </body>
</html>
'''

def js_ui(data, template, out_fn=None, out_path='./graph',
          width='100%', height='100%', **kwargs):
    '''生成一个包含模板化javascript包的IFrame'''
    
    if not out_fn:
        out_fn = Path(f'{uuid.uuid4()}.html')
    
    out_path = Path(out_path)
    filepath = out_path / out_fn
    filepath.parent.mkdir(parents=True, exist_ok=True)
    
    with io.open(filepath, 'wt', encoding='utf8') as outfile:
        outfile.write(template.format(**data))
    
    return IFrame(src=filepath, width=width, height=height)

## Python 语言

### 诞生

Python 的主要作者之一是 Guido van Rossum。他担任 Python 的 BDFL (Benevolent Dictator For Life，终生仁慈独裁者) 直至 2018 年，影响对语言更改和更新的决策。

<img src="https://gvanrossum.github.io/images/guido-headshot-2019.jpg" alt="Guido van Rossum" style="zoom:25%;" />

1989 年，他正在研究基于微内核的分布式系统 Amoeba，为此开发系统实用程序。在研究时，Guido 意识到用 C 语言开发需要太多时间。他决定利用空闲时间构建一种可以帮助他更快完成工作的语言。于是他想用一种介于 C 和 Shell 脚本之间的解释型脚本语言。

> **冷知识**
>
> Python 命名来源并不是蛇，而是源自英国超现实喜剧团 Monty Python
>
> Python 语言有一套明确的原则和优先事项，一个很好的例子是 Python 的 Zen (禅)，即软件工程师 Tom Peters 的一套格言。 在 20 行文字中，Zen 包含了 Python 的核心哲学。
>
> 第一个版本 (0.9.0) 具有诸如类、异常处理、函数和核心数据类型 (如 list、dict、str) 等特性。1994 年 1 月，1.0 版发布，并为其创建了一个单独的 Usenet 新闻组，这标志着 Python 历史上的一个里程碑。1991 年 2 月，Guido 将 Python 解释器的源代码发布到 alt.sources，这是一个用于开源代码的新闻组。开源 Python 是其在当时取得成功的重要因素之一。尽管今天看来，开源一个编程语言是很稀松平常的事。
>
> 1996 年，该语言已被用于构建 Microsoft Merchant Server 等产品，它是 Windows NT 的一部分。
>
> 2000 年 10 月发布的 Python 2.0 引入了列表推导式，这是一种常用的 Python 特性，后来出现在 Haskell 等函数式编程语言中。 它还添加了其他功能，例如 Unicode 支持和完整的垃圾收集器。与此同时，核心开发人员开始考虑下一个版本的 Python，希望精简语言，削减 Python 在其近 20 年的存在中积累的不必要的语言结构和功能。 
>
> 2008 年 12 月发布的 Python 3.0 是一个**向后不兼容**的 Python 语言版本。不幸的是，这个版本带来了一些复杂性。开发人员没有意识到有多少 Python 代码依赖于其他 Python 库。 因此，虽然将脚本迁移到 Python 3 很容易，但迁移依赖于第三方库的程序却困难得多，因为它们的升级速度没有那么快。
>
> 阵痛之后是新生，Python 2 终于在 2020 年退役，而 Python 3 赢得了社区的广泛欢迎。

### Python 哲学

```
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
```

> **友情提示**
>
> 在 Python 交互环境使用 
> ```python
> import this
> ```
>
> 可以查看 Python 禅的文本。

中文翻译版如下

```
优美优于丑陋，
明了优于隐晦；
简单优于复杂，
复杂优于凌乱，
扁平优于嵌套，
稀疏优于稠密，
可读性很重要！
即使实用比纯粹更优，
特例亦不可违背原则。
错误绝不能悄悄忽略，
除非它明确需要如此。
面对不确定性，拒绝妄加猜测。
任何问题应有一种，且最好只有一种显而易见的解决方法。
尽管这方法一开始并非如此直观，除非你是荷兰人。
做优于不做，
然而不假思索还不如不做。
很难解释的，必然是坏方法。
很好解释的，可能是好方法。
命名空间是个绝妙的主意，我们应好好利用它！
```

In [2]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


### Python 社区现状

随着机器学习、大数据等领域的发展，以及开发人员数量的增加 (Python 是编程语言入门的流行选择)，Python 的受欢迎程度飙升。

根据 Google Trends 的[统计](https://trends.google.com/trends/explore?date=all&q=%2Fg%2F11bwprfn_5)，`Python Machine Learning` 在 2016 年 9 月左右达到了一个拐点。 这是谷歌基于深度学习的机器学习库 TensorFlow 发布一年后，这反映了全球对机器学习的兴趣出现了类似的增长。

事实上，得益于社区的壮大，Python 是多才多艺的编程语言，既可以用它写系统脚本，也可以开发应用软件。这里有一个典型的 Python   开发者的学习路径和分流方向示意图

In [3]:
paths = '''
flowchart TB
  subgraph A[语言基础]
    b1[Python] === b2[Jupyter]
  end
  subgraph B[数值计算]
    n1[Numpy] --> n2[SciPy]
  end
  subgraph C[数据科学]
    d1[pandas] --> d2[Xarray]
  end
  subgraph D[渲染作图]
    p1[matplotlib] --> p2[seaborn]
    p3[Shapely] --> p4[Cartopy]
    p1 --> p4
  end
  subgraph E[项目部署]
    e0([Nginx])
    e1[Dask]
    e2[Streamlit]
  end
  subgraph F[机器学习]
    f1[Scikit-Learn]
    f2[TensorFlow]
    f3[PyTorch]
  end
  subgraph G[Web开发]
    g0([HTML])
    g1[Flask]
    g2[Scrapy]
  end
  A ==> B --> C
  A ==> G --> E
  B & C --> D
  B & C--> E
  C --> F
  F --> D
'''

js_ui({'src': paths}, TEMPLATE_MERMAIDJS, height=1000)

## 代码样例

Python 是通用目的高级编程语言，其设计哲学是优雅、明确、简单。它是多范型的编程语言，支持面向过程(结构化)编程、面向对象(工程化)编程、函数式编程、元编程等。

### 第一个例子

In [3]:
# 导入包
import random
from typing import Any

# 类的定义
class ColorCode:
    '''
        ANSI 色彩码
    '''
    BLACK = "\033[0;30m"
    RED = "\033[0;31m"
    GREEN = "\033[0;32m"
    BROWN = "\033[0;33m"
    BLUE = "\033[0;34m"
    PURPLE = "\033[0;35m"
    CYAN = "\033[0;36m"
    LIGHT_GRAY = "\033[0;37m"
    DARK_GRAY = "\033[1;30m"
    LIGHT_RED = "\033[1;31m"
    LIGHT_GREEN = "\033[1;32m"
    YELLOW = "\033[1;33m"
    LIGHT_BLUE = "\033[1;34m"
    LIGHT_PURPLE = "\033[1;35m"
    LIGHT_CYAN = "\033[1;36m"
    LIGHT_WHITE = "\033[1;37m"
    BOLD = "\033[1m"
    FAINT = "\033[2m"
    ITALIC = "\033[3m"
    UNDERLINE = "\033[4m"
    BLINK = "\033[5m"
    NEGATIVE = "\033[7m"
    CROSSED = "\033[9m"
    END = "\033[0m"

# 函数的定义
def is_int(element: Any) -> bool:
    try:
        int(element)
        return True
    except ValueError:
        return False

# 以下为主要功能
# 猜一个从 1 到 100 的整数
computed = random.randint(1, 100)
print(f"{ColorCode.FAINT}随机产生的数字为：{computed}。{ColorCode.END}")

# 一共 5 次机会
for count in range(5):
    raw = input("请输入一个整数：")
    guess = int(raw) if is_int(raw) else 0
    
    if guess > computed:
        print("猜的数字太大了。")
    elif guess < computed:
        print("猜的数字太小了。")
    else:
        print("你赢了！")
        break

if count == 0:
    print("-" * 20)
    print("次数用光了。")

[2m随机产生的数字为：73。[0m


请输入一个整数： 56


猜的数字太小了。


请输入一个整数： 75


猜的数字太大了。


请输入一个整数： 73


你赢了！


### 第二个例子

In [4]:
def rf_bisection(f, a, b, eps=1e-4, N=15):
    '''
        用二分法寻找函数 f(x)=0 在区间 [a, b] 内的近似根
    '''
    import math
    
    sign = lambda x: math.copysign(1, x)
    sfa = sign(f(a))
    for i in range(N):
        p = a + 0.5 * (b - a)
        if (b - a) < 2 * eps:
            return p
        sfp = sign(f(p))
        if (sfa * sfp < 0):
            b = p
        else:
            a = p
            sfa = sfp
    return

# 现在我们来测试一下这个函数
test_func = lambda x: x ** 3 + 2 * x ** 2 - 3 * x - 1 # 这是测试用函数式，即f(x)=x³+2x²-3x-1

# 对比 SciPy 科学计算库提供的求解器
from scipy import optimize

my_ans, scipy_ans = rf_bisection(test_func, 1, 2), optimize.bisect(test_func, 1, 2)

print(f'我的函数求解结果是{my_ans:.6f}\nSciPy的函数结果是{scipy_ans:.6f}')

我的函数求解结果是1.198669
SciPy的函数结果是1.198691


## 解释器

解释型语言不同于编译型语言，它直接逐句解释来运行代码，而不是通过编译器先编译为机器码之后再运行

**REPL** (Read-Eval-Print Loop)

- 读取(read)函数接受来自用户的表达式，并将其解析为内存中的数据结构
- 求值(eval)函数接收这个内部数据结构并对其进行评估
- 打印(print)函数接收估值结果，并将其打印出来给用户

In [8]:
x = 666
x

666

In [4]:
repl = '''
flowchart TB
subgraph 编译器
a[源代码]
b[编译器]
c[机器码]
d[可执行]
a --> b --> c --> d
end
subgraph 解释器
a1[源代码]
b1[解释器]
c1[字节码]
d1[可执行]
a1 --> b1 --> c1 --> d1
end
'''

js_ui({'src': repl}, TEMPLATE_MERMAIDJS)

在执行代码之前，确定选择合适的 Python 解释器，它可能在操作系统的某个路径(如`/usr/local/bin/`)里，也可能在用户通过工具创建的 Python 虚拟环境路径(如`~/anaconda3/envs/venv/bin/`)里。

Python 解释器提供了一个类似 Shell 的交互模式，进入后的界面类似这样：

```
Python 3.9.10 | packaged by conda-forge | (main, Feb  1 2022, 21:27:43) 
[Clang 11.1.0 ] on darwin
Type "help", "copyright", "credits" or "license" for more information.
>>>
```

在这个界面中可以键入符合 Python 语法的代码。

如果有续行，续行后的新行会有三个点表示(`...`)，例如

```python
>>> if guess > computed:
...     print("猜的数字太大了。")
```

## 标识符

标识符(indentifier)是用来辨识变量、函数、类、模块等代码要素的名称。

Python 标识符是大小写敏感的，满足

- 合法的标识符包括大写字母(`A-Z`)、小写字母(`a-z`)、数字(`0-9`)以及下划线(`_`)
- 标识符起名时，**不能以数字开头**，但可以是下划线和大小写字母开头
- **不能使用保留字**，如`class`、`return`、`True`等
- 推荐的 Python 风格命名法则是小写单词用下划线分隔，如 `user_info`，而不是 `userInfo` 这种驼峰式命名

```python
# 标识符规则
my_int = 42
MAX_ITERATION = 50
i18n = 'zh-CN'
_private = True

# 错误用法
100percent = 1.0
return = False
```

当文本出现在类定义中的标识符以两个或多个下划线(`_`)字符开头并且不以两个或多个下划线结尾时，被认为是该类的私有名称，例如

```python
__secret = '🤫'
```

**变量**(variable)可以存储数值和字符，也可以存储复杂的对象，还可以存储算法(表达式)，其存储的内容可以更改。

变量可以减少冗余，提高性能，并使代码更易读，赋值操作使用 `=`字符：

```python
<变量名> = <表达式>
```

例如

```py
answer = 42
my_country = '中国'
```

赋值其实是绑定标识符到一个对象的**引用**而不是**值**

```python
a = 5
```

图示

In [9]:
asgn1 = '''
graph LR
subgraph 标识符
a
end
subgraph 内存
A[0000 0101]
end
a --> A
'''

js_ui({'src': asgn1}, TEMPLATE_MERMAIDJS)

```python
a = 7
```

图示

In [10]:
asgn2 = '''
graph LR
subgraph 标识符
a
end
subgraph 内存
A[0000 0101]
B[0000 0111]
end
a --> B
style A fill:#666,stroke:#f66,color:#fff
'''

js_ui({'src': asgn2}, TEMPLATE_MERMAIDJS, height=400)

```python
b = a
```

图示

In [8]:
asgn3 = '''
graph LR
subgraph 标识符
a
b
end
subgraph 内存
A[0000 0101]
B[0000 0111]
end
a & b --> B
style A fill:#666,stroke:#f66,color:#fff
'''

js_ui({'src': asgn3}, TEMPLATE_MERMAIDJS, height=400)

ID 测试，使用`id(标识符)`，例如

```python
a = 5
id(a)
```

也可以用`is`检测两个变量是否绑定相同对象，这样的对象也叫别名(alias)

在表达式中的变量先代入、再取值

In [9]:
a = 5

In [10]:
type(a)

int

In [11]:
a = '5'

In [12]:
id(a)

4377146928

In [13]:
a = 7

In [14]:
id(a)

4374358512

In [15]:
b = a

In [16]:
id(b)

4374358512

> Python 将变量和值存储在一个叫做**框架** (frame) 的结构中，框架包含一组绑定。**绑定**(binding) 是指变量及其值之间的关系。当程序分配一个变量时，Python 为该变量在框架中添加一个绑定 (如果该变量已经存在，则更新其值)；当程序访问一个变量时，Python 使用框架为该变量找到一个绑定。

## 表达式

Python 中严格区分表达式和语句，表达式中不能包含语句，反之可以。

- 表达式(expression)是值和运算符的组合，其计算结果是单个值
- 语句(statement)是除表达式之外的指令，语句可以包含表达式

语句 > 表达式 $\approx$ 值

下面例子是错误的

```python
# 错误用法
if (a = 1):
    print('hello')
```

`:=`用在复杂表达式中，将表达式赋值给标识符且返回该表达式的值，上例改成就可以了

```python
if (a := 1):
    print('hello')
```

> **冷知识**
>
> 由于`:=`长得像一只~~躺平~~旋转 90° 的海象的脸，该运算符也叫“海象运算符”。

表达式的最基础元素叫做**原子**(atom)，包括但不限于：

- 标识符
- 字面量
  - 字符串
  - 字节串
  - 整数
  - 浮点数
  - 复数
- 圈闭形式
  - 圆括号
  - 列表
  - 字典
  - 集合
  - 生成器

### 常量

常量(constant)是描述标识符的访问**只读性**，而不是在讨论数据**可变性**。

经典的 Python **没有**关于常量的语法表示，非要用的话，可以用类或模块封装常量，或用全大写标识符在字面上提示代码读者。

**新增语法**在类型提示中增加了~~防君子不防小人的~~`Final`注记

```python
from typing import Final
MY_CONST: Final = 1 #这样就能在静态类型检查中被识别为常量
```

## 类型概述

Python 是典型的鸭子类型(duck typing)语言，是动态类型也是强类型

> 当看到一只鸟走起来像鸭子、游泳起来像鸭子、叫起来也像鸭子，那么这只鸟就可以被称为鸭子。

### 查看类型

用 `type()`函数。Python 类型大致有以下几种：

- 布尔类型：`bool`
- 数值类型：`int`、`float`、`complex`
- 序列类型：`list`、`tuple`、`range`、`str`、`bytes`、`bytearray`、`memoryview`
- 映射类型：`dict`
- 集合类型：`set`、`frozenset`

In [17]:
# 测试类型
PI = 3.14                 # 实数
radius = 2                # 整数
message = '圆的面积是'      # 字符串
a_comp = 3 + 4j           # 复数
a_bool = a_comp.imag == 4 # 布尔

print(type(PI))
print(type(radius))
print(type(message))
print(type(a_comp))
print(type(a_bool))

<class 'float'>
<class 'int'>
<class 'str'>
<class 'complex'>
<class 'bool'>


In [18]:
message.split('的')

['圆', '面积是']

类型转换的基础方法是直接使用`类型名()`，例如

```python
an_int = 3
float(3)
```

Python 本身是动态类型语言，但可以使用静态类型检查

类型提示(type hint)是 Python 3.6 之后的**新增功能**，用来声明变量的类型。通过声明变量的类型，编辑器和 IDE 能提供更好的支持

```python
def greeting(name: str) -> str:
    return 'Hello ' + name
```

## 几个概念

### 可迭代性

如果一个对象包含成员，且能够每次按需返回其成员，则它是可迭代的 (iterable)

In [19]:
itrbl = '''
graph TB
subgraph 容器对象
成员1
成员2
成员3
成员4
成员...
end
A([我])
A -.-> |第1次访问|成员1
A -.-> |第2次访问|成员2
A --> |第3次访问|成员3
'''

js_ui({'src': itrbl}, TEMPLATE_MERMAIDJS, height=400)

所有的序列类型 (如 `list`、`str` 和 `tuple`) 和一些非序列类型 (如 `dict`)

可迭代对象可以在 `for` 循环等操作序列的地方使用，当一个可迭代对象被作为参数传递给内置函数 `iter()` 时，返回该对象的一个迭代器 (iterator)

### 不可变性

程序将数据存储在表示计算机内存中存储位置的变量中。在程序执行的任何给定点，在内存中的是程序的**状态**(state)。Python 中的一些对象是**可变的**(mutable)，而一些是**不可变的**(immutable)。可变对象的状态在创建后可以修改。不可变对象的状态在创建后无法修改。

- 可变对象创建后，即使内容中内容已经改变，但起始位置的地址还是一样。
- 不可变对象创建后，无法覆盖它的值，但是可以重新分配一个值给标识符。

具有固定值的对象是不可变的 (immutable)，不可变对象包括数值、字符串和元组。如果要存储一个不同的值，就必须创建一个新的对象

可变对象可以改变其值，但保持其`id()`

```python
a = [1, 2, 2]
```

图示

In [20]:
imtbl = '''
graph LR
subgraph 标识符
a
a0[a_0]
a1[a_1]
a2[a_2]
end
subgraph 内存
P[地址1]
A[地址2<br>0000 0001]
B[地址3<br>0000 0010]
end
a --> P
a0 -.-> A
a1 & a2 -.-> B
'''

js_ui({'src': imtbl}, TEMPLATE_MERMAIDJS, height=400)

```python
a[0] = 2
```

图示

In [21]:
imtbl2 = '''
graph LR
subgraph 标识符
a
a0[a_0]
a1[a_1]
a2[a_2]
end
subgraph 内存
P[地址1]
A[地址2<br>0000 0001]
B[地址3<br>0000 0010]
end
a --> P
a0 & a1 & a2 -.-> B
style A fill:#666,stroke:#f66,color:#fff
'''

js_ui({'src': imtbl2}, TEMPLATE_MERMAIDJS, height=400)

### 可散列性

如果一个对象在其生命周期内有一个永不改变的散列值，并且可以与其他对象比较，则它是可散列的 (hashable)

相等的可散列对象必须有相同的散列值

可散列性使得一个对象可以作为字典 (`dict`) 的**键**和集合 (`set`) 的**成员**使用

## 基础类型

### 布尔及其运算

在 Python 中，布尔类型的字面量用关键字 `True` (真) 和 `False` (假) 表示

布尔类型实际是整数类型 (整型) 的特殊情况

- `True` 的对应整数是 1
- `False` 的对应整数是 0

```python
# 结果应该是2
True + 1

# 结果应该是?
2 / False
```

In [22]:
2 / False

ZeroDivisionError: division by zero

#### 逻辑运算符

 `True` (真) 和 `False` (假) 可以参与逻辑运算，三个**逻辑运算符**

- `not` - 非，例如 `not p`
  - 若 `p` 为真，则结果为假
  - 若 `p` 为假，则结果为真
- `or` - 或，例如 `p or q`
  - 若 `p` 为真，则结果为  `p` (**短路**)
  - 若 `p` 为假，则结果为 `q`
- `and` - 与，例如 `p and q`
  - 若 `p` 为真，则结果为  `q`
  - 若 `p` 为假，则结果为 `p` (**短路**)

```python
# 真 and 真 = 真
True and True
# 假 or 真 = 真
False or True
# not 真 = 假
not True
```

### 数值及其运算

Python 没有静态类型语言那么强调数值类型的具体存储规格，通常直接使用整数或浮点数就可以

```python
# 整数
an_int = 56

# 浮点数
a_float = 5.6

# 复数
a_complex = 5 + 6j
```

Python 语言在使用时，几乎不用担心数值存储的溢出问题

> 因为 Python 没有设计成指定存储规格的那类语言，它不用指定是 8 位整型、16 位整型，抑或 32 位浮点型……Python 会自动选择合适的存储类型
>
> 如果非常纠结于具体的存储规格，建议使用 NumPy 来工作，只不过代价是“杀鸡用牛刀”

#### 算术运算符

算术运算通常产生数值型结果，因此可以按运算优先级扩展算术运算表达式

- 加法 `+`
- 减法 `-`
- 乘法 `*`
- 整数除法 `//`
- 浮点除法 `/`
- 取模 `%`
- 指数 `**`
- 矩阵乘法 `@`

```python
# 普通四则运算符合数学法则

1 + 1
2 - 0
2 * 1
6 / 2 # 注意除法结果
6 // 2

# 整除和取模
7 // 2
7 % 2

# 指数和对数
2 ** 3 # 注意必须连写*号，中间不能有空格
# 对数没有直接的运算符，但是在 math 包有 log()、log2()、log10() 等函数
import math
math.log2(8) # 以2为底
```

In [23]:
7 % 2

1

In [24]:
2 ** 3

8

#### 浮点精度

Python 浮点类型符合 IEEE 754 的规定，在计算机硬件中表示为以 2 为底的二进制分数

浮点运算存在误差

```python
100 - 99.9
```

```shell
0.09999999999999432
```

Python 在大多数情况下会显示整洁美观的输出，实际上调用了 `round()` 函数做过**舍入**

为了**减轻**浮点参与的运算影响计算结果，应该尽量做到

- 如果强烈要求保留精度，请用官方的 `decimal` 包
- 如果要比较两个浮点数是否相等，请用官方 `math` 包的 `isclose(a, b, rel_tol)`
- 算法设计中，避免相对大的数和相对小的数的同时参与的运算

```python
# decimal 举例
from decimal import Decimal
Decimal('100') - Decimal('99.0')
```

```shell
Decimal('1.0')
```

#### 比较运算符

比较运算产生布尔型结果，因此可以用布尔运算连接不同的比较运算表达式

- 大于 `>`
- 小于 `<`
- 等于 `==`
- 不等于 `!=`
- 小于或等于 `<=`
- 大于或等于 `>=`

`==`、`!=`按值比较

`is`、`is not` 按引用比较对象，即比较两个标识符是否引用同一个对象

> `a is b` 在功能上相当于 `id(a) == id(b)`

```python
# 比较大小
2 > 1
2 < 1
2 >= 1

# 嵌入算术表达式
2 + 1 > 1

# 连接不同的比较运算
x = 3
print(x > 1 and x < 6)
```

#### 位运算符

位运算通常能提高计算效率

- (按位)与 `&`
- (按位)或 `|`
- (按位)取反 `~`
- (按位)异或 `^`
- 左移 `<<`
- 右移 `>>`

```python
# 位运算符

a = 32
a << 2
```

## 序列类型

### 字符串

字符串是**不可变**的序列对象，由单引号 (`'`) 或双引号 (`"`) 界定

> Python 序列以 0 为索引起点，序列 `seq` 中的第一个成员是 `seq[0]`
>
> **索引**的语法是用方括号 (`[]`) 表示的

In [25]:
# 不可变对象无法更改成员
a_str = "这很合理"

# 查看成员
print(a_str[0])

这


In [26]:
# 尝试修改成员
a_str[0] = "那"

TypeError: 'str' object does not support item assignment

反斜杠 (`\`) 是**转义字符**，`r `引导的原始字符串对转义字符不作转义

In [27]:
# 转义字符
a = '我的\n世界'
b = r'我的\n世界'
print(a)
print(b)

我的
世界
我的\n世界


三引号 (`'''`或`"""`) 字符串可以表示多行文本，多用来在代码中插入*文档*，因此又叫**文档字符串** (docstring)

In [28]:
# 文档字符串

'''从这里开始撰写文档
文内换行如实保留
    缩进 空格什么的都保留
'''

'从这里开始撰写文档\n文内换行如实保留\n    缩进 空格什么的都保留\n'

内置函数 `len()`可以获取序列的长度，当然包括字符串的长度

#### 字符串格式化

- 老方法：`%`格式化符号
- 新方法：`str.format()`方法
- 新新方法：`f''`字符串

```python
# 字符串格式化

name = '全てのエヴァンゲリオン'

print('さようなら %s！' % name)
print('さようなら {}！'.format(name))
print(f'さようなら {name}！')
```

> 各有利弊

- `%` 现在几乎用得不多了，除了那些特别怀念 C 语言的人
- `format()` 是的优势是允许多次重复使用参数
- `f` 字符串的优势是直观易读，不用跳着看代码

```python
# format()可以重复使用参数
print("{0}是{1}的{0}".format("中国", "中国人民"))
```

> 其实还有一个 `format()` 函数
>
> 使用方法是 `format(被格式化的量, '格式化模版字符串')`

#### 常用字符串方法

- `str.lower()`全体大写字符转为小写，`str.upper()`全体小写字符转为大写
- `str.lstrip()`删除字符串起首空格字符，`str.rstrip()`删除字符串结尾空格字符，`str.strip()`删除字符串起首**和**结尾空格字符
- `str.startswith(s)`判断是否以`s`起首，`str.endswith(s)`判断是否以`s`结尾
- `str.split(s)`以`s`为分隔符拆分字符串为序列，`str.join(seq)`以`str`为分隔符组装序列`seq`为字符串
- `str.find(s, start=0, end=len(str))`在字符串`str`中查找字符串`s`，`start`和`end`指定范围
- 各种`str.isalpha()`、`str.isdigit()`、`str.isspace()`等判断是否包含/仅包含某些字符的函数

In [29]:
# 举例

# 打碎指环
ring = 'ash nazg durbatulûk ash nazg gimbatul ash nazg thrakatulûk agh burzum-ishi krimpatul'
seq = ring.split(' ')

# 再接起来
print('\n'.join(seq))

ash
nazg
durbatulûk
ash
nazg
gimbatul
ash
nazg
thrakatulûk
agh
burzum-ishi
krimpatul


### 字节串

字节串 (`bytes`) 与字符串的形式类似，但是在引号前面有一个 `b` 前缀

```python
# 字节串

my_bytes = b"Hello, world!"
```

字节串中只允许使用 ASCII 字符

字节串通常和十六进制表示息息相关，可以用内置方法相互转换

此外，字节串可以解码为字符串；反之，字符串可以编码为字节串

```python
# 解码到字符串
my_str = my_bytes.decode('utf-8')
# 编码成字节串
my_str.encode('utf-8')
```

可以简单的理解为

- 字符串有利于人类通信
- 字节串有利于计算机通信

字节串还有许多方法与字符串的方法功能类似 (甚至命名都一样)

In [30]:
my_bytes = b"Hello, world!"
my_str = my_bytes.decode('utf-8')

In [31]:
my_str

'Hello, world!'

In [32]:
my_str.encode('utf-8')

b'Hello, world!'

## 总结

### 基础知识

- 解释器和编译器
- Python 标识符的命名规范
- Python 代码结构
- Python 变量的绑定
- 用 `id()` 查看内存地址
- Python 类型
- `type()` 查看数据类型
- Python 3.6+ 新增的静态类型注解
- 概念辨析：可迭代的、不可变的、可散列的
- 逻辑运算符的短路
- 整型、浮点型、复数型都是数值类型
- 字符串是序列类型
- 字符串的基本操作
- 字节串和字符串的区别和联系

### 编程心得

- 变量命名遵循 [PEP 8](https://peps.python.org/pep-0008/)
- 避免使用语义不明的标识符命名
- 使用注释增强代码可读性
- 空行也是注释
- 养成使用静态类型注解的习惯
- 注意浮点运算的精度损失问题
- 利用字符串格式化处理文本和数值的相关问题
- 布尔型的数值特性可以用于统计和编码
- 在涉及通信、文件读写的场合使用指定编解码方式的字节串

## 课后作业

**截止日期：2022-09-19 00:00**

### 1. 简答

##### a. 为何以下代码在 Python 解释器中是这个输出

```python
a = '123'
b = '123'

print(a is b)
```
输出
```
True
```

##### b. 为何以下代码得到的输出结果会是这样？如何改进才能得到预期的数学计算结果

```python
print(.1 + .1 + .1)
```
输出
```
0.30000000000000004
```

[comment]: 答案写在这里

#### a.

Python 将变量和值存储在一个叫做框架的结构中，框架包含一组绑定。

绑定是指变量及其值之间的关系。当程序分配一个变量时，Python 为该变量在框架中添加一个绑定 (如果该变量已经存在，则更新其值)；当程序访问一个变量时，Python 使用框架为该变量找到一个绑定。

在本题中，变量 `a` 和 `b` 被绑定到同一个字符串类型的值 `'123'` 上，在内存中的位置是相同的；而 `is` 比较运算符检查对象同一性，结果当然是真 (`True`)。

#### b. 

原因：浮点在机内表示的不精确性

解决方法：

1. 使用 `decimal` 库来包装浮点数，或
2. 通过数学转换，改变计算过程

### 2. 编码转换

在处理文字的时候，经常会遇到“乱码”。中文乱码一般是由于对字符串的编码和解码方式不一致造成的

结合 Pythob 的字节串编解码方法，可以尝试破解乱码！

例如

```python
a_mysterious_string = '潠等蚥衾葩娸洁抌蚥衾喱躇'
# ... 请解密
result = # ?
print(result)
```

**思路提示**

常用的中文字符编码方式有：

- `uft-8`是Unicode标准中规定的编码
- `gbk`是中华人民共和国国标编码
- `big5`是中国台湾地区使用的繁体字编码

In [None]:
a_mysterious_string = '潠等蚥衾葩娸洁抌蚥衾喱躇'
# 参考题解
# 先按`big5`编码成字节串，再把结果按`gbk`解码成字符串
result = a_mysterious_string.encode('big5').decode('gbk')
print(result)

### 3. 进制转换

二进制可以表示成字符串形式，例如 `"110.011"` 就是一个值相当于十进制的 6.375 的带分数

> **带分数**
>
> 包含整数部分和纯分数部分的分数

编写一段代码，功能是将一个表示二进制带分数的字符串转换为十进制(即 Python 默认的数值类型)

例如

```python
bin_str = "110.011"
# ... 请发功
result = # ?
print(result)
```
打印结果应该是
```
6.375
```

**思路提示**

In [None]:
conv = '''
flowchart LR
input[/输入<br>二进制带小数<br>字符串/]
split[分割小数点<br>左右两部分]
para1{+}
subgraph L[左侧]
in1[/输入小数点左侧部分/]
parse1[整数二进制转十进制]
out1[/输出十进制值/]
end
subgraph R[右侧]
in2[/输入小数点右侧部分/]
parse2[整数二进制转十进制]
proc2[按二进制小数位数缩小]
out2[/输出十进制值/]
end
para2{+}
add[十进制整数值<br>加<br>十进制小数值]
output[/输出<br>十进制带小数<br>数值/]
input --> split --> para1 --> L & R --> para2 --> add --> output
in1 --> parse1 --> out1
in2 --> parse2 --> proc2 --> out2
'''

js_ui({'src': conv}, TEMPLATE_MERMAIDJS, height=1000)

In [None]:
bin_str = "110.011"

# 分隔二进制表示的字符串为整数部分和小数部分
parts = bin_str.split('.')
# 整数部分直接按2为底转字符串为整数值
whole = int(parts[0], 2)
# 小数部分先按2为底转字符串为整数值
# 再缩小2的幂，幂是小数部分字符串的长度
fraction = int(parts[1], 2) / 2 ** len(parts[1])

result = whole + fraction
print(result)