### 1. 查询自己使用的Python版本

In [1]:
# 通过输入指令查看Python版本

!python --version

Python 3.9.19


In [2]:
# 通过使用内置sys模块查询相关的值确定当前使用的Python版本

import sys

print(sys.version_info)
print(sys.version)

sys.version_info(major=3, minor=9, micro=19, releaselevel='final', serial=0)
3.9.19 (main, Mar 21 2024, 17:21:27) [MSC v.1916 64 bit (AMD64)]


### 2. PEP 8风格指南

**与空白有关的建议**

- 用空格（space）表示缩进，而不要用制表符（tab）。
- 和语法相关的每一层缩进都用4个空格表示。
- 每行不超过79个字符。
- 对于占据多行的长表达式来说，除了首行之外的其余各行都应该在通常的缩进级别之上再加4个空格。
- 在同一份文件中，函数与类之间用两个空行隔开。
- 在同一个类中，方法与方法之间用一个空行隔开。
- 使用字典时，键与冒号之间不加空格，写在同一行的冒号和值之间应该加一个空格。
- 给变量赋值时，赋值符号的左边和右边各加一个空格，并且只加一个空格就好。
- 给变量的类型做注解（annotation）时，不要把变量名和冒号隔开，但在类型信息前应该有一个空格。

**与命名有关的建议**

- 函数、变量及属性用小写字母来拼写，各单词之间用下划线相连，例如：lowercase_underscore。
- 受保护的实例属性，用一个下划线开头，例如：_leading_underscore。
- 私有的实例属性，用两个下划线开头，例如：__double_leading_underscore。
- 类（包括异常）命名时，每个单词的首字母均大写，例如：CapitalizedWord。
- 模块级别的常量，所有字母都大写，各单词之间用下划线相连，例如：ALL_CAPS。
- 类中的实例方法，应该把第一个参数命名为self，用来表示该对象本身。
- 类方法的第一个参数，应该命名为cls，用来表示这个类本身。

**与表达式和语句有关的建议**

- 采用行内否定，即把否定词直接写在要否定的内容前面，而不要放在整个表达式的前面，例如应该写if a is not b，而不是if not a is b。
- 不要通过长度判断容器或序列是不是空的，例如不要通过if len(somelist) == 0判断somelist是否为[]或''等空值，而是应该采用if not somelist这样的写法来判断，因为Python会把空值自动评估为False。
- 如果要判断容器或序列里面有没有内容（比如要判断somelist是否为[1]或'hi'这样非空的值），也不应该通过长度来判断，而是应该采用if somelist语句，因为Python会把非空的值自动判定为True。
- 不要把if语句、for循环、while循环及except复合语句挤在一行。
- 应该把这些语句分成多行来写，这样更加清晰。如果表达式一行写不下，可以用括号将其括起来，而且要适当地添加换行与缩进以便于阅读。
- 多行的表达式，应该用括号括起来，而不要用\符号续行。

**与引入有关的建议**

- import语句（含from x import y）总是应该放在文件开头。
- 引入模块时，总是应该使用绝对名称，而不应该根据当前模块路径来使用相对名称。例如，要引入bar包中的foo模块，应该完整地写出from bar import foo，即便当前路径为bar包里，也不应该简写为import foo。
- 如果一定要用相对名称来编写import语句，那就应该明确地写成：from . import foo。- 文件中的import语句应该按顺序划分成三个部分：首先引入标准库里的模块，然后引入第三方模块，最后引入自己的模块。
- 属于同一个部分的import语句按字母顺序排列。

### 3. 了解bytes与str的区别（用的时候注意）

In [3]:
# bytes 包含的是原始数据

a = b'h\x65llo'

print(list(a))
print(a)

[104, 101, 108, 108, 111]
b'hello'


In [4]:
# str包含的是Unicode码点

a = 'a\u0300 propos'

print(list(a))
print(a)

['a', '̀', ' ', 'p', 'r', 'o', 'p', 'o', 's']
à propos


我们通常需要编写两个辅助函数（helper function），以便在这两种情况之间转换，确保输入值类型符合开发者的预期形式。

In [6]:
# 第一个辅助函数接受bytes或str实例，并返回str

def to_str(bytes_or_str):
    if isinstance(bytes_or_str, bytes):
        value = bytes_or_str.decode('utf-8')
    else:
        value = bytes_or_str
    return value # Instance of str

print(repr(to_str(b'foo')))
print(repr(to_str('foo')))

'foo'
'foo'


In [8]:
# 第二个辅助函数也接受bytes或str实例，但它返回的是bytes

def to_bytes(bytes_or_str):
    if isinstance(bytes_or_str, str):
        value = bytes_or_str.encode('utf-8')
    else:
        value = bytes_or_str
    return value # Instance of bytes

print(repr(to_bytes(b'foo')))
print(repr(to_bytes('foo')))

b'foo'
b'foo'


在Python中使用原始的8位值与Unicode字符串时，有两个问题要注意。

1. bytes与str这两种类型似乎是以相同的方式工作的，但其实例并不相互兼容，所以在传递字符序列的时候必须考虑好其类型。

In [14]:
# 1. bytes与str这两种类型似乎是以相同的方式工作的，但其实例并不相互兼容，
#    所以在传递字符序列的时候必须考虑好其类型。

# 可以用+链接
print(b'one' + b'two')
print('one' + 'two')

# 但是不能互相连接

try:
    print(b'one' + 'two')
except TypeError:
    print('type error 1')
try:
    print('one' + b'two')
except TypeError:
    print('type error 2')

b'onetwo'
onetwo
type error 1
type error 2


In [15]:
# 2. 比较运算符

# 可以用+链接
print(b'one' == b'two')
print('one' == 'two')

# 但是不能互相连接

try:
    print(b'one' == 'two')
except TypeError:
    print('type error 1')
try:
    print('one' == b'two')
except TypeError:
    print('type error 2')

False
False
False
False


In [1]:
# 两种类型的实例都可以出现在%的右侧，用来替换左侧那个格式字符串里的%s

print(b'red %s' % b'blue')
print('red %s' % 'blue')

b'red blue'
red blue


In [2]:
# 如果格式字符串是bytes类型，那么不能用str替换%s，因为Python不知道str应该按照什么方案来编码

print(b'red %s' % 'blue')

TypeError: %b requires a bytes-like object, or an object that implements __bytes__, not 'str'

In [3]:
# 但是反过来可以，但是可能不会得到想要的结果。
# 因为会直接调用byte类型的repr函数进行表示
print('red %s' % b'blue')

red b'blue'


2. 操作文件句柄的时候

In [10]:
# open函数返回的句柄。这样的句柄默认需要使用Unicode字符串操作，
# 而不能采用原始的bytes。

with open('./assets/data.bin', 'w') as f:
    try:
        f.write(b'\xf1\xf1\xf1\xf1\xf1')
    except:
        print('error')

error


In [11]:
# 想要写入二进制文件，必须手动指明wb
with open('./assets/data.bin', 'wb') as f:
    try:
        f.write(b'\xf1\xf1\xf1\xf1\xf1')
        print('success')
    except:
        print('error')

success


In [12]:
# 另一种方式是通过encoding参数指定编码的标准
with open('./assets/data.bin', 'r', encoding='cp1252') as f:
    data = f.read()

print(data)

ñññññ


读文件的时候同理

### 4. 强烈建议使用f-string

In [19]:
# 不好的方法：C语言风格的字符串【代码略】

# --- 缺点1：值的顺序的变化引起的转换类型不兼容的问题。

# --- 缺点2：填充模板之前如果进行处理，那么表达式就会变得很长，不易读

# --- 缺点3：如果想用同一个值来填充格式字符串里的多个位置，那么必须在%操作符右侧的元组中相应地多次重复该值。

# --- 缺点4：把dict写到格式化表达式里面会让代码变多。

In [22]:
# 不好的方法：str.format()

k = 'name'
v = 'zhangsan'
# format
print('{} = {}'.format(k, v))
# format的对齐方式
print('{:<10} = {:.2s}'.format(k, v))
# format的下标
print('{1} = {0}'.format(k, v))

name = zhangsan
name       = zh
zhangsan = name


In [24]:
# 好的方法：插值字符串 f-string
# 可以在字符串中嵌入任意的Python表达式

key = 'my_var'
value = 1.234

formatted = f'{key} = {value}'

print(formatted)

my_var = 1.234


In [25]:
formatted = f'{key!r:<10} = {value:.2f}'
print(formatted)

'my_var'   = 1.23


In [27]:
# 方便+灵活
stu = [('zhangsan', 12), ('lisi', 23), ('wangwu', 32)]

for i, (name, age) in enumerate(stu):
    print(f'#{i+1} '
          f'{name:<10s}'
          f'{age}')

#1 zhangsan  12
#2 lisi      23
#3 wangwu    32


In [28]:
# Python表达式也出现在格式说明符中。
places = 3
number = 1.23456

print(f'My number is {number:.{places}f}')

My number is 1.235


### 5. 把复杂表达式封装成函数

In [2]:
# 要把URL之中的查询字符串拆分成键值对，那么只需要使用parse_qs函数就可以了。

from urllib.parse import parse_qs

my_values = parse_qs('red=5&blue=0&green=', keep_blank_values=True)
my_values

{'red': ['5'], 'blue': ['0'], 'green': ['']}

In [6]:
print(f'Red values: {my_values.get("red")}')
print(f'Blue values: {my_values.get("blue")}')
print(f'Green values: {my_values.get("green")}')

# 我们希望自动处理缺失值为0，上述这种情况应该如何改进？

Red values: ['5']
Blue values: ['0']
Green values: ['']


In [7]:
# ----处理方法1：如果是空值，就改为数字0

print(f'Red values: {my_values.get("red")[0] or 0}')
print(f'Blue values: {my_values.get("blue")[0] or 0}')
print(f'Green values: {my_values.get("green")[0] or 0}')

Red values: 5
Blue values: 0
Green values: 0


In [11]:
# 这样虽然解决了问题，但是我们最终想要的是int类型，而不是str

print(type(my_values.get('red')[0]))
print(type(my_values.get('blue')[0]))
print(type(my_values.get('green')[0]))

<class 'str'>
<class 'str'>
<class 'str'>


In [15]:
# 这样写很复杂，并且每次获取值都要重写代码，最好的方法是封装成函数

print(int(my_values.get('red')[0] or 0))
print(int(my_values.get('blue')[0] or 0))
print(int(my_values.get('green')[0] or 0))

5
0
0


In [18]:
# 获取第一个值的函数
def get_first_int(values, key, default=0):
    found = values.get(key)
    if found[0]:
        return int(found[0])
    return default

print(get_first_int(my_values, 'red'))
print(get_first_int(my_values, 'green'))
print(get_first_int(my_values, 'blue'))

5
0
0


## 6. unpacking机制

通过unpacking来赋值要比通过下标去访问元组内的元素更清晰，而且这种写法所需的代码量通常比较少。

事实上，不止tuple支持unpacking机制，很多可迭代对象类型也支持：
- 列表类型 `a, b, c = [1, 2, 3]`
- 字符串类型 `a, b, c = "abc"`
- 字典的items()方法 `for key, value in my_dict.items(): ...`
- 集合 `a, b, c = {1, 2, 3}`
- 嵌套的可迭代对象 `a, (b, c), d = [1, (2, 3), 4]`
- 使用 * 操作符进行扩展 `a, *b, c = [1, 2, 3, 4, 5]` (b = [2, 3, 4])

In [26]:
book_list = [('C', 23), ('C++', 32), ('java', 43)]

for id, (name, price) in enumerate(book_list):
    print(f'id = {id} name = {name} price = {price}')

id = 0 name = C price = 23
id = 1 name = C++ price = 32
id = 2 name = java price = 43


## 7. 用enumerate取代range

In [28]:
# 上一个例子已经写了，这里补充一下，可以通过第二个参数指定起始序号

book_list = [('C', 23), ('C++', 32), ('java', 43)]

for id, (name, price) in enumerate(book_list, 200):
    print(f'id = {id} name = {name} price = {price}')

id = 200 name = C price = 23
id = 201 name = C++ price = 32
id = 202 name = java price = 43


## 8. zip函数用来同时遍历两个迭代器

In [31]:
name = ['zhangsan', 'lisi', 'wangwu']
age = [23, 34, 45]

for id, (n, a) in enumerate(zip(name, age)):
    print(f'id = {id} name = {n} age = {a}')

id = 0 name = zhangsan age = 23
id = 1 name = lisi age = 34
id = 2 name = wangwu age = 45


zip每次只从它封装的那些迭代器里面各自取出一个元素，所以即便源列表很长，程序也不会因为占用内存过多而崩溃。

如果列表长度不一样，会按照最短的那个来，如果要按照最长的来，需要使用`zip_longest`，缺少的会置为null

In [33]:
from itertools import zip_longest

name = ['zhangsan', 'lisi', 'wangwu', 'liliu']
age = [23, 34, 45]

for id, (n, a) in enumerate(zip_longest(name, age)):
    print(f'id = {id} name = {n} age = {a}')

id = 0 name = zhangsan age = 23
id = 1 name = lisi age = 34
id = 2 name = wangwu age = 45
id = 3 name = liliu age = None


## 9. 避免在循环后面写else块

把else块紧跟在整个循环后面，会让人不太容易看出这段代码的意思，所以要避免这样写。

## 10.用赋值表达式减少重复代码

赋值表达式通过海象操作符（:=）给变量赋值，并且让这个值成为这条表达式的结果，于是，我们可以利用这项特性来缩减代码。如果赋值表达式是大表达式里的一部分，就得用一对括号把它括起来。

In [None]:
def pick_fruit():
    ...
def make_juice():
    ...


bottles = []
while True:
    # 以下三行代码可以用海象操作符简化
    fresh_fruit = pick_fruit()
    if not fresh_fruit:
        break
    for fruit in fresh_fruit:
        ...

# 如下所示
while fresh_fruit := pick_fruit():
    for fruit in fresh_fruit:
        ...