# 行结构

编码规则: Python 源文件是文本文件(.py). 文本要变成二进制时有一定的编码规则, Python 默认的编码规则是UTF-8, 当然也可由编码声明指定别的编码规则.

Python 分析器: 将程序文本解码成一个个的码点. 解码不成功, 则引发 SyntaxError 
- 把程序文本拆分为一个个逻辑行
- 把逻辑行拆分为一个个的形符, 并进行解码, 得到一个个的码点。


## 逻辑行 

程序文件由多个逻辑行构成, 一个逻辑行包含一个或多个物理行

- 显式折行: 如果一个逻辑行太长,则可用反斜杠字符 (`\`)进行折行 
- 隐式折行: 圆括号、方括号或花括号以内的表达式可以写成多个物理行

```python
#!/usr/bin/env python
# -*- coding: <encoding-name> -*-

"""
功能:XX
作者:XX
版本:XX
日期:XX
"""
...

if 1900 < year < 2100 and 1 <= month <= 12 \
        and 1 <= day <= 31 and 0 <= hour < 24 \
        and 0 <= minute < 60 and 0 <= second < 60:   # Looks like a valid date
    print(“The date is ...” )

month_names = ['Januari', 'Februari', 'Maart',      # These are the
               'April',   'Mei',      'Juni',       # Dutch names
               'Juli',    'Augustus', 'September',  # for the months
               'Oktober', 'November', 'December']   # of the year
...

```

## 注释行 

- 注释以井号 (#) 开头，放在语句后则可标志着逻辑行的结束
  
  如例中的 `# Looks like a valid date`
  

- 如果出现在行拼接内, 则不标志逻辑行的结束
  
  如例中的 `# These are the ... `

### 编码声明

编码声明是一种特殊的注释行:
- 位于 Python 程序的第一或第二行
- 匹配正则表达式 `coding[=:]\s*([-\w.]+)`
- 编码声明必须独占一行。如果它是第二行，则第一行必须是注释

如例中的:  `# -*- coding: <encoding-name> -*- `

正则表达式 `coding[=:]\s*([-\w.]+)`:
- `coding` : 匹配 `coding`
- `[=:]`: `coding`后匹配一个`=`号或`:`
- `\s*`: 匹配数个空白
- `([-\w.]+)`: 匹配的第一个字符可以是`-` 或`字符`或`任意符`,重复多次

## 缩进

缩进规则:
- 空白 (制表符) 的数目被用来计算该逻辑行的缩进等级
- 相同缩进等级的逻辑行属于同一个段落(程序块)。
- 混合使用制表符和空格符进行缩进, 可能引发 TabError

逻辑行的折行不必遵守缩进规则

In [1]:
def perm(l):
        # Compute the list of all permutations of l
    if len(l) <= 1:
        return [l]
    r = []
    for i in range(len(l)):
        s = l[:i] + l[i+1:]
        p = perm(s)
        for x in p:
            r.append(l[i:i+1] + x)
    return r

## 形符

形符是行的构成单元
- 一个物理行由一个或多个形符构成
- 用空白符把形符分开
  
例如: `for x in p:` 内含4个形符.

形符的种类:

- 标识符
- 关键字
- 字面值
- 运算符
- 分隔符

### 标识符
也称为名称, 如:变量名, 函数名, 对象名和类名等

命名规则: 
- 由字母数字的下划线构成, 但不可用数字打头
- 标识符不能是 Python 关键字，但可包含。
- 标识符不能是 Python 内置对象名，但可包含。
- 命名要见名知意

In [2]:
month_names = ['Januari', 'Februari', 'Maart',      # These are the
               'April',   'Mei',      'Juni',       # Dutch names
               'Juli',    'Augustus', 'September',  # for the months
               'Oktober', 'November', 'December']   # of the year

查看一个标识符是不是内置函数

In [3]:
type(max)

builtin_function_or_method

### 关键字
也称保留字, 具有特别的意义, 不能用来做标识符

In [3]:
#导入keyword 模块
import keyword
#显示所有关键字,*请删除后面的分号“;”
keyword.kwlist;

<table>
  <tr>
    <td>False</td>
    <td>await</td>
    <td>else</td>
    <td>import</td>
    <td>pass</td>
  </tr>
  <tr>
    <td>None</td>
    <td>break</td>
    <td>except</td>
    <td>in</td>
    <td>raise</td>
  </tr>
  <tr>
    <td>True</td>
    <td>class</td>
    <td>finally</td>
    <td>is</td>
    <td>return</td>
  </tr>
  <tr>
    <td>and</td>
    <td>continue</td>
    <td>for </td>
    <td>lambda </td>
    <td>try </td>
  </tr>
  <tr>
    <td>as</td>
    <td>def</td>
    <td>from</td>
    <td>nonlocal </td>
    <td>while </td>
  </tr>
  <tr>
    <td>assert</td>
    <td>del</td>
    <td>global</td>
    <td>not</td>
    <td>with </td>
  </tr>
  <tr>
    <td>async</td>
    <td>elif</td>
    <td>if </td>
    <td>or </td>
    <td>yield </td>
  </tr>
</table>

### 内置对象

内置对象名不能用来做标识符

In [4]:
import builtins
dir(builtins);
len(dir(builtins))

155

- 内置常量（built-in constants）: 6
- 内置函数（built-in functions）: 69  
- 内置异常（built-in exceptions）: XX
- 内置类型（built-in types）: XX

比如 range 是一个内置函数,如果被定义为变量名,则在调用时会发生错误
```python
range = 1
range(100)
```
TypeError: 'int' object is not callable

### 字面值

字面值就是见字知意的一些规定. 主要用于定义内置的数据类型,

- `'abc'`和`“abc”`: 表示里面是字符串(`abc`)
- '''abc''', """ abc """: 三引号表示里面是字符串(`abc`)
- `\`: 表示后面的字符转义, 比如 `\n` 中`n`不再是字母`n` 而是换行的意思
- 前缀 'b' 或 'B' 表示后面生成 bytes 类型而非 str 类型 
- 前缀 'r' 或 'R' 表示是原始字符串, 其中的反斜杠可能不是转义
- 前缀 'f' 或 'F' 格式化字符串字面值
- 复数与科学计数: 1+2j, 1.013e+03

### 转义序列

<table>
  <tr>
    <th>转义序列</th>
    <th>含义</th>
  </tr>
  <tr>
    <td>\newline</td>
    <td>反斜杠加换行全被忽略</td>
  </tr>
  <tr>
    <td>\\</td>
    <td>反斜杠 (\)</td>
  </tr>
  <tr>
    <td>\'</td>
    <td>单引号 (')</td>
  </tr>
  <tr>
    <td>\a</td>
    <td>ASCII 响铃 (BEL)</td>
  </tr>
  <tr>
    <td>\b</td>
    <td>ASCII 退格 (BS)</td>
  </tr>
  <tr>
    <td>\f</td>
    <td>ASCII 进纸 (FF)</td>
  </tr>
  <tr>
    <td>\n</td>
    <td>ASCII 换行 (LF)</td>
  </tr>
  <tr>
    <td>\r</td>
    <td>ASCII 回车 (CR)</td>
  </tr>
  <tr>
    <td>\t</td>
    <td>ASCII 水平制表 (TAB)</td>
  </tr>
  <tr>
    <td>\v</td>
    <td>ASCII 垂直制表 (VT)</td>
  </tr>
  <tr>
    <td>\ooo</td>
    <td>八进制数 ooo 码位的字符</td>
  </tr>
  <tr>
    <td>\xhh</td>
    <td>十六进制数 hh 码位的字符</td>
  </tr>
  <tr>
    <td>\N{name}</td>
    <td>Unicode 数据库中名称为 name 的字符</td>
  </tr>
  <tr>
    <td>\uxxxx</td>
    <td>16位十六进制数 xxxx 码位的字符</td>
  </tr>
  <tr>
    <td>\Uxxxxxxxx</td>
    <td>32位16进制数 xxxxxxxx 码位的字符</td>
  </tr>
</table>

### 运算符

进行数值和逻辑运算的符号
<table>
  <tr>
    <td>+</td>
    <td>-</td>
    <td>*</td>
    <td>/</td>
    <td>//</td>
    <td>**</td>
    <td>%</td>
    <td>@</td>
  </tr>
  <tr>
    <td><<</td>
    <td>>> </td>
    <td>&</td>
    <td>|</td>
    <td>^</td>
    <td>~</td>
    <td>:=</td>
  </tr>
  <tr>
    <td><</td>
    <td>></td>
    <td><=</td>
    <td>>=</td>
    <td>==</td>
    <td>!=</td>
  </tr>
</table>

### 分隔符

<table>
  <tr>
    <td>(</td>
    <td>)</td>
    <td>[</td>
    <td>]</td>
    <td>{</td>
    <td>}</td>
  </tr>
  <tr>
    <td>'</td>
    <td>: </td>
    <td>.</td>
    <td>;</td>
    <td>@</td>
    <td>=</td>
    <td>-></td>
  </tr>
  <tr>
    <td>+=</td>
    <td>-=</td>
    <td>*=</td>
    <td>/=</td>
    <td>//=</td>
    <td>%=</td>
    <td>@=</td>
  </tr>
  <tr>
    <td>&=</td>
    <td>|=</td>
    <td>^=</td>
    <td>>>=</td>
    <td><<=</td>
    <td>**=</td>
  </tr>
</table>