# 🕮 1: 基础知识

🖊 本章主要介绍python的相关基础知识。涉及到的知识点有：
+ 1.1 [交互式解释器](#1.1-交互式解释器（略）)
+ 1.2 [算法](#1.2-算法)
+ 1.3 [数和表达式](#1.3-数和表达式)
+ 1.4 [变量](#1.4-变量)
+ 1.5 [语句](#1.5-语句)
+ 1.6 [获取用户输入](#1.6-获取用户输入)
+ 1.7 [函数](#1.7-函数)
+ 1.8 [模块](#1.8-模块)
+ 1.9 [保存并执行程序](#1.9-保存并执行程序)
+ 1.10 [字符串](#1.10-字符串)

### 1.1 交互式解释器（略）

### 1.2 算法

**算法**由 **`对象`** 和 **`语句`** 组成。

### 1.3 数和表达式
#### 1.3.1 除法运算：浮点数运算与整除运算

+ ***浮点数运算***
    - 🌟语法：`[number_1]` **/** `[number_2]`

In [None]:
1 / 2

In [2]:
1 / 1

1.0

+ ***整数运算***

取整的除法运算，其取整的规则是**向下取整**。具体示例可见下面的代码。
+ 🌟语法：`[number_1]` **//** `[number_2]`

In [3]:
1 // 2
10 // -3

-4

In [4]:
5.0 // 2.4

2.0

#### 1.3.2 取模运算

+ 🌟语法：`[number_1]` **%** `[number_2]`
取模运算与取整除法运算的关系如下：

`[number_1]` **%** `[number_2]`

等价于

`[number_1]` **-** `[number_1]` __//__ `[number_2]` __*__ `[number_2]`

In [5]:
9 % 3

0

In [8]:
-10 // 3

-4

In [6]:
-10 % 3

2

In [9]:
10 // -3

-4

In [7]:
10 % -3

-2

#### 1.3.3 十六进制、八进制和二进制

+ 使用前缀来表示不同进制：

In [10]:
0xAF

175

In [11]:
# 在python交互式命令行中，前缀为'0'，而写到python脚本里，前缀要改成'0o'
0o10

8

In [12]:
0b1011010010

722

### 1.4 变量

+ 使用Python变量前必须给它赋值，因为Python变量没有默认值。

### 1.5 语句

+ 前面的代码都是 **`表达式`** ，表达式表达了一些事物本身
+ **`语句`** 意味着**操作**， **`表达式`** 就是 **`语句`** 所操作的对象

In [13]:
# 表达式
2 * 2

4

In [14]:
#  语句
print(2 * 2)

4


_[注] `print()` 其实是一个函数。在`python 2.x` 中， `print` 是一个语句，可以直接在其后输入需要打印输出的表达式_

### 1.6 获取用户输入
+ 介绍最基础的用户与程序的交互
+ 主要介绍通过`input()` 函数获取用户输入

In [15]:
x = input("x = ")
print("x:"+ x)

x = 10
x:10


### 1.7 函数
+ 简单举例了几个基础函数

In [16]:
# 使用符号表示幂乘
print(2 ** 3)
# 使用函数计算幂乘
print(pow(2, 3))

8
8


In [17]:
# 使用符号计算取整除法
print(2 // 3)
# 使用函数计算指定的取整出发计算
print(round(2 / 3))
import math
print(math.floor(2 / 3))

0
1
0


### 1.8 模块

可将模块视为扩展，通过将其导入可以扩展python的性能。

+ 🌟语法：`import`

In [4]:
import math
import cmath
print(math.floor(32.9))
print(math.ceil(32.9))

print(cmath.sqrt(-1))

32
33
1j


+ 🐍回到未来:`__future__`模块

对于Python当前不支持，但未来将成为标准组成部分的功能，你可从`__future__`模块进行导入

### 1.9 保存并执行程序

#### 🎁 海龟绘图法（turtle graphic）

In [19]:
from turtle import *

# draw a 8-edge-fig
degree = 360 / 8

for i in range(8):
    forward(100)
    left(degree)
    
done()

#### 1.9.2 让脚本像普通程序一样

+ UNIX提供了实现这种目标的标准方式：让脚本的第一行以字符序列#!（称为pound bang或shebang）开始，并在它后面指定用于对脚本进行解释的程序（这里是Python）的绝对路径。

+ 将下面的代码作为脚本的第一行，就可在UNIX中轻松运行脚本*（如果你安装了多个版本的Python，可用更具体的可执行文件名（如python3）替换python）*：

In [None]:
#!/usr/bin/env python

### 1.10 字符串

#### 1.10.1 单引号字符串以及对引号转义

In [5]:
print("let's go")
#print('let's go')
print('let\'s go')

let's go
let's go


#### 1.10.2 拼接字符串

In [23]:
"let's say"'"hello, world"'

'let\'s say"hello, world"'

In [24]:
x = "let's say"
y = '"hello, world"'
#print(x y)
print(x+y)

let's say"hello, world"


#### 1.10.3 字符串表示str和repr
使用`str`能以合理的方式将值转换为用户能够看懂的字符串。例如，尽可能将特殊字符编码转换为相应的字符。然而，使用`repr`时，通常会获得值的合法Python表达式表示。

具体见下例：

In [26]:
print('<str>'+ str("hello,\nworld"))
print('<repr>'+ repr("hello,\nworld"))
print("hello,\nworld")

<str>hello,
world
<repr>'hello,\nworld'
hello,
world


#### 1.10.4 长字符串、原始字符串和字节

1. **长字符串**

要表示很长的字符串（跨越多行的字符串），可使用三引号`'''`或三双引号`"""`（而不是普通引号）

In [27]:
print('''This is a very long string. It continues here.
And it's not over yet. "Hello, world!"
Still here.''')
print("""This is a very long string. It continues here.
And it's not over yet. "Hello, world!"
Still here.""")

This is a very long string. It continues here.
And it's not over yet. "Hello, world!"
Still here.
This is a very long string. It continues here.
And it's not over yet. "Hello, world!"
Still here.


2. **原始字符串**

    + 原始字符串不以特殊方式处理反斜杠，因此在有些情况下很有用
    + 原始字符串由前缀`r`表示
    + 引号需要像通常那样进行转义
    + 原始字符串的最后一个字符不能是反斜杠，除非你对其进行转义（但进行转义时，用于转义的反斜杠也将是字符串的一部分)

In [30]:
print(r'C:\Program Files\fnord\foo\bar\baz\frozz\bozz')
#print(r'let's go')
print(r'let\'s go')
#print(r'hello,world\')
print(r'hello, world\\')

C:\Program Files\fnord\foo\bar\baz\frozz\bozz
let\'s go
hello, world\\


3. **Unicode、bytes和bytearray**

+ Unicode

    - 大致而言，每个Unicode字符都用一个码点（code point）表示，而码点是Unicode标准给每个字符指定的数字。
    - Unicode字符的通用机制：
        + 前缀`\u` 或 `\U`
        + 使用字符的Unicode名称：`\N{name}`

In [31]:
print("\u00C6")
print("\U0001F60A")
print("This is a cat: \N{Cat}")

Æ
😊
This is a cat: 🐈


为与C语言互操作以及将文本写入文件或通过网络套接字发送出去，Python提供了两种类似的类型：不可变的bytes和可变的bytearray。
+ 如果需要，可直接创建`bytes`对象（而不是字符串），方法是使用前缀`b`

In [32]:
print(repr(b'Hello, world!'))

b'Hello, world!'


+ 变长编码UTF-8

    - UTF-32：定长`Unicode`编码
    - UTF-8：Kenneth Thompson提出的变长编码——霍夫曼编码
    - 可将字符串编码为`bytes`，同样也可将`bytes`解码为字符串
    - 可由`bytes()`和`str()`直接创建`bytes`和`str`对象
    - *由上条可见，`encode()`和`decode()`是`bytes`的类方法*

In [33]:
print(repr("Hello, world!".encode("ASCII")))
print(repr("Hello, world!".encode("utf-32")))
print(repr("Hello, world!".encode("utf-8")))
print("--------")
print(repr("Hællå, wørld!".encode("ASCII", "backslashreplace")))
print(repr("Hællå, wørld!".encode("utf-32")))
print(repr("Hællå, wørld!".encode("utf-8")))
print("--------")
print(len("Hello, world!".encode("ASCII")))
print(len("Hello, world!".encode("utf-32")))
print(len("Hello, world!".encode("utf-8")))
print("--------")
print(len("Hællå, wørld!".encode("ASCII", "ignore")))
print(len("Hællå, wørld!".encode("utf-32")))
print(len("Hællå, wørld!".encode("utf-8")))
print("--------")
print(b'H\\xe6ll\\xe5, w\\xf8rld!'.decode())
print(b'\xff\xfe\x00\x00H\x00\x00\x00\xe6\x00\x00\x00l\x00\x00\x00l\x00\x00\x00\xe5\x00\x00\x00,\x00\x00\x00 \x00\x00\x00w\x00\x00\x00\xf8\x00\x00\x00r\x00\x00\x00l\x00\x00\x00d\x00\x00\x00!\x00\x00\x00'.decode("utf-32"))
print(b'H\xc3\xa6ll\xc3\xa5, w\xc3\xb8rld!'.decode("utf-8"))
print("--------")
print(bytes("Hællå, wørld!", encoding="utf-8"))
print(str(b'H\xc3\xa6ll\xc3\xa5, w\xc3\xb8rld!', encoding="utf-8"))

b'Hello, world!'
b'\xff\xfe\x00\x00H\x00\x00\x00e\x00\x00\x00l\x00\x00\x00l\x00\x00\x00o\x00\x00\x00,\x00\x00\x00 \x00\x00\x00w\x00\x00\x00o\x00\x00\x00r\x00\x00\x00l\x00\x00\x00d\x00\x00\x00!\x00\x00\x00'
b'Hello, world!'
--------
b'H\\xe6ll\\xe5, w\\xf8rld!'
b'\xff\xfe\x00\x00H\x00\x00\x00\xe6\x00\x00\x00l\x00\x00\x00l\x00\x00\x00\xe5\x00\x00\x00,\x00\x00\x00 \x00\x00\x00w\x00\x00\x00\xf8\x00\x00\x00r\x00\x00\x00l\x00\x00\x00d\x00\x00\x00!\x00\x00\x00'
b'H\xc3\xa6ll\xc3\xa5, w\xc3\xb8rld!'
--------
13
56
13
--------
10
56
16
--------
H\xe6ll\xe5, w\xf8rld!
Hællå, wørld!
Hællå, wørld!
--------
b'H\xc3\xa6ll\xc3\xa5, w\xc3\xb8rld!'
Hællå, wørld!


*注：源代码也将被编码，且默认使用的也是UTF-8编码。如果你想使用其他编码（例如，如果
你使用的文本编辑器使用其他编码来存储源代码），可使用特殊的注释来指定:*

    _\# -*- coding: encoding name -*-_
*请将其中的`encoding name`替换为你要使用的编码（大小写都行），如`utf-8`或`latin-1`。*

+ byte array
    - 从某种意义上说，它就像是可修改的字符串——常规字符串是不能修改的
    - 要替换其中的字符，必须将其指定为0～255的值*[间接说明byte array的大小是256字节]*
    - 要插入字符，必须使用`ord`获取其序数值（ordinal value）。

In [34]:
x = bytearray(b"Hello!")
x[1] = ord(b'o')
x[4] = ord(b'a')
x

bytearray(b'Holla!')

# 🞂 つづく