# 1. 字符编码
* 在Python 3版本中，字符串是以Unicode编码的:

In [1]:
print('包含中文的str')

包含中文的str


* 对于单个字符的编码，Python提供了ord()函数获取字符的整数表示，chr()函数把编码转换为对应的字符：

In [2]:
ord('A')

65

In [3]:
ord('中')

20013

In [4]:
chr(66)

'B'

In [5]:
chr(25991)

'文'

* 如果知道字符的整数编码，还可以用十六进制这么写str：

In [6]:
'\u4e2d\u6587'

'中文'

* 注意区分'ABC'和b'ABC'，前者是str，后者虽然内容显示得和前者一样，但bytes的每个字符都只占用一个字节:

In [7]:
'ABC'.encode('ascii')

b'ABC'

In [8]:
'中文'.encode('utf-8')

b'\xe4\xb8\xad\xe6\x96\x87'

In [9]:
'中文'.encode('ascii')

UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)

* 要把bytes变为str，就需要用decode()方法：

In [10]:
b'ABC'.decode('ascii')

'ABC'

In [11]:
b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')

'中文'

* 如果bytes中包含无法解码的字节，decode()方法会报错：

In [12]:
b'\xe4\xb8\xad\xff'.decode('utf-8')

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 3: invalid start byte

* 如果bytes中只有一小部分无效的字节，可以传入errors='ignore'忽略错误的字节：

In [13]:
b'\xe4\xb8\xad\xff'.decode('utf-8', errors='ignore')

'中'

* 要计算str包含多少个字符，可以用len()函数：

In [14]:
len('ABC')

3

In [15]:
len('中文')

2

* len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数：

In [16]:
len(b'ABC')

3

In [17]:
len(b'\xe4\xb8\xad\xe6\x96\x87')

6

In [18]:
len('中文'.encode('utf-8'))

6

* 为了让它按UTF-8编码读取，我们通常在文件开头写上这两行：

In [19]:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

# 2. 格式化
* 在Python中，采用的格式化方式和C语言是一致的，用%实现:
      占位符 替换内容
        %d	整数
        %f	浮点数
        %s	字符串
        %x	十六进制整数

In [20]:
'Hello, %s' % 'world'

'Hello, world'

In [21]:
'Hi, %s, you have $%d.' % ('Michael', 1000000)

'Hi, Michael, you have $1000000.'

* 格式化整数和浮点数还可以指定是否补0和整数与小数的位数：

In [22]:
print('%2d-%02d' % (3, 1))
print('%.6f' % 3.1415926)

 3-01
3.141593


* %s永远起作用，它会把任何数据类型转换为字符串：

In [23]:
'Age: %s. Gender: %s' % (25, True)

'Age: 25. Gender: True'

* 字符串里面的%是一个普通字符怎么办？这个时候就需要转义，用%%来表示一个%：

In [24]:
'growth rate: %d %%' % 7

'growth rate: 7 %'

* 另一种格式化字符串的方法, format()方法:

In [25]:
'Hello, {0}, 成绩提升了 {1:.1f}%'.format('小明', 17.125)

'Hello, 小明, 成绩提升了 17.1%'

# 练习
* 小明的成绩从去年的72分提升到了今年的85分，请计算小明成绩提升的百分点，并用字符串格式化显示出'xx.x%'，只保留小数点后1位：

In [26]:
# -*- coding: utf-8 -*-

s1 = 72
s2 = 85
r = (85/72 - 1) * 100
print('%.1f %%' % r)

18.1 %
