# 一、Python3基础

1.**字符串和编码**

python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes

Python对bytes类型的数据用带b前缀的单引号或双引号表示：

In [1]:
x = b'ABC'
print (x)

b'ABC'


要注意区分'ABC'和b'ABC'，前者是str，后者虽然内容显示得和前者一样，但bytes的每个字符都只占用一个字节。

以Unicode表示的str通过encode()方法可以编码为指定的bytes，例如：

In [2]:
'ABC'.encode('utf-8')

b'ABC'

In [3]:
'中文'.encode('utf-8')

b'\xe4\xb8\xad\xe6\x96\x87'

反过来，如果我们从网络或磁盘上读取了字节流，那么读到的数据就是bytes。要把bytes变为str，就需要用decode()方法：

In [4]:
b'ABC'.decode('utf-8')

'ABC'

In [5]:
b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8')

'中文'

len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数：

In [6]:
len('ABC')

3

In [7]:
len(b'ABC')

3

In [8]:
len('中文')

2

In [9]:
len('中文'.encode('utf-8'))

6

~~~
通常在python文件头部加入，告诉python解释器按照UTF-8编码读取源代码
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
~~~

2.**list和tuple**

In [10]:
classmates = ['Michael', 'Bob', 'Tracy']
classmates

['Michael', 'Bob', 'Tracy']

In [11]:
len(classmates)

3

In [12]:
classmates.append('Adam')
classmates

['Michael', 'Bob', 'Tracy', 'Adam']

In [13]:
classmates.insert(1, 'Jack')
classmates

['Michael', 'Jack', 'Bob', 'Tracy', 'Adam']

In [14]:
classmates.pop()

'Adam'

In [15]:
classmates

['Michael', 'Jack', 'Bob', 'Tracy']

In [16]:
classmates.pop(1)

'Jack'

In [17]:
classmates

['Michael', 'Bob', 'Tracy']

tuple一旦初始化就不能修改，没有append()，insert()这样的方法

只有1个元素的tuple定义时必须加一个逗号,，来消除歧义：

In [18]:
t = (1,)
t

(1,)

2.**dict和set**

In [19]:
d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}

In [20]:
d['Adam'] = 67
d

{'Adam': 67, 'Bob': 75, 'Michael': 95, 'Tracy': 85}

判断key是否存在，有2种办法，一是通过in判断key是否存在

In [21]:
'Thomas' in d

False

二是通过dict提供的get()方法，如果key不存在，可以返回None，或者自己指定的value：

In [22]:
d.get('Thomas')
d.get('Thomas', -1)

-1

In [23]:
d.pop('Bob')

75

In [24]:
d

{'Adam': 67, 'Michael': 95, 'Tracy': 85}

请务必注意，dict内部存放的顺序和key放入的顺序是没有关系的。

需要牢记的第一条就是dict的key必须是不可变对象。这种通过key计算位置的算法称为哈希算法（Hash）。<br/>
在Python中，字符串、整数等都是不可变的，因此，可以放心地作为key。而list是可变的，就不能作为key。

和list比较，dict有以下几个特点：<br/>
<br/>
1.查找和插入的速度极快，不会随着key的增加而变慢；<br/>
2.需要占用大量的内存，内存浪费多。<br/>
而list相反：<br/>
<br/>
1.查找和插入的时间随着元素的增加而增加；<br/>
2.占用空间小，浪费内存很少。<br/>
所以，dict是用空间来换取时间的一种方法。<br/>

要创建一个set，需要提供一个list作为输入集合：

In [25]:
s = set([1, 2, 3])
s

{1, 2, 3}

In [26]:
s.add(4)
s

{1, 2, 3, 4}

In [27]:
s.remove(4)
s

{1, 2, 3}

set的原理和dict一样，所以，同样不可以放入可变对象

# 二、函数

交互式命令行通过help(abs)查看abs函数的帮助信息

In [28]:
help(abs)

Help on built-in function abs in module builtins:

abs(x, /)
    Return the absolute value of the argument.



数据类型转换函数

In [29]:
int('123')

123

In [30]:
int(12.34)

12

In [31]:
float('12.34')

12.34

In [32]:
str(1.23)

'1.23'

In [33]:
str(100)

'100'

In [34]:
bool(1)

True

In [35]:
bool('')

False

数据类型检查可以用内置函数isinstance()实现：

In [36]:
def my_abs(x):
    if not isinstance(x, (int, float)):
        raise TypeError('bad operand type')
    if x >= 0:
        return x
    else:
        return -x

函数可以同时返回多个值，但其实就是一个tuple。

定义默认参数要牢记一点：默认参数必须指向不变对象！

在函数参数前面加一个\*号，表示可变参数

In [37]:
def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum

In [38]:
calc(1, 2)

5

In [39]:
calc()

0

调用时，在list或tuple前面加一个\*号，把list或tuple的元素变成可变参数传进去：

In [40]:
nums = [1, 2, 3]
calc(*nums)

14

关键字参数允许你传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict。

In [41]:
def person(name, age, **kw):
    print('name:', name, 'age:', age, 'other:', kw)

In [42]:
person('Bob', 35, city='Beijing')

name: Bob age: 35 other: {'city': 'Beijing'}


In [43]:
extra = {'city': 'Beijing', 'job': 'Engineer'}
person('Jack', 24, **extra)

name: Jack age: 24 other: {'job': 'Engineer', 'city': 'Beijing'}


如果要限制关键字参数的名字，就可以用命名关键字参数，例如，只接收city和job作为关键字参数。命名关键字参数必须传入参数名

In [44]:
def person(name, age, *, city, job):
    print(name, age, city, job)

In [45]:
person('Jack', 24, city='Beijing', job='Engineer')

Jack 24 Beijing Engineer


如果函数定义中已经有了一个可变参数，后面跟着的命名关键字参数就不再需要一个特殊分隔符\*了：

In [46]:
def person(name, age, *args, city, job):
    print(name, age, args, city, job)

命名关键字参数可以有缺省值，从而简化调用：

In [47]:
def person(name, age, *, city='Beijing', job):
    print(name, age, city, job)

In [48]:
person('Jack', 24, job='Engineer')

Jack 24 Beijing Engineer


在Python中定义函数，可以用必选参数、默认参数、可变参数、关键字参数和命名关键字参数，这5种参数都可以组合使用。但是请注意，参数定义的顺序必须是：必选参数、默认参数、可变参数、命名关键字参数和关键字参数。

对于任意函数，都可以通过类似func(\*args, \*\*kw)的形式调用它，无论它的参数是如何定义的。

# 三、切片

In [49]:
L = list(range(100))

In [50]:
L[:10]

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [51]:
L[-10:]

[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

In [52]:
L[10:20]

[10, 11, 12, 13, 14, 15, 16, 17, 18, 19]

In [53]:
L[:10:2]

[0, 2, 4, 6, 8]

In [54]:
L[::5]

[0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95]

In [55]:
L[:]

[0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31,
 32,
 33,
 34,
 35,
 36,
 37,
 38,
 39,
 40,
 41,
 42,
 43,
 44,
 45,
 46,
 47,
 48,
 49,
 50,
 51,
 52,
 53,
 54,
 55,
 56,
 57,
 58,
 59,
 60,
 61,
 62,
 63,
 64,
 65,
 66,
 67,
 68,
 69,
 70,
 71,
 72,
 73,
 74,
 75,
 76,
 77,
 78,
 79,
 80,
 81,
 82,
 83,
 84,
 85,
 86,
 87,
 88,
 89,
 90,
 91,
 92,
 93,
 94,
 95,
 96,
 97,
 98,
 99]

tuple和str也可以用切片操作

In [56]:
(0, 1, 2, 3, 4, 5)[:3]

(0, 1, 2)

In [57]:
'ABCDEFG'[:3]

'ABC'