# 元组
### 固定长度，不可改变的Python序列对象，用逗号分隔一列值

In [117]:
tup = 1,2,3
tup

(1, 2, 3)

In [118]:
# 可用tuple()将任意序列或迭代器转化为元组
tup = tuple('string')
tup

('s', 't', 'r', 'i', 'n', 'g')

In [119]:
# 元组中存储的对象可能是可变对象，一旦创建了元组，元组中的 对象就不能被修改了
tup = tuple(['foo', [1, 2], True])
tup[2] = False

TypeError: 'tuple' object does not support item assignment

In [None]:
# 如果元组中的某个对象是可变的，比如列表，可以在原位进行修改
tup = tuple(['foo', [1, 2], True])
tup[1].append(3)
tup

In [None]:
# 拆分元组
tup = 1,2,(3,4)
a,b,(c,d) = tup
a,c

In [None]:
values = 1,2,3,4,5
a,b,*rest = values
a,b,rest

# 列表
### 内容可变，对象可被修改，使用更加灵活，使用[]或list()函数定义

In [None]:
lis = ['foo', 'bar', 'baz']
lis[1]

In [None]:
# 用append在列表末尾添加元素
lis.append('vodka')
lis

In [None]:
# 用insert在指定位置插入元素
lis.insert(1,'wave')
lis

In [None]:
# pop移除并返回指定位置的元素
lis.pop(4)

In [None]:
# 使用remove去除列表中的某个值（会先寻找第一个值）
lis.remove('baz')
lis

In [None]:
# 使用sort函数对列表原地排序（不创建新的对象）
a = [8,4,6,9,2,5,7,6]
a.sort()
a

In [None]:
b = ['one','two','three','four','five']
b.sort(key=len)
b

In [None]:
# 二分搜索和维护已排序的列表，使用bisect模块
# bisect.bisect,找到插入值并返回其位置，不改变原列表顺序
# bisect.insort,向这个位置插入值（按顺序）
import bisect
s = [1,22,8,5,66,4,4,7,5]
s.sort()  #原地排序
bisect.bisect(s,8)

In [None]:
bisect.insort(s,100)
s

# 序列函数
- enumerate函数
- sorted函数
- zip函数
- reversed函数

In [None]:
# enumerate函数，返回(i,value)元组序列
some_list = ['foo','bar','baz']
mapping = {}
for i,value in enumerate(some_list):
    mapping[value] = i
mapping

In [None]:
# sorted函数，从任意序列的元素返回一个新的排好序的列表
sorted(range(10),reverse=True)

In [None]:
# zip函数，将多个列表、元组或其他序列成对组合成一个元组列表
seq1 = ['foo','batr','baz']
seq2 = ['one','two','three']
zipped = zip(seq1,seq2)
print(type(zipped))
list(zipped)

In [None]:
# zip函数和enumerate函数搭配使用
for i,(a,b) in enumerate(zip(seq1,seq2)):
    print('{0}:{1},{2}'.format(i,a,b))

In [None]:
# reversed函数，从后向前迭代一个序列，实现反转，是一个生成器
list(reversed(range(10)))

# 字典
### 常见名字为哈希映射或关联数组，是键值对大小可变的集合，键和值都为Python可变对象，使用花括号创建，用冒号分隔键和值

In [None]:
dic = {'name':'vodka','sex':'boy','age':25}
dic['age']

In [None]:
# 使用关键字del或pop（返回值的同时删除键）方法删除值
dic['tall'] = 183
del dic['age']
dic

In [None]:
pop_value = dic.pop('tall')
pop_value

In [120]:
dic

{'name': 'vodka', 'sex': 'boy'}

In [121]:
# 用序列方法创建字典，结合zip函数
mapping = dict(zip(range(5),reversed(range(5))))
mapping

{0: 4, 1: 3, 2: 2, 3: 1, 4: 0}

In [122]:
# 有效的键类型，键通常为不可变的标量类型（整数、浮点、字符串）或元组，“可哈希性”，用hash()函数检测一个对象是否是可哈希的
hash('vodka')

-3084222241900416308

# 集合

In [123]:
# 集合支持合并、交集、差分和对称差等数学集合运算
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}

In [124]:
# 并集,提取两个集合中不重复的元素
a | b    
a.union(b)

{1, 2, 3, 4, 5, 6, 7, 8}

In [125]:
# 交集，两个元素的公共元素
a & b
a.intersection(b)

{3, 4, 5}

In [126]:
# 实现去重功能
a = [11,4,5,7,89,6,2,2,2,2,4]
set(a)

{2, 4, 5, 6, 7, 11, 89}

# 列表、集合和字典推导式

In [127]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
aa = [x.upper() for x in strings if len(x) > 2]
aa

['BAT', 'CAR', 'DOVE', 'PYTHON']

In [128]:
unique_lengths = {len(x) for x in strings}
unique_lengths

{1, 2, 3, 4, 6}

In [129]:
loc_mapping = {val:index for index,val in enumerate(strings)}
loc_mapping

{'a': 0, 'as': 1, 'bat': 2, 'car': 3, 'dove': 4, 'python': 5}

# 函数
### 函数是Python 中最主要也是最重要的代码组织和复用手段。作为最重要的原则，如果你要重复使用相同或非常类似的代码，就需要写一个函数。通过给函数起一个名字，还可以提高代码的可读

In [130]:
# 函数使用关键字def声明，用return关键字返回值
def my_function(x, y, z=1.5):
    if z > 1:
        return z * (x + y)
    else:
        return z / (x + y)

In [131]:
# 函数参数：位置参数必须位于关键字参数之前

In [132]:
# 命名空间，作用域，和局部函数
# 全局变量，局部变量
def func():
    a = []
    for i in range(5):
        a.append(i)
    return a

In [133]:
#调用函数fun()后，首先会创建出空列表，然后添加五个元素，最后a会在函数退出的时候被销毁
print(func())

[0, 1, 2, 3, 4]


In [134]:
# 匿名(lambda)函数:由单条语句组成，该语句的结果就是返回值，通过lambda关键字定义
def apply_to_list(some_list, f):
    return [f(x) for x in some_list]
ints = [4, 0, 1, 5, 6]
apply_to_list(ints, lambda x: x * 2)

[8, 0, 2, 10, 12]

In [135]:
strings = ['foo', 'card', 'bar', 'aaaa', 'abab']
strings.sort(key=lambda x:len(set(list(x))))
strings

['aaaa', 'foo', 'abab', 'bar', 'card']

# 错误和异常处理

In [136]:
# float函数会返回浮点类型值，但不能将字符串转换为数值类型
def attempt_float(x):
    try:
        return float(x)
    except (ValueError,TypeError):
        return(x)

In [137]:
print(attempt_float('546785'))
print(attempt_float('something'))

546785.0
something


In [138]:
path = 'test.txt'
f = open(path)
for line in f:
    pass
f.clos()

AttributeError: '_io.TextIOWrapper' object has no attribute 'clos'

In [None]:
# 用sys模块检查默认的编码
import sys
sys.getdefaultencoding()

# 文件方法
- read([size]),以字符串形式返回文件数据，'size'用于说明读取的字节数
- readlines([size]),将文件返回为行列表，可选参数size
- write(str),将字符串写入文件
- close(),关闭句柄
- flush(),清空内部I/O缓存区，并将数据强行写回磁盘
- seek(pos),移动到指定的文件位置（整数）
- tell(),以整数形式返回当前文件位置
- closed,如果文件已关闭，则为True