# 数据结构

## 字符串

### 格式转换

#### 字符串/json to 字典

In [40]:
import json
str1 = "{'key':1,'value':2}"

# 内置函数转换
eval(str1)

# 可将json的null替换为python能识别的None
json1= '{"key":null,"value":2}'
dicts = json.loads(json1)
print(dicts)

{'key': None, 'value': 2}


### 单双引号使用

In [2]:
# 双引号中的双引号需要转义
string1 = "hello，my，\"god\" "
# 单引号中的双引号不需要转义
string2 = 'hello, my "god" '

### py文件中的sql

In [6]:
sql_a = 'select * from asset where asset_create_at >= "2018-08-01" '

# 注意每一个右引号左边都需要空格
sql_b = ('select * '
         'from asset '
         'where asset_id = "123456";'
         )


select * from assetwhere asset_id = "123456";


### 转unicode和split

In [8]:
b = u"Hi"  # 转成unicode格式

assert 'Hello World！'.istitle() == True  # 判定字符串是否每个单词有且只有第一个字母是大写
print('hello world！'.title())  # 将每一个单词的首字母大写

# 两种不同的split
print('  hello  world!  '.split())
print('  hello  world!  '.split(' '))

Hello World！
['hello', 'world!']
['', '', 'hello', '', 'world!', '', '']


## 元祖

### 格式转换

#### 元祖to字典

In [25]:
# 把元组转换成一个字典
l = (('Knights', 'Ni'), ('Monty', 'Python'), ('SPAM', 'SPAAAM'))
d = dict(l)
print(d)

{'Knights': 'Ni', 'Monty': 'Python', 'SPAM': 'SPAAAM'}


## 列表

### 格式转换

#### 列表to字典

In [None]:
dict1 = {x: x ** 2 for x in (2, 4, 6)}
print(dict1)

### 索引

In [19]:
# 不适用索引，可以不用使用first_name = l[0]，last_name = l[1]
lst = ['David', 'Pythonista', '+1-514-555-1234']
first_name, last_name, phone_number = lst
# Python 3 Only
first, *middle, last = lst

### 遍历迭代

In [9]:
# 遍历列表以及索引
li = ['a', 'b', 'c', 'd', 'e']
for i, e in enumerate(li):
    print("index:",i,"element:",e)

index: 0 element: a
index: 1 element: b
index: 2 element: c
index: 3 element: d
index: 4 element: e


#### 多列表迭代

In [22]:
# 循环嵌套
# 不推荐
x_list, y_list, z_list = [], [], []
for x in x_list:
    for y in y_list:
        for z in z_list:
            None
##推荐
from itertools import product
for x, y, z in product(x_list, y_list, z_list):
    None

#### 自定义反序迭代

In [10]:
li = ['a', 'b', 'c', 'd', 'e']
def myenumerate(sequence):
    n = -1
    for elem in reversed(sequence):
        yield len(sequence)+n, elem
        n = n - 1

for i2,e2 in myenumerate(li):
    print("index:", i2, "element:", e2)

index: 4 element: e
index: 3 element: d
index: 2 element: c
index: 1 element: b
index: 0 element: a


### 列表元素批处理
使用python的collections模块替代内建容器类型

deque：增强功能的类似list类型
(列表是基于数组实现的，而deque是基于双链表的，所以后者在中间or前面插入元素，或者删除元素都会快很多)

defaultdict：类似dict类型
(defaultdict为新的键值添加了一个默认的工厂，可以避免编写一个额外的测试来初始化映射条目，比dict.setdefault更高效)

namedtuple：类似tuple类型

#### setdefault

In [41]:
result1 = {}
data1 = [("p", 1), ("p", 2), ("p", 3),
        ("h", 1), ("h", 2), ("h", 3)]
for (key, value) in data1:
    result1.setdefault(key, []).append(value)
print(result1)

{'p': [1, 2, 3], 'h': [1, 2, 3]}


#### defaultdict

In [43]:
# use defaultdict 性能更好
from collections import defaultdict

data2 = [("p", 1), ("p", 2), ("p", 3),
        ("h", 1), ("h", 2), ("h", 3)]
result2 = defaultdict(list)
for (key, value) in data2:
    result2[key].append(value)

print(result2)

defaultdict(<class 'list'>, {'p': [1, 2, 3], 'h': [1, 2, 3]})


## 字典

### 遍历迭代

In [11]:
personinfo = {'name': 'joe', 'age':'20', 'hobby':'football'}
for k, v in personinfo.items():
    print(k, v)

name joe
age 20
hobby football


## 内置函数

### all 迭代对象判断

In [None]:
# 如果可迭代的对象(数组，字符串，列表等，下同)中的元素都是 true (或者为空)的话返回 True
# all(iterable)

### any 迭代对象判断

In [None]:
# 如果可迭代的对象中任何一个元素为 true 的话返回 True 。如果可迭代的对象为空则返回 False
# any(iterable)

### cmp 比较两个对象大小

In [None]:
# 比较两个对象 x 和 y 。 x < y 的时候返回负数， x ==y 的时候返回 0， x > y 的时候返回正数
# cmp(x, y)

### pow 返回 x 的 y 次幂

In [44]:
# 返回 x 的 y 次幂(如果 z 存在的话则以 z 为模)
# pow(x, y [,z])  等同于 mod = (x ** y) % z，可以极大的提升速度
print(pow(1234567,4567676,56))

25


# 高级编程

## 生成器

### 列表生成器

In [17]:
ls = [1, 2, 3, 4]
list1 = [i for i in ls if i > 2]
print(list1)

list2 = [i * 2 for i in ls if i > 2]
print(list2)

dict1 = {x: x ** 2 for x in (2, 4, 6)}
print(dict1)

dict2 = {x: 'item' + str(x ** 2) for x in (2, 4, 6)}
print(dict2)

set1 = {x for x in 'hello world' if x not in 'low level'}
print(set1)


[3, 4]
[6, 8]
{2: 4, 4: 16, 6: 36}
{2: 'item4', 4: 'item16', 6: 'item36'}
{'h', 'r', 'd'}


### 需要bool判断的生成器

In [15]:
## 不推荐
def condition(item):
    print(item+100)

a_list = [1,2,3,4,5,6]
found = False
for item in a_list:
    if condition(item):
        found = True
        break
if found:
    None

## 推荐
if any(condition(item) for item in a_list):
    None

101
102
103
104
105
106
101
102
103
104
105
106
