In [None]:
"""Python数据结构

列表list，有序集合，[]，有append, insert, pop等操作
元组tuple，类似list，()，一旦定义内容不可变
字典dict，无序键值对，{}
集合set，无序无重复元素的集合，只存储key，以set()方法构建，参数为一个list
"""

In [5]:
# 列表list
colors_list = ['red', 'green', 'blue', 'black', 'white']
print('列表list: ', colors_list)

# 元祖tuple
colors_tuple = ('red', 'green', 'blue', 'black', 'white')
print('元祖tuple: ', colors_tuple)

# 字典dict
colors_dict = {'red':'ff0000', 'green':'00ff00', 'blue':'0000ff', 'black':'000000', 'white':'ffffff'}
print('字典dict: ', colors_dict)

# 集合set
colors_set = set(colors_list)
print('集合set: ', colors_set)

列表list:  ['red', 'green', 'blue', 'black', 'white']
元祖tuple:  ('red', 'green', 'blue', 'black', 'white')
字典dict:  {'red': 'ff0000', 'green': '00ff00', 'blue': '0000ff', 'black': '000000', 'white': 'ffffff'}
集合set:  {'blue', 'green', 'red', 'black', 'white'}


In [31]:
"""枚举对象

enumerate(iterable, start=0) 返回一个枚举对象
"""

colors = ['red', 'green', 'blue', 'black', 'white']

# 列表可以通过下标访问
# 但不能直接遍历出下标
# print(colors[0])
# ValueError: too many values to unpack
# for index, color in colors:
#     print(index, color)

# 转换为枚举对象
print(list(enumerate(colors)))

# 遍历枚举对象
for index, color in enumerate(colors, start=1):
    print(index, color)

[(0, 'red'), (1, 'green'), (2, 'blue'), (3, 'black'), (4, 'white')]
1 red
2 green
3 blue
4 black
5 white


In [12]:
"""切片

list, tuple, str都可以进行切片操作
Python没有针对字符串的截取函数，使用切片完成对字符串的截取
"""

colors = ['red', 'green', 'blue', 'black', 'white']

# 取前3个元素，从索引0开始，到索引3为止，但不包括索引3
print(colors[0:3])

# 如果开始索引是0，可以省略
print(colors[:3])

# 反向切片
print(colors[-2:])

# 倒数第一个的索引是-1
print(colors[-2:-1])

# 取最后一个元素
print(colors[-1:])

# 每两个元素取一个
print(colors[::2])

['red', 'green', 'blue']
['red', 'green', 'blue']
['black', 'white']
['black']
['white']
['red', 'blue', 'white']


In [27]:
"""迭代

可迭代对象均可进行迭代操作
迭代通过for...in来完成
"""

# 判断一个对象是否为可迭代对象
from collections import Iterable

print(isinstance([1, 2, 3], Iterable))
print(isinstance('abc', Iterable))
print(isinstance(100, Iterable))

# 对字典dict对象进行迭代
colors = {'red':'ff0000', 'green':'00ff00', 'blue':'0000ff'}
# 默认迭代key
for color in colors:
    print(color, end='\t')
print()
# 迭代value
for code in colors.values():
    print(code, end='\t')
print()
# 同时迭代key和value
for color, code in colors.items():
    print(color, code)
    
# 对字符串str进行迭代
for ch in 'ABC':
    print(ch, end='\t')
print()    
    
# 同时迭代多个值
coords = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
for x, y, z in coords:
    print(x, y, z, sep='\t')

# 以上写法等价于
for coord in coords:
    print(coord[0], coord[1], coord[2], sep='\t')

True
True
False
red	green	blue	
ff0000	00ff00	0000ff	
red ff0000
green 00ff00
blue 0000ff
A	B	C	
1	2	3
4	5	6
7	8	9
1	2	3
4	5	6
7	8	9


In [41]:
"""列表生成式

列表生成式即List Comprehensions
Python内置的非常简单却强大的可以用来创建list的生成式
"""

# 列表生成式
print(list(range(1, 11)))
print([n for n in range(1, 11)])
print([n * n for n in range(1, 11)])

# 在列表生成式中使用if...else
# for后面的if是过滤条件，不能带else
# for前面的if...else是表达式，必须带else
print([n * n for n in range(1, 11) if n % 2 == 0])
print([n if n % 2 == 0 else -n for n in range(1, 11)])

# 通过多层循环生成全排列
print([m + n for m in 'ABC' for n in 'XYZ'])

# 运用列表生成式，列出当前目录下的所有文件和目录名
import os
print([d for d in os.listdir('.')])

# 把list中的所有字符串变成小写
colors = ['RED', 'GREEN', 'BLUE']
print([color.lower() for color in colors])

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]
[4, 16, 36, 64, 100]
[-1, 2, -3, 4, -5, 6, -7, 8, -9, 10]
['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']
['.ipynb_checkpoints', 'data', 'files', 'templates', 'Web开发.ipynb', '函数式编程.ipynb', '基础&杂记.ipynb', '字符串和文本.ipynb', '并发编程.ipynb', '数字.ipynb', '数据库操作.ipynb', '数据结构和算法.ipynb', '数据结构和算法2.ipynb', '数据结构和算法3.ipynb', '数据编码和处理.ipynb', '文件和IO.ipynb', '日期和时间.ipynb', '网络爬虫.ipynb', '网络编程.ipynb', '迭代器和生成器.ipynb', '错误和异常处理.ipynb', '面向对象编程.ipynb', '面向对象编程2.ipynb']
['red', 'green', 'blue']


In [9]:
"""变量的unpack

对于任何可迭代对象，都可以解压并赋值给多个变量
唯一的前提是变量的数量必须和可迭代对象包含的元素的数量相等
否则会抛出一个ValueError的异常
"""

colors = ['ff0000', '00ff00', '0000ff']
red, green, blue = colors

green

'00ff00'

In [11]:
"""解压不确定元素个数的可迭代对象

扩展的迭代器解压语法是专门为解压不确定个数或任意个数元素的可迭代对象设计的
通常这些可迭代对象的元素具有一定的规则
*号表达式：返回一个list
"""

record = ('Neo', 33, 'male', '15987654321', '025-12345678')
name, age, gender, *phones = record

phones

['15987654321', '025-12345678']

In [19]:
"""队列的基本使用

相比列表，队列的运行速度更快
使用collections.deque()方法构建，参数为一个list
"""

from collections import deque

# 设置队列的最大长度，旧的元素被自动删除
colors = deque(['red', 'green', 'blue'], maxlen=3)
colors.append('black')

# 在队列的头新增元素
colors.appendleft('white')

# 弹出最后一个元素
colors.pop()

# 弹出第一个元素
colors.popleft()

# 获取第一个元素
colors[0]

'green'

In [24]:
"""堆队列算法 heapq

当要查找的元素个数较少的时候，使用nlargest()和nsmallest()比较合适
如果要查找的元素个数和集合大小接近，则可以先排序，再切片
如果仅是要获取最值，则可以使用max()和min()
"""

import heapq

nums = [7, 22, 18, -6, 32, -19, 8, 16, 28, 1, 33]

# 查找最大的3个元素
heapq.nlargest(3, nums)

# 查找最小的3个元素
heapq.nsmallest(3, nums)

# 对list整体排序
sorted(nums)

# 最大值
max(nums)

# 最小值
min(nums)

-19

In [28]:
"""自定义排序

通过比较指定属性的大小进行排序
"""

import heapq

phones = [
    {'name': 'Apple', 'price': 9999},
    {'name': 'HuaWei', 'price': 6899},
    {'name': 'Mi', 'price': 3299},
    {'name': 'vivo', 'price': 4899},
    {'name': 'OPPO', 'price': 5299},
    {'name': 'Samsung', 'price': 7899}
]

# 按价格排序(默认升序)
sorted(phones, key=lambda phone: phone['price'])

# 价格最高的3个手机
heapq.nlargest(3, phones, key=lambda phone: phone['price'])

# 价格最低的3个手机
heapq.nsmallest(3, phones, key=lambda phone: phone['price'])

[{'name': 'Mi', 'price': 3299},
 {'name': 'vivo', 'price': 4899},
 {'name': 'OPPO', 'price': 5299}]

In [44]:
"""heapq的基本使用

heapq.heapify()
heapq.heappush()
heapq.heappop()
"""

import heapq

colors = ['red', 'green', 'blue', 'black', 'white']

# 将list转换成堆
# heapq.heapify(colors)

# 将元素加入堆中
heapq.heappush(colors, 'purple')

# 弹出堆的最小元素
heapq.heappop(colors)

colors

['blue', 'green', 'purple', 'black', 'white']

In [46]:
"""实现一个优先级队列"""

import heapq


# 定义元素类
class Color:
    def __init__(self, name):
        self.name = name
        
    def __repr__(self):
        return 'Color({!r})'.format(self.name)
    
    
# 定义优先级队列类
class PriorityQueue:
    def __init__(self):
        self._queue = []
        self._index = 0
    
    # 插入元素
    def push(self, item, priority):
        heapq.heappush(self._queue, (-priority, self._index, item))
        self._index += 1
    
    # 返回元素
    # 优先返回优先级最高的元素
    # 优先级相同的情况下，按照被插入到队列的顺序返回
    def pop(self):
        return heapq.heappop(self._queue)[-1]
    

# 测试
pq = PriorityQueue()
pq.push(Color('red'), 1)
pq.push(Color('green'), 3)
pq.push(Color('blue'), 3)
pq.push(Color('black'), 2)

pq.pop()

Color('green')