## 数据结构底层实现

### 列表的拷贝 —— 浅拷贝

In [4]:
ls_1 = [1,[34,54,23],(4,5,2),{"name":"ric"}]
ls_2 = ls_1.copy()
ls_2[1].append(34)
print("list1:  ",ls_1)
print("list2:  ",ls_2)

list1:   [1, [34, 54, 23, 34], (4, 5, 2), {'name': 'ric'}]
list2:   [1, [34, 54, 23, 34], (4, 5, 2), {'name': 'ric'}]


### 列表的底层实现
#### 引用数组的概念
    列表内的元素可以分散存储再内存中
    列表存储的实际上是这些元素的地址 —— 地址的存储再内存中是连续的

#### 列表浅拷贝时，如果列表中的元素也是列表，则时拷贝的列表的地址，而不是列表中的元素或元素地址

### 列表中元组的拷贝

In [11]:
ls_2[2] = (4,5,2)
ls_2[2] += (7,8)
print("list1:  ",ls_1)
print("list2:  ",ls_2)

list1:   [1, [34, 54, 23, 34], (4, 5, 2), {'name': 'ric'}]
list2:   [1, [34, 54, 23, 34], (4, 5, 2, 7, 8), {'name': 'ric'}]


#### 拷贝元组时由于元组时不可变类型，执行 += 操作时，会创建一个新的元组给列表中的元组进行替换

In [13]:
ls_2[2] -= (7,8)   # 元组可以执行 += 但是不能执行 -=

TypeError: unsupported operand type(s) for -=: 'tuple' and 'tuple'

### 列表中字典的拷贝 —— 与列表相似

In [14]:
ls_2[3]['math'] = 34

print("list1:  ",ls_1)
print("list2:  ",ls_2)

list1:   [1, [34, 54, 23, 34], (4, 5, 2), {'name': 'ric', 'math': 34}]
list2:   [1, [34, 54, 23, 34], (4, 5, 2, 7, 8), {'name': 'ric', 'math': 34}]


### 引入深拷贝

In [16]:
import copy

list_1 = [1,[34,54,23],(4,5,2),{"name":"ric"}]
list_2 = copy.deepcopy(list_1)
list_2[1].append(34)
list_2[-1]["math"] = 43

print("list1:  ",list_1)
print("list2:  ",list_2)

list1:   [1, [34, 54, 23], (4, 5, 2), {'name': 'ric'}]
list2:   [1, [34, 54, 23, 34], (4, 5, 2), {'name': 'ric', 'math': 43}]


## 字典

### 快速查找

In [25]:
"""普通列表方法"""
import time
ls_1 = list(range(10000000))
ls_2 = list(range(500))+[-10]*500

start = time.time()
count = 0
for n in ls_2:
    if n in ls_1:
        count += 1
end = time.time()
print("查找{}个元组，在ls_1中有{}个，共用时{}秒".format(len(ls_2),count,round(end-start,2)))
            

查找1000个元组，在ls_1中有500个，共用时22.14秒


In [26]:
"""字典法"""
import time
d = {i:i for i in range(10000000)}  # 字典键和值一一对应
ls_2 = list(range(500)) + [-10]*500

start = time.time()
count = 0
for n in ls_2:
    try:
        d[n]   # 检验字典中的元素是否存在
    except:
        pass
    else:
        count += 1
end = time.time()
print("查找{}个元组，在ls_1中有{}个，共用时{}秒".format(len(ls_2),count,round(end-start,2)))

查找1000个元组，在ls_1中有500个，共用时0.01秒


#### 字典是使用hash算法直接计算出散列值来找字典的，字典是一个稀疏数组，可以进行快速查找
通过空间换时间，字典需要较大的内存

### 字符串是紧凑数组
元素直接挨在一起

### 元组不总是不可变的

#### 1. 不可变类型 ：数字，字符串，元组
    在生命周期中，元素内容保持不变
    但是可以通过 += 操作符创建一个新的元组，给原来的元组变量符号赋值

In [28]:
x = 1
y = "python"

print("x id:",id(x))
print("y id:",id(y))

x += 2
y += "3.7"
print("x id:",id(x))
print("y id:",id(y))

x id: 140466813307184
y id: 140466671348080
x id: 140466813307248
y id: 140466188999664


####  2.可变类型：列表，字典，集合
    id保持不变
    内容可变

In [31]:
alist = ["d",3,"d","d"]
alist.remove(alist[2])  # remove 删除操作是删除列表中第一次出现的特定元素
# 不会直接删除对应下表的元素
alist

[3, 'd', 'd']

In [33]:
"""所以使用remove进行遍历删除的时候，需要使用负向索引的方式，否则容易跳过"""
# 不能直接使用 for i in list 进行遍历
alist = ["d",3,"d","5","d",3,"7","d"]
for i in range(-len(alist), 0):
    if alist[i] == "d":
        alist.remove("d")
print(alist)

[3, '5', 3, '7']


##  多维数组的创建

In [39]:
ls = [[0]*5]*5
ls

[[0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0]]

In [40]:
ls[0][0] = 1
ls
# 这样创建会导致多行列表都指向同一个一维列表

[[1, 0, 0, 0, 0],
 [1, 0, 0, 0, 0],
 [1, 0, 0, 0, 0],
 [1, 0, 0, 0, 0],
 [1, 0, 0, 0, 0]]

## 解析语法

#### 以列表推导为例 也称为列表推导式
    [expression for value in iterable if condition]
    三要素：表达式，可迭代对象，条件【可选】

#### 执行过程
    1.从可迭代对象中拿出一个元素
    2.通过if条件，对元素进行筛选
        若通过筛选，则把元素传递给表达式
        若未通过则进入下一次迭代
    3.将传递给表达式的元素，代入表达式进行处理，产生一个结果
    4.将3.产生的结果作为列表的一个元素进行存储


In [41]:
ls = [[0]*10 for i in range(5)]
ls

[[0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

In [43]:
ls[0][0] = 1
ls

[[1, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0, 0, 0, 0]]

#### 除了列表推导式还是有

In [44]:
# 集合推导
squares = {i**2 for i in range(5)}
squares

{0, 1, 4, 9, 16}

In [45]:
# 字典推导
squares = {i:i**2 for i in range(5)}
squares

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

In [46]:
# 生成器推导
squares = (i**2 for i in range(5))
for i in squares:
    print(i)

0
1
4
9
16


In [48]:
# 支持多变量以及循环嵌套
x = [1,2,3]
y = [1,2,3]
results = [i*j for i,j in zip(x,y)]
print(results)

colors = ["black","white"]
sizes = ["S","M","L"]
tshirts = ["{} {}".format(color,size) for color in colors for size in sizes ]
tshirts

[1, 4, 9]


['black S', 'black M', 'black L', 'white S', 'white M', 'white L']

### 条件表达式
    expr1 if condition else expr2

In [49]:
n = -10
if n >= 0:
    x = n
else:
    x = -n
x

10

In [50]:
n = -10
x = n if n >= 0 else -n
x

10

## 三大神器

### 生成器

In [51]:
ls = (i**2 for i in range(1000))
ls

<generator object <genexpr> at 0x7fc0b3dfca50>

### 生成器函数 —— yield
    相当于return 但是函数收到迭代信号或者 next()的时候会继续进行下去

In [59]:
def fab(max):
    a, b, n = 1, 1, 1
    while n<=max:
        if n > 2:
            a, b = b, a+b
            yield b
            n += 1
        elif n <= 2:
            yield 1
            n += 1


In [61]:
for i in fab(9):
    print(i)

1
1
2
3
5
8
13
21
34


### 迭代器
    可以不断被 next() 函数迭代，最后抛出 StopIterateion 的对象就是迭代器
    生成器，生成器函数都是迭代器

#### 列表、元组、字符串、字典、集合不是迭代器，只是可迭代对象

In [67]:
from collections.abc import Iterator
isinstance([1,2,3], Iterator)


False

range() 不是迭代器 xrange() 是生成器

for item in iterable 等价于：

    先通过iter() 函数获取可迭代对象的迭代器
    然后对获取到的迭代器不断调用next()方法来获取下一个值并赋予item
    当遇到StopIteration的异常的时候结束循环

itertools 里的函数迭代器 zip enumerate

文件也是迭代器

### 装饰器
    需要对已开发上线的程序添加某些功能
    不能对程序中的源码进行更改
    不能改变程序中函数的调用方式

In [90]:
import time

def timer(func): 
        start = time.time()
        func()
        end = time.time()
        print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start)))
        return func
    
def f1():
    print("f1 run")
    time.sleep(1)
    
    
timer(f1)

f1 run
f1 函数运行用时1.00秒


<function __main__.f1()>

In [83]:
def timer_test(func):
    
   # func不需要传参可以直接return func 不需要添加中间层
    start = time.time()
    func()
    end = time.time()
    print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start)))
    return func

@timer_test
def f1():
    print("f1 run")
    time.sleep(1)

f1()

f1 run
f1 函数运行用时1.00秒
f1 run


定义inner 函数以后，可以防止执行timer()的时候直接调用func，而是返回一个函数的指针，并且增加传参功能

In [71]:

def timer(func):
    
    def inner(*args, **kwargs):   # 定义inner 函数以后，可以防止执行timer()的时候直接调用func，而是返回一个函数的指针,并且增加传参功能
        start = time.time()
        func(*args, **kwargs)
        end = time.time()
        print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start)))
    return inner
    
def f2(n):
    print("f1 run")
    time.sleep(n)
    
    
timer(f2)

<function __main__.timer.<locals>.inner()>

用装饰器方式表达

In [72]:
# 用装饰器方式表达
@timer
def f2():
    print("f2 run")
    time.sleep(1)

# 相当于这里省略了 f2 = timer(f2)
f2()  

f2 run
f2 函数运行用时1.00秒


#### 装饰器所有功能：
    装饰的函数需要传参
    装饰的函数需要返回值
    装饰器本身需要传参
    装饰器需要多种返回值

In [76]:
def timer(method):    # 装饰器本身需要传参
    
    
    def single(func): # 在这里另外加一层嵌套
        def single_inner(*args, **kwargs):  #这一层开始和不加参数的相似
            print("single inner run")
            start = time.time()
            res = func(*args, **kwargs)
            end = time.time()
            print("{} 函数运行用时{:.2f}秒".format(func.__name__, (end-start)))
            return res
        return single_inner
    
    def double(func):
        def double_inner(*args, **kwargs):
            print("double inner run")
            start = time.time()
            res = func(*args, **kwargs)
            end = time.time()
            print("{} 函数运行双倍用时{:.2f}秒".format(func.__name__, 2*(end-start)))
            return res
        return double_inner
    
    if method == "origin":   # 可以在所有中间嵌套定义结束后选择需要根据参数返回中间嵌套函数
        return single    
    elif method == "double":
        return double
        
@timer(method="double")  # 默认执行了初步的函数转换  timer = timer(method)  再接下来  f2 = timer(f2) 装饰 f2函数， 所以创造装饰器时也需要多一层
def f2(n):
    print("f2 sleep")
    time.sleep(n)
    return n
    
f2(2)

double inner run
f2 sleep
f2 函数运行双倍用时4.00秒


2