<a href="https://colab.research.google.com/github/artizans/pythoncore/blob/main/pythonModular.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### 简单模块化
1. 多文件：将函数、类、常量等拆分到不同的文件，放到同一文件夹中
  * 引用：from your_file import function_name, class_name
2. 多文件夹：将函数、类、常量等拆分到不同的文件，放到不同文件夹中
  * 引用
    * 获得文件所在的文件夹：sys.path.append('..'):将当前所在位置向上提一级
    * from your_dir.your_file import fucntion_name,class_name
  * import同一个模块只会被执行一次，防止重复导入模块出现问题


### 项目模块化

1. 文件路径(项目中建议使用绝对路径)
  * 相对路径:任意两个文件都存在一条通路
    * `..`：表示上一层目录
  * 绝对路径：从根目录开始到子叶节点的路径
    * Linux每个文件都有绝对路径，以`/`(根目录)开头到叶子节点(/home/ubuntu/Desktop/my_project/test.py)
2. 一个Python文件运行时，都有一个运行时位置，但可以改变
  * sys.path.append("..")：改变当前Python解释器位置
3. 模块化思想：项目目录为最基本的目录，所有自定义模块调用，都通过根目录一层层向下索引的方式来`import`.

### import相关问题

1. import导入的模块寻找路径：
 ```
  import sys  
  print(sys.path)
  ########## 输出 ##########
  ['', '/usr/lib/python36.zip', '/usr/lib/python3.6', '/usr/lib/python3.6/lib-dynload', '/usr/local/lib/python3.6/dist-packages', '/usr/lib/python3/dist-packages']

 ```
2. 修改import导入的模块寻找路径
  * 硬修改:在入口文件处或配置文件中
    * sys.path[0] = '/home/ubuntu/workspace/your_projects'
  * 修改PYTHONHOME:在虚拟环境中，修改activate文件
    * `export PYTHONPATH="/home/ubuntu/workspace/your_projects"`
3. mport在导入文件时，会自动执行暴露在外面的代码
4. 避开import时执行：若想将文件封装成模块，又想在模块内执行
  * 模块内最后加`if __name__ == '__main__'`，并将要执行代码放入其中
  * import语句会将`__name__`赋予该模块的名字

### 思考题
1. `from module_name import * 和 import module_name`的区别
 * `from module_name import *`将目录下的文件的所有模块都导入，且都有各自的前缀。类似拷贝一个目录下所有文件。
 * `import module_name`导入一个前缀，所有模块通过前缀访问。类似拷贝整个目录。





In [1]:
# utils.py
# 
def get_sum(a, b):
  return a + b

In [2]:
# class_utils.py
class Encoder(object):
  def encode(self, s):
    return s[::-1]

class Decoder(object):
  def decode(self, s):
    return ''.join(reversed(list(s)))

In [None]:
# main.py

from utils import get_sum
from class_utils import *

print(get_sum(1, 2))

encoder = Encoder()
decoder = Decoder()

print(encoder.encode('abcde'))
print(decoder.decode('edcba'))

########## 输出 ##########
# 3
# edcba
# abcde

In [None]:
# 避开import执行
# utils.py
def get_sum(a, b):
  return a + b
print('testing')
print('{} + {} = {}'.format(1, 2, get_sum(1, 2)))


# utils_with_main.py
def get_sum(a, b):
    return a + b
# 可单独调试模块，且在import导入此模块时避免执行
if __name__ == '__main__':
  print('testing')
  print('{} + {} = {}'.format(1, 2, get_sum(1, 2)))
    
# main.py
from utils import get_sum
print('get_sum: ', get_sum(1, 2))

########## 输出 ##########
# import导入模块时，会自动执行暴露在模块外的代码
# testing
# 1 + 2 = 3
# get_sum: 3

# main_2.py
from utils_with_main import get_sum

print('get_sum: ', get_sum(1, 2))

########## 输出 ##########
# import导入模块时，会将`__name__`改变为模块名
# 此时 if __name__ == '__main__':为False
# get_sum_2: 3

### 列表、元组、字典、集合

| 类型 | 说明 | 创建 | 内置函数 | 操作 | 存储差异 |
| ---- | ---- | ---- | ---- | ---- | ---- |
| 列表(list) |动态，任意类型、可重复的有序集合| []、list() | count()/index()/sort()/reverse() | 负数索引、切片操作、任意嵌套 |动态，除开元素空间外，额外存储指针及分配额外空间用于动态增长|
| 元组(tuple) |静态，任意类型、可重复的有序集合| (,)、tuple() | reversed()/sorted() | 负数索引、切片操作、任意嵌套 |静态，大小长度固定不可变|
| 字典(dict) |任意类型、有序集合| []、list | count | 以 |差异|
| 集合(set) |任意类型、有序集合| []、list | count | 以 |差异|

负数索引:可迭代对象支持负数索引,-1表示最后一个元素,-2为倒数第二个,依次类推

切片操作:可迭代对象进行选取操作
  * iterable[start:end[:step]]
    * start:起始索引值,可省略(从头开始),可为负数
    * end:终止索引值(end-1),可省略(末尾结束),可为负数
    * step:步长,可选参数,隔step取一个值
      * 大于0,切片从左往右
      * 小于0,切片从右往左 
  * 操作
    * 遍历可迭代对象的部分
    * 复制可迭代对象
    * 切片倒转:[::-1]
over-allocating机制:为提高列表的增加、删除效率，会额外分配给列表空间。




资源缓存(resource caching):静态数据占用空间不大时，会被后台缓存。
性能对比
  * 元组比列表轻量级，性能优于列表
    * 资源缓存会提高元组初始化效率
    * 索引操作两者差不多
    * 增删改操作列表更优
  * 使用场景
    * 元组用于不可变场景
    * 列表用于可变场景
思考题:何种方式创建列表更优
```
    # 创建空列表
    # option A
    empty_list = list()
    # option B
    empty_list = []
```
  

### 内置函数
  


```
# 列表、元组内置函数
# count(item):统计列表/元组中item出现的次数
# index(item):返回列表/元组中item第一次出现的位置
# list.reverse():原地倒转列表
# list.sort():原地排序列表
# reversed(tup):原地倒转元组，返回一个迭代器(),可通过list()将其转为列表
# sorted(tup):原地排序元组，返回排序好的新列表


l = [3, 2, 3, 7, 8, 1]
l.count(3) 
##### 输出 #####
# 2
l.index(7)
##### 输出 #####
# 3

l.reverse()
l
##### 输出 #####
# [1, 8, 7, 3, 2, 3]
l.sort()
l
##### 输出 #####
# [1, 2, 3, 3, 7, 8]

tup = (3, 2, 3, 7, 8, 1)
tup.count(3)
##### 输出 #####
# 2
tup.index(7)
##### 输出 #####
# 3
list(reversed(tup))
##### 输出 #####
# [1, 8, 7, 3, 2, 3]
sorted(tup)
##### 输出 #####
# [1, 2, 3, 3, 7, 8]
```



动态(mutable):长度大小不固定，可随意增删改元素
  * 增加元素：append()
  * 删除元素：

静态(immutable):长度大小固定，无法增删改元素
  * 增删改元组元素: 开辟新的内存，创建新的元组，将旧元组元素拷贝到新元组


### 列表
1. 增加元素
  * 列表末尾添加: append(value)
  * 插入元素: insert(index, value)
    * index: 要插入位置的索引值
2. 删除元素
  * del语句删除: `del list_name[index]`
  * pop()方法删除: `list_name.pop([index])`
    * index: 可选参数，删除元素在列表中的索引值
  * 区别: del直接删除，pop()返回被删除的元素值
  * remove()删除: `remove(value)`
    * value: 元素的值
    * 只删除第一个指定的值，如果存在多个相同值，需要循环删除
3. 组织列表
  * 永久排序: list_name.sort([reverse=True])
    * reverse:可选参数，为True时，降序排列
  * 临时排序: sorted(list_name,[reverse=True]),不改变原列表
  * 倒转列表: list_name.reverse()
  * 列表长度: len(list_name)
4. 列表操作
  * 对象遍历
  ```
    for val in val_list:
      print(val)
  ```
  * 索引遍历
  ```
    for index in range(len(val_list):
      print(val_list[index])
  ```
5. 常见函数
  * range([start,]end[,step]):生成有序数列
    * start:如果为0可不填，其他必填
    * end:结束位置(end-1)
    * setp:步长
  * min():返回列表中最小值
  * max():返回列表中最大值
  * sum():列表元素求和
  
6. 操作符
  * 乘方: `value ** n`(value的n次方)

8. 列表解析:for循环和创建新元素代码合成一行
  * 格式: expression for value in iterable
    ```
    squares = [value**2 for value in range(1,11)]
    ```












In [1]:
d = {'b':1, 'a':2, 'c':10}
d_sorted_by_key = sorted(d.items(), key=lambda x: x[0])
d_sorted_by_value = sorted(d.items(), key=lambda x: x[1])
print('d_sorted_by_key: {}'.format(d_sorted_by_key))
print('d_sorted_by_value: {}'.format(d_sorted_by_value))

d_sorted_by_key: [('a', 2), ('b', 1), ('c', 10)]
d_sorted_by_value: [('b', 1), ('a', 2), ('c', 10)]


In [2]:
s = {4, 3, 2, 1}
s_sorted = sorted(s)
print('s s_sorted:{}'.format(s_sorted))
print('s: {}'.format(s))

s s_sorted:[1, 2, 3, 4]
s: {1, 2, 3, 4}


In [6]:
import time 
id = [x for x in range(0, 100000)]
price = [x for x in range(200000, 300000)]
products = list(zip(id, price))

# 
def find_unique_price_using_list(products)->int:
  unique_price = []
  for _, price in products:
    if price not in unique_price:
      unique_price.append(price)
  print('find_unique_price_using_list size:{}'.format(len(unique_price)))
  return len(unique_price)
  

# 计算列表版本的时间
start_using_list = time.perf_counter()
find_unique_price_using_list(products)
end_using_list = time.perf_counter()
print('time elapse using list: {}'.format(end_using_list - start_using_list))

def find_unique_price_using_set(products):
  unique_price = set()
  for _, price in products:
    unique_price.add(price)
  print('find_unique_price_using_list size:{}'.format(len(unique_price)))
  return len(unique_price)
# 计算集合版本的时间
start_using_set = time.perf_counter()
find_unique_price_using_set(products)
end_using_set = time.perf_counter()
print('time elapse using set: {}'.format(end_using_set - start_using_set))
##### output #####
find_unique_price_using_list size:100000
time elapse using list: 75.80880516099933
find_unique_price_using_list size:100000
time elapse using set: 0.015269129999069264

find_unique_price_using_list size:100000
time elapse using list: 75.80880516099933
find_unique_price_using_list size:100000
time elapse using set: 0.015269129999069264


In [10]:
import time
def computer_execut_time(func, count, func_name):
  start_time = time.perf_counter()
  func(count)
  end_time = time.perf_counter()
  print('{} {} time elapse: {}'.format(count, func_name, end_time - start_time))

def str_add(count):
  s = ''
  for n in range(count):
    s += str(n)

def str_join(count):
  l = []
  for n in range(count):
    l.append(str(n))
  s = ''.join(l)
computer_execut_time(str_add,1000,'+= str')
computer_execut_time(str_join,1000,'join str')

1000 += str time elapse: 0.0004790629999433804
1000 join str time elapse: 0.000288160999957654


In [10]:
my_food = ['pizza', 'falafel', 'carrot cake']
# 深拷贝:新开一个块内存，存储变量值
friend_food = my_food[:]
# 浅拷贝:保存my_food的引用(内存地址)
other_friend_food = my_food
print('my_food list:{}'.format(my_food))
print('friend_food list:{}'.format(friend_food))
print('other_friend_food list:{}'.format(other_friend_food))
##### 输出 #####
# my_food list:['pizza', 'falafel', 'carrot cake']
# friend_food list:['pizza', 'falafel', 'carrot cake']
# other_friend_food list:['pizza', 'falafel', 'carrot cake']

# 比较值是否相等
print('my_food==friend_food==other_friend_food:{} '.format(my_food==friend_food==other_friend_food))
##### 输出 #####
# my_food==friend_food==other_friend_food:True 

# 比较对象是否相等，即是否为同一内存地址
# 深拷贝
print('my_food is friend_food:{}'.format(my_food is friend_food))
# 浅拷贝
print('my_food is other_friend_food:{}'.format(my_food is other_friend_food))
# 打印各自内存地址
print('my_food is id:{}'.format(id(my_food)))
print('friend_food is id:{}'.format(id(friend_food)))
print('other_friend_food is id:{}'.format(id(other_friend_food)))

##### 输出 #####
# my_food is friend_food:False
# my_food is other_friend_food:True
# my_food is id:140359247984752
# friend_food is id:140359248284880
# other_friend_food is id:140359247984752


my_food list:['pizza', 'falafel', 'carrot cake']
friend_food list:['pizza', 'falafel', 'carrot cake']
other_friend_food list:['pizza', 'falafel', 'carrot cake']
my_food==friend_food==other_friend_food:True 
my_food is friend_food:False
my_food is other_friend_food:True
my_food is id:140359247984752
friend_food is id:140359248284880
other_friend_food is id:140359247984752


In [7]:
# 元组是静态的(不可变)
demensions = (200, 500)
print('original dimensions:')
for demension in demensions:
  print(demension)
print('current demensions id:{}'.format(id(demension)))
# 元组不可通过索引对其元素进行删除或修改,Python会报错
# print('Modified dimensions by index:')
# TypeError: 'tuple' object does not support item assignment
# demensions[0] = 400
# 修改元组值只能通过重新赋值给变量，该变量会指向新的引用(内存地址)
print('\nModified dimensions:')
demensions = (400, 100)
for demension in demensions:
  print(demension)
print('Modified demensions id:{}'.format(id(demension)))
##### 输出 #####
# original dimensions:
# 200
# 500
# current demensions id:140359247859984

# Modified dimensions:
# 400
# 100
# Modified demensions id:94158712743520


original dimensions:
200
500
current demensions id:140359247859984

Modified dimensions:
400
100
Modified demensions id:94158712743520
