# 学习python

In [None]:
a : int | None = None
b = a or 10
print(b)   

3


## : | 用法
a : 是告诉开发者a的变量类型
`|` 是要么是第一个类型, 要不是第二个类型
b = a or 10 意思是a如果是真的话取a, 否则取b



## 修饰器 @ 用法
装饰器本质：高阶函数 + 闭包，用于给函数 / 方法添加额外功能，不修改原代码；
@装饰器名是语法糖，等价于函数 = 装饰器(函数)；
核心写法：装饰器接收原函数→定义内部包装函数（加新功能）→返回包装函数；
进阶技巧：用*args/**kwargs支持任意参数，return保留原函数结果；      *为解包符
常用场景：__日志、计时__、权限校验、缓存，以及内置的@property（方法转属性）。

### 修饰器常见误区
__忘记返回原函数结果__：装饰器的wrapper如果不return func(*args, **kwargs)，原函数的返回值会丢失；
不支持参数：直接写wrapper()而不用*args/**kwargs，导致带参数的函数调用报错；
混淆装饰器执行时机：@装饰器名在定义函数时就会执行（不是调用时).

## *args, **kwargs 含义
*args和**kwargs是 Python 专门用来处理任意数量参数的语法：
*args：接收任意数量的位置参数（按顺序传的参数），打包成一个元组；
**kwargs：接收任意数量的关键字参数（key=value形式的参数），打包成一个字典； (kwargs = keyargs)
（注：args和kwargs只是约定俗成的名字，你也可以写*abc/**def，但行业里都用args/kwargs，可读性更高）


In [None]:
#修饰器用法(贴纸)   添加附加功能
def fusu(a) -> function:                #定义一个修饰器
    def new():                          #定义一个新函数, 包装原函数     必须要有这个, 不然在定义test函数时就会执行了
        print("====开始执行函数====")
        a()
        print("====函数执行结束====")
    return new
    
@fusu
def test():
    print("正在执行test函数")

test()

====开始执行函数====
正在执行test函数
====函数执行结束====


In [None]:
# 支持任意参数的装饰器
def add_log(func):
    def wrapper(*args, **kwargs):  # 接收任意位置参数和关键字参数
        print(f"[日志] 函数{func.__name__}开始执行，参数：{args}, {kwargs}")
        result = func(*args, **kwargs)  # 把参数传给原函数
        print(f"[日志] 函数{func.__name__}执行结束，结果：{result}")
        return result  # 返回原函数的执行结果
    return wrapper

@add_log
def add(a, b):
    return a + b

# 调用带参数的函数
print(add(10, 20))


[日志] 函数add开始执行，参数：(10, 20), {}
[日志] 函数add执行结束，结果：30
30


In [None]:
# 自己尝试一个计算函数执行时间的装饰器
import time
def add_time(func):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        result = func(*args, **kwargs)
        end_time = time.time()
        print(f"[时间] 函数{func.__name__}执行时间: {end_time - start_time}秒")
        return result
    return wrapper

@add_time
def multiply(a, b):
    time.sleep(1)  # 模拟耗时操作
    return a * b

print(multiply(5, 6))
            

[时间] 函数multiply执行时间: 1.0003223419189453秒
30


## with open的使用
语法糖  不用手动close()，不怕异常导致资源泄露
实现了__enter__/__exit__的对象都能用（比如数据库连接、锁、网络会话）
出了错误会自己退出, 如file.close()
with是 Python 给你的 “资源管家”，不用你手动盯着资源的 “打开 / 关闭”，专注写核心逻辑就行。

with在英文中最核心的含义是：“和… 一起”“伴随”“在… 的情况下”。这个语义完美对应上下文管理器的核心功能
 ——“伴随某个资源的生命周期执行操作”

In [None]:
"""
with open(f"{keyword}.csv", "w", encoding="utf-8-sig", newline="") as f:
        writer = csv.writer(f)
        writer.writerow(["BVID"])  # 写入表头（可选，更清晰）
        for bvid in bv_id_list:
            writer.writerow([bvid])  # 逐行写入BVID
"""

## 类型转换
可以使用 int(), float(), str() 函数来进行类型转换       用type()函数查看变量类型
str -> 别的类型要小心是否可以转, 别字母转int了

In [1]:
t_str = "1234"
num = int(t_str)
print(type(num))  # <class 'int'>
print(type(str(num)))        # <class 'str'>

<class 'int'>
<class 'str'>


## 字符串拼接
字符串之间可以用加号拼接, 非常方便
也可以格式化输入 f == format    {}来框取要代替的变量 {}中也可以有表达式

In [4]:
name = "fusu"
print("他的名字叫" + name  + ", 很好听")

print(f"他的名字叫{name}, 很好听")

print(f"1 + 1 = {1 + 1}")

他的名字叫fusu, 很好听
他的名字叫fusu, 很好听
1 + 1 = 2


## input()
要注意, 从input()函数中得到的数据永远是字符串类型的!
input()的括号中可以添加提示词

In [5]:
num = int(input("请输入一个数字: "))
print(f"你输入的数字是{num}，它的类型是{type(num)}")
str_num = input("请输入一个数字: ")
print(f"你输入的数字是'{str_num}'，它的类型是{type(str_num)}")

你输入的数字是1，它的类型是<class 'int'>
你输入的数字是'2'，它的类型是<class 'str'>


## if语句
if 表达式 : 
    XXX
elif 表达式:
    XXX
else :
    XXX

注意冒号

## while
while 条件: 
    XXX

for 临时变量 in 待处理的数据集:      可以给数据集使用enumerate()函数, 就会是 for i, num in enumerate(li):
    XXX                            就有index了

range() 左闭右开
range(0, 6, 2), 最后一个是步长, 默认是1
注意冒号

也有C中的continue和break, 作用和C也类似


pass 语句  即什么也不执行
while true:
    pass

In [None]:
for i in range(0, 6):
    print(i)
    
for i in range(1, 6, 2):  #奇数
    print(i)

0
1
2
3
4
5
1
3
5


## 函数
定义函数
def func(): -> int      可以指定返回类型
    ```
        函数说明文档
        XXX
    ```
    XXX
    return()            如果不写return, 就默认return None
                        python的return可以有多个返回值, 以元组的方式返回, 所以可以解包

任意实参列表  使用 *args 和 ** kwargs 来用列表和字典

解包实参列表
可以使用*来解包, 如 *args 和 ** kwargs

函数注解
以字典的形式存放在函数的 __annotations__ 属性中而对函数的其他部分没有影响

函数也可以当做一个变量, 即函数变量, 可赋值, 可当参数传入

匿名函数lambda  lambda 临时变量: 处理临时变量逻辑

In [22]:
#任意参数函数
def concat(*args, sep="/"):
    print(sep.join(args))

concat("earth", "mars", "venus")

concat("earth", "mars", "venus", sep=".")

#解包
def parrot(voltage, state='a stiff', action='voom'):        #默认action是voom, 现在是VOOM
    print("-- This parrot wouldn't", action, end=' ')
    print("if you put", voltage, "volts through it.", end=' ')
    print("E's", state, "!")

d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"}
parrot(**d)

#函数注解
def f(ham: str, eggs: str = 'eggs') -> str:
    print("Annotations:", f.__annotations__)
    print("Arguments:", ham, eggs)
    return ham + ' and ' + eggs
f('spam')

earth/mars/venus
earth.mars.venus
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !
Annotations: {'ham': <class 'str'>, 'eggs': <class 'str'>, 'return': <class 'str'>}
Arguments: spam eggs


'spam and eggs'

##  数据容器

1. list
li = [元素1, 元素2, XXX]    list里面也可以套list    也有下标, 和数组一样, 也可以反向索引, 最后一个是-1
list 的方法
li.append(元素)     尾添加一个元素
li.extend(容器)     尾相连一个容器
li.insert(下标, 元素)   插入元素
li.pop(下标)            删元素
li.remove(元素)         查找第一个匹配的元素
li.clear()              清空
li.count(元素)          字面意思
li.index(元素)          查找元素的下标, 查不到报错
li.popleft()            字面
len(li)                 list的长度  因为这个别的容器也用所以单独成一个函数, 而不是list一个方法
python中的list很容易实现模拟栈和队列

for element in li:
    XXX

2. tuple 元组
元组一旦定义完成，就不可修改
tpl = (元素1, 元素2, XXX)        使用小括号      要注意的是元组不可修改
                                但如果元组中嵌套的有列表，那么列表中的元素可以修改（列表list的本质没有改变，所以不违背元组不可以修改的原则）
tuple 的方法
index()
count()
len()
tuple也可以解包     x, y, z = tpl       左边的个数要相同    若不要什么, 什么写成_, 多个不要写成_*, 或成list  
                    x, _, z = tpl   |    x, *_ = tpl    |     x, *other = tpl
zip(list1, list2)                   将两个列表对应形成元组

3. str 字符串
和C一样
str的方法
str.index()
str.replace(字符串1, 字符串2)       把str中的所有字符串1替换成字符串2  返回一个新的字符串
str.split(字符串)                   根据字符串分割str, 返回一个新的列表
str.strip() / str.strip(字符串)     移除首尾的空格和换行符或指定字符串
str.count()
__分隔符.join(字符串)__                如函数中的那个例子所展示的  这个要想起来
len(str)

字符串不可以对某一个元素进行单独赋值 str[0] = X     但可以使用replace

4. 序列
序列是指：内容连续、有序，可使用*下标索引*的一类数据容器
列表、元组、字符串，均可以可以视为序列。

序列的参见操作是切片
语法：序列[起始下标:结束下标:步长]          注意: 中间是冒号

5. set集合
my_set = {元素1, 元素2, XXX}        无序, 不可重复

set 方法
set.add(元素)
set.remove(元素)
set.pop()           随机取出来一个元素
set.clear()         
set1.difference.(set2)   得到一个新集合, 包含两个集合的差集
set1.difference_update(set2)    在集合1中, 删除集合2中存在的元素
set1.union(set2)         得到一个新集合, 包含两个集合的全部元素
len(set)

6. 字典
字典的定义，同样使用{}，不过存储的元素是一个个的：键值对
my_dict = {key:value, key:value}        字典里面也可以套字典

dict 方法
dict[key] = value       添加或更新键值对
dict.pop(Key)
dict.clear()
dict.in(key)            检查是否有key           
dict.keys()             获取字典的全部key, 可用于for遍历        注意是keys
dict.values()
len(dict)
dict(zip(list1, list2))                   将两个列表对应形成字典
dict和列表一样也可以写字典推导式, 把[]换成{}即可 {操作 for XXX if XXX}
若使用dict[key]去访问, 若key没有的话会报错, 所以可以使用dict.get(key)的get方法, 没有只会返回none
对字典直接使用list(dict), 返回dict的所有键值对列表
字典的遍历也可以直接    for key in my_dict:

7. 数据容器的通用操作:
max(set)
min(list)
len(tuple)
list()          转成列表
tuple()         转成元组
sort(list)    正序排列
sorted(list, reverse=True)      逆序排列


## 语法糖

In [None]:
# 大数字的更易读写法
a = 10000000000
b = 10_0000_0000        #更易读的数字表示法

In [None]:
# 交换值
a = 5
b = 10
a, b = b, a

In [9]:
# 范围比较
a = 15
if 10 < a < 20:
    print("a在10到20之间")

a在10到20之间


In [10]:
# 字符串乘法
print ("-" * 10 + "分隔符" + "-" * 10)

----------分隔符----------


In [11]:
# 列表合并
a = [1, 2, 3]
b = [4, 5, 6]
c = a + b
c

[1, 2, 3, 4, 5, 6]

In [None]:
# 多重赋值 (打包解包)
a = [1, 2]
b, c = a
print(b, c)    # 1 2
print([b, c])  # [1, 2]，这里用元组做例子也一直，比如坐标

In [None]:
# with 语句打开文件     
with open("example.txt", "w") as f:
    f.write("Hello, World!")

In [None]:
# 列表推导式
# 举个例子，给a中元素每个+10创建到另一个数组，直接递归很麻烦，列表推导式能很简洁地写成↓
# 基础版    [表达式 for 变量 in 可迭代对象]
a = [1, 2, 3, 4]
b = [k + 10 for k in a]
print(b)   # [11, 12, 13, 14]

# 模拟sorted_by_play（可迭代对象，元素是字典）
sorted_by_play = [
    {"bvid": "BV123", "play": 1000},
    {"bvid": "BV456", "play": 2000}
]
# 列表推导式：提取每个字典的"bvid"值
bvid_list = [v["bvid"] for v in sorted_by_play]
print(bvid_list)  # ['BV123', 'BV456']

#进阶版    [表达式 for 变量 in 可迭代对象 if 条件]

In [17]:
# 最后一个就是昨天的装饰器内容
def add_log(func):
    def wrapper(*args, **kwargs):  # 接收任意位置参数和关键字参数
        print(f"[日志] 函数{func.__name__}开始执行，参数：{args}, {kwargs}")
        result = func(*args, **kwargs)  # 把参数传给原函数
        print(f"[日志] 函数{func.__name__}执行结束，结果：{result}")
        return result  # 返回原函数的执行结果
    return wrapper

@add_log
def add(a, b):
    return a + b

add(10, 20)

[日志] 函数add开始执行，参数：(10, 20), {}
[日志] 函数add执行结束，结果：30


30

## 错误和异常
try:
    XXX
except Exception as e:          # e是一个元组, 有args属性,  存储着冒出异常传入的参数
    XXX


raise  主动抛出异常

## 复杂排序
即列表里套的字典这种
sorted(list, 要排的属性(这里得是一个函数去返回这个属性))

In [None]:
# 字典列表
videos = [
    {"bvid": "BV1", "play_count": 100000, "duration": 180, "publish_time": "2025-01-01"},
    {"bvid": "BV2", "play_count": 50000, "duration": 120, "publish_time": "2025-01-02"},
    {"bvid": "BV3", "play_count": 100000, "duration": 240, "publish_time": "2025-01-03"},
    {"bvid": "BV4", "play_count": 80000, "duration": 90, "publish_time": "2024-12-30"},
]

# 1. 单条件排序：按播放量升序
sorted_by_play = sorted(videos, key=lambda x: x["play_count"])  #用函数作为key参数, 即每一个元素x取其播放量字段
print("按播放量升序：", [v["bvid"] for v in sorted_by_play])  # ['BV2', 'BV4', 'BV1', 'BV3']

# 2. 单条件降序：按播放量降序（两种方式）
# 方式1：reverse=True（全局反向）
sorted_by_play_desc = sorted(videos, key=lambda x: x["play_count"], reverse=True)
# 方式2：对数值取负（更灵活，适合多条件排序）   这个真是绝了
sorted_by_play_desc2 = sorted(videos, key=lambda x: -x["play_count"])
print("按播放量降序：", [v["bvid"] for v in sorted_by_play_desc])  # ['BV1', 'BV3', 'BV4', 'BV2']

## 类
1. 作用域和命名空间示例
用global和nonlocal对变量进行设置        有nonlocal时global不生效

2. 类定义语法
class Myclass:
    i = 1234
    def f(self):                self!       方法的第一个参数常常被命名为 self。
        return 'hello world'
    def __init__(self):
        self.i = 5678

类的实例化
x = Myclass()       实例化会调用类的__init__()特殊方法  可以定义

可用del语句 删除类的属性值

3. 继承
class DerivedClassName(BaseClassName):
    <语句-1>
    .
    <语句-N>
多重继承
class DerivedClassName(Base1, Base2, Base3):
    <语句-1>
    .
    <语句-N>
用super().来指代父类
4. 私有变量
那种仅限从一个对象内部访问的“私有”实例变量在 Python 中并不存在。 但是，大多数 Python 代码都遵循这样一个约定：
受保护的属性(protected): _(约定)        私有属性(private): __(名称修饰)

类可以定义一些魔术属性/函数
    最常用的就是 __init__() 这种还有很多, 可能有近一百个, 每次碰见没见过得再去单个查
    魔术函数还有是全局的, 如模块级别的__name__, 每次导入一个模块时第一次会执行一次模块中的代码, 所以要判断
    __name__ == __main__


In [None]:
#1. 作用域和命名空间示例
def scope_test():
    def do_local():
        spam = "local spam"

    def do_nonlocal():
        nonlocal spam
        spam = "nonlocal spam"

    def do_global():
        global spam
        spam = "global spam"

    spam = "test spam"
    do_local()
    print("After local assignment:", spam)
    do_nonlocal()
    print("After nonlocal assignment:", spam)
    do_global()
    print("After global assignment:", spam)

scope_test()
print("In global scope:", spam)

In [None]:
#2. 类的简单示例
class Complex:
    def __init__(self, realpart, imagpart):
        self.r = realpart
        self.i = imagpart

x = Complex(3.0, -4.5)
x.r, x.i

## 标准库

1. 随机模块
import random       random() 生成0~1    randint(1, 10)   生成一个随机整数
            也可以随机列表  shuffle(中文意思是洗牌) random.shuffle(li)  会改变列表中的顺序
                            choice(li)      随机选一个
                            choices(li, k=2)    随机选多个
                            sample(li, k=2)     随机选且不重复
                            若想真正的不重复, 有一个技巧: 可以将list转成set之后再转回list去重

2. 数学
import math         sqrt()  开方    ceil()  向上取整(中文含义天花板)    floor()     向下取整
                    round() 四舍五入(不是math里的)  最大公约数  gcd()
                    isclose(0.1*3, 0.3) 判断近似等于, 因为0.1在二进制中是无限不循环小数
                    sin() cos() 接受的是弧度    radians(30) 能将角度转换成弧度

3. 日期
import datetime     now = datetime.datetime.now()   返回当前时间
                    day = datetime.datetime(2004, 5, 17)    设定时间  print(day.year)/ print(day.week())
                    day = datetime.datetime.strptime("2004-5-17", "%Y-%m-%d")   字符串  格式
                    print(day.week())   返回这天是周几  这个好用啊
                    print(day.strftime("%Y年%m月%d日"))    规定格式
                    日期可以做运算  delta = day2-day1   算差多少天
                    delta = datetime.timedelta(days=10, hours=5)    可以自己手动设置一个delta
                    print(day1+delta)   可以算一个时间之后多长时间的值

4. 日历
import calender     print(calender.calender(2025))  打印25年所有日历
                    print(calender.month(2025, 1))  打印25年1月的日历
                    weekday = calender.weekday(2025, 1, 1)  返回这天是星期几
                    isleap(2025)    返回是否这一年是闰年

5. 文件
                    file_name = "names.txt"
                    f = open(file_name, mode='w', encoding='utf-8')
                    f.write("XX")
                    f.close()       可用with自动关闭    with open() as f:
                    os.path.isfile(file_name)   判断文件是否存在
                    for line in f:              以行读
                        print(line.strip())     因为line读取的时候有换行符, 所以要用strip给它去了
                    lines = f.readlines()       得到一个列表

6. collections          较高级的数据结构    下面都是
import collections
        defaultdict:
                    my_dict = defaultdict(要传一个工厂函数 init())           def init(): return 0;
                或  my_dict = defaultdict(lambda: 0)
                或  my_dict = defaultdict(int)          因为int() 默认返回值是0
        counter:
                    counter =collections.Counter(li)       能得到list中各个元素出现的次数(得到一个类dict)
                    print(counter.most_common(3))          返回top-K
                    counter.elements()                     返回counter数据结构中的所有元素
        deque:      双向列表(向表头插)
                    queue = collections.deque([1, 2, 3])
                    queue.appendleft(0);
                    queue.extendleft([-1, -2])
                    queue.popleft()
                    queue.rotate(2)         将前面两个元素旋转到最后面
                    queue = collections.deque(maxlen=3)     最多只保存最新的三个元素

7. 深拷贝
        浅拷贝  只复制第一层        深拷贝  所有的引用都完整复制
    import copy

8. pprint
    全称 : pretty print 专门解决普通print打印复杂嵌套式结构     如字典列表等嵌套
    import pprint       pprint("XXX")
    小技巧 : 格式化字符串 pprint.pformat()
            如 formatted_str = pprint.pformat(complex_data, indent=2)       indent的意思是缩进
    