# 0C - Python basics C

- 函数 function
- 变量作用域 variable scope
- 参数传递 argument passing
- 生成器 generator
- 模块 module

## 函数function

为什么我们要自己写函数？
- 代码复用
- 代码组织
- 提高可读性

### 函数的基本语法

Python中使用`def`关键字定义函数。

基本语法：
```python
def function_name(parameters):
    """文档字符串（非必须）"""
    ... # 函数体
    return value  # 返回结果
```

关于参数：
| 概念         | 英文术语         | 中文俗称       | 定义简述                                               | 出现时机     |
|--------------|------------------|----------------|--------------------------------------------------------|--------------|
| 参数 / 形参  | Parameter        | 形参           | 函数定义时声明的变量，用于接收传入的值，是占位符       | 函数定义时   |
| 实参 / 实际参数 | Argument         | 实参           | 函数调用时传递给函数的具体值，用于初始化形参           | 函数调用时   |

In [1]:
# 简单的函数示例
def greet(name):   # 定义一个函数，将其命名为greet，接受一个参数，在函数内赋值给变量name
    """
    问候函数
    参数：name - 要问候的人的姓名
    返回：问候语字符串
    """
    print("This line will be executed.")
    return f"Hello, {name}!"   # 返回一个对象，作为函数的输出
    print("This line will not be executed.")  # 这行代码不会被执行，因为return已经结束了函数的执行

In [2]:
greet

<function __main__.greet(name)>

In [3]:
# 调用函数
# "Alice"是实参，调用greet时，greet将实参赋值给了函数定义时的形参name；
# 相当于在函数内偷偷执行了name = "Alice"
message = greet("Alice")
print(message)

This line will be executed.
Hello, Alice!


In [4]:
# 函数也是对象
print(type(greet))  # 输出函数的类型
print(greet.__name__)  # 输出函数的名称

<class 'function'>
greet


In [5]:
print(dir(greet))  # 查看函数的属性和方法

['__annotations__', '__builtins__', '__call__', '__class__', '__closure__', '__code__', '__defaults__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__get__', '__getattribute__', '__getstate__', '__globals__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__kwdefaults__', '__le__', '__lt__', '__module__', '__name__', '__ne__', '__new__', '__qualname__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__type_params__']


In [6]:
from inspect import getsource
print(getsource(greet))  # 获取函数的源代码

def greet(name):   # 定义一个函数，将其命名为greet，接受一个参数，在函数内赋值给变量name
    """
    问候函数
    参数：name - 要问候的人的姓名
    返回：问候语字符串
    """
    print("This line will be executed.")
    return f"Hello, {name}!"   # 返回一个对象，作为函数的输出
    print("This line will not be executed.")  # 这行代码不会被执行，因为return已经结束了函数的执行



In [7]:
greet2 = greet  # 将函数赋值给另一个变量
print(greet2("Bob"))  # 调用新的变量名，输出结果与原函数相同

This line will be executed.
Hello, Bob!


In [8]:
# return可以省略，但一般最好不要这么做，明确地写出来，提高代码可读性。 
def print_info(name, age):
    print(f"Name: {name}")
    print(f"Age: {age}")

print_info("Bob", 25)

Name: Bob
Age: 25


-----------------

🙋**练习**

没有明确定义`return`的函数返回什么？试着将以上单元格中的函数运行的结果赋值给一个变量，打印出其值来验证你的猜想。

-----------------

### lambda函数

In [9]:
# 除了用def之外，还可以用lambda创建函数
# lambda在创建函数时不需要指定名称，而是将所创建的函数作为返回值
f = lambda x, y: f"{x}, {y}"
f

<function __main__.<lambda>(x, y)>

In [10]:
print(f('abc', 123))  # 调用lambda函数

abc, 123


In [11]:
# lambda函数是一个表达式（expression），不是一条指令（statement）；
# 而通过def定义函数是指令，不是表达式；
# 因此lambda函数的定义可以作为指令的一部分使用；
(lambda x: x**2 + x*3 - 1)(5)  # 调用lambda函数，计算5的平方加上3倍的5减去1

39

In [12]:
 # 定义一个lambda函数，接受一个函数和一个序列，返回应用函数后的结果
apply = lambda func, seq: {x: func(x) for x in seq} 

# lambda可以创建简单的匿名函数，这个函数仅在这里使用，其他地方几乎不会用到，所以命名没有必要；
apply(lambda x:x**2 + x*3 -1, [1, 2, 3, 4])

{1: 3, 2: 9, 3: 17, 4: 27}

-----------------

🙋**练习**

尝试不使用函数，用第二次课中讲到的字典推导式(dictionary comprehensions)得到跟以上单元格相同的结果。

-----------------

In [13]:
# 函数的定义可以嵌套，函数的返回值可以是函数
def f(n):
    def g(x):
        return x**n
    return g

-----------------

🙋**练习**

对于上方单元格中定义的函数`f`，以下代码的输出结果是什么？

```python
f(3)(2)
```

-----------------

### 变量作用域（Scope）

def或lambda创建的函数在每次运行时会创建一个本次运行的局部作用领域，函数接受的参数、以及函数中定义的变量都是这个函数的局部变量(local)， 这意味着它们只能在函数内部访问，函数外部无法访问这些变量。

In [14]:
# 函数在调用时执行，执行时才会创建局部变量；
# 所以定义函数时，使用了并没有定义的变量也不会报错；
def add(var1):
    res = var1 + var2
    return res

In [15]:
add(3)

NameError: name 'var2' is not defined

In [16]:
def add(var1, var2):
    res = var1 + var2
    # 在函数内部可以访问var1, var2, res
    print(f"Inside add: var1={var1}, var2={var2}, res={res}")
    return res

add(3, 5)

Inside add: var1=3, var2=5, res=8


8

In [17]:
# 在函数外部不可以
var1

NameError: name 'var1' is not defined

In [18]:
# 对于嵌套的函数，外部函数中定义的变量x、y对于外部函数是局部变量，
# 但对于内部函数来说x、y，是非局部变量(nonlocal)，可以在内部函数中访问。
# 内部函数自己定义的变量z、result是内部函数的局部变量，外部函数无法访问。

def add2_time3(x):
    y = x + 2
    def time(z):
        result = y * z
        return result
    return time(3)

add2_time3(5)

21

In [19]:
# 因为z是内层函数的局部变量，外层函数无法访问
# 你的就是我的，我的还是我的:)  <---- 请分析，这里的"我"是谁？
def add2_time3(x):
    y = x + 2
    def time(z):
        return y * z
    result = time(3)
    print(z)
    return result

print(add2_time3(5))

NameError: name 'z' is not defined

-----------------

🙋**练习**

1. 对于上方单元格中的变量`time`，它对`add2_time3`函数来说是局部变量还是非局部变量？`time`变量对`time`函数来说是局部变量还是非局部变量？

2. 函数可以自己调用自己吗？试着定义一个函数，函数体中至少调用一次函数自身，看看能不能运行。

-----------------

In [20]:
# 在任何def或lambda函数以外创建的变量都是当前文件中的全局变量(global)
a = 10

In [21]:
# 可以用globals查看当前文件中的全局变量

for k, v in globals().items():
    if not k.startswith('_') and k not in ("In", "Out"):
        print(f'{k}: {v}')

RuntimeError: dictionary changed size during iteration

In [22]:
# 用locals可以查看当前环境中已经定义的局部变量
def f(n):
    a = 3
    print(locals())
    b = a + 3
    return b

f(2)

{'n': 2, 'a': 3}


6

#### Python看到一个变量名时，怎么解析其对应的值？
Python中变量作用域的解析遵循**LEGB规则**：

1. **L (Local)**：局部作用域 - 函数内部
2. **E (Enclosing)**：嵌套作用域 - 外层函数的局部作用域  
3. **G (Global)**：全局作用域 - 模块级别
4. **B (Built-in)**：内置作用域 - Python内置名称

Python按照L→E→G→B的顺序搜索变量。

In [23]:
a = 1

def f():
    a = 2
    return a

f()

2

In [24]:
def f():
    return a

f()

1

In [25]:
def f2():
    a = 3
    def f3():
        a = 4
        return a
    return f3()

f2()

4

In [26]:
def f2():
    a = 3
    def f3():
        return a
    return f3()

f2()

3

In [27]:
def f2():
    def f3():
        return a
    return f3()

f2()

1

In [28]:
def f2():
    def f3():
        return abc
    return f3()

f2()

NameError: name 'abc' is not defined

-----------------

🙋**练习**

为什么下面的代码片段1不能正常运行但片段2可以？请结合片段1运行后的报错信息进行分析。

片段1：
```python
a = 1

def f():
    a = a + 1
    return a

f()
```

片段2：
```python
a = 1

def f():
    b = a + 1
    return b

f()
```

（notebook的结尾有这道练习题的提示）

-----------------

In [29]:
# 在函数内不能修改全局变量的值；
# 在函数内部强行修改全局变量的值时，需要使用global关键字；
a = 1
def f():
    global a  # 声明a是全局变量
    a = a + 1
    return a

print(f())

print(a)

2
2


In [30]:
# 对于嵌套函数，存在同样的问题，内层函数不能修改外层函数定义的变量的值；
def f1():
    b = 1
    def f2():
        b += 1
        print(f'inner b = {b}')
        return b
    result = f2()
    print(f'outer b = {b}')
    return result

f1()

UnboundLocalError: cannot access local variable 'b' where it is not associated with a value

In [31]:
# 如果非要修改内层函数的nonlocal变量，可以使用nonlocal关键字声明
def f1():
    b = 1
    def f2():
        nonlocal b
        b += 1
        print(f'inner b = {b}')
        return b
    result = f2()
    print(f'outer b = {b}')
    return result

f1()

inner b = 2
outer b = 2


2

### 函数参数
- 函数参数的传递就是把实际参数值(argument)赋给对应的形参（parameter，即函数定义时函数名后面的括号里声明的参数名）；
- 如果参数是一个可变对象，修改这个对象的内容会影响到外部对象，但如果重新赋值，则不会影响外部对象。

In [32]:
def f(x):  # 接受一个参数，赋给函数内的局部变量x
    x = x + 1  # 修改局部变量的值
    return x   # 返回局部变量

x = 4  # 创建一个全局变量x
f(x=x)  # 第一个x是形参，函数运行时将会创建的局部变量；第二个x实参，我们刚刚定义的全局变量x；

5

In [33]:
a = [1, 2, 3]
print(id(a))  # 输出全局变量a的内存地址

def f(x):
    x.append(4)
    return x

print(f(a))

# 全局变量a是可变对象，当f运行时，把a作为参数传递给x等价于在函数内定义了x = a
# 所以在函数内对x的修改会影响到全局变量a的值，但是注意变量a一直是指向同一个对象，其内存地址没有发生改变；

print(a)
print(id(a))

4581319680
[1, 2, 3, 4]
[1, 2, 3, 4]
4581319680


当有多个参数时，Python支持多种参数传递方式实现形参与实参的对应：

- **位置参数 (positional arguments)**：按顺序传递的参数
- **关键字参数 (keyword arguments)**：使用参数名传递的参数
- **默认（default）参数**：有默认值的参数
- **可变参数**：
   - `*args`：接收任意数量的位置参数
   - `**kwargs`：接收任意数量的关键字参数
- **强制关键字参数**：使用`*`分隔的参数

In [34]:
def introduce(name, age, city):
    return f"I am {name}, {age} years old, from {city}"

# 位置参数严格按照顺序从左到右与变量名匹配
print(introduce("Tom", "Beijing", 30))

I am Tom, Beijing years old, from 30


In [35]:
print(introduce("Tom", 30, "Beijing"))

I am Tom, 30 years old, from Beijing


In [36]:
# 参数的数目要与函数定义时的参数数目一致
print(introduce("Tom", "Beijing", 30, "Ecology"))

TypeError: introduce() takes 3 positional arguments but 4 were given

In [37]:
print(introduce("Tom", "Beijing"))

TypeError: introduce() missing 1 required positional argument: 'city'

In [38]:
# 关键字参数调用根据参数名匹配，区分大小写，顺序不重要
print(introduce(city="Shanghai", name="Jerry", age=25))

I am Jerry, 25 years old, from Shanghai


In [39]:
print(introduce(city="Shanghai", name="Jerry", Age=25))

TypeError: introduce() got an unexpected keyword argument 'Age'. Did you mean 'age'?

In [40]:
# 关键字参数调用时，参数名必须与函数定义中的参数名完全匹配
print(introduce(city="Shanghai", n="Jerry", age=25))

TypeError: introduce() got an unexpected keyword argument 'n'

In [41]:
# 混合调用（位置参数必须在关键字参数前面）
print(introduce("Mike", age=28, city="Guangzhou"))

I am Mike, 28 years old, from Guangzhou


In [42]:
print(introduce(age=28, city="Guangzhou", "Mike"))

SyntaxError: positional argument follows keyword argument (69524516.py, line 1)

In [43]:
# 每个关键字参数只能出现一次，不能重复
print(introduce(name="Mike", age=28, city="Guangzhou", city="Lanzhou"))

SyntaxError: keyword argument repeated: city (432361409.py, line 2)

In [44]:
# 定义函数时可以给形参提供默认值，如果调用时没有提供实参，将会使用默认值
def greet_with_title(name, title="Mr./Ms."):
    return f"Hello, {title} {name}!"

# 使用默认参数
print(greet_with_title("Tom"))

Hello, Mr./Ms. Tom!


In [45]:
# 即使有默认值，如果我们调用时提供了实参，函数会使用实参而非默认值
print(greet_with_title("Jerry", "Dr."))

Hello, Dr. Jerry!


-----------------

🙋**练习**

函数的默认参数最好是不可变对象，如果默认参数是可变对象（如列表或字典），会导致意外的行为引发错误。先看看这段代码：

```python
def add_item(item, target_list=None):
    if target_list is None:
        target_list = []  # 每次调用时创建新列表
    target_list.append(item)
    return target_list

list1 = add_item("apple")
list2 = add_item("banana")
print("list1:", list1)
print("list2:", list2)
```

1. 请预测这段代码运行后的输出结果，跟你预期的是否一样，为什么会这样？
2. 如果`target_list`的默认值是`[]`，那么输出会是怎样的？请尝试修改代码并运行，观察结果。

（文档末尾有这道练习题的提示）

-----------------

In [46]:
# *args来收集任意数量的位置参数,局部变量args将被赋值为tuple；
# **kwargs收集任意数量的关键字参数，局部变量kwargs将被赋值为dict；
def f(*a, **b):
    """计算任意数量数字的和"""
    return a, b

print(f())
print(f(1, 2, 3))
print(f(1, 2, 3, a = 4, b = 5))

((), {})
((1, 2, 3), {})
((1, 2, 3), {'a': 4, 'b': 5})


In [47]:
# 混合使用不同类型的参数
def complex_function(required, default_param="default", *args, **kwargs):
    print(f"Required parameter: {required}")
    print(f"Default parameter: {default_param}")
    print(f"Extra positional args: {args}")
    print(f"Extra keyword args: {kwargs}")

complex_function("required_value", "custom_default", 1, 2, 3, extra1="value1", extra2="value2")

Required parameter: required_value
Default parameter: custom_default
Extra positional args: (1, 2, 3)
Extra keyword args: {'extra1': 'value1', 'extra2': 'value2'}


In [48]:
# 加一个单独的*表示其后的参数为强制关键字参数（Keyword-only arguments）；
# *本身并不算作一个形参；
def create_user(name, *, email, age=None):
    """
    创建用户，email必须使用关键字传递
    """
    user = {"name": name, "email": email}
    if age is not None:
        user["age"] = age
    return user

# 正确调用
user1 = create_user("Tom", email="tom@example.com")
print(user1)
# 不正确调用
user2 = create_user("Jerry", "jerry@example.com", age=25)
print(user2)


{'name': 'Tom', 'email': 'tom@example.com'}


TypeError: create_user() takes 1 positional argument but 2 positional arguments (and 1 keyword-only argument) were given

-----------------

🙋**练习**

1. 可以要求所有参数通过关键字传递吗？修改上面的代码试一试。
2. 反过来，可以要求部分或所有参数必须通过位置传递吗？查一查python是否支持，如果支持的话如何实现？


（第二个问题文档末尾有提示）

-----------------

### 函数文档字符串（Docstring）

文档字符串是函数的重要组成部分，用于描述函数的功能、参数和返回值。它们位于函数定义的第一行，使用三重引号。

具体内容没有官方的格式要求，但一个良好的文档字符串可以包含：
1. 函数的简短描述
2. 参数说明
3. 返回值说明
4. 示例（可选）
5. 异常说明（如果有的话）

In [49]:
# Google风格的文档字符串示例
def calculate_bmi(weight, height):
    """
    计算身体质量指数(BMI)。
    
    Args:
        weight (float): 体重，单位为千克;
        height (float): 身高，单位为米;
        
    Returns:
        float: BMI值
        
    Raises:
        ValueError: 当weight或height小于等于0时;
        
    Examples:
        >>> calculate_bmi(70, 1.75)
        22.857142857142858
    """
    if weight <= 0 or height <= 0:
        raise ValueError("Weight and height must be greater than 0")
    
    bmi = weight / (height ** 2)
    return bmi


    
# 查看函数的文档字符串
print(calculate_bmi.__doc__)   # doc: documentation


计算身体质量指数(BMI)。

Args:
    weight (float): 体重，单位为千克;
    height (float): 身高，单位为米;

Returns:
    float: BMI值

Raises:
    ValueError: 当weight或height小于等于0时;

Examples:
    >>> calculate_bmi(70, 1.75)
    22.857142857142858



In [50]:
# help函数所呈现的其实就是函数的`.__doc__`的内容：
help(calculate_bmi)

Help on function calculate_bmi in module __main__:

calculate_bmi(weight, height)
    计算身体质量指数(BMI)。

    Args:
        weight (float): 体重，单位为千克;
        height (float): 身高，单位为米;

    Returns:
        float: BMI值

    Raises:
        ValueError: 当weight或height小于等于0时;

    Examples:
        >>> calculate_bmi(70, 1.75)
        22.857142857142858



### 生成器（Generator）和yield关键字

生成器是Python中一种特殊的迭代器，创建生成器的函数使用`yield`关键字来产生值，而不是`return`。

**生成器的特点：**
1. **惰性求值**：只在需要时才计算下一个值
2. **内存效率**：不会一次性将所有值加载到内存中
3. **状态保持**：函数的执行状态在每次yield后被保存

**生成器的创建方式：**
1. 生成器函数（使用yield）
2. 生成器表达式

**yield vs return：**
- `return`：终止函数执行并返回值
- `yield`：暂停函数执行，返回值，下次调用时从暂停处继续

In [51]:
# 简单的生成器函数
def count_up_to(max_count):
    """
    生成从1到max_count的数字序列
    """
    for i in range(1, max_count + 1):
        yield i
    print("Generator finished")

# 创建生成器对象
counter = count_up_to(3)
print(f"Generator object: {counter}")
print(f"Generator type: {type(counter)}")


Generator object: <generator object count_up_to at 0x1110e3760>
Generator type: <class 'generator'>


In [52]:
# 使用next()函数逐个获取值
print("\nUsing next() to get values:")
print(next(counter))


Using next() to get values:
1


In [53]:
print(next(counter))
print(next(counter))

2
3


In [54]:
# 当生成器耗尽时，再次调用next()会抛出StopIteration异常
try:
    print(next(counter))
except StopIteration:
    print("Generator exhausted")

Generator finished
Generator exhausted


In [55]:
# 在for循环中使用生成器
def fibonacci_generator(n):
    """
    生成前n个斐波那契数
    """
    a, b = 0, 1
    for i in range(n):
        yield a
        a, b = b, a + b

print("First 10 Fibonacci numbers:")
for num in fibonacci_generator(10):
    print(num, end=" ")
print()

First 10 Fibonacci numbers:
0 1 1 2 3 5 8 13 21 34 


In [56]:
# 生成器表达式（Generator Expression）
# 类似列表推导式，但使用圆括号且返回生成器
numbers = [1, 2, 3, 4, 5]

# 列表推导式（立即创建所有元素）
squares_list = [x**2 for x in numbers]
print(f"List comprehension: {squares_list}")

# 生成器表达式（惰性求值）
squares_gen = (x**2 for x in numbers)
print(f"Generator expression: {squares_gen}")
print(f"Generator content: {list(squares_gen)}")


List comprehension: [1, 4, 9, 16, 25]
Generator expression: <generator object <genexpr> at 0x111245be0>
Generator content: [1, 4, 9, 16, 25]


In [57]:
# 一个函数可以有两个yield表达式
def f(n):
    for i in range(n): yield i
    for i in range(n): yield i**2

list(f(5))

[0, 1, 2, 3, 4, 0, 1, 4, 9, 16]

In [58]:
def f(n):
    def g(n):
        yield n
        yield n**2
    for i in range(n):
            for j in g(i): yield j

list(f(5))

[0, 0, 1, 1, 2, 4, 3, 9, 4, 16]

In [59]:
# "yield from"语句可以简化生成器的嵌套调用
# 它可以将一个生成器的所有值直接传递给外层生成器
def f(n):
    def g(n):
        yield n
        yield n**2
    for i in range(n): yield from g(i)

list(f(5))

[0, 0, 1, 1, 2, 4, 3, 9, 4, 16]

### 函数编程工具

In [60]:
# map可以将一个函数应用到一个可迭代对象的每个元素上，并返回一个生成器
x = range(10)
y = map(lambda x: x**2, x)
print('__next__' in dir(y))
list(y)

True


[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

-----------------

🙋**练习**

利用刚讲过的yield创建一个生成器函数`g`，使得下面的代码运行后得到跟上面的单元格同样的输出结果。
```python
y = g(lambda x: x**2, range(10))

print('__next__' in dir(y))
list(y)
```

-------------------

In [61]:
# filter可以过滤可迭代对象中的元素，返回一个生成器
list(filter(lambda x: x % 2 == 0, range(10)))  # 过滤出偶数

[0, 2, 4, 6, 8]

In [62]:
# reduce函数可以对可迭代对象中的元素进行累积操作
from functools import reduce

# cumsum
print(list(range(10)))
reduce(lambda x, y: x + y, range(10))  # 计算0到9的累积和

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


45

## 6. 模块（Module）

模块是包含Python代码的文件，以`.py`为扩展名。模块可以包含函数、类、变量以及可执行的代码。

**模块的作用：**
1. **代码重用**：避免重复编写相同的代码；
2. **命名空间**：每一个模块都有自己的全局变量，可以避免变量名冲突；
3. **代码组织**：将相关功能组织在一起；

**导入模块的方式：**
1. `import module_name`
2. `from module_name import function_name`
3. `from module_name import *`
4. `import module_name as alias`

**一些常用内置模块：**

- `sys`: 与系统交互；
- `math`：数学函数
- `random`：随机数生成
- `datetime`：日期时间处理
- `os`：操作系统接口

In [63]:
# 1. 导入整个模块
import math
import random
import datetime

# 使用模块中的函数
print(f"Pi: {math.pi}")
print(f"Square root of 10: {math.sqrt(10)}")
print(f"Random number: {random.randint(1, 100)}")
print(f"Current time: {datetime.datetime.now()}")

Pi: 3.141592653589793
Square root of 10: 3.1622776601683795
Random number: 84
Current time: 2025-07-21 21:14:13.642541


In [64]:
def sin(x):
    return x

In [65]:
# 2. 从模块导入特定函数
from math import sin, cos, radians
from random import choice

angle = radians(45)  # 45度转弧度
print(f"sin(45°) = {sin(angle):.4f}")
print(f"cos(45°) = {cos(angle):.4f}")

fruits = ["apple", "banana", "orange"]
print(f"Randomly chosen fruit: {choice(fruits)}")

sin(45°) = 0.7071
cos(45°) = 0.7071
Randomly chosen fruit: banana


In [66]:
# 3. 使用别名导入
import datetime as dt
# import numpy as np  # 如果安装了numpy
# import pandas as pd

current_time = dt.datetime.now()
print(f"Current time using alias: {current_time}")

from math import pi as PI
print(f"Value of pi using alias: {PI}")

Current time using alias: 2025-07-21 21:14:14.601245
Value of pi using alias: 3.141592653589793


In [67]:
# 4. 查看模块信息
# 查看模块的属性和方法
print(f"Some attributes of math module: {[attr for attr in dir(math) if not attr.startswith('_')][:10]}")

print(f"\nMath module documentation: {math.__doc__}")
print(f"Math module file location: {math.__file__}")

Some attributes of math module: ['acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'cbrt', 'ceil', 'comb']

Math module documentation: This module provides access to the mathematical functions
defined by the C standard.
Math module file location: /Users/mt1022/miniforge3/envs/main/lib/python3.13/lib-dynload/math.cpython-313-darwin.so


In [68]:
# 5. 创建自定义模块的示例
# 注意：在实际应用中，这些代码应该保存在单独的.py文件中

# 模拟一个数学工具模块的内容
def add(a, b):
    """加法函数"""
    return a + b

def multiply(a, b):
    """乘法函数"""
    return a * b

def factorial(n):
    """计算阶乘"""
    if n <= 1:
        return 1
    return n * factorial(n - 1)

# 模块级别的变量
PI = 3.14159
VERSION = "1.0.0"

In [69]:
import mathlib

This module is imported from the workding directory


In [70]:
mathlib.PI

3.14

In [71]:
# 如果.py文件存在于某个子文件夹，需要在导入时加上具体路径
from src.mathlib import add, multiply, factorial, PI, VERSION

This module is being imported from the src directory


In [72]:
# 测试自定义函数
print(f"5 + 3 = {add(5, 3)}")
print(f"4 * 6 = {multiply(4, 6)}")
print(f"5! = {factorial(5)}")
print(f"Module PI value: {PI}")
print(f"Module version: {VERSION}")

5 + 3 = 8
4 * 6 = 24
5! = 120
Module PI value: 3.14159
Module version: 1.0.0


In [73]:
#  __name__ 变量的使用
print(f"Current module name: {__name__}")

# 在真实的模块文件中，通常会有这样的代码：
if __name__ == "__main__":
    print("This module is being run directly, not imported")
    # 这里可以放测试代码
else:
    print("This module is being imported")

Current module name: __main__
This module is being run directly, not imported


In [74]:
globals()['__name__']

'__main__'

In [75]:
math.__name__

'math'

In [76]:
mathlib.__name__

'mathlib'

## 总结

本节我们学习了Python中的重要概念：

### 🔧 函数（Functions）
- **基本语法**：使用`def`关键字定义函数
- **参数类型**：位置参数、关键字参数、默认参数、可变参数(*args, **kwargs)、强制关键字参数
- **文档字符串**：使用docstring记录函数功能、参数和返回值

### 🔍 变量作用域（Scope）
- **LEGB规则**：Local → Enclosing → Global → Built-in
- **global关键字**：修改全局变量
- **nonlocal关键字**：修改嵌套作用域变量

### ⚡ 生成器（Generators）
- **yield关键字**：创建生成器函数，实现惰性求值
- **内存效率**：适合处理大量数据，节省内存
- **双向通信**：使用send()方法与生成器交互
- **生成器表达式**：简洁的语法创建生成器

### 📦 模块（Modules）
- **代码重用**：将相关功能组织成模块
- **导入方式**：import、from...import、别名导入
- **内置模块**：math、random、datetime等
- **__name__变量**：区分模块是被导入还是直接运行

这些概念是Python编程的基础，掌握它们将帮助你写出更清晰、更高效的代码！

## Homework

创建一个名为`fasta.py`的模块，包含以下函数：
- `read_fasta(file_path)`: 创建一个读取fasta文件中序列的generator，每次以tuple的形式返回一条序列记录的id与序列，两者都是字符串;
- `reverse_complement(sequence)`: 返回给定DNA序列的反向互补序列;

然后定义一个名为`main`的函数，输入一个fasta文件的路径（字符串），调用`fasta`模块读取该fasta文件，然后用`fasta`模块中的`reverse_complement`函数将文件中每条序列全部转换为反向互补序列，并以fasta格式输出到一个新的文件中。

## 拓展内容

- 怎么创建自己的python package并发布到PyPI供它人通过`pip`安装: https://packaging.python.org/en/latest/

## 部分练习题的提示

- 当我们在函数内部给一个变量a赋值时，python会先认定a是函数内部创建的局部变量，然后再根据=右边的表达式确定其值，但是认定a是局部变量后，a在之前并没有定义，所以无法计算a+1，导致错误；
- 默认参数在函数定义时只被创建一次，而不是每次调用时都创建新的实例；
- 在最近的python版本中，强制位置参数可以通过反斜杠实现；