# 抽象
#### 一、抽象的核心思想
1. **人类认知特性**
   人类更擅长通过**高层抽象**理解复杂指令（如“沿街往前走”），而非具体步骤（如“走10步左转”）。
   - **示例**：问路时，对方回答“过天桥到马路对面”比逐步移动指令更易理解。

2. **程序设计的抽象原则**
   - 将复杂操作分解为高层次、语义明确的模块（如下载网页、统计词频）。
   - 隐藏具体实现细节，通过函数或方法封装底层操作。

---

#### 二、代码示例：抽象化的网页词频统计
```python
# 高层抽象：描述功能而非实现
page = download_page()           # 下载网页（具体实现未展示）
freqs = compute_frequencies(page) # 计算词频（算法细节封装）
for word, freq in freqs:         # 打印结果
    print(word, freq)
```

#### 三、抽象的优势
| 优势                | 说明                          |
|---------------------|-----------------------------|
| **可读性**          | 代码语义清晰，便于人类快速理解逻辑 |
| **可维护性**        | 修改底层实现不影响高层调用       |
| **复用性**          | 功能模块可被多场景重复使用        |

In [1]:
import math
x = 1
y = math.sqrt
callable(x)

False

In [2]:
callable(y)             # callable函数判断某个对象是否可调用

True

In [9]:
def fib(num):
    result = [1,1]
    for i in range(num-2):
        result.append(result[i] + result[i+1])
    return result
fib(10)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

In [11]:
def square(x):
    'calculate the square of the number x.' # 给函数编写文档,放在函数开头的字符串称为文档字符串,将作为函数的一部分储存起来
    return x * x

square.__doc__          # 访问文档字符串

'calculate the square of the number x.'

In [12]:
help(square)        # 在交互解释器中,可使用它获取有关函数的信息,包含文档字符串.

Help on function square in module __main__:

square(x)
    calculate the square of the number x.



In [13]:
def test():         # 不返回任何值(None)的函数.
    print('test')
    return          # return后的语句不会被执行!!!
    print("you can't see me.")

编写函数旨在为当前程序(甚至其他程序)提供服务,你的职责是确保它在提供的参数正确时完成任务,并在参数不对时以显而易见的方式失败.

In [1]:
def try_to_change(n):
    n = 'Mr. Gumby'
name = 'Mr. Jack'
try_to_change(name)     # 函数内部给参数赋值对外部没有任何影响.这是一个完全不同的变量.
name                    # 仅仅给局部变量赋了新值.

'Mr. Jack'

In [2]:
def change(n):
    n[0] = 'Mr. Gumby'

names = ['Mrs. Entity','Mrs. Thing']        # 修改了变量关联到的列表,这并不奇怪,请看下面的例子
change(names)
names

['Mr. Gumby', 'Mrs. Thing']

In [5]:
names = ['Mrs. Entity','Mrs. Thing']
n = names           # 将同一个列表赋给两个变量时,这两个变量将同时指向这个列表
n[0] = 'Mr. Gumby'
print(n is names)       # 返回值为True!!!
names

True


['Mr. Gumby', 'Mrs. Thing']

要避免这样的结果,必须创建列表的副本.对序列执行切片的操作时,返回的切片都是副本.因此,如果你创建整个列表的切片,得到的将是列表的副本.

In [4]:
names = ['Mrs. Entity','Mrs. Thing']
n = names[:]

print(n is names)
print(n == names)

False
True


## 关键词参数和默认值
之前使用的参数都是位置参数,位置比名字往往更重要.为了简化调用工作,我们引入关键字参数

In [11]:
def hello_1(greeting = 'Hello',name = 'World'):
    print(greeting, name)

hello_1()
hello_1('Hai',"Friend")
hello_1(greeting = '你好',name = '世界')
hello_1(name = 'Young')         # 提供默认值的参数,调用函数时可不提供.

Hello World
Hai Friend
你好 世界
Hello Young


In [17]:
def hello_2(greeting = 'Hello',name = 'World',punctuation = "!"):
    print(greeting, name, punctuation)

hello_2()
hello_2('Haha')
hello_2('Haha','Mars')
hello_2('Haha','Mars','...')
hello_2('Haha',punctuation = "?")           # 位置参数与关键词参数混合使用

Hello World !
Haha World !
Haha Mars !
Haha Mars ...
Haha World ?


## 收集参数
有时候,允许用户提供任意数量的参数很有用.

In [19]:
def print_params(*params):
    print(params)

print_params(1)         # 注意输出的仍然是一个元组
print_params('hh','你好','why?')

(1,)
('hh', '你好', 'why?')


(programme_control章提到)赋值时带星号的变量收集多余的值,将其存放在一个**列表**中.
这里,参数前面带星号将提供的所有值都放在一个元组中.如果没有可供收集的参数,将是一个空元组.

In [20]:
def pt(name,*info):
    print(name,info)

pt('Alice')

Alice ()


与赋值时一样,带星号的参数可放在其他位置(而不是最后),但不同的是,这种情况下需要**使用名称来指定后续参数**

In [22]:
def middle(x,*y,z):             # 星号不会收集关键词参数
    print(x,y,z)

middle(1,2,3,z = 7)

1 (2, 3) 7


In [24]:
def mm(**name):         # 要收集关键词参数,可以使用两个星号
    print(name)
mm(x = 1, y = 2, z = 3)         # 如你所见,这样得到的是一个字典而不是元组!!!

{'x': 1, 'y': 2, 'z': 3}


In [25]:
def p_all(x,y,z=3,*pospar,**keypar):
    print(x,y,z)
    print(pospar)
    print(keypar)

p_all(1,2,3,4,5,6,7,foo=1,bar=2,baz=3)

1 2 3
(4, 5, 6, 7)
{'foo': 1, 'bar': 2, 'baz': 3}


## 分配参数
前面介绍了如何将参数收集到元组和字典中,但用同样的两个运算符(\*和\*\*)也可以执行相反的操作.

In [26]:
def add(x,y):
    return x+y

params = (1,2)          # 参数是元组
add(*params)            # 在调用函数时使用*运算符,实现参数分配

3

In [27]:
def hello_1(greeting = 'Hello',name = 'World'):
    print(greeting, name)

params = {'name' : 'Sir Robin','greeting' : 'Well met'}
hello_1(**params)           # 使用**运算符,将字典中的值分配给关键词参数.

Well met Sir Robin



#### 二、注意事项与陷阱
1. **定义与调用时的星号作用域**
   - 在**定义函数**时使用`*`或`**`表示接受可变数量的参数（如`*args`或`**kwargs`）。
   - 在**调用函数**时使用`*`或`**`表示拆分参数（元组/字典→位置/关键字参数）。
   - **错误用法**：
     ```python
     # 定义和调用时均使用**，导致冗余
     def with_stars(**kwds):
         print(kwds['name'], 'is', kwds['age'], 'years old')

     args = {'name': 'Mr. Gumby', 'age': 42}
     with_stars(**args)  # 正确但冗余，等效于直接传递字典
     ```

2. **等效操作的对比**
   ```python
   # 不拆分字典，直接传递字典参数
   def without_stars(kwds):
       print(kwds['name'], 'is', kwds['age'], 'years old')

   args = {'name': 'Mr. Gumby', 'age': 42}
   without_stars(args)  # 直接传递字典，函数内部需手动提取键值
   ```

---

### 总结
| 运算符 | 上下文   | 作用                     | 示例                           |
|--------|----------|--------------------------|--------------------------------|
| `*`    | 调用函数 | 拆分元组为位置参数       | `func(*(1,2))` → `func(1,2)`   |
| `**`   | 调用函数 | 拆分字典为关键字参数     | `func(**{'a':1})` → `func(a=1)`|
| `*`    | 定义函数 | 接收可变位置参数（元组） | `def func(*args): ...`         |
| `**`   | 定义函数 | 接收可变关键字参数（字典）| `def func(**kwargs): ...`      |

**核心原则**：
- 定义时用`*`/`**`收集参数，调用时用`*`/`**`拆分参数。
- 避免冗余使用，仅在需要动态处理参数时使用拆分运算符。
```

## 练习使用参数

In [6]:
def story(**kwds):
    return 'Once upon a time, there was a ' \
            '{job} called {name}.'.format_map(kwds)         # 通过字典格式化

def power(x,y,*others):
    if others:
        print("Received redundant parameters:",others)
    return pow(x,y)

def interval(start,stop=None,step=1):
    'Imitate range() for step > 0'
    if stop is None:
        start , stop = 0, start
    result = []

    i = start
    while i < stop:
        result.append(i)
        i += step
    return result

print(story(job='king',name='Gumby'))
params = {'job':'language','name':'Python'}
print(story(**params))
del params['job']
print(story(job='stroke of genius',**params))

Once upon a time, there was a king called Gumby.
Once upon a time, there was a language called Python.
Once upon a time, there was a stroke of genius called Python.


In [10]:
print(power(2,3))
print(power(y=3,x=4))
params = (3,) * 2
print(power(*params))
power(2,3,'Hello world!')

8
64
27
Received redundant parameters: ('Hello world!',)


8

In [17]:
print(interval(10))
print(interval(1,20))
print(interval(1,20,3))
print(power(*interval(2,6,1)))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
[1, 4, 7, 10, 13, 16, 19]
Received redundant parameters: (4, 5)
8


请大胆尝试这些函数以及自己创建的函数,直到你觉得自己掌握了所有相关的工作原理.
## 作用域
变量到底是什么?可将其视为**指向值的名称**.因此,执行赋值语句x=1后,名称x指向值1.这几乎与使用**字典**时一样(字典中的键指向值),只是你使用的时"看不见"的字典.
实际上,这种解释已经离真相不远了.有一个名为**vars**的内置函数,它返回这个不可见的字典:

In [21]:
x = 1
scope = vars()
scope['x']

1

In [22]:
scope['x'] += 1
x

2

In [23]:
print(scope)            # 你看到了你在这篇文档中目前创建的所有的变量与值!

{'__name__': '__main__', '__doc__': 'Automatically created module for IPython interactive environment', '__package__': None, '__loader__': None, '__spec__': None, '__builtin__': <module 'builtins' (built-in)>, '__builtins__': <module 'builtins' (built-in)>, '_ih': ['', 'def story(**kwds):\n    return \'Once upon a time, there was a \' \\\n            \'{job} called {name}.\'.format_map(kwds)         # 通过字典格式化\n\ndef power(x,y,*others):\n    if others:\n        print("Received redundant parameters:",others)\n        return pow(x,y)\n\ndef interval(start,stop=None,step=1):\n    \'Imitate range() for step > 0\'\n    if stop is None:\n        start , stop = 0, start\n    result = []\n\n    i = start\n    while i < stop:\n        result.append(i)\n        i += step\n    return result\n\nprint(story(job=\'king\',name=\'Gumby\'))', 'def story(**kwds):\n    return \'Once upon a time, there was a \' \\\n            \'{job} called {name}.\'.format_map(kwds)         # 通过字典格式化\n\ndef power(x,y,*ot

- 一般而言,不应修改vars返回的字典,因为根据python官方文档的说法,这样做的结果是不确定的.

这种"看不见的字典"称为**命名空间**或**作用域**.那么有多少个命名空间呢?除全局作用域外,每个**函数调用**都将创建一个.
在函数内部使用的变量称为局部变量(与之相对的是全局变量).参数类似于局部变量,因此参数与全局变量同名不会有任何问题.

In [24]:
def foo():
    x = 10086
x = 1
foo()
print(x)

1


In [25]:
def output(x):
    print(x)
x = 1
y = 2
output(y)

2


到目前为止一切顺利.但如果要在函数中访问全局变量呢?如果只是想要**读取**这种变量的值**(而不重新关联它)**,通常不会有任何问题.

In [26]:
def combine(parameter):
    print(parameter + external)

external = 'berry'
combine('Shrub')

Shrubberry


### 像这样访问全局变量是**众多**bug的根源.务必慎用全局变量.
### Python的查找变量的机制是:
- 优先在本作用域的范围内查找,若找到符合名称的变量后即停止
- 若在本作用域内未找到,则扩大至上一层作用域内查找,直至找到为止
- 若一直到全局作用域都还未找到,就会报错.

我们来介绍一下**globals**(注意有"s")函数
这个函数类似于vars,返回一个包含全局变量的字典.(locals返回一个包含局部变量的字典)

In [29]:
def combine_fail(parameter):
    print(parameter + parameter)
parameter = 'berry'
combine_fail('Shrub')

def combine(parameter):
    print(parameter + globals()['parameter'])           # 字典的用法!!
parameter = 'berry'
combine('Shrub')

ShrubShrub
Shrubberry


In [31]:
print(globals())            # 不要被吓到,这就是一个字典!!

{'__name__': '__main__', '__doc__': 'Automatically created module for IPython interactive environment', '__package__': None, '__loader__': None, '__spec__': None, '__builtin__': <module 'builtins' (built-in)>, '__builtins__': <module 'builtins' (built-in)>, '_ih': ['', 'def story(**kwds):\n    return \'Once upon a time, there was a \' \\\n            \'{job} called {name}.\'.format_map(kwds)         # 通过字典格式化\n\ndef power(x,y,*others):\n    if others:\n        print("Received redundant parameters:",others)\n        return pow(x,y)\n\ndef interval(start,stop=None,step=1):\n    \'Imitate range() for step > 0\'\n    if stop is None:\n        start , stop = 0, start\n    result = []\n\n    i = start\n    while i < stop:\n        result.append(i)\n        i += step\n    return result\n\nprint(story(job=\'king\',name=\'Gumby\'))', 'def story(**kwds):\n    return \'Once upon a time, there was a \' \\\n            \'{job} called {name}.\'.format_map(kwds)         # 通过字典格式化\n\ndef power(x,y,*ot

但如果你想要**重新关联**全局变量(使其指向新值)该怎么办呢?
在函数内部给变量赋值时,该变量默认为局部变量,除非你明确地告诉Python它是全局变量.这就需要用到"global"语句.

In [32]:
x = 1
def change_global():
    global x
    x = x + 1
change_global()
x

2

## 作用域嵌套
Python函数可以嵌套,即可将一个函数放在另一个函数内,如下所示:

In [33]:
def foo():
    def bar():
        print("Hello, world!")
    bar()

foo()

Hello, world!


嵌套通常用处不大,但有一个很突出的用途:**使用一个函数来创建另一个函数**.这意味着可以像下面一样编写函数:

In [35]:
def multiplier(factor):
    def multiplyByFactor(number):
        return number * factor
    return multiplyByFactor

在这里,一个函数位于另一个函数中,且外面的函数返回**一个函数**,而**不是**调用它!
重要的是,返回的函数能够访问其定义所在的作用域.换而言之,它携带着自己所在的环境(和相关的局部变量).
每当外部函数被调用时,都将重新定义内部的函数,而变量factor的值也可能不同.由于Python的嵌套作用域,可在内部函数中访问这个来自外部局部作用域(这里是multiplier)的变量,如下所示:

In [38]:
double = multiplier(2)
double(5)

10

In [39]:
triple = multiplier(3)
triple(5)

15

In [40]:
multiplier(10)(7)

70

像multiplyByFactor这样储存其所在作用域的函数称为**闭包**
通常,不可以给外部作用域内的变量赋值,但如果一定要这么做,可使用关键字"nonlocal".这个关键字的用法与global很像,让你能够给外部作用域(非全局作用域)内的变量赋值.

## 递归
前面深入介绍了如何创建函数和调用函数.函数可调用其他函数,而其实,函数也可调用**自己**!
我们给出递归的一个非常stupid的定义:
递归[名词]:参见"递归".
你明白了吗?
下面我们通过数据结构里的一个例子来感受一下:

In [43]:
ls = [1,2,3,4]
ls[3] = ls
ls

[1, 2, 3, [...]]

[...]中是什么呢?我们通过索引来看看!

In [44]:
ls[3]           # 这不奇怪,因为是我们将ls[3]赋值为ls的嘛

[1, 2, 3, [...]]

In [45]:
ls[3][3]

[1, 2, 3, [...]]

In [46]:
ls[3][3][3][3][3][3][3][3][3][3][3][3][3][3]

[1, 2, 3, [...]]

这就是递归了,这有些类似于当你使用录屏软件查看自己的录屏一样出现的情况. 这种递归称为**无穷递归**,因为它从理论上永远不会结束.这显然不是我们在函数中期望看到的:

In [47]:
def recursion():
    recursion()

recursion()

RecursionError: maximum recursion depth exceeded

RecursionError: maximum recursion depth exceeded
Python为函数设置了最大递归深度,因为无穷的递归将占用大量的内存导致程序崩溃.
你想要的是能够对你有所帮助的递归函数,这样的递归函数通常包含下面两部分:
- 基线条件(针对最小的问题):满足这种条件时函数将直接返回一个值(我们也形象地称其为"出口")
- 递归条件:包含一个或多个调用,这些调用旨在解决**问题的一部分**

下面我们来看两个经典的递归例子:

In [50]:
# 阶乘
def factorial(n):
    if n == 0:
        return 1
    else:
        return n * factorial(n-1)
factorial(5)

def power(x,n):
    if n == 0:
        return 1
    else:
        return x * power(x,n-1)
power(2,3)

8

In [58]:
# 二分查找
def search(seq,num,lower=0,upper=None):
    if upper is None:
        upper = len(seq) - 1
    if lower == upper:
        assert num == seq[lower],'很遗憾,数列里没有这个数!'
        return lower
    else:
        mid = (lower + upper) // 2
        if seq[mid] < num:
            return search(seq,num,mid+1,upper)      # +1很重要,当上下限相邻时,不+1会导致区间无法缩小,陷入无限递归!!!
        else:
            return search(seq,num,lower,mid)
seq = [34,67,8,123,4,100,95]
seq.sort()
print(search(seq,34))
print(search(seq,100))
print(search(seq,101))

2
5


AssertionError: 很遗憾,数列里没有这个数!

二分查找是一种效率非常高的算法,事实上,在可观察宇宙中,包含的粒子数为10^87个.要找出其中的一个粒子,只需要递归大约290次!
实际上,bisert提供了标准的二分查找实现.
### 函数式编程
我们暂时省略对函数式编程的介绍.
我们来介绍Python的一种名为lambda表达式(匿名函数)的功能,让你能够创建内嵌的简单函数.

In [64]:
# 在map(),filter(),sorted()等函数中,用Lambda函数快速定义逻辑.
numbers = [1,2,3,4,5]
squared = list(map(lambda x: x * x, numbers))       # 将列表元素平方
print(squared)
evens = list(filter(lambda x: x % 2 != 0, numbers))     # 过滤奇数
print(evens)

words = ['apple','kiwi','banana']
sorted_words = sorted(words,key=lambda word: len(word),reverse=True)
print(sorted_words)

[1, 4, 9, 16, 25]
[1, 3, 5]
['banana', 'apple', 'kiwi']


In [66]:
# 快速定义简单函数
# 替代单行的def函数,减少代码量
add = lambda x,y: x + y
print(add(1,2))

uppercase = lambda s: s.upper()
print(uppercase('hello'))

3
HELLO


In [68]:
# 闭包与函数工厂
# 动态生成特定行为的函数
def multiplier(n):
    return lambda x: n * x
double = multiplier(2)
print(double(5))
triple = multiplier(3)
triple(5)

10


15

In [70]:
# 字典排序或复杂排序
# 按自定义规则对复杂结构排序
students = [
    {'name':'Alice',"age":22},
    {'name':'Bob',"age":19},
    {'name':'Joe',"age":23},
]
sorted_students = sorted(students,key=lambda x: x['age'],reverse=True)
print(sorted_students)

[{'name': 'Joe', 'age': 23}, {'name': 'Alice', 'age': 22}, {'name': 'Bob', 'age': 19}]
