### 第十一章 数组

#### 本章内容

1. 列表使用回顾
2. 内存中的变量与数组
3. 数据处理

#### 1. 列表使用回顾

还记得我们在第四章讲到的列表（list）变量吗？在Python中，**列表是一种能够存储一系列数据的“容器”**。你可以把它理解成一个可以随时扩展或缩小的收纳盒——里面可以装下任何类型的物品，无论是数字、文本，还是更复杂的对象。这种特性，我们称为“动态存储”。

你可能想问：什么叫“动态”？你想象一下，日常使用的收纳盒通常只有固定容量，但Python的列表却不是这样。它可以**随时新增元素**（比如把新东西放进盒子）、也可以删掉已有的元素（比如拿出不需要的东西），大小会自动调整，非常灵活。

其实，为了实现这种灵活性，**Python 列表背后会在内存中预留一块空间**。当现有空间不够用时，系统会自动帮你安排一个更大的空间，把原有的东西整体“搬”过去，然后再加进新内容。一般而言，这种扩展是分批进行的，而不是一次只加一个空间，这样效率会更高一些。

在交互艺术或创意编程项目中，列表特别适合用来存储一批相似的数据。例如，一组粒子的坐标、一系列按钮的属性、或者不同画笔的颜色。你可以随时增加或者减少这些对象，非常好用。

比如，你正在做一个视觉交互项目，画面上不断有“粒子”出现、消失。怎么保存和管理这些粒子的运动信息？这时，列表就成了你的好帮手。

##### 数组

如果我们**去掉列表可以随时增加/减少元素的能力，并且规定它只能装同一种类型的内容**，我们得到的就是“数组”（array）这种更基础的数据结构。

数组，是指**在内存中有连续空间、每个元素类型相同、通常长度固定的数据集**。在一些其它语言（比如C或Java）里，数组必须在创建时就指定大小，后续不能随便添加、删除元素，所有的数据类型也都一样。

在Python中，标准的 `array` 模块（以及第三方的 `numpy` 库）能帮你创建类型统一的数组。虽然Python的数组长度也是可以调整的，但**它要求所有元素类型一致，并且高强度数值计算时比列表更高效**。

##### 列表和数组的主要区别

- **列表可以存放任意类型的数据，也可以动态改变长度**；
- **数组需要所有元素类型相同，长度通常是固定的（或者必须按数组模块的特定方式调整），存储和计算更高效**。

In [None]:
# 在Jupyter代码单元中强制重启内核
import IPython
IPython.get_ipython().run_line_magic('reset', '-f')

import py5

# 设置字体（如果需要显示文字）
def setup():
    py5.size(600, 400)
    py5.text_font(py5.create_font("Noto Sans Thin", 16))

# 动态增长的列表：存储所有点击位置
circles_list = []

# 固定长度的数组（用列表模拟，长度始终为5）
fixed_array = [None] * 5
arr_index = 0  # 当前存放的位置

def draw():
    py5.background(240)
    py5.fill(0, 150, 64)
    py5.text("绿色圆：列表，点越多越长（动态）", 20, 30)
    py5.fill(200, 50, 70)
    py5.text("红色圆：模拟数组，只保留5个（非动态）", 20, 50)
    
    # 绘制动态列表的所有点（绿色）
    py5.fill(0, 200, 64)
    for (x, y) in circles_list:
        py5.circle(x, y, 18)
    
    # 绘制数组（仅保留5个最新点，红色）
    py5.fill(200, 50, 70)
    for p in fixed_array:
        if p is not None:
            py5.circle(p[0], p[1], 18)

def mouse_pressed():
    # 列表添加新点（动态增加，无限制）
    circles_list.append((py5.mouse_x, py5.mouse_y))

    # 数组仅保留5个点（循环覆盖，非动态）
    global arr_index
    fixed_array[arr_index] = (py5.mouse_x, py5.mouse_y)
    arr_index = (arr_index + 1) % 5  # 循环

py5.run_sketch()

#### 2. 内存中的变量与数组

在上一章中，我们讲过计算机的内存结构。**简单来说，计算机会先将内存分成许许多多的小块，就像一个巨大的蜂巢或者储物柜，每个格子都有自己的编号（也叫“地址”）**。然后，根据变量类型的“体型”——也就是需要占用的空间大小——将这些小格子组合起来“打包”，**就像用合适大小的储物箱来存放不同大小的物品**。

比如，对于一个整数型变量，如果它需要4个字节，那计算机会安排4个连续的小格子来存放它——这4个格子正好凑成一个“包间”，专门放这个整数。  
如果是数组呢？**数组在内存中的表现更像是“一长排打包好的储物格”**，每一个小格子紧挨着下一个，每个格子里都装着同一种类型的数据。这意味着，数组在内存里占用的是一块连续的空间。

你可以看到，这种连续空间的特性有个大优点，就是**可以非常快地、随时找到数组里任何一个元素**——因为只要知道第一个元素的位置，再加上索引，就能立刻算出目标元素的位置。因此，用索引查找数组元素是非常高效的。

然而，这种布局也有它的局限：**如果想要在数组的中间插入或删除一个元素，就得把后面所有的数据往后或往前挪动，非常麻烦**；更要命的是，数组的大小事先是固定下来的，如果想要改变数组的容量，比如往里多加几个元素，往往就得找一块更大的连续空间，然后把原来的整个数组“整体搬家”过去，这样的操作很费时也容易出错。

同时，如果我们不是按索引查找，而是希望找到数组中“值等于多少”的元素，就得一个一个检查，这也就是所谓的“遍历查找”，不管用数组还是列表，遇到查找具体内容时都要这样做。

相对而言，**列表在内存中的表现要灵活很多**。Python中的列表其实存储的是一连串元素的“引用”，也可以理解为指向实际数据的小标签——这些标签本身是连续排列的，而数据本身则可以分散在内存的不同地方。这样做的好处是什么呢？就是列表的大小可以动态变化，只要有空间，随时可以加新元素、删掉旧元素，甚至还能装下不同类型的东西。

当然，实现这么多灵活的功能，是有代价的。**为了快速访问和动态扩展，列表需要额外的空间，不仅要存储所有元素的引用，还要为将来可能添加的新元素预留一部分空间**（比如说，一下子多准备几个储物格，省得等下要加东西时再搬家）。另外，维护这些引用本身也会占用额外的内存。

正是这些额外开销，换来了插入、删除、拼接等高层操作的便捷性，也让列表能够容纳不同类型乃至不同大小的元素。

#### 3. 数据处理

##### 3.1 增、删、改、查 —— 数据处理的四大基本操作

在程序设计的实际过程中，**对数据的处理其实无非就是四种操作：增、删、改、查**。

- **增**：往已有的数据结构中增加新的内容，比如添加一条记录、插入一个新元素。
- **删**：把已有内容中的某些元素删除，比如移除陈旧的信息、去掉不需要的部分。
- **改**：修改某个元素的值，比如把名单里的“小张”改成“小王”。
- **查**：查找、获取某个内容，比如找到数组中第3个人的名字，或者搜索列表里有没有“红色”这个元素。

这四种基础操作，几乎可以覆盖我们在编程中遇到的绝大多数数据处理情景。任何复杂的操作，拆解到最底层，其实也是这四类的组合与变化。

###### 3.2 Python中List和Array的增删改查实现

在 Python 里，**List（列表）**的这四种基本操作都可以通过内建函数或方法直接实现：

- **增**：`append()`、`insert()`、`extend()`
- **删**：`remove()`、`pop()`、`clear()`
- **改**：直接通过索引赋值，比如 `lst[2] = "新值"`
- **查**：`index()` 查索引，或者 `in` 关键字检查某个值存不存在，如 `"红色" in lst`


In [None]:
# ----- 列表 List 的增删改查 -----
lst = [10, 20, 30]
print("初始列表：", lst)

# 增：尾部添加 append
lst.append(40)
print("append 40：", lst)

# 增：任意位置插入 insert
lst.insert(1, 15)
print("insert 15 到下标1：", lst)

# 删：移除特定值 remove
lst.remove(20)  # 移除第一个20
print("remove 20：", lst)

# 删：弹出指定位置 pop
v = lst.pop(0)  # 弹出第0个
print("pop 0号元素（被删的是", v, "）：", lst)

# 改：通过索引赋值
lst[1] = 99
print("把下标1的元素改为 99：", lst)

# 查：通过 in 判断是否存在
print("30 是否在列表中？", 30 in lst)

# 查：获取元素索引 index
print("99 的索引为：", lst.index(99))


而对于 **数组（array）**，虽然功能上和列表有相似之处，但它通常需要你先 `import array`，并且类型要求更严格（只能存一样的数据类型）。数组的增删改查常用方法也有：

- **增**：`append()`、`insert()`、`extend()`
- **删**：`remove()`、`pop()`
- **改**：用索引赋值，如 `arr[1] = 9`
- **查**：`index()`、`count()`

In [None]:
import array

# ----- 数组 array.array 的增删改查 -----
arr = array.array('i', [1, 2, 3])
print("初始数组：", arr.tolist())

# 增：append 添加到末尾
arr.append(4)
print("append 4：", arr.tolist())

# 增：insert 插入到指定位置
arr.insert(1, 10)
print("insert 10 到下标1：", arr.tolist())

# 删：remove 删除值
arr.remove(2)
print("remove 2：", arr.tolist())

# 删：pop 弹出元素
x = arr.pop()
print("pop 末尾元素（被删的是", x, "）：", arr.tolist())

# 改：用下标改值
arr[0] = 99
print("下标0的元素改为 99：", arr.tolist())

# 查：index 查找值的位置
print("10 的索引为：", arr.index(10))

# 查：count 统计某元素出现次数
print("99 的出现次数：", arr.count(99))

##### 3.3 嵌套结构与多维数组

无论是数组还是列表，**都可以进行嵌套**。什么叫嵌套呢？就是列表里面还可以再放列表，数组里面也可以再放数组，这样我们就可以构造“表格”或者“矩阵”这类多行多列的数据结构。

**最常见的嵌套结构，就是二维数组（或二维列表）**。想象一下 Excel 表格，行和列每个单元格都能放数据，这就是二维结构。在 Python 里，你可以用 `lst[row][col]` 这种“下标套下标”的方式访问二维数组中的某一个元素。这有两种常见表示方式：

1. **方括号连用**：`lst[行][列]`
2. **用元组做索引**（在某些高级库，比如 NumPy 中）：`arr[行, 列]`

如果嵌套的层数更多（比如列表中嵌列表，每个子列表里再嵌子列表），那就是**多维数组**。比如三维数组可以用来表示颜色图片（宽、高、RGB三个通道），四维甚至更多维的结构也很常见于图像处理、科学计算等领域。

在程序设计中，多维数组有很多应用，比如：  
- 存储图像的像素网格  
- 记录游戏地图的方格信息  
- 进行空间数据的三维建模  
- 数学运算、矩阵操作等等

In [None]:
# 在Jupyter代码单元中强制重启内核
import IPython
IPython.get_ipython().run_line_magic('reset', '-f')

import py5

rows, cols = 8, 12  # 网格行列
cell_w, cell_h = 50, 40  # 网格单格宽高

# 创建二维数组，初始全为False
grid = [[False for _ in range(cols)] for _ in range(rows)]

def setup():
    py5.size(cols * cell_w, rows * cell_h)
    py5.text_font(py5.create_font("Noto Sans Thin", 16))
    py5.text("点击任意格子切换颜色（二重索引：grid[row][col])", 10, 25)

def draw():
    py5.background(220)
    py5.fill(0)
    py5.text("点击任意格子切换颜色（二重索引：grid[row][col])", 10, 25)
    for i in range(rows):
        for j in range(cols):
            x = j * cell_w
            y = i * cell_h + 30
            if grid[i][j]:
                py5.fill(0, 126, 255)
            else:
                py5.fill(200)
            py5.stroke(100)
            py5.rect(x, y, cell_w, cell_h)

def mouse_pressed():
    # 计算出点击的是哪个格子
    j = py5.mouse_x // cell_w
    i = (py5.mouse_y - 30) // cell_h
    if 0 <= i < rows and 0 <= j < cols:
        grid[i][j] = not grid[i][j]  # 状态切换

py5.run_sketch()

In [None]:
# 在Jupyter代码单元中强制重启内核
import IPython
IPython.get_ipython().run_line_magic('reset', '-f')

import py5
import random

particles = []  # 每个粒子：[x, y, vx, vy, age, color]

def setup():
    py5.size(600, 400)
    py5.text_font(py5.create_font("Noto Sans Thin", 16))

def draw():
    py5.background(25)
    py5.fill(255)
    py5.text("点击画布添加粒子，每个粒子包含多维属性", 15, 25)
    
    # 更新和绘制每个粒子
    to_remove = []
    for idx, p in enumerate(particles):
        # 更新位置
        p[0] += p[2]
        p[1] += p[3]
        p[4] += 1  # 增加“年龄”
        # 画
        py5.fill(p[5][0], p[5][1], p[5][2], max(255-p[4]*3,0))  # 年龄大了渐变透明
        py5.no_stroke()
        py5.circle(p[0], p[1], 18)
        # “老”的粒子要删掉
        if p[4] > 80:
            to_remove.append(idx)
    # 删除“老”的粒子（倒序删除避免紊乱）
    for idx in reversed(to_remove):
        particles.pop(idx)

def mouse_pressed():
    # 添加新粒子，包含多维属性
    x, y = py5.mouse_x, py5.mouse_y
    vx, vy = random.uniform(-2,2), random.uniform(-2,2)
    color = (random.randint(32,255), random.randint(32,255), random.randint(32,255))
    particle = [x, y, vx, vy, 0, color]  # 位置、速度、年龄、颜色
    particles.append(particle)

py5.run_sketch()

#### 本章总结

##### 本章知识点汇总

1. **列表（List）**  
   Python中的动态数据容器，可存放任意类型元素，支持随时扩展和缩减，操作灵活，适合交互艺术项目中管理一组对象。

2. **数组（Array）**  
   元素类型必须一致，内存中连续存储，长度一般固定，查找高效，适用于数值计算与批量处理。

3. **动态存储**  
   数据结构可以根据需要自动变长或变短（如列表），无需提前预定容量，灵活应对实时变化。

4. **连续内存**  
   数据在内存中紧挨排列（如数组），便于快速定位第n个元素，但调整容量困难。

5. **增删改查**  
   对数据的四种基本操作："增"（Insert）、"删"（Delete）、"改"（Update）、"查"（Retrieve）。

6. **嵌套结构/多维数组**  
   数据结构内部还包含同类型结构，实现行列（二维）、体（多维）等复杂数据组织，比如矩阵、像素网格。

##### 课后练习

1. 简要说明列表和数组在Python中的主要区别。
2. 用一句话说明“动态存储”与“连续内存”的优缺点。
3. 何为“嵌套结构”？举一个常见的二维嵌套数据使用场景。
4. 数据操作的“增删改查”在Python List对象中对应哪些常用方法？
5. 编写代码，创建一个整数列表，对第3个元素赋新值，再添加1个新元素并输出结果。
6. 利用Python标准库`array`模块，构建一个仅保存浮点数的数组，展示添加和删除操作。
7. 写一段代码，利用嵌套列表存储3行2列的数据，并打印所有值及其对应索引(row,col)。
8. 写出查找列表中某个元素是否存在，并列出其所有出现的索引。
9. 在示例 1 的基础上加入键盘 + / - 以增加或减少列数。缩放后需保留原有格子的选中状态。

##### 扩展知识

**NumPy**（Numerical Python）是 Python 最重要的科学计算库之一。它为我们带来了高效的“数值型数组”操作能力，特别适合批量处理、矩阵操作、图像和信号读取等工作。用通俗的话说，NumPy 就像给 Python 添了“双引擎”：“数得又快、用起来还顺手”。

- **核心概念**：NumPy 最重要的数据类型叫 `ndarray`，——多维数组，n-dimensional array。
- **高效**：在 C 语言层面做了优化，比普通 List 快很多。
- **功能齐全**：不仅能存数，还能一口气做加减乘除、排序统计、矩阵变形。

假如你刚接触数据，其实只要两三行代码，就能体验 NumPy 的便捷：

```python
import numpy as np

a = np.array([1,2,3])      # 一维数组
b = np.array([[1,2],[3,4]])  # 二维数组（矩阵）
print(a + 10)  # [11 12 13]，支持“批量”操作
print(b.T)     # 转置，行列互换
```
在 NumPy 里，我们经常处理高维数组，比如用来描述图像、信号、传感器数据。你甚至可以用一条语句同时“改造”好几万个数据！

为什么 NumPy 这么受 AI（人工智能）领域青睐？  
因为多数“AI算法”其实都在处理**超大规模的数字矩阵**：比如一副图片，其实就是一个 3 维的像素矩阵（高度×宽度×色彩通道）；一段声音，就是一维的时序数字数组。  
NumPy 能让“机器感知世界”的每一步都丝滑如飞：数据整理、归一化、特征提取、矩阵运算……

**可以说：如果没有 NumPy，现代人工智能的许多基础算法都很难实现得又快又流畅！**

在AI和科研讨论里，经常会听到“张量”这个词，它到底是什么？

- **简单说**：张量就是任意维度的数字数组（一维、二维、三维、甚至更多维！）。
- **类比理解**
  - 标量 = 一个数
  - 向量 = 一串数（比如风速的三要素：大小x,y,z）
  - 矩阵 = 一张表格（二维）
  - 张量 = 任意多维，比如一组 100 张RGB图片（100，宽， 高， 3）

**在人工智能和深度学习中，“张量”几乎等同于“程序里处理的核心数据结构”。**

NumPy 的 `ndarray` 天生就是“张量”结构。  
你随手生成的二维表格、三维像素方块，都属于“张量”范畴。

当我们想要进入AI领域、更高阶地操作张量，这时你会用到**PyTorch**和**FastAI**这两个库。

**PyTorch**
- Facebook 研发的开源机器学习框架，主打“用得像Numpy一样顺滑”、“自由定义AI模型”。
- 它的核心数据类型就叫`Tensor`（张量），支持在CPU和GPU间切换，效率极高。
- 绝大多数深度学习算法都以 PyTorch 为基座实现。

**FastAI**
- 在PyTorch基础上，专为“让AI更易用”而设计的高级库。
- 提供了众多现成的模型和流程，哪怕你没深厚编程经验，也能快速搭建图像识别、文本处理、生成艺术等AI项目。
- 优点是**高层抽象+简洁调用**，非常适合交互艺术和跨界实验。

- [NumPy 官方手册](https://numpy.org/doc/stable/)
- [PyTorch 官方中文文档](https://pytorch.apachecn.org/)
- [FastAI 官方文档](https://docs.fast.ai/)
- [交互艺术中的数据结构实践案例（可搜索Processing/Py5相关）](https://processing.org/examples/)
- [A Visual Introduction to NumPy and Data Representation](https://jalammar.github.io/visual-numpy/)
- [Stanford CS231n Lecture Notes – Deep Learning for Computer Vision](https://cs231n.github.io/)


##### 练习题提示

1. 列表可容纳任意类型、长度可变；数组元素需同类型，空间通常连续且长度固定，适用于高效批量运算。

2. 动态存储灵活便捷但有额外空间消耗，连续内存便于高效索引但扩展困难。

3. 嵌套结构是结构内套结构，如二维嵌套可以表达像素表格、棋盘、矩阵等；如：LED点阵屏行列开关。

4. 增：append/insert/extend，删：remove/pop/clear，改：lst[idx]=v，查：in/index/count。

5. 
   ```python
   lst = [1, 3, 5, 7]
   lst[2] = 99      # 第3个元素改为99
   lst.append(42)   # 增
   print(lst)       # [1, 3, 99, 7, 42]
   ```

6. 
   ```python
   import array
   a = array.array('f', [1.2, 3.4, 5.6])
   a.append(8.8)
   a.pop()
   print(a.tolist())  # [1.2, 3.4, 5.6]
   ```

7. 
   ```python
   data = [[10,11], [20,21], [30,31]]
   for r in range(3):
       for c in range(2):
           print(f"data[{r}][{c}]={data[r][c]}")
   ```

8. 
   ```python
   lst = [3, 7, 3, 9, 3]
   idxs = [i for i,v in enumerate(lst) if v==3]
   print(3 in lst, idxs)
   ```

9. 提示：新建宽度变化后的二维列表，再用双循环把旧状态复制进可覆盖范围。