# Jupyter笔记本中的可重现性问题

这个笔记本演示了Jupyter中常见的可重现性问题：
1. 隐藏状态问题
2. 乱序执行问题
3. 删除单元格后变量仍存在内存中的问题

## 问题1：隐藏状态

在Jupyter中，你可以按任意顺序执行单元格，导致代码和输出不匹配

In [None]:
# 第一步：定义变量
x = 10
print(f"x = {x}")

In [None]:
# 第二步：使用变量
y = x * 2
print(f"y = x * 2 = {y}")

In [None]:
# 第三步：修改x的值
x = 20
print(f"现在 x = {x}")
print(f"但是 y 仍然是 {y}，因为第二个单元格没有重新运行")

## 问题2：删除单元格后的幽灵变量

In [None]:
# 定义一个临时变量
temp_variable = "我是一个临时变量"
print(temp_variable)

In [None]:
# 使用临时变量
result = f"处理结果：{temp_variable}"
print(result)

**问题演示**：
1. 运行上面两个单元格
2. 删除第一个单元格（定义temp_variable的那个）
3. 重新运行第二个单元格 - 它仍然能工作，因为temp_variable还在内存中
4. 但是如果有人重新启动内核并运行笔记本，第二个单元格会失败

## 问题3：依赖关系不明确

In [None]:
import pandas as pd
import numpy as np

# 创建数据
data = pd.DataFrame({
    'A': np.random.randn(100),
    'B': np.random.randn(100)
})
print("数据已创建")
print(data.head())

In [None]:
# 数据处理
processed_data = data.copy()
processed_data['C'] = processed_data['A'] + processed_data['B']
print(f"处理后的数据形状：{processed_data.shape}")

In [None]:
# 分析结果
mean_c = processed_data['C'].mean()
print(f"C列的平均值：{mean_c}")

**问题演示**：
1. 如果你修改第一个单元格中的数据生成逻辑
2. 后续单元格不会自动重新运行
3. 导致分析结果基于旧数据，但看起来像是基于新数据