In [None]:
# sys 是 Python 内置核心库，用于与 Python 解释器交互（控制程序运行、获取系统 / 解释器信息），无需额外安装。
# 主要常用方法（言简意赅）：
# sys.exit(n)：终止程序，n 为退出码（0 = 正常，非 0 = 异常，推荐替代 exit()）；
# sys.argv：获取命令行参数（运行脚本时传入的参数列表）；
# sys.path：Python 模块搜索路径列表（可添加自定义路径）；
# sys.stdin/sys.stdout：标准输入 / 输出流（替代 input()/print() 更灵活）；
# sys.version：获取 Python 解释器版本信息；
# sys.platform：获取操作系统平台（如 win32/linux/darwin）。
# 核心用途：控制程序生命周期、获取运行环境信息、处理命令行参数。  

pandas常用方法

In [None]:
# pandas 是 Python 核心数据处理库，专为表格型数据（如 CSV/Excel、数据库数据）设计，
# 核心对象是 DataFrame（二维表格）和 Series（一维列），能高效实现数据读取、查看、筛选、清洗、运算、保存等操作，
# 是数据分析、金融数据处理（如股票/期货数据）的必备工具
import pandas as pd

# ---------------------- 1. 数据读取（常用）----------------------
df = pd.read_csv("文件路径.csv")  # 读取CSV文件
df = pd.read_excel("文件路径.xlsx")  # 读取Excel文件
df = pd.DataFrame({"列1": [1,2,3], "列2": [4,5,6]})  # 直接创建DataFrame

# ---------------------- 2. 数据查看（常用）----------------------
df.head(5)  # 查看前5行（默认5行，可改参数）
df.tail(3)  # 查看后3行
df.info()  # 查看数据类型、非空值数量等信息
df.describe()  # 查看数值列统计摘要（均值、标准差等）
df.columns.tolist()  # 查看所有列名（返回列表）√
df.shape  # 查看数据维度（行数, 列数）

# ---------------------- 3. 数据筛选（常用）----------------------
df["列名"]  # 按列名取整列（返回Series）
df[["列1", "列2"]]  # 取多列（返回DataFrame）
df.loc[0:5, "列名"]  # 按行标签、列名筛选（左闭右闭）
df.iloc[0:5, 0:2]  # 按行索引、列索引筛选（左闭右开）
df[df["列名"] > 10]  # 按条件筛选行（列值大于10）
df[(df["列1"] > 5) & (df["列2"] == "值")]  # 多条件筛选（&且、|或）

# ---------------------- 4. 数据处理（常用）----------------------
df.dropna()  # 删除包含缺失值的行（默认axis=0）
df.dropna(axis=1)  # 删除包含缺失值的列
df.fillna(0)  # 缺失值填充为0（可填均值/中位数等）
df.drop_duplicates()  # 删除重复行
df.rename(columns={"旧列名": "新列名"})  # 重命名列
df.drop(columns=["无用列1", "无用列2"])  # 删除指定列

# ---------------------- 5. 数据运算（常用）----------------------
df.groupby("分组列")["计算列"].sum()  # 按列分组后求和（可换mean/max等）
other_df = []
df.merge(other_df, on="关联列", how="inner")  # 表连接（inner/left/right/outer）
df.sort_values("排序列", ascending=False)  # 按列排序（ascending=False降序）
df["列1"].sum()  # 单列求和（mean/median/mode/std等同理）
df["新列"] = df["列1"] + df["列2"]  # 新增列（基于已有列运算）

# ---------------------- 6. 数据转换（常用）----------------------
df.astype({"列1": int, "列2": str})  # 转换列数据类型
df.reset_index(drop=True)  # 重置索引（drop=True删除原索引）
df.set_index("列名")  # 将指定列设为索引
df["日期列"] = pd.to_datetime(df["日期列"])  # 转换为日期类型


# ---------------------- 7. 数据保存（常用）----------------------
df.to_csv("保存路径.csv", index=False)  # 保存为CSV（index=False不存索引）
df.to_excel("保存路径.xlsx", sheet_name="工作表1", index=False)  # 保存为Excel


# ---------------------- 8. 索引操作（补充）----------------------
df = pd.to_datetime()#变成时间类型pandas的datetime类型
df.index.name = "Date"  # 给索引命名（如“日期”）
df.reset_index(inplace=True)  # 把索引变回普通列（inplace=True直接修改原df）
df.set_index("Date", drop=True)  # 把指定列设为索引（drop=True删除原列）

numpy简介以及常用方法

In [None]:
# NumPy 是 Python 核心数值计算库，专为高效处理多维数组（矩阵）设计，
# 核心对象是 ndarray（N维数组），提供快速的数组运算、线性代数、统计分析等功能，
# 是 pandas、matplotlib 等数据科学库的底层依赖，适合数值计算、矩阵操作、数据预处理
import numpy as np

# ---------------------- 1. 数组创建（常用）----------------------
arr1 = np.array([1, 2, 3, 4])  # 创建1维数组
arr2 = np.array([[1, 2], [3, 4]])  # 创建2维数组（矩阵）
arr3 = np.zeros((3, 4))  # 创建3行4列全0数组
arr4 = np.ones((2, 3))  # 创建2行3列全1数组
arr5 = np.arange(0, 10, 2)  # 生成0-10（不含10）、步长2的数组：[0,2,4,6,8]
arr6 = np.linspace(0, 1, 5)  # 生成0-1间5个等距数：[0,0.25,0.5,0.75,1]

# ---------------------- 2. 数组属性（常用）----------------------
arr2.shape  # 查看数组维度：(2,2)（2行2列）
arr2.dtype  # 查看数据类型：int64（默认）
arr2.size  # 查看元素总数：4
arr2.ndim  # 查看维度数：2（二维）

# ---------------------- 3. 数组索引与切片（常用）----------------------
arr1[0]  # 1维数组取第1个元素：1
arr2[0, 1]  # 2维数组取第1行第2列：2（行/列索引从0开始）
arr1[1:3]  # 1维数组切片：[2,3]（左闭右开）
arr2[:, 0]  # 2维数组取所有行的第1列：[1,3]
arr2[1:, :]  # 2维数组取第2行及以后所有列：[[3,4]]

# ---------------------- 4. 数组运算（常用）----------------------
arr1 + 2  # 数组每个元素加2：[3,4,5,6]
arr1 * 3  # 数组每个元素乘3：[3,6,9,12]
arr1 + arr1  # 同维度数组对应元素相加：[2,4,6,8]
arr2 @ arr2  # 矩阵乘法（等价于 np.matmul(arr2, arr2)）：[[7,10],[15,22]]
np.dot(arr1, arr1)  # 向量点积：1*1 + 2*2 + 3*3 +4*4 =30
arr1.mean()  # 数组均值：2.5
arr1.sum()  # 数组求和：10
arr1.max()  # 数组最大值：4
arr2.sum(axis=0)  # 按列求和：[4,6]（axis=1按行求和）

# ---------------------- 5. 数组形状操作（常用）----------------------
arr2.reshape((4, 1))  # 重塑为4行1列数组
arr1.reshape((2, 2))  # 1维数组转2行2列：[[1,2],[3,4]]
arr2.flatten()  # 多维数组展平为1维：[1,2,3,4]
arr3 = np.vstack((arr1, [5,6,7,8]))  # 垂直堆叠数组（上下拼接）
arr4 = np.hstack((arr2, [[5],[6]]))  # 水平堆叠数组（左右拼接）

# ---------------------- 6. 数据处理（常用）----------------------
np.where(arr1 > 2, arr1, 0)  # 条件替换：大于2保留原值，否则为0 → [0,0,3,4]
arr_with_nan = None#避免报错
arr_duplicate = None
np.nan_to_num(arr_with_nan, nan=0)  # 缺失值（nan）替换为0
np.unique(arr_duplicate)  # 去重并排序
arr = []
arr.clip(1, 3)  # 数值裁剪：小于1→1，大于3→3，中间保留原值

# ---------------------- 7. 常用工具函数----------------------
np.random.rand(2, 3)  # 生成2行3列[0,1)随机数
np.sqrt(arr1)  # 每个元素开平方
np.log(arr1)  # 每个元素取自然对数
np.argmax(arr2)  # 数组中最大值的索引：3（对应元素4）
np.argsort(arr1)  # 元素排序后的索引：[0,1,2,3]

matplotlib

In [None]:
# Matplotlib 是 Python 核心绘图库，专注于数据可视化，
# 核心模块是 pyplot（简化绘图接口），核心对象是 Figure（图表容器）和 Axes（绘图区域），
# 支持绘制折线图、柱状图、散点图、直方图等多种图表，可灵活定制样式，是数据分析可视化必备工具
import matplotlib.pyplot as plt
import numpy as np  # 辅助生成测试数据

# ---------------------- 1. 基础绘图流程（核心）----------------------
# 1. 创建图表容器（可选，默认自动创建）
fig = plt.figure(figsize=(8, 5))  # 设置图表尺寸（宽8英寸，高5英寸）
# 2. 创建绘图区域（1行1列第1个区域，也可简写为 plt.subplot(111)）
ax = plt.subplot(1, 1, 1)

# 生成测试数据
x = np.linspace(0, 10, 100)  # 0-10间100个等距点
y1 = np.sin(x)  # 正弦曲线
y2 = np.cos(x)  # 余弦曲线

# ---------------------- 2. 绘制常用图表----------------------
ax.plot(x, y1, label='sin(x)', color='blue', linewidth=2, linestyle='-')  # 折线图
ax.plot(x, y2, label='cos(x)', color='red', linewidth=1.5, linestyle='--')  # 虚线折线图
ax.scatter(x[::5], y1[::5], color='orange', s=30, alpha=0.7)  # 散点图（每5个点取1个）
ax.bar(x[:5], y1[:5], color='green', alpha=0.5)  # 柱状图（前5个点）
ax.hist(y1, bins=10, color='purple', alpha=0.4)  # 直方图（统计y1分布）

# ---------------------- 3. 图表定制（标签、图例、网格等）----------------------
ax.set_title('Sin & Cos Curve', fontsize=14, pad=15)  # 图表标题（字体大小、间距）
ax.set_xlabel('X Axis', fontsize=12)  # X轴标签
ax.set_ylabel('Y Axis', fontsize=12)  # Y轴标签
ax.legend(loc='upper right')  # 显示图例（位置：右上角）
ax.grid(True, alpha=0.3)  # 显示网格（透明度0.3）
ax.set_xlim(0, 10)  # 设置X轴范围
ax.set_ylim(-1.2, 1.2)  # 设置Y轴范围
ax.set_xticks(np.arange(0, 11, 2))  # 自定义X轴刻度

# ---------------------- 4. 多子图绘制----------------------
fig, axes = plt.subplots(2, 1, figsize=(8, 6))  # 2行1列子图（共享X轴可加 sharex=True）
axes[0].plot(x, y1, color='blue')
axes[0].set_title('Sin(x)')
axes[1].plot(x, y2, color='red')
axes[1].set_title('Cos(x)')
plt.tight_layout()  # 自动调整子图间距，避免重叠

# ---------------------- 5. 图表保存与显示----------------------
plt.savefig('sin_cos_plot.png', dpi=300, bbox_inches='tight')  # 保存图片（分辨率300，裁剪空白）
plt.show()  # 显示图表（阻塞程序，直到关闭窗口）

# ---------------------- 6. 常用样式调整----------------------
plt.style.use('seaborn-v0_8-darkgrid')  # 设置预设样式（如ggplot、seaborn等）
plt.rcParams['font.sans-serif'] = ['SimHei']  # 解决中文显示问题（Windows）
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示问题

mplfinance绘图

In [None]:
# mplfinance（现名mpfinance）是基于matplotlib的Python金融可视化库，
# 专为金融数据设计，核心是快速绘制专业K线图（蜡烛图）、OHLC图，
# 支持叠加均线、成交量、技术指标（MACD/RSI等），无需手动搭建底层结构，
# 适配pandas DataFrame格式，是股票/期货数据可视化的高效工具
import mplfinance as mpf
import pandas as pd
import akshare as ak

# ---------------------- 1. 数据准备（需符合mpfinance要求）----------------------
# 获取期货/股票日K数据（AKShare返回的DataFrame已适配，含Date/Open/High/Low/Close/Volume列）
df = ak.futures_zh_daily_sina(symbol="IF2511")  # 沪深300股指期货2511合约
# 确保日期列为datetime类型（mpfinance要求索引为日期）
df.index = pd.to_datetime(df.index)
# 筛选必要列（Open/High/Low/Close/Volume，列名需匹配）
df = df[['开盘', '最高', '最低', '收盘', '成交量']]#具体看接口说明，如果是英文，就不需要重命名，只需要筛选
# 重命名列（mpfinance默认识别英文列名，可选）
df.columns = ['Open', 'High', 'Low', 'Close', 'Volume']

# ------------- 解决中文显示问题（固定配置，直接抄）-------------
plt.rcParams['font.sans-serif'] = ['SimHei']  # Windows系统用（黑体）
# plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']  # Mac系统用这行
# plt.rcParams['font.sans-serif'] = ['WenQuanYi Zen Hei']  # Linux系统用这行
plt.rcParams['axes.unicode_minus'] = False  # 解决负号（-）显示为方框的问题



# ---------------------- 2. 核心：绘制基础K线图（蜡烛图）----------------------
mpf.plot(
    df,  # 数据（索引为日期）
    type='candle',  # 图表类型：candle（蜡烛图）/ohlc（高低开收线）/line（折线图）
    title='IF2511 日K线图',  # 图表标题
    ylabel='价格（点）',  # Y轴标签
    volume=True,  # 显示成交量子图
    figratio=(12, 6),  # 图表宽高比
    style='yahoo'  # 预设样式（如yahoo、binance、classic等）
)

# ---------------------- 3. 定制样式（颜色、字体等）----------------------
# 自定义K线颜色（上涨红、下跌绿）
my_style = mpf.make_mpf_style(
    base_mpf_style='default',  # 基础样式
    marketcolors=mpf.make_marketcolors(
        up='red',  # 上涨K线颜色
        down='green',  # 下跌K线颜色
        volume='gray'  # 成交量颜色
    ),
    figcolor='white',  # 图表背景色
    gridcolor='lightgray'  # 网格颜色
)

mpf.plot(
    df[-30:],  # 只显示最近30天数据
    type='candle',
    style=my_style,
    title='IF2511 近30日K线（自定义样式）',
    volume=True
)

# ---------------------- 4. 叠加均线（MA）----------------------
mpf.plot(
    df[-60:],
    type='candle',
    style='yahoo',
    title='IF2511 近60日K线（叠加均线）',
    volume=True,
    mav=(5, 10, 20),  # 叠加5日、10日、20日均线
    ylabel_lower='成交量'  # 成交量子图Y轴标签
)

# ---------------------- 5. 叠加技术指标（MACD/RSI，需手动计算）----------------------
# 计算MACD指标
df['EMA12'] = df['Close'].ewm(span=12, adjust=False).mean()
df['EMA26'] = df['Close'].ewm(span=26, adjust=False).mean()
df['MACD'] = df['EMA12'] - df['EMA26']
df['Signal'] = df['MACD'].ewm(span=9, adjust=False).mean()
df['Histogram'] = df['MACD'] - df['Signal']

# 准备指标子图数据
add_plot = [
    # MACD线
    mpf.make_addplot(df['MACD'], panel=1, color='blue', title='MACD'),
    # Signal线
    mpf.make_addplot(df['Signal'], panel=1, color='red'),
    # MACD柱状图
    mpf.make_addplot(df['Histogram'], panel=1, type='bar', color='gray')
]

# 绘制含MACD的多子图
mpf.plot(
    df[-40:],
    type='candle',
    style='binance',
    title='IF2511 近40日K线+MACD',
    volume=True,
    addplot=add_plot,  # 附加指标子图
    panel_ratios=(3, 1, 1)  # 主图、成交量图、MACD图的高度比例
)

# ---------------------- 6. 图表保存----------------------
mpf.plot(
    df[-30:],
    type='candle',
    style='yahoo',
    volume=True,
    mav=(5, 10),
    savefig='IF2511_K线图.png',  # 保存路径
    dpi=300  # 分辨率
)

akshare常用接口

In [None]:
import akshare as ak
import mplfinance as mpf
import pandas as pd
from matplotlib import pyplot as plt

# ---------------------- 核心说明 ----------------------
# 1. 沪深300股指期货代码：IF（中证指数公司编制，标的物为沪深300指数）
# 2. 日K线绘图首选接口：主力连续（适合长期趋势）或具体合约（适合短期交易）
# 3. 接口区别：
#    - futures_main_sina：主力连续合约（自动拼接不同时期主力合约，无到期顾虑，推荐绘图）
#    - futures_zh_daily_sina：单个具体合约（如IF2512=2025年12月到期，到期后需换合约代码）

# ---------------------- 配置中文显示（绘图必加）----------------------
plt.rcParams['font.sans-serif'] = ['SimHei']  # Windows用（黑体），Mac/Linux换对应字体
plt.rcParams['axes.unicode_minus'] = False  # 解决负号显示方框问题

# ---------------------- 接口1：沪深300股指期货 主力连续合约（推荐绘图）----------------------
# 用途：长期日K线分析（无需关注合约到期，数据连续）
# symbol="IF0"：IF=沪深300股指期货，0=主力连续标识
df_main = ak.futures_main_sina(symbol="IF0")
print("=== 沪深300主力连续合约数据 ===")
print("数据列名:", df_main.columns.tolist())  # 列名：date/open/high/low/close/volume 等（英文小写）
print("数据时间范围:", df_main['date'].min(), "至", df_main['date'].max())
print("前5行数据:")
print(df_main.head())

# ---------------------- 接口2：沪深300股指期货 具体合约（短期交易用）----------------------
# 用途：短期日K线分析（关注特定到期合约，如IF2512=2025年12月到期）
# 合约代码规则：IF + 年份后2位 + 月份（1-12），如IF2603=2026年3月到期
df_contract = ak.futures_zh_daily_sina(symbol="IF2512")  # 2025年12月到期合约
print("\n=== 沪深300具体合约（IF2512）数据 ===")
print("数据列名:", df_contract.columns.tolist())
print("数据时间范围:", df_contract['date'].min(), "至", df_contract['date'].max())
print("前5行数据:")
print(df_contract.head())

# ---------------------- 数据清洗（适配mplfinance绘图，通用函数）----------------------
def clean_futures_data(df):
    """清洗沪深300期货数据，适配mplfinance日K线绘图"""
    # 1. 日期转换为datetime并设为索引（绘图必需）
    df['date'] = pd.to_datetime(df['date'])
    df = df.set_index('date')
    
    # 2. 筛选绘图必需列（open/high/low/close/volume）
    required_cols = ['open', 'high', 'low', 'close', 'volume']
    df = df[required_cols]
    
    # 3. 转换为数值类型（避免字符串导致绘图报错）
    for col in required_cols:
        df[col] = pd.to_numeric(df[col], errors='coerce')
    
    # 4. 删除缺失值+按日期排序（确保数据有效、顺序正确）
    df = df.dropna().sort_index()
    return df

# 清洗主力连续合约数据（绘图用这个！）
df_clean = clean_futures_data(df_main)

# ---------------------- 绘制日K线图（主力连续合约，推荐）----------------------
def plot_if_kline(df):
    """绘制沪深300股指期货日K线图（带成交量）"""
    # 自定义K线样式（上涨红、下跌绿，符合国内习惯）
    mc = mpf.make_marketcolors(up='red', down='green', edge='black', wick='black', volume='gray')
    style = mpf.make_mpf_style(marketcolors=mc, gridstyle=':', facecolor='white')
    
    # 绘图
    mpf.plot(
        df.tail(100),  # 显示最近100个交易日（避免数据过多拥挤）
        type='candle',  # 蜡烛图（日K线核心类型）
        style=style,
        volume=True,  # 显示成交量
        title='沪深300股指期货 主力连续 日K线图',
        ylabel='价格（点）',
        ylabel_lower='成交量（手）',
        figratio=(14, 10),  # 宽高比（舒展不拥挤）
        show_nontrading=False  # 不显示非交易日（避免K线间距异常）
    )

# 执行绘图（运行后弹出日K线图）
plot_if_kline(df_clean)

# ---------------------- 常用接口总结（注释版）----------------------
# 1. 主力连续合约（绘图首选）：ak.futures_main_sina(symbol="IF0")
#    - 优势：数据连续，无到期更换合约的麻烦，适合看长期趋势
#    - 适用场景：日K线绘图、长期走势分析
#
# 2. 具体到期合约：ak.futures_zh_daily_sina(symbol="IF2512")
#    - 优势：精准对应单个合约，适合短期交易参考
#    - 适用场景：短期合约分析、到期前交易参考
#
# 3. 绘图必选：主力连续合约（df_main）→ 清洗后 → mplfinance.plot()

In [None]:
import akshare as ak


def get_stock_data():
    """
    从AKShare获取股票日K线数据
    """
    df = ak.futures_zh_daily_sina(symbol="IF2511")#使用沪深300指数的25年11月合约
    try:
        if df is None or df.empty:
            print("获取数据失败")
            return None
        return df
    except Exception as e:#E大写
        print(f"获取数据时出错: {str(e)[:100]}")
        return None

df = get_stock_data()

if df is None:  # 添加检查
    print("数据获取失败，程序退出")
    exit(1)  # 退出程序，有bug，使用exit(0)退出是正常退出，也可以导入sys模块使用sys.exit()
print("原始数据列名:", df.columns.tolist())
print("数据前5行:")
print(df.head())#这里是前五行数据，也可以df.head(10)看10行
print(df)

RSI计算代码

In [None]:
def calculate_rsi(prices, period=14):  # period=14：默认14天周期（行业通用）
    """计算RSI指标"""
    # 1. 计算每日收盘价的涨跌差值（后一天 - 前一天）
    delta = prices.diff()  
    # 语法：Series.diff() → 对一列数据做“相邻元素差分”（后一个减前一个）
    # 例子：prices = [100, 102, 98, 101] → delta = [NaN, 2, -4, 3]（第1行无前一天，所以是NaN）

    # 2. 计算“上涨值的14天滚动均值”
    gain = delta.where(delta > 0, 0).rolling(window=period).mean()  #N日内收盘价上涨幅度的平均值
    # 拆语法：
    # a. delta.where(条件, 不满足条件时的值) → 条件筛选：
    #    delta>0（上涨）→ 保留原差值；delta≤0（下跌/平盘）→ 设为0
    #    例子：delta = [NaN, 2, -4, 3] → 筛选后 = [NaN, 2, 0, 3]
    # b. .rolling(window=14) → 滚动窗口：每次取“当前行+前13行”共14行数据（窗口大小=period）
    # c. .mean() → 对窗口内的数据求均值（平均上涨幅度）
    # 最终：gain 是“过去14天的平均上涨幅度”

    # 3. 计算“下跌值的14天滚动均值”
    loss = (-delta.where(delta < 0, 0)).rolling(window=period).mean()  
    # 拆语法：
    # a. delta.where(delta < 0, 0) → 条件筛选：delta<0（下跌）→ 保留原差值；否则设为0
    #    例子：delta = [NaN, 2, -4, 3] → 筛选后 = [NaN, 0, -4, 0]
    # b. -delta → 给下跌差值取绝对值（因为下跌是负数，取负后变成正数，方便计算幅度）
    #    上面例子 → -delta 后 = [NaN, 0, 4, 0]
    # c. .rolling(window=14).mean() → 过去14天的平均下跌幅度（绝对值）
    # 最终：loss 是“过去14天的平均下跌幅度”

    # 4. 计算相对强弱 RS（避免除零报错）
    rs = gain / (loss + 1e-10)  
    # 语法：数值除法 → gain（平均上涨）除以 loss（平均下跌）
    # 1e-10：极小值（0.0000000001），防止 loss=0 时“除零报错”（比如14天全上涨，loss=0）

    # 5. 计算RSI（公式：RSI = 100 - (100/(1+RS))）
    rsi = 100 - (100 / (1 + rs))  
    # 语法：普通算术运算 → 结果范围0-100（超买>70，超卖<30）

    return rsi  # 返回RSI列（Series类型）

KDJ计算代码

In [None]:
def calculate_kdj(df, n=9, m1=3, m2=3):  # n=9（KDJ基础周期），m1=3（K线周期），m2=3（D线周期）
    """计算KDJ指标"""
    # 1. 计算9天内的最低价（滚动窗口）
    low_list = df['low'].rolling(window=n).min()  
    # 拆语法：
    # a. df['low'] → 取表格的“最低价”列（Series）
    # b. .rolling(window=9) → 滚动窗口：每次取“当前行+前8行”共9行数据
    # c. .min() → 对窗口内的9个最低价，取最小值
    # 最终：low_list 是“过去9天的最低价格”

    # 2. 计算9天内的最高价（滚动窗口）
    high_list = df['high'].rolling(window=n).max()  
    # 语法和上面一致，只是把 .min() 改成 .max() → 取窗口内的最大值
    # 最终：high_list 是“过去9天的最高价格”

    # 3. 计算RSV（未成熟随机值，公式：(收盘价-9天最低价)/(9天最高价-9天最低价)*100）
    rsv = (df['close'] - low_list) / (high_list - low_list + 1e-10) * 100  
    # 拆语法：
    # a. df['close'] → 收盘价列；分子=当前收盘价 - 9天最低价（反映收盘价在9天区间的位置）
    # b. 分母=9天最高价 - 9天最低价（9天价格波动范围）；+1e-10 避免分母为0（9天价格无波动）
    # c. *100 → 把结果缩放到0-100之间
    # 最终：RSV 是“收盘价在9天价格区间的相对位置”

    # 4. 计算K线（RSV的3天指数移动平均）
    k = rsv.ewm(span=m1).mean()  
    # 语法：
    # a. .ewm(span=3) → 指数移动平均（Exponential Moving Average）：
    #    比普通滚动平均（.rolling().mean()）更重视“近期数据”（近期数据权重更高）
    #    span=3 → 相当于3天的指数平均（m1=3）
    # b. .mean() → 计算均值
    # 最终：K线是RSV的平滑版（反应比RSV慢，比D线快）

    # 5. 计算D线（K线的3天指数移动平均）
    d = k.ewm(span=m2).mean()  
    # 语法和上面一致：对K线再做一次3天指数平均 → 比K线更平滑，反应更慢

    # 6. 计算J线（公式：J=3*K - 2*D）
    j = 3 * k - 2 * d  
    # 语法：普通算术运算 → 放大K和D的差值，反应最灵敏（波动最大）

    return k, d, j  # 返回K、D、J三列（都是Series类型）

语法	作用	所属对象
Series.diff()	相邻元素差分（后一个减前一个）	Series（单列）
Series.where(cond, val)	条件筛选：满足 cond 留原值，否则设 val	Series
Series.rolling(window=n).min()	滚动窗口取最小值（n 天内最小）	Series
Series.rolling(window=n).max()	滚动窗口取最大值（n 天内最大）	Series
Series.rolling(window=n).mean()	滚动窗口取均值（n 天内平均）	Series
Series.ewm(span=n).mean()	指数移动平均（重视近期数据，n 天周期）	Series
1e-10	极小值，避免除零报错	通用语法

RSI 和 KDJ 的核心区别（小白能懂，用表格 + 通俗话）
两者都是 “判断市场强弱 / 反转” 的技术指标，但核心逻辑、侧重点、用法完全不同，总结成表格更清晰：
对比维度	RSI（相对强弱指数） kDJ（随机指标）                     
核心逻辑	看 “过去 N 天上涨和下跌的幅度对比”，判断 “超买超卖”	看 “当前收盘价在过去 N 天价格区间的位置”，判断 “趋势反转”
计算依据	只依赖「收盘价的涨跌差值」（单因子）	依赖「最高价、最低价、收盘价」（三因子）
指标形态	单条线（范围 0-100）	三条线（K/D/J，范围 0-100，J 线可超界）
反应速度	中等（单条线，平滑度适中）	快（J 线最灵敏，K 线次之，D 线最稳）
核心用法	超买（RSI>70）→ 警惕下跌；超卖（RSI<30）→ 警惕上涨	K 穿 D（金叉）→ 潜在上涨；K 穿 D（死叉）→ 潜在下跌；J 线超界（>100/<0）→ 反转信号
适用行情	震荡行情（横盘时信号准）	趋势行情（上涨 / 下跌时信号准）

In [None]:
# ---------------------- 1. Flask 接口进阶实战（RESTful 规范+容错）----------------------
from flask import Flask, request, jsonify
import akshare as ak
import pandas as pd
import numpy as np
from typing import Optional, Dict, List  # 类型注解，提升代码可读性和IDE提示

app = Flask(__name__)

# 进阶点1：类型注解（明确函数参数/返回值类型，便于维护和调试）
def get_im_minute_rsi(
    code: str = "IM0",
    start_time: str = "",
    end_time: str = ""
) -> Dict[str, Optional[List[Dict] | str | int]]:
    """
    进阶点2：异常分层捕获（精准处理不同类型错误，返回明确提示）
    异常类型：数据获取失败、数据处理异常、时间格式错误等
    """
    try:
        # 进阶点3：接口数据缓存（可选，避免重复请求第三方接口，提升性能）
        # 实际项目可用 redis：cache.get(f"rsi_{code}_{start_time}_{end_time}")
        # 缓存命中直接返回，未命中再请求+存入缓存
        
        # 进阶点4：第三方接口调用容错（设置超时+重试，避免网络波动导致失败）
        # 此处简化，实际可封装重试装饰器：@retry(max_attempts=3, delay=1)
        df = ak.futures_zh_minute_sina(symbol=code, period="1")
        
        if df.empty:
            return {"code": 400, "msg": "第三方接口返回空数据", "data": []}
        
        # ---------------------- 2. Pandas 数据处理进阶 ----------------------
        # 进阶点5：链式调用（简化代码，减少中间变量）
        close_prices = df["close"]
        delta = close_prices.diff()
        
        # 进阶点6：滚动窗口优化（避免重复计算，提升效率）
        gain = delta.where(delta > 0, 0).rolling(window=14, min_periods=14).mean()  # min_periods=14：必须满14个数据才计算
        loss = (-delta.where(delta < 0, 0)).rolling(window=14, min_periods=14).mean()
        
        # 进阶点7：数值稳定性处理（除零保护+避免极端值）
        rs = gain.div(loss + 1e-10)  # 用 DataFrame/Series 内置方法，更优雅
        df["rsi"] = 100 - (100 / (1 + rs))
        
        # 进阶点8：时间筛选优化（先转格式再筛选，避免重复转换）
        df["datetime"] = pd.to_datetime(df["datetime"], errors="coerce")  # errors="coerce"：非法时间转NaT
        df = df.dropna(subset=["datetime"])  # 删除时间格式错误的行
        
        # 进阶点9：向量化筛选（比循环快10倍+，pandas核心优化）
        start_dt = pd.to_datetime(start_time, errors="coerce")
        end_dt = pd.to_datetime(end_time, errors="coerce")
        
        if pd.isna(start_dt) or pd.isna(end_dt):
            return {"code": 400, "msg": "时间格式错误（正确格式：YYYY-MM-DD HH:MM:SS）", "data": []}
        
        # 向量化掩码筛选，替代循环判断
        mask = (df["datetime"] >= start_dt) & (df["datetime"] <= end_dt)
        df_filtered = df.loc[mask].copy()  # .copy() 避免 SettingWithCopyWarning
        
        if df_filtered.empty:
            return {"code": 400, "msg": "指定时间区间无有效数据", "data": []}
        
        # 进阶点10：批量数据转换（用 apply 替代循环，提升效率）
        def generate_signal(row: pd.Series) -> Dict[str, str | bool]:
            rsi = row["rsi"]
            return {
                "eob": row["datetime"].strftime("%Y-%m-%d %H:%M:%S"),
                "B": rsi < 30 if not pd.isna(rsi) else False,
                "S": rsi > 70 if not pd.isna(rsi) else False
            }
        
        # 批量生成信号，比 for 循环更高效
        data = df_filtered.apply(generate_signal, axis=1).tolist()
        
        # 存入缓存（示例）：cache.set(f"rsi_{code}_{start_time}_{end_time}", data, expire=300)  # 5分钟过期
        return {"code": 200, "msg": "请求成功", "data": data}
    
    except ak.exceptions.AkShareError as e:
        # 进阶点11：精准捕获第三方库异常
        return {"code": 400, "msg": f"AKShare接口错误：{str(e)}", "data": []}
    except ValueError as e:
        return {"code": 400, "msg": f"数据处理错误：{str(e)}", "data": []}
    except Exception as e:
        # 进阶点12：全局异常兜底（避免服务崩溃，记录错误日志）
        import logging
        logging.error(f"未知错误：{str(e)}", exc_info=True)  # 记录错误堆栈，便于排查
        return {"code": 500, "msg": f"服务器内部错误：{str(e)[:50]}", "data": []}

# ---------------------- 3. Flask 接口进阶配置 ----------------------
@app.route("/get_rsi", methods=["GET"])
def get_rsi():
    # 进阶点13：参数结构化获取+默认值优化
    params = {
        "code": request.args.get("code", "IM0"),
        "start_time": request.args.get("start_time", ""),
        "end_time": request.args.get("end_time", "")
    }
    
    # 进阶点14：参数校验逻辑封装（便于复用和扩展）
    def validate_params(params: Dict[str, str]) -> Optional[str]:
        if not params["start_time"] or not params["end_time"]:
            return "start_time和end_time为必填参数（格式：YYYY-MM-DD HH:MM:SS）"
        # 可添加更多校验：合约代码合法性、时间区间合理性（开始时间<=结束时间）
        if pd.to_datetime(params["start_time"], errors="coerce") > pd.to_datetime(params["end_time"], errors="coerce"):
            return "开始时间不能晚于结束时间"
        return None
    
    err_msg = validate_params(params)
    if err_msg:
        return jsonify({"code": 400, "msg": err_msg, "data": []})
    
    # 进阶点15：函数参数解包（简化传参）
    result = get_im_minute_rsi(**params)
    return jsonify(result)

# 进阶点16：生产环境配置（关闭debug，设置host和端口）
if __name__ == "__main__":
    # 实际生产环境用 gunicorn 启动：gunicorn -w 4 -b 0.0.0.0:5000 脚本名:app
    app.run(debug=False, host="0.0.0.0", port=5000)  # host=0.0.0.0：允许外部访问