# 📊 使用Python进行金融数据可视化

## 🎯 学习目标

完成本综合绘图教程后，您将能够：

1. **掌握matplotlib基础**，创建专业的金融图表
2. **可视化金融时间序列数据**，使用适当的格式和样式
3. **创建高级绘图布局**，使用子图和多轴图
4. **使用seaborn**进行金融数据的统计可视化
5. **生成专业金融图表**，如使用mplfinance的K线图
6. **应用最佳实践**于投资分析中的金融数据可视化

## 📈 可视化在金融中的重要性

- **模式识别**：识别市场数据中的趋势、周期和异常
- **风险评估**：可视化波动率、相关性和投资组合表现
- **沟通交流**：清晰地向利益相关者和决策者展示发现
- **分析速度**：快速评估大型数据集和时间序列
- **决策支持**：基于视觉洞察做出明智的投资决策

## 📚 涵盖的库

- **matplotlib**：Python的核心绘图库
- **seaborn**：基于matplotlib的统计数据可视化
- **mplfinance**：专业金融图表（K线，OHLC）
- **plotly**：交互式金融仪表板（附加内容）

## 🗂️ 教程结构

1. **Matplotlib基础** - 核心绘图概念和语法
2. **金融时间序列图** - 线图、价格图、成交量分析
3. **高级Matplotlib** - 子图、双轴、自定义
4. **使用Seaborn进行统计可视化** - 分布、相关性、因子分析
5. **金融专用图表** - K线、OHLC、技术指标
6. **最佳实践** - 专业样式、导出格式、性能提示

## 📦 库设置和配置

**基本参考：**
- [Matplotlib官方文档](https://matplotlib.org/stable/contents.html)
- [Matplotlib速查表](https://github.com/matplotlib/cheatsheets)
- [Seaborn教程](https://seaborn.pydata.org/tutorial.html)
- [MPLFinance文档](https://github.com/DanielGoldfarb/mplfinance)

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd
import numpy as np
from datetime import datetime, timedelta
import warnings
warnings.filterwarnings('ignore')

%matplotlib inline

plt.rcParams.update({
    'figure.figsize': (12, 8),
    'font.size': 12,
    'axes.labelsize': 14,
    'axes.titlesize': 16,
    'xtick.labelsize': 12,
    'ytick.labelsize': 12,
    'legend.fontsize': 12,
    'figure.titlesize': 18,
    'axes.grid': True,
    'grid.alpha': 0.3
})

sns.set_style("whitegrid")
sns.set_palette("husl")

print("✅ Plotting libraries configured successfully!")
print(f"📊 Matplotlib version: {plt.matplotlib.__version__}")
print(f"🎨 Seaborn version: {sns.__version__}")
print(f"🐼 Pandas version: {pd.__version__}")

## 📈 加载金融数据

我们将使用当前文件夹中的真实金融数据来演示绘图技术。

In [None]:
def load_financial_data():
    """加载多个股票数据集用于绘图演示"""
    
    stocks = ['AAPL', 'MSFT', 'GOOGL', 'TSLA']
    stock_data = {}
    
    for symbol in stocks:
        try:
            file_path = f'{symbol}_stock_data.csv'
            df = pd.read_csv(file_path, index_col='Date', parse_dates=True)
            stock_data[symbol] = df
            print(f"✅ 已加载 {symbol}: {len(df)} 个交易日")
        except FileNotFoundError:
            print(f"⚠️ 当前文件夹中未找到 {symbol}_stock_data.csv")
    
    return stock_data

stocks = load_financial_data()

if stocks:
    close_prices = pd.DataFrame({symbol: data['Close'] for symbol, data in stocks.items()})
    print(f"\n📊 合并数据集形状: {close_prices.shape}")
    print(f"📅 日期范围: {close_prices.index[0].strftime('%Y-%m-%d')} 至 {close_prices.index[-1].strftime('%Y-%m-%d')}")

    print("\n📋 样本数据（最近5天）:")
    print(close_prices.tail().round(2))
else:
    print("⚠️ 未加载股票数据。请确保CSV文件在当前文件夹中。")

---

# 1. 📊 Matplotlib基础

## 1.1 基本绘图结构

理解matplotlib绘图的结构对于创建专业的金融可视化至关重要。

---

In [None]:
np.random.seed(42)
dates = pd.date_range('2020-01-01', periods=365, freq='D')
price_base = 100
returns = np.random.normal(0.001, 0.02, 365)  # Daily returns with 2% volatility
prices = price_base * (1 + returns).cumprod()

plt.figure(figsize=(12, 6))
plt.plot(dates, prices, linewidth=2, color='blue')
plt.title('Stock Price Over Time - Basic Plot')
plt.xlabel('Date')
plt.ylabel('Price ($)')
plt.grid(True, alpha=0.3)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()

print("📈 这展示了金融时间序列图的基本结构")

---

## 1.2 图形和轴对象（专业方法）

使用图形和轴对象提供更多控制，是复杂金融可视化的推荐方法。

---

In [None]:
fig, ax = plt.subplots(figsize=(14, 8))

if 'AAPL' in stocks:
    apple_data = stocks['AAPL']
    ax.plot(apple_data.index, apple_data['Close'], 
            label='AAPL Close Price', linewidth=2, color='#1f77b4')
    
    # Add moving average
    ma_20 = apple_data['Close'].rolling(window=20).mean()
    ax.plot(apple_data.index, ma_20, 
            label='20-day Moving Average', linewidth=2, color='red', alpha=0.7)

# Formatting
ax.set_title('Apple Inc. (AAPL) Stock Price with Moving Average', fontsize=16, fontweight='bold')
ax.set_xlabel('Date', fontsize=14)
ax.set_ylabel('Price ($)', fontsize=14)
ax.legend(loc='upper left')
ax.grid(True, alpha=0.3)

# Format x-axis dates
fig.autofmt_xdate()

plt.tight_layout()
plt.show()

print("✅ 使用图形和轴对象的专业绘图")
print("📊 关键特性：标题、轴标签、图例、网格、日期格式化")

---

## 1.3 多线和样式

比较多个金融工具需要清晰的视觉区分。

---

In [None]:
fig, ax = plt.subplots(figsize=(14, 8))

colors = ['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728']
line_styles = ['-', '--', '-.', ':']

if len(stocks) > 0:
    # 将价格标准化为从100开始以便比较
    normalized_prices = close_prices.div(close_prices.iloc[0]) * 100
    
    for i, (symbol, color, style) in enumerate(zip(normalized_prices.columns, colors, line_styles)):
        ax.plot(normalized_prices.index, normalized_prices[symbol], 
                label=f'{symbol}', color=color, linewidth=2.5, linestyle=style)

ax.set_title('Stock Performance Comparison (Normalized to 100)', fontsize=16, fontweight='bold')
ax.set_xlabel('Date', fontsize=14)
ax.set_ylabel('Normalized Price (Base = 100)', fontsize=14)
ax.legend(loc='best', frameon=True, fancybox=True, shadow=True)
ax.grid(True, alpha=0.3)

ax.axhline(y=100, color='black', linestyle='--', alpha=0.5, label='Starting Point')

fig.autofmt_xdate()

plt.tight_layout()
plt.show()

print("📈 使用标准化价格的多股票比较")
print("💡 提示：标准化允许比较不同价格水平的股票")

---

# 2. 📊 金融时间序列可视化

## 2.1 OHLC（开盘、最高、最低、收盘）数据可视化

---

In [None]:
if 'AAPL' in stocks:
    recent_data = stocks['AAPL'].tail(30)  # Last 30 days
    
    fig, (ax1, ax2) = plt.subplots(2, 1, figsize=(14, 10), 
                                   gridspec_kw={'height_ratios': [3, 1]})
    
    # 包含OHLC信息的价格图
    ax1.plot(recent_data.index, recent_data['Close'], label='Close', linewidth=2, color='blue')
    ax1.plot(recent_data.index, recent_data['High'], label='High', linewidth=1, color='green', alpha=0.7)
    ax1.plot(recent_data.index, recent_data['Low'], label='Low', linewidth=1, color='red', alpha=0.7)
    
    # 填充最高价和最低价之间的区域
    ax1.fill_between(recent_data.index, recent_data['High'], recent_data['Low'], 
                     alpha=0.2, color='gray', label='Daily Range')
    
    ax1.set_title('AAPL - Price Movement (Last 30 Days)', fontsize=14, fontweight='bold')
    ax1.set_ylabel('Price ($)', fontsize=12)
    ax1.legend()
    ax1.grid(True, alpha=0.3)
    
    # 成交量图
    volume_colors = ['green' if close >= open_ else 'red' 
                     for close, open_ in zip(recent_data['Close'], recent_data['Open'])]
    
    ax2.bar(recent_data.index, recent_data['Volume']/1e6, 
            color=volume_colors, alpha=0.7, width=0.8)
    ax2.set_ylabel('Volume (Millions)', fontsize=12)
    ax2.set_xlabel('Date', fontsize=12)
    ax2.grid(True, alpha=0.3)
    
    # 格式化日期
    fig.autofmt_xdate()
    plt.tight_layout()
    plt.show()
    
    print("📊 带成交量的OHLC可视化")
    print("🎨 成交量柱按价格方向着色（绿色=上涨，红色=下跌）")

---

## 2.2 收益率分析可视化

---

In [None]:
if len(stocks) > 0:
    # 计算日收益率
    returns = close_prices.pct_change().dropna()
    
    fig, axes = plt.subplots(2, 2, figsize=(16, 12))
    
    # 图1：收益率时间序列
    axes[0, 0].plot(returns.index, returns.iloc[:, 0] * 100, linewidth=1, alpha=0.7)
    axes[0, 0].set_title(f'{returns.columns[0]} Daily Returns (%)', fontweight='bold')
    axes[0, 0].set_ylabel('Daily Return (%)')
    axes[0, 0].axhline(y=0, color='black', linestyle='-', alpha=0.3)
    axes[0, 0].grid(True, alpha=0.3)
    
    # 图2：收益率直方图
    axes[0, 1].hist(returns.iloc[:, 0] * 100, bins=50, alpha=0.7, edgecolor='black')
    axes[0, 1].set_title(f'{returns.columns[0]} Returns Distribution', fontweight='bold')
    axes[0, 1].set_xlabel('Daily Return (%)')
    axes[0, 1].set_ylabel('Frequency')
    axes[0, 1].axvline(x=0, color='red', linestyle='--', alpha=0.7)
    axes[0, 1].grid(True, alpha=0.3)
    
    # 图3：滚动波动率
    rolling_vol = returns.rolling(window=30).std() * np.sqrt(252) * 100  # 年化波动率
    axes[1, 0].plot(rolling_vol.index, rolling_vol.iloc[:, 0], linewidth=2)
    axes[1, 0].set_title(f'{returns.columns[0]} Rolling 30-Day Volatility (Annualized)', fontweight='bold')
    axes[1, 0].set_ylabel('Volatility (%)')
    axes[1, 0].grid(True, alpha=0.3)
    
    # 图4：累计收益率
    cumulative_returns = (1 + returns).cumprod() - 1
    for i, symbol in enumerate(cumulative_returns.columns):
        axes[1, 1].plot(cumulative_returns.index, cumulative_returns[symbol] * 100, 
                       label=symbol, linewidth=2)
    axes[1, 1].set_title('Cumulative Returns Comparison', fontweight='bold')
    axes[1, 1].set_ylabel('Cumulative Return (%)')
    axes[1, 1].legend()
    axes[1, 1].grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    # 打印汇总统计
    print("📊 收益率分析摘要:")
    for symbol in returns.columns:
        daily_ret = returns[symbol]
        print(f"\n{symbol}:")
        print(f"  📈 平均日收益率: {daily_ret.mean()*100:.3f}%")
        print(f"  📉 日波动率: {daily_ret.std()*100:.3f}%")
        print(f"  📊 年化波动率: {daily_ret.std()*np.sqrt(252)*100:.2f}%")
        print(f"  📈 总收益率: {cumulative_returns[symbol].iloc[-1]*100:.2f}%")

---

# 3. 🔧 高级Matplotlib技术

## 3.1 子图和多面板布局

---

In [None]:
if 'AAPL' in stocks:
    apple = stocks['AAPL'].copy()
    
    # 计算技术指标
    apple['MA_20'] = apple['Close'].rolling(window=20).mean()
    apple['MA_50'] = apple['Close'].rolling(window=50).mean()
    apple['Returns'] = apple['Close'].pct_change()
    apple['Volatility'] = apple['Returns'].rolling(window=30).std() * np.sqrt(252) * 100
    
    # 创建复杂的子图布局
    fig = plt.figure(figsize=(16, 12))
    
    # 定义网格布局（3行，2列）
    gs = fig.add_gridspec(3, 2, hspace=0.3, wspace=0.3, height_ratios=[2, 1, 1])
    
    # 主价格图（跨2列）
    ax1 = fig.add_subplot(gs[0, :])
    ax1.plot(apple.index, apple['Close'], label='Close Price', linewidth=2, color='blue')
    ax1.plot(apple.index, apple['MA_20'], label='20-day MA', linewidth=2, color='orange')
    ax1.plot(apple.index, apple['MA_50'], label='50-day MA', linewidth=2, color='green')
    ax1.set_title('AAPL Stock Analysis Dashboard', fontsize=16, fontweight='bold')
    ax1.set_ylabel('Price ($)', fontsize=12)
    ax1.legend()
    ax1.grid(True, alpha=0.3)
    
    # 成交量图
    ax2 = fig.add_subplot(gs[1, 0])
    ax2.bar(apple.index, apple['Volume']/1e6, alpha=0.7, color='purple')
    ax2.set_title('Trading Volume', fontweight='bold')
    ax2.set_ylabel('Volume (Millions)')
    ax2.grid(True, alpha=0.3)
    
    # 收益率分布
    ax3 = fig.add_subplot(gs[1, 1])
    ax3.hist(apple['Returns'].dropna() * 100, bins=50, alpha=0.7, color='red', edgecolor='black')
    ax3.set_title('Returns Distribution', fontweight='bold')
    ax3.set_xlabel('Daily Return (%)')
    ax3.set_ylabel('Frequency')
    ax3.axvline(x=0, color='black', linestyle='--', alpha=0.7)
    ax3.grid(True, alpha=0.3)
    
    # 滚动波动率
    ax4 = fig.add_subplot(gs[2, :])
    ax4.plot(apple.index, apple['Volatility'], linewidth=2, color='darkred')
    ax4.set_title('Rolling 30-Day Volatility (Annualized)', fontweight='bold')
    ax4.set_ylabel('Volatility (%)')
    ax4.set_xlabel('Date')
    ax4.grid(True, alpha=0.3)
    
    # 格式化x轴日期
    for ax in [ax2, ax4]:
        fig.autofmt_xdate()
    
    plt.show()
    
    print("📊 高级多面板金融仪表板")
    print("🎛️ 特性：价格图、成交量、收益率分布、波动率")

---

## 3.2 双Y轴图

---

In [None]:
if 'AAPL' in stocks:
    apple = stocks['AAPL'].tail(60)  # Last 60 days for clarity
    
    fig, ax1 = plt.subplots(figsize=(14, 8))
    
    # 主Y轴：价格
    color1 = 'tab:blue'
    ax1.set_xlabel('Date', fontsize=12)
    ax1.set_ylabel('Price ($)', color=color1, fontsize=12)
    line1 = ax1.plot(apple.index, apple['Close'], color=color1, linewidth=3, label='Close Price')
    ax1.tick_params(axis='y', labelcolor=color1)
    ax1.grid(True, alpha=0.3)
    
    # 次Y轴：成交量
    ax2 = ax1.twinx()
    color2 = 'tab:red'
    ax2.set_ylabel('Volume (Millions)', color=color2, fontsize=12)
    bars = ax2.bar(apple.index, apple['Volume']/1e6, alpha=0.4, color=color2, 
                   width=0.8, label='Volume')
    ax2.tick_params(axis='y', labelcolor=color2)
    
    # 标题和格式化
    ax1.set_title('AAPL: Price vs Volume (Dual Y-Axis)', fontsize=16, fontweight='bold')
    
    # 组合图例
    lines1, labels1 = ax1.get_legend_handles_labels()
    lines2, labels2 = ax2.get_legend_handles_labels()
    ax1.legend(lines1 + lines2, labels1 + labels2, loc='upper left')
    
    # 格式化日期
    fig.autofmt_xdate()
    
    plt.tight_layout()
    plt.show()
    
    print("📊 双Y轴图：价格和成交量")
    print("💡 在比较不同尺度的指标时很有用")

---

# 4. 🎨 使用Seaborn进行统计可视化

## 4.1 相关性分析

---

In [None]:
if len(stocks) > 1:
    # 计算收益率的相关性矩阵
    returns = close_prices.pct_change().dropna()
    correlation_matrix = returns.corr()
    
    # 创建相关性热力图
    plt.figure(figsize=(10, 8))
    
    # 使用自定义样式的seaborn热力图
    mask = np.triu(np.ones_like(correlation_matrix, dtype=bool))  # 掩码上三角
    
    sns.heatmap(correlation_matrix, 
                mask=mask,
                annot=True, 
                cmap='RdYlBu_r', 
                center=0,
                square=True, 
                fmt='.3f',
                cbar_kws={'label': 'Correlation Coefficient'})
    
    plt.title('Stock Returns Correlation Matrix', fontsize=16, fontweight='bold')
    plt.tight_layout()
    plt.show()
    
    print("📊 股票收益率的相关性热力图")
    print("🔍 相关性越高 = 价格走势越相似")

    # 打印相关性洞察
    print("\n📈 相关性洞察:")
    high_corr_pairs = []
    for i in range(len(correlation_matrix.columns)):
        for j in range(i+1, len(correlation_matrix.columns)):
            corr_value = correlation_matrix.iloc[i, j]
            if corr_value > 0.7:
                high_corr_pairs.append((correlation_matrix.columns[i], 
                                      correlation_matrix.columns[j], 
                                      corr_value))
    
    if high_corr_pairs:
        for stock1, stock2, corr in high_corr_pairs:
            print(f"  🔗 {stock1} & {stock2}: {corr:.3f} (高相关性)")
    else:
        print("  📊 未找到高度相关的配对 (>0.7)")


---

## 4.2 分布分析


---

In [None]:
if len(stocks) > 0:
    returns = close_prices.pct_change().dropna() * 100  # 转换为百分比
    
    fig, axes = plt.subplots(2, 2, figsize=(16, 12))
    
    # 图1：多重分布
    for symbol in returns.columns:
        sns.histplot(returns[symbol], kde=True, alpha=0.6, label=symbol, ax=axes[0, 0])
    axes[0, 0].set_title('Returns Distribution Comparison', fontweight='bold')
    axes[0, 0].set_xlabel('Daily Return (%)')
    axes[0, 0].legend()
    axes[0, 0].axvline(x=0, color='black', linestyle='--', alpha=0.7)
    
    # 图2：箱线图 - 五数概括可视化
    # 箱线图显示五数概括：最小值、第一四分位数（Q1）、
    # 中位数（Q2）、第三四分位数（Q3）和最大值
    # - 箱体跨越Q1到Q3（四分位距，IQR），包含50%的数据
    # - 箱体内部的线显示中位数（Q2）
    # - 须线延伸到箱体边缘外的1.5*IQR
    # - 须线之外的点是异常值（潜在的极端市场事件）
    # 金融意义：帮助识别收益率对称性、波动率聚集，
    # 以及可能需要风险管理关注的极端市场事件
    sns.boxplot(data=returns, ax=axes[0, 1])
    axes[0, 1].set_title('Returns Box Plots', fontweight='bold')
    axes[0, 1].set_ylabel('Daily Return (%)')
    axes[0, 1].tick_params(axis='x', rotation=45)

    # 图3：小提琴图 - 分布形状 + 箱线图组合
    # 小提琴图结合了箱线图和核密度估计（KDE）
    # - 宽度变化显示不同收益率水平的概率密度
    # - 较宽的部分 = 观察到这些收益值的较高概率
    # - 白点代表中位数
    # - 粗黑条显示四分位距（Q1到Q3）
    # - 细黑线延伸到数据极值（在1.5*IQR内）
    # 金融应用：揭示分布形状（正态、偏态、双峰）、
    # 尾部厚度（厚尾表明极端事件概率更高）、
    # 并帮助评估投资组合模型的收益率分布假设
    sns.violinplot(data=returns, ax=axes[1, 0])
    axes[1, 0].set_title('Returns Violin Plots', fontweight='bold')
    axes[1, 0].set_ylabel('Daily Return (%)')
    axes[1, 0].tick_params(axis='x', rotation=45)

    # 图4：Q-Q图（分位数-分位数图）- 正态性评估
    # Q-Q图将样本数据的分位数与理论正态分布进行比较
    # - 对角线参考线代表完美的正态分布
    # - 接近线的点表明数据遵循正态分布
    # - S形曲线表明偏态分布（左偏=凹，右偏=凸）
    # - 极端处的偏离点表明厚尾（极端事件概率更高）
    # 金融重要性：许多风险模型（VaR，投资组合优化）假设正态性。
    # 偏离正态性需要替代模型或风险调整。
    # 厚尾尤其关键，因为它们低估了极端损失概率。
    from scipy import stats
    symbol = returns.columns[0]  # Use first stock
    stats.probplot(returns[symbol], dist="norm", plot=axes[1, 1])
    axes[1, 1].set_title(f'{symbol} Q-Q Plot (Normality Check)', fontweight='bold')
    axes[1, 1].grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    print("📊 金融收益率的高级统计分布分析")
    print("📦 箱线图：五数概括揭示异常值和收益率对称性")
    print("   - 箱体边缘显示Q1（第25百分位数）和Q3（第75百分位数）")
    print("   - 中位数线将数据分成两半，须线延伸到合理的极值")
    print("   - 须线之外的异常值可能表明需要关注的极端市场事件")
    print("🎻 小提琴图：结合箱线图和概率密度可视化")
    print("   - 宽度变化揭示每个水平的收益率概率")
    print("   - 较厚的部分 = 观察到这些收益的较高可能性")
    print("   - 形状揭示分布特征（正态、偏态、多峰）")
    print("📐 Q-Q图：金融风险模型的基本正态性评估")
    print("   - 沿对角线的点 = 正态分布（许多模型假设这一点）")
    print("   - S曲线表明偏度，末端偏离显示厚尾")
    print("   - 厚尾很关键：正态模型低估了极端损失风险")
    print("💡 金融影响：非正态分布需要稳健的风险模型和压力测试")

---

## 4.3 配对图分析

---

In [None]:
if len(stocks) >= 3:  # 至少需要3只股票进行有意义的配对图
    returns = close_prices.pct_change().dropna() * 100
    
    # 创建配对图
    g = sns.pairplot(returns, 
                     diag_kind='kde',  # 对角线上的KDE图
                     plot_kws={'alpha': 0.6, 's': 20},  # 散点图样式
                     diag_kws={'shade': True})  # KDE样式
    
    g.fig.suptitle('Stock Returns Pair Plot Analysis', fontsize=16, fontweight='bold', y=1.02)
    
    # 在上三角添加相关系数
    def corrfunc(x, y, **kws):
        r = np.corrcoef(x, y)[0][1]
        ax = plt.gca()
        ax.annotate(f'ρ = {r:.3f}', xy=(0.1, 0.9), xycoords=ax.transAxes,
                   fontsize=12, fontweight='bold')
    
    g.map_upper(corrfunc)
    
    plt.show()
    
    print("📊 配对图分析显示所有股票对之间的关系")
    print("📈 对角线：每只股票收益率的分布")
    print("📉 非对角线：显示相关性的散点图")
    print("ρ：每对的相关系数")

---

# 5. 📈 使用MPLFinance的金融专用图表

## 5.1 K线图

---

In [None]:
try:
    import mplfinance as mpf
    mplfinance_available = True
    print("✅ mplfinance 导入成功")
except ImportError:
    mplfinance_available = False
    print("⚠️ mplfinance 不可用。使用以下命令安装: pip install mplfinance")

if mplfinance_available and 'AAPL' in stocks:
    # 为mplfinance准备数据（需要特定的列名）
    apple_data = stocks['AAPL'].copy()
    apple_data.columns = ['Open', 'High', 'Low', 'Close', 'Volume', 'Dividends', 'Stock Splits']
    
    # 使用近期数据以获得更好的可见性
    recent_data = apple_data.tail(60)
    
    # 基本K线图
    mpf.plot(recent_data,
             type='candle',
             style='yahoo',
             volume=True,
             title='AAPL Candlestick Chart (Last 60 Days)',
             ylabel='Price ($)',
             figsize=(14, 10))
    
    print("🕯️ K线图创建成功")
    print("📊 绿色蜡烛 = 价格上涨，红色蜡烛 = 价格下跌")
    print("📈 每个蜡烛显示当天的开盘价、最高价、最低价、收盘价")
else:
    print("⚠️ 跳过K线图 - mplfinance不可用或无数据")

---

## 5.2 带技术指标的高级K线图

---

In [None]:
if mplfinance_available and 'AAPL' in stocks:
    # 使用更多数据用于移动平均线
    chart_data = apple_data.tail(100)

    # 创建自定义样式
    custom_style = mpf.make_mpf_style(
        marketcolors=mpf.make_marketcolors(
            up='#00ff00',      # 上涨蜡烛为绿色
            down='#ff0000',    # 下跌蜡烛为红色
            edge='inherit',
            wick={'up': '#00ff00', 'down': '#ff0000'},
            volume='in'
        ),
        gridaxis='both',
        gridstyle='-',
        y_on_right=True
    )

    # 绘制带移动平均线的图
    mpf.plot(chart_data,
             type='candle',
             style=custom_style,
             volume=True,
             mav=(5, 10, 20),  # 移动平均线：5, 10, 20天
             title='AAPL Advanced Candlestick Chart with Moving Averages',
             ylabel='Price ($)',
             figsize=(16, 12),
             savefig='apple_candlestick.png')  # 保存图表
    
    print("🕯️ 带技术指标的高级K线图")
    print("📈 移动平均线：5日（最快）、10日、20日（最慢）")
    print("💾 图表已保存为 'apple_candlestick.png'")
else:
    print("⚠️ 跳过高级K线图")


---

## 5.3 自定义金融指标

---

In [None]:
if 'AAPL' in stocks:
    apple = stocks['AAPL'].copy()
    
    # 计算技术指标
    # 简单移动平均线
    apple['SMA_20'] = apple['Close'].rolling(window=20).mean()
    apple['SMA_50'] = apple['Close'].rolling(window=50).mean()
    
    # 布林带
    apple['BB_Middle'] = apple['Close'].rolling(window=20).mean()
    apple['BB_Std'] = apple['Close'].rolling(window=20).std()
    apple['BB_Upper'] = apple['BB_Middle'] + (apple['BB_Std'] * 2)
    apple['BB_Lower'] = apple['BB_Middle'] - (apple['BB_Std'] * 2)
    
    # RSI（相对强弱指数）
    def calculate_rsi(prices, period=14):
        delta = prices.diff()
        gain = (delta.where(delta > 0, 0)).rolling(window=period).mean()
        loss = (-delta.where(delta < 0, 0)).rolling(window=period).mean()
        rs = gain / loss
        rsi = 100 - (100 / (1 + rs))
        return rsi
    
    apple['RSI'] = calculate_rsi(apple['Close'])
    
    # 创建综合技术分析图
    fig, (ax1, ax2, ax3) = plt.subplots(3, 1, figsize=(16, 14), 
                                        gridspec_kw={'height_ratios': [3, 1, 1]})
    
    # 近期数据以获得更好的可见性
    recent = apple.tail(120)
    
    # 图1：带布林带和移动平均线的价格
    ax1.plot(recent.index, recent['Close'], label='Close Price', linewidth=2, color='blue')
    ax1.plot(recent.index, recent['SMA_20'], label='SMA 20', linewidth=2, color='orange')
    ax1.plot(recent.index, recent['SMA_50'], label='SMA 50', linewidth=2, color='green')
    
    # 布林带
    ax1.plot(recent.index, recent['BB_Upper'], label='BB Upper', linewidth=1, color='red', alpha=0.7)
    ax1.plot(recent.index, recent['BB_Lower'], label='BB Lower', linewidth=1, color='red', alpha=0.7)
    ax1.fill_between(recent.index, recent['BB_Upper'], recent['BB_Lower'], 
                     alpha=0.1, color='gray', label='BB Band')
    
    ax1.set_title('AAPL Technical Analysis Dashboard', fontsize=16, fontweight='bold')
    ax1.set_ylabel('Price ($)', fontsize=12)
    ax1.legend(loc='upper left')
    ax1.grid(True, alpha=0.3)
    
    # 图2：成交量
    volume_colors = ['green' if close >= open_ else 'red' 
                     for close, open_ in zip(recent['Close'], recent['Open'])]
    ax2.bar(recent.index, recent['Volume']/1e6, color=volume_colors, alpha=0.7)
    ax2.set_ylabel('Volume (Millions)', fontsize=12)
    ax2.grid(True, alpha=0.3)
    
    # 图3：RSI
    ax3.plot(recent.index, recent['RSI'], linewidth=2, color='purple')
    ax3.axhline(y=70, color='red', linestyle='--', alpha=0.7, label='Overbought (70)')
    ax3.axhline(y=30, color='green', linestyle='--', alpha=0.7, label='Oversold (30)')
    ax3.axhline(y=50, color='black', linestyle='-', alpha=0.5)
    ax3.set_ylabel('RSI', fontsize=12)
    ax3.set_xlabel('Date', fontsize=12)
    ax3.set_ylim(0, 100)
    ax3.legend()
    ax3.grid(True, alpha=0.3)
    
    # 格式化日期
    fig.autofmt_xdate()
    plt.tight_layout()
    plt.show()
    
    print("📊 综合技术分析仪表板")
    print("📈 布林带：价格波动率和潜在的支撑/阻力")
    print("📉 RSI：超买 (>70) 和超卖 (<30) 条件")
    print("📊 成交量：带颜色编码价格方向的交易活动")

---

# 6. 🎯 最佳实践和专业提示

## 6.1 配色方案和样式

---

In [None]:
if len(stocks) > 0:
    # 定义专业调色板
    financial_colors = {
        'profit': '#2E8B57',     # Sea Green
        'loss': '#DC143C',       # Crimson
        'neutral': '#4682B4',    # Steel Blue
        'volume': '#708090',     # Slate Gray
        'ma_short': '#FF8C00',   # Dark Orange
        'ma_long': '#32CD32',    # Lime Green
        'background': '#F5F5F5'  # White Smoke
    }

    fig, ax = plt.subplots(figsize=(14, 8))
    
    # 设置背景颜色
    fig.patch.set_facecolor(financial_colors['background'])
    ax.set_facecolor('white')
    
    # 使用专业样式绘制标准化价格
    normalized_prices = close_prices.div(close_prices.iloc[0]) * 100
    
    colors = ['#1f77b4', '#ff7f0e', '#2ca02c', '#d62728', '#9467bd']
    
    for i, symbol in enumerate(normalized_prices.columns):
        ax.plot(normalized_prices.index, normalized_prices[symbol],
                label=symbol, linewidth=2.5, color=colors[i % len(colors)])
    
    # 专业样式
    ax.set_title('Stock Performance Comparison\nProfessional Styling Example', 
                fontsize=16, fontweight='bold', pad=20)
    ax.set_xlabel('Date', fontsize=12, fontweight='bold')
    ax.set_ylabel('Normalized Price (Base = 100)', fontsize=12, fontweight='bold')
    
    # 自定义图例
    legend = ax.legend(loc='upper left', frameon=True, fancybox=True, 
                      shadow=True, framealpha=0.9)
    legend.get_frame().set_facecolor('white')
    
    # 网格样式
    ax.grid(True, linestyle='--', alpha=0.7, color='gray')
    ax.set_axisbelow(True)
    
    # 参考线
    ax.axhline(y=100, color='black', linestyle='-', alpha=0.8, linewidth=1)
    
    # 移除顶部和右侧脊柱
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    
    # 格式化日期
    fig.autofmt_xdate()
    
    plt.tight_layout()
    plt.show()
    
    print("🎨 演示的专业样式技术:")
    print("  📊 金融数据的自定义调色板")
    print("  🎭 干净的背景和网格样式")
    print("  📝 专业的图例和轴格式化")
    print("  ✨ 移除了不必要的图表元素（顶部/右侧脊柱）")


---

## 6.2 导出和保存格式

---

In [None]:
if 'AAPL' in stocks:
    apple = stocks['AAPL'].tail(60)
    
    # 创建用于导出的高质量图表
    fig, ax = plt.subplots(figsize=(12, 8))
    
    # 绘制数据
    ax.plot(apple.index, apple['Close'], linewidth=3, color='#1f77b4', label='AAPL Close')
    ax.plot(apple.index, apple['Close'].rolling(20).mean(), 
            linewidth=2, color='#ff7f0e', label='20-day MA')
    
    # 专业格式化
    ax.set_title('AAPL Stock Price - Export Quality Chart', 
                fontsize=16, fontweight='bold')
    ax.set_xlabel('Date', fontsize=14)
    ax.set_ylabel('Price ($)', fontsize=14)
    ax.legend(fontsize=12)
    ax.grid(True, alpha=0.3)
    
    # 移除顶部和右侧脊柱
    ax.spines['top'].set_visible(False)
    ax.spines['right'].set_visible(False)
    
    fig.autofmt_xdate()
    plt.tight_layout()
    
    # 以多种格式导出
    export_formats = {
        'PNG (High DPI)': {'format': 'png', 'dpi': 300, 'bbox_inches': 'tight'},
        'PDF (Vector)': {'format': 'pdf', 'dpi': 300, 'bbox_inches': 'tight'},
        'SVG (Web)': {'format': 'svg', 'bbox_inches': 'tight'}
    }
    
    print("💾 以多种格式导出图表:")
    
    for name, params in export_formats.items():
        filename = f"aapl_chart.{params['format']}"
        plt.savefig(filename, **params)
        print(f"  ✅ {name}: {filename}")
    
    plt.show()
    
    print("\n📄 导出格式指南:")
    print("  🖼️  PNG：最适合演示和网页（高质量，文件较大）")
    print("  📑 PDF：完美适合报告和打印（矢量格式，可缩放）")
    print("  🌐 SVG：Web应用程序和交互式图表（矢量，XML）")
    print("  📸 JPG：社交媒体和电子邮件（压缩，文件较小）")
    print("\n💡 专业提示：打印使用DPI 300+，网页使用150-200")

---

## 6.3 大型数据集的性能提示

---

In [None]:
# 性能优化技术
import time

if len(stocks) > 0:
    print("⚡ 金融数据可视化的性能优化技术:")
    print("\n1. 📊 大型数据集的数据采样")

    # 演示数据采样
    full_data = close_prices
    sampled_data = full_data.iloc[::5]  # 每第5个数据点
    
    print(f"   原始数据点: {len(full_data)}")
    print(f"   采样数据点: {len(sampled_data)} (减少5倍)")

    # 时间比较
    print("\n2. ⏱️ 绘图速度比较")
    
    # 绘制完整数据
    start_time = time.time()
    fig, ax = plt.subplots(figsize=(10, 6))
    ax.plot(full_data.index, full_data.iloc[:, 0])
    ax.set_title('Full Dataset Plotting')
    plt.close()  # 关闭以节省内存
    full_time = time.time() - start_time
    
    # 绘制采样数据
    start_time = time.time()
    fig, ax = plt.subplots(figsize=(10, 6))
    ax.plot(sampled_data.index, sampled_data.iloc[:, 0])
    ax.set_title('Sampled Dataset Plotting')
    plt.close()  # 关闭以节省内存
    sampled_time = time.time() - start_time
    
    print(f"   完整数据集: {full_time:.4f} 秒")
    print(f"   采样数据集: {sampled_time:.4f} 秒")
    print(f"   速度提升: {full_time/sampled_time:.1f}倍更快")

    print("\n3. 🎯 优化最佳实践:")
    print("   📉 对时间序列使用线图而不是散点图")
    print("   🎨 限制颜色数量和透明度效果")
    print("   📊 智能采样数据（保留关键点如峰值/谷值）")
    print("   💾 缓存计算指标以避免重新计算")
    print("   🖼️ 对具有许多数据点的图表使用栅格化输出")
    print("   📱 考虑对大型数据集使用交互式图表（plotly）")

    # 演示智能采样
    print("\n4. 🧠 智能采样示例:")

    def smart_sample(data, max_points=500):
        """采样数据同时保留重要特征"""
        if len(data) <= max_points:
            return data

        # 计算采样间隔
        interval = len(data) // max_points

        # 取每第n个点
        sampled_indices = list(range(0, len(data), interval))

        # 始终包含最后一个点
        if sampled_indices[-1] != len(data) - 1:
            sampled_indices.append(len(data) - 1)

        return data.iloc[sampled_indices]

    smart_sampled = smart_sample(full_data)
    print(f"   智能采样: {len(full_data)} → {len(smart_sampled)} 点")
    print(f"   保持起始点和结束点以确保准确性")
else:
    print("⚠️ 无可用数据进行性能演示")

---

# 7 总结和后续步骤

---

In [None]:
print("🎓 金融数据可视化精通完成！")
print("=" * 60)

print("\n📚 您学到的内容:")
skills = [
    "✅ Matplotlib基础和专业样式",
    "✅ 金融时间序列可视化技术",
    "✅ 高级子图布局和多轴图",
    "✅ 使用Seaborn进行统计可视化",
    "✅ 专业金融图表（K线，OHLC）",
    "✅ 技术指标可视化",
    "✅ 专业导出格式和优化",
    "✅ 大型数据集的性能提示",
    "✅ 金融图表设计的最佳实践"
]

for skill in skills:
    print(f"  {skill}")

print("\n🎯 关键要点:")
takeaways = {
    "📊 始终讲述故事": "您的图表应该清晰地传达洞察",
    "🎨 专业外观很重要": "干净、样式良好的图表建立可信度",
    "📈 上下文至关重要": "始终提供参考点和尺度",
    "🔍 交互性增强参与度": "考虑交互式图表进行探索",
    "⚡ 性能影响用户体验": "为您的受众和使用案例进行优化"
}

for principle, explanation in takeaways.items():
    print(f"  {principle}: {explanation}")

print("\n🚀 您旅程的下一步:")
next_steps = [
    "📊 练习不同的资产类别（债券、商品、加密货币）",
    "🤖 探索使用matplotlib自动生成报告",
    "🌐 使用Plotly Dash或Streamlit构建交互式仪表板",
    "📱 创建移动响应式金融可视化",
    "🎓 学习高级主题：3D图、动画、实时图表",
    "💼 将这些技能应用到您自己的金融分析项目中"
]

for step in next_steps:
    print(f"  {step}")

print("\n📖 附加资源:")
resources = {
    "Matplotlib图库": "https://matplotlib.org/stable/gallery/index.html",
    "Seaborn教程": "https://seaborn.pydata.org/tutorial.html",
    "MPLFinance示例": "https://github.com/DanielGoldfarb/mplfinance",
    "Plotly金融图表": "https://plotly.com/python/financial-charts/",
    "Python图库": "https://python-graph-gallery.com/"
}

for name, url in resources.items():
    print(f"  📚 {name}: {url}")

print("\n🌟 记住：伟大的可视化既是艺术也是科学。")
print("    持续练习，保持好奇，始终优先考虑清晰度！")
print("\n" + "=" * 60)
print("🎉 绘图愉快！ 📈📊🎨")