# Функции визуализации для финансовых данных

Библиотека готовых функций для построения графиков для работы с ML и финансовыми данными.


In [10]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from typing import Dict, List, Optional, Tuple

# Настройка стиля
try:
    plt.style.use('seaborn-v0_8-darkgrid')
except:
    try:
        plt.style.use('seaborn-darkgrid')
    except:
        try:
            plt.style.use('ggplot')
        except:
            pass

sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (14, 8)
plt.rcParams['font.size'] = 10

print("✅ Библиотеки загружены")


ModuleNotFoundError: No module named 'seaborn'

In [None]:
def plot_price(df: pd.DataFrame, ticker: str = "", price_col: str = 'close', 
                date_col: str = 'date', ax=None) -> None:
    """График цены закрытия"""
    if ax is None:
        fig, ax = plt.subplots(figsize=(14, 6))
    
    ax.plot(df[date_col], df[price_col], linewidth=1.5, color='blue', label=f'{ticker} Цена' if ticker else 'Цена')
    ax.set_title(f'Цена закрытия {ticker}' if ticker else 'Цена закрытия', fontsize=14, fontweight='bold')
    ax.set_ylabel('Цена (руб.)', fontsize=12)
    ax.legend()
    ax.grid(True, alpha=0.3)
    ax.tick_params(axis='x', rotation=45)
    plt.tight_layout()
    if ax is None:
        plt.show()


def plot_log_returns(df: pd.DataFrame, ticker: str = "", return_col: str = 'log_return',
                      date_col: str = 'date', ax=None) -> None:
    """График логарифмических доходностей"""
    if ax is None:
        fig, ax = plt.subplots(figsize=(14, 6))
    
    ax.plot(df[date_col], df[return_col], linewidth=0.8, color='green', alpha=0.7, label='Log Returns')
    ax.axhline(y=0, color='red', linestyle='--', linewidth=1, alpha=0.5)
    ax.set_title(f'Логарифмические доходности {ticker}' if ticker else 'Log Returns', fontsize=14, fontweight='bold')
    ax.set_ylabel('Log Return', fontsize=12)
    ax.legend()
    ax.grid(True, alpha=0.3)
    ax.tick_params(axis='x', rotation=45)
    plt.tight_layout()
    if ax is None:
        plt.show()


def plot_returns_distribution(df: pd.DataFrame, ticker: str = "", return_col: str = 'log_return',
                              bins: int = 50, ax=None) -> None:
    """Гистограмма распределения доходностей"""
    if ax is None:
        fig, ax = plt.subplots(figsize=(10, 6))
    
    returns = df[return_col].dropna()
    ax.hist(returns, bins=bins, color='purple', alpha=0.7, edgecolor='black', density=True)
    ax.axvline(x=returns.mean(), color='red', linestyle='--', linewidth=2, 
               label=f'Среднее: {returns.mean():.4f}')
    ax.axvline(x=returns.median(), color='orange', linestyle='--', linewidth=2,
               label=f'Медиана: {returns.median():.4f}')
    ax.set_title(f'Распределение доходностей {ticker}' if ticker else 'Распределение доходностей', 
                 fontsize=14, fontweight='bold')
    ax.set_xlabel('Log Return', fontsize=12)
    ax.set_ylabel('Плотность', fontsize=12)
    ax.legend()
    ax.grid(True, alpha=0.3)
    plt.tight_layout()
    if ax is None:
        plt.show()


def plot_price_and_returns(df: pd.DataFrame, ticker: str = "", price_col: str = 'close',
                           return_col: str = 'log_return', date_col: str = 'date') -> None:
    """Комбинированный график: цена и доходности"""
    fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True)
    
    plot_price(df, ticker, price_col, date_col, axes[0])
    plot_log_returns(df, ticker, return_col, date_col, axes[1])
    
    plt.tight_layout()
    plt.show()


def plot_cumulative_returns(df: pd.DataFrame, ticker: str = "", return_col: str = 'log_return',
                            date_col: str = 'date', ax=None) -> None:
    """График кумулятивных доходностей"""
    if ax is None:
        fig, ax = plt.subplots(figsize=(14, 6))
    
    cumulative = np.exp(df[return_col].fillna(0).cumsum())
    ax.plot(df[date_col], cumulative, linewidth=1.5, color='blue', label=f'{ticker} Кумулятивные' if ticker else 'Кумулятивные')
    ax.axhline(y=1, color='red', linestyle='--', linewidth=1, alpha=0.5, label='База (1.0)')
    ax.set_title(f'Кумулятивные доходности {ticker}' if ticker else 'Кумулятивные доходности', 
                 fontsize=14, fontweight='bold')
    ax.set_ylabel('Кумулятивная доходность', fontsize=12)
    ax.legend()
    ax.grid(True, alpha=0.3)
    ax.tick_params(axis='x', rotation=45)
    plt.tight_layout()
    if ax is None:
        plt.show()


def plot_volatility(df: pd.DataFrame, ticker: str = "", return_col: str = 'log_return',
                    date_col: str = 'date', window: int = 30, ax=None) -> None:
    """График волатильности (скользящее стандартное отклонение)"""
    if ax is None:
        fig, ax = plt.subplots(figsize=(14, 6))
    
    volatility = df[return_col].rolling(window=window).std() * np.sqrt(252)  # Годовая волатильность
    ax.plot(df[date_col], volatility, linewidth=1.5, color='red', alpha=0.7, label=f'{ticker} Волатильность' if ticker else 'Волатильность')
    ax.set_title(f'Волатильность {ticker} (окно {window} дней)' if ticker else f'Волатильность (окно {window} дней)', 
                 fontsize=14, fontweight='bold')
    ax.set_ylabel('Волатильность (годовая)', fontsize=12)
    ax.legend()
    ax.grid(True, alpha=0.3)
    ax.tick_params(axis='x', rotation=45)
    plt.tight_layout()
    if ax is None:
        plt.show()


def plot_qq_plot(df: pd.DataFrame, ticker: str = "", return_col: str = 'log_return', ax=None) -> None:
    """Q-Q plot для проверки нормальности распределения"""
    try:
        from scipy import stats
    except ImportError:
        print("⚠️ scipy не установлен. Установите: pip install scipy")
        return
    
    if ax is None:
        fig, ax = plt.subplots(figsize=(8, 8))
    
    returns = df[return_col].dropna()
    stats.probplot(returns, dist="norm", plot=ax)
    ax.set_title(f'Q-Q Plot {ticker}' if ticker else 'Q-Q Plot', fontsize=14, fontweight='bold')
    ax.grid(True, alpha=0.3)
    plt.tight_layout()
    if ax is None:
        plt.show()


def plot_boxplot_comparison(results: Dict[str, pd.DataFrame], return_col: str = 'log_return',
                            tickers: Optional[List[str]] = None) -> None:
    """Box plot для сравнения распределений доходностей нескольких тикеров"""
    fig, ax = plt.subplots(figsize=(12, 6))
    
    if tickers is None:
        tickers = list(results.keys())
    
    data_to_plot = [results[ticker][return_col].dropna() for ticker in tickers if ticker in results]
    
    bp = ax.boxplot(data_to_plot, labels=tickers[:len(data_to_plot)], patch_artist=True)
    
    # Раскраска
    colors = sns.color_palette("husl", len(bp['boxes']))
    for patch, color in zip(bp['boxes'], colors):
        patch.set_facecolor(color)
        patch.set_alpha(0.7)
    
    ax.set_title('Сравнение распределений доходностей', fontsize=14, fontweight='bold')
    ax.set_ylabel('Log Return', fontsize=12)
    ax.grid(True, alpha=0.3, axis='y')
    plt.tight_layout()
    plt.show()


def plot_returns_correlation(results: Dict[str, pd.DataFrame], return_col: str = 'log_return',
                             tickers: Optional[List[str]] = None) -> None:
    """Корреляционная матрица доходностей"""
    if tickers is None:
        tickers = list(results.keys())
    
    # Создаем DataFrame с доходностями для всех тикеров
    returns_df = pd.DataFrame()
    for ticker in tickers:
        if ticker in results:
            returns_df[ticker] = results[ticker][return_col]
    
    # Вычисляем корреляции
    corr_matrix = returns_df.corr()
    
    fig, ax = plt.subplots(figsize=(10, 8))
    sns.heatmap(corr_matrix, annot=True, fmt='.3f', cmap='coolwarm', center=0,
                square=True, linewidths=1, cbar_kws={"shrink": 0.8}, ax=ax)
    ax.set_title('Корреляция доходностей', fontsize=14, fontweight='bold')
    plt.tight_layout()
    plt.show()


def plot_multiple_returns(results: Dict[str, pd.DataFrame], return_col: str = 'log_return',
                          date_col: str = 'date', tickers: Optional[List[str]] = None) -> None:
    """График доходностей нескольких тикеров на одном графике"""
    if tickers is None:
        tickers = list(results.keys())
    
    fig, ax = plt.subplots(figsize=(14, 6))
    
    for ticker in tickers:
        if ticker in results:
            df = results[ticker]
            ax.plot(df[date_col], df[return_col], linewidth=0.8, alpha=0.7, label=ticker)
    
    ax.axhline(y=0, color='black', linestyle='--', linewidth=1, alpha=0.3)
    ax.set_title('Сравнение доходностей', fontsize=14, fontweight='bold')
    ax.set_ylabel('Log Return', fontsize=12)
    ax.legend()
    ax.grid(True, alpha=0.3)
    ax.tick_params(axis='x', rotation=45)
    plt.tight_layout()
    plt.show()


def plot_distribution_comparison(results: Dict[str, pd.DataFrame], return_col: str = 'log_return',
                                 tickers: Optional[List[str]] = None, bins: int = 50) -> None:
    """Сравнение распределений доходностей нескольких тикеров"""
    if tickers is None:
        tickers = list(results.keys())
    
    fig, ax = plt.subplots(figsize=(12, 6))
    
    for ticker in tickers:
        if ticker in results:
            returns = results[ticker][return_col].dropna()
            std = returns.std()
            ax.hist(returns, bins=bins, alpha=0.5, label=f'{ticker} (σ={std:.4f})', density=True)
    
    ax.set_title('Сравнение распределений доходностей', fontsize=14, fontweight='bold')
    ax.set_xlabel('Log Return', fontsize=12)
    ax.set_ylabel('Плотность вероятности', fontsize=12)
    ax.legend()
    ax.grid(True, alpha=0.3)
    plt.tight_layout()
    plt.show()


def plot_rolling_statistics(df: pd.DataFrame, ticker: str = "", return_col: str = 'log_return',
                            date_col: str = 'date', window: int = 30) -> None:
    """График скользящих статистик (среднее и стандартное отклонение)"""
    fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True)
    
    returns = df[return_col]
    rolling_mean = returns.rolling(window=window).mean()
    rolling_std = returns.rolling(window=window).std()
    
    axes[0].plot(df[date_col], returns, alpha=0.3, label='Log Returns', color='gray')
    axes[0].plot(df[date_col], rolling_mean, linewidth=2, label=f'Скользящее среднее ({window} дней)', color='blue')
    axes[0].set_title(f'Скользящее среднее {ticker}' if ticker else 'Скользящее среднее', 
                      fontsize=14, fontweight='bold')
    axes[0].set_ylabel('Log Return', fontsize=12)
    axes[0].legend()
    axes[0].grid(True, alpha=0.3)
    axes[0].axhline(y=0, color='red', linestyle='--', linewidth=1, alpha=0.5)
    
    axes[1].plot(df[date_col], rolling_std, linewidth=2, label=f'Скользящее ст.откл. ({window} дней)', color='red')
    axes[1].set_title(f'Скользящее стандартное отклонение {ticker}' if ticker else 'Скользящее стандартное отклонение',
                      fontsize=14, fontweight='bold')
    axes[1].set_ylabel('Стандартное отклонение', fontsize=12)
    axes[1].set_xlabel('Дата', fontsize=12)
    axes[1].legend()
    axes[1].grid(True, alpha=0.3)
    axes[1].tick_params(axis='x', rotation=45)
    
    plt.tight_layout()
    plt.show()


def plot_ohlc(df: pd.DataFrame, ticker: str = "", date_col: str = 'date', 
              ohlc_cols: Tuple[str, str, str, str] = ('open', 'high', 'low', 'close'),
              show_volume: bool = True) -> None:
    """График OHLC (свечной график упрощенный)"""
    fig, axes = plt.subplots(2, 1, figsize=(14, 10), sharex=True, 
                             gridspec_kw={'height_ratios': [3, 1]})
    
    dates = df[date_col]
    open_p, high, low, close = [df[col] for col in ohlc_cols]
    
    # Верхний график: цены
    axes[0].plot(dates, high, color='green', alpha=0.3, linewidth=0.5, label='High')
    axes[0].plot(dates, low, color='red', alpha=0.3, linewidth=0.5, label='Low')
    axes[0].plot(dates, open_p, color='blue', alpha=0.5, linewidth=1, label='Open')
    axes[0].plot(dates, close, color='blue', linewidth=2, label='Close')
    
    # Закрашиваем области
    axes[0].fill_between(dates, high, low, alpha=0.1, color='gray')
    
    axes[0].set_title(f'OHLC {ticker}' if ticker else 'OHLC', fontsize=14, fontweight='bold')
    axes[0].set_ylabel('Цена (руб.)', fontsize=12)
    axes[0].legend()
    axes[0].grid(True, alpha=0.3)
    
    # Нижний график: объем
    if show_volume and 'volume' in df.columns:
        axes[1].bar(dates, df['volume'], alpha=0.6, color='orange', label='Volume')
        axes[1].set_ylabel('Объем', fontsize=12)
        axes[1].legend()
        axes[1].grid(True, alpha=0.3)
    
    axes[1].set_xlabel('Дата', fontsize=12)
    axes[1].tick_params(axis='x', rotation=45)
    
    plt.tight_layout()
    plt.show()


print("✅ Функции визуализации загружены")


## Примеры использования

```python
# Импорт функций из этого блокнота
# %run plots.ipynb  # или скопируйте функции выше

# 1. График цены и доходностей для одного тикера
plot_price_and_returns(df, ticker='SBER')

# 2. Сравнение нескольких тикеров
plot_multiple_returns(results, tickers=['SBER', 'GAZP', 'LKOH'])

# 3. Корреляционная матрица
plot_returns_correlation(results)

# 4. Box plot для сравнения распределений
plot_boxplot_comparison(results)

# 5. Кумулятивные доходности
plot_cumulative_returns(df, ticker='SBER')

# 6. Волатильность
plot_volatility(df, ticker='SBER', window=30)
```
