In [8]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import seaborn as sns

# --- 1. Генерация синтетических финансовых данных ---

np.random.seed(42)  # Для воспроизводимости

# Период: 2 года ежедневных данных
start_date = datetime(2023, 1, 1)
end_date = datetime(2024, 12, 31)
dates = pd.date_range(start=start_date, end=end_date, freq='B')  # Только рабочие дни

n_days = len(dates)

# Генерируем цены акций с трендом и шумом
base_price = 100
trend = np.linspace(0, 20, n_days)  # Плавный рост
noise = np.random.normal(0, 2, n_days)  # Случайные колебания
prices = base_price + trend + noise

# Объём торгов: зависит от цены (чем выше цена — тем ниже объём )
volumes = (100000 / prices) * np.random.uniform(0.8, 1.2, n_days)
volumes = np.round(volumes).astype(int)

# Дивиденды: выплачиваются 4 раза в год, сумма зависит от текущей цены
dividend_dates = pd.date_range(start='2023-03-15', end='2024-12-15', freq='Q')
dividends = pd.Series(
    np.random.uniform(0.5, 2.0, len(dividend_dates)),
    index=dividend_dates
)

# Собираем DataFrame
df = pd.DataFrame({
    'date': dates,
    'price': np.round(prices, 2),
    'volume': volumes
})
df.set_index('date', inplace=True)


# Добавляем дивиденды (NaN для дней без выплат)
df['dividend'] = dividends

print("Исходные данные (первые 5 строк):")
print(df.head())

Исходные данные (первые 5 строк):
             price  volume  dividend
date                                
2023-01-02  100.99    1097       NaN
2023-01-03   99.76     877       NaN
2023-01-04  101.37     917       NaN
2023-01-05  103.16     940       NaN
2023-01-06   99.69    1006       NaN


  dividend_dates = pd.date_range(start='2023-03-15', end='2024-12-15', freq='Q')
