In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from datetime import datetime, timedelta
import seaborn as sns

# --- 1. Генерация синтетических финансовых данных ---

np.random.seed(42)  # Для воспроизводимости

# Период: 2 года ежедневных данных
start_date = datetime(2023, 1, 1)
end_date = datetime(2024, 12, 31)
dates = pd.date_range(start=start_date, end=end_date, freq='B')  # Только рабочие дни

n_days = len(dates)

# Генерируем цены акций с трендом и шумом
base_price = 100
trend = np.linspace(0, 20, n_days)  # Плавный рост
noise = np.random.normal(0, 2, n_days)  # Случайные колебания
prices = base_price + trend + noise

# Объём торгов: зависит от цены (чем выше цена — тем ниже объём)
volumes = (100000 / prices) * np.random.uniform(0.8, 1.2, n_days)
volumes = np.round(volumes).astype(int)

# Дивиденды: выплачиваются 4 раза в год, сумма зависит от текущей цены
dividend_dates = pd.date_range(start='2023-03-15', end='2024-12-15', freq='Q')
dividends = pd.Series(
    np.random.uniform(0.5, 2.0, len(dividend_dates)) * (prices[dates.isin(dividend_dates)] / 100),
    index=dividend_dates
)

# Собираем DataFrame
df = pd.DataFrame({
    'date': dates,
    'price': np.round(prices, 2),
    'volume': volumes
})
df.set_index('date', inplace=True)

# Добавляем дивиденды (NaN для дней без выплат)
df['dividend'] = dividends

print("Исходные данные (первые 5 строк):")
print(df.head())

  dividend_dates = pd.date_range(start='2023-03-15', end='2024-12-15', freq='Q')


ValueError: operands could not be broadcast together with shapes (7,) (3,) 

In [2]:
dates

DatetimeIndex(['2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05',
               '2023-01-06', '2023-01-09', '2023-01-10', '2023-01-11',
               '2023-01-12', '2023-01-13',
               ...
               '2024-12-18', '2024-12-19', '2024-12-20', '2024-12-23',
               '2024-12-24', '2024-12-25', '2024-12-26', '2024-12-27',
               '2024-12-30', '2024-12-31'],
              dtype='datetime64[ns]', length=522, freq='B')

In [4]:
dividend_dates

DatetimeIndex(['2023-03-31', '2023-06-30', '2023-09-30', '2023-12-31',
               '2024-03-31', '2024-06-30', '2024-09-30'],
              dtype='datetime64[ns]', freq='QE-DEC')

In [6]:
np.random.uniform(0.5, 2.0, len(dividend_dates))

array([1.12959098, 1.45778892, 1.0963916 , 0.9113228 , 1.97596647,
       1.11400101, 1.84114881])