#  Описание работы

## Задания
* Придумать, что делать с пропущенными отсчётами:
    1. [Теорема Котельникова](https://ru.wikipedia.org/wiki/%D0%A2%D0%B5%D0%BE%D1%80%D0%B5%D0%BC%D0%B0_%D0%9A%D0%BE%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D0%B8%D0%BA%D0%BE%D0%B2%D0%B0)
* Оптимизировать работу кода, задейстовав все возможные потоки процессора - [параллельное программирование](https://www.youtube.com/watch?v=fKl2JW_qrso&list=RDCMUCCezIgC97PvUuR4_gbFUs5g&start_radio=1&rv=fKl2JW_qrso&t=28)
* Проверить корректность работы ЕМ-алгоритма:
    * В окне довожу ЕМ до точности $\varepsilon$. Не сдвигая окно запускаю ЕМ ещё раз, но с новыми начальными приближениями. Так делаю 10 раз, сохраняя информацию о нач. прибл-ях. Добавляю 11-ым набором предпоследние, 10-ые, начальные приближения с последнего окна и выбираю тот набор, который максимизирует функцию правдоподобия. Результат - более точная (уверенная) максимизация функции правдоподобия (более точное разделение смесей).   
* Построить 3D горы для смесей.

1. Первая стадия 
    * Данные по одной координате разделить на смеси в окне, считая что имеется __6__ нормальных законов. Суммарно получается 18-ть дополнительных массивов: мат. ож-е, ср. кв. откл. и веса для каждого закона.
    * Визуализировать полученные массивы (придумать как). Можно через составляющие валатильности и тренд.
    * В каждом окне считается энтропия $H = -\sum_{i=1}^{6} p_i \cdot \log{p_i}$
    
2. Далее разбиваемся на группы: построение многомерного ЕМ и изучения всплесков, их вер-ти.

## Информация от физиков

### Письмо

Пересылаю запрошенный в конце прошедшей недели набор файлов за 2023 год, включающий:
именования столбцов регистрируемых параметров + трехмесячные файлы изображения временных разверток + листинги этих разверток. __Период опроса__ -- 1 минута. Предобработка по ограничению уровня и скорости вариации индукции магнитиного поля. В сумме -- около 2.000.000 выборок. Кажущиеся дефекты с октября 2023 года соответствуют процессу предфильтрации, через месяц они исчезнут. Формат содержит только актуальные данные, необходимые для реконструкции.

Для проверочных кодов будем использовать четыре __синтетических__ параметра: SYM_H, ASYM_H, SYM_D, ASYM_D.







## Замечания






* Один и тот же файл выдают за разный - `omni_min_def_20230401_20230630.lst` и `omni_min_def_20230101_20230331.lst`. Это данные за Январь-Март-2023 и Апрель-Июнь-2023. Судя по всему потеряна именно информация со второго периода, так как значения переменной 'Day'.
* В данных за октябрь полностью отсутсвуют синтетические параметры. Да и в принципе мало данных за этот месяц.
* EM-алгоритм выдает пропуски на графиках в связи с тем, что на каком-то номере итерации среднеквадрат-е откл-е $\sigma$ становится равным нулю. Что превращает веса с индексами соответсвующими $\sigma_k=0$ на следующей итерации в неопределённые значения `nan`

### Памятка


* Не забывай при существенном изменении кода создавать новые ветки и работать на них.
* https://numpy.org/devdocs/user/basics.types.html - number types.
* https://plotly.com/python/3d-charts/ - plotly 3D
* https://plotly.github.io/plotly.py-docs/generated/plotly.express.histogram.html - plotly histogram
* https://plotly.com/python/reference/layout/#layout-title - plotly fig layout
* https://coolors.co/092327-0b5351-00a9a5-4e8098-90c2e7 - генератор политры цвета.

# Загрузка данных

In [2]:
import pandas as pd
import numpy as np
import os

import histplot as hp # Персональный модуль визуализации
import essentials as es # Персональный модуль основных алгоритмов


# Позволяет использовать измененные модули без перезагрузки ядра
%load_ext autoreload
%autoreload 2

# Позволяет выводит графики в ячейках
%matplotlib inline

# Путь к папке с данными
PATH_DATA = os.getcwd() + '/Data/'

# Указание типов для упрощения считывания данных из *.csv файлов
TYPES = dtypes = {
    'Year': int, # str на самом деле, просто с int удобнее работать
    'Day': int, # str
    'Hour': int, # str
    'Minute': int, # str
    'BX': float,
    'BY': float,
    'BZ': float,
    'Vx_Velocity': float,
    'Vy_Velocity': float,
    'Vz_Velocity': float,
    'SYM/D': int,
    'SYM/H': int,
    'ASY/D': int,
    'ASY/H': int }

# os.listdir(PATH_DATA) # выводит содержимое папки, лежащей по пути 'PATH_DATA'

# Считываени данных
# df1 = pd.read_csv(PATH_DATA + "january_march.csv", dtype=TYPES)
# df2 = pd.read_csv(PATH_DATA + "april_jun.csv", dtype=TYPES)
# df3 = pd.read_csv(PATH_DATA + "july_september.csv", dtype=TYPES)
# df4 = pd.read_csv(PATH_DATA + "october.csv")
# df = pd.read_csv(PATH_DATA + "FULL_DATA.csv")

data_clean = pd.read_csv(PATH_DATA + "dropna_january_march.csv", dtype=TYPES)



The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [3]:
from converter import time_related_id
time_related_id(data_clean)

# Обработка периода Январь-Март

В связи упомянутым замечанием про отсутсвие данных с периода Февраль-Июнь и построенным графиком всех данных, анализ данных будет осуществляться на подвыборке Январь-Март

## Визуализация данных

### Временные ряды и их гистограммы

In [None]:
custom_title_drop = "Пропуски \"склеены\"."
custom_xaxis = data_clean['ydhm_id']
hp.show_genral_info(data_clean['BX'], add_title=custom_title_drop, add_xaxis=custom_xaxis)

In [None]:
data_clean

Комментарии:
1. Склеенные данные не выглядят сплошными из-за равномерности сетки по времени. На самом деле в "дырках" отсчетов нет

### 3D гистограммы временных рядов

In [None]:
clean_hist_3D = es.construct_hist3D(data_clean['BX'], window_size=4000, step=100)

hp.movable3D_hist(clean_hist_3D)

clean_BX_3D_0_3000_30 = es.construct_hist3D(data_clean['BX'][:3000], step=30)
clean_BY_3D_0_3000_30 = es.construct_hist3D(data_clean['BY'][:3000], step=30)
clean_BZ_3D_0_3000_30 = es.construct_hist3D(data_clean['BZ'][:3000], step=30)

hp.movable3D_hist(clean_BX_3D_0_3000_30)
hp.movable3D_hist(clean_BY_3D_0_3000_30)
hp.movable3D_hist(clean_BZ_3D_0_3000_30)

# ЕМ-алгоритм

* __Е-этап__
    1. Calculate unnormalized responsibilities: 
    $$
    \normalsize{ \quad \tilde\rho_k^{[i]} = \pi_k \cdot \frac{1}{\sigma_k \sqrt{2\pi}} \cdot \exp{\left(-\frac{(x^{[i]} - \mu_k)^2}{2\sigma^2}\right)} \equiv
    \pi_k \cdot \frac{1}{\sigma_k} \cdot \varphi \left(\frac{x^{[i]} - \mu_k}{2\sigma} \right) }
    $$
    2. Normilize responsibilities: 
    $$
    \normalsize{ \quad \rho_k^{[i]} = \frac{\tilde\rho_k^{[i]}}{\sum_{k=0}^{M-1} \tilde\rho_k^{[i]}} }
    $$
    3. Calculate class responsibilities: 
    $$
    \normalsize{ \quad \gamma_k = \sum_{i=0}^{N-1} \rho_k^{[i]} }
    $$
* __М-этап__
    1. Update the class probabilities: 
    $$
    \normalsize{ \quad \pi_k = \frac{\quad \gamma_k}{N} }
    $$
    2. Update the math. expectations: 
    $$
    \normalsize{ \quad \mu_k = \frac{1}{\gamma_k} \cdot \sum_{i=0}^{N-1} \rho_k^{[i]}x^{[i]} }
    $$
    3. Update the standard deviations:
    $$
    \normalsize{ \quad \sigma_k = \sqrt{\frac{1}{\gamma_k} \cdot \sum_{i=0}^{N-1} \rho_k^{[i]}\left(x^{[i]} - \mu_k \right)^2} }
    $$

## Реализация алгоритма

### Код для проверки корректности работы реализованного ЕМ-алгоритма

## Применение к склеиным данным.

In [None]:
random_seed = 42 # for reproducability
n_iterations = 42
n_classes = 6
clean_mix_dicts = []
for n_classes in range(1,11):
    class_probs, mus, sigmas = es.EM(data_clean['BX'].values,
                                     n_classes, 
                                     n_iterations,
                                     random_seed)
    param = {}
    param.update({"class_probs": class_probs,
                  "mus" : mus,
                  "sigmas" : sigmas})
    clean_mix_dicts.append(param)
    print(f"Вероятности классов: {class_probs}")
    print(f"Мат. ожидания: {mus}")
    print(f"Ср. кв. отклонение: {sigmas}\n")

In [12]:
import silence_tensorflow.auto
import numpy as np
import tensorflow as tf
import tensorflow_probability as tfp
from scipy.special import logsumexp
import matplotlib.pyplot as plt

from tqdm import tqdm # progress-meter

class_probs_true = [0.6, 0.4]
mus_true = [2.5, 4.8]
sigmas_true = [0.6, 0.3]

random_seed = 42 # for reproducability
n_samples = 10000

n_iterations_pre_sieving = 5#**(-4) #epsilon
n_candidates = 100
n_iterations_post_sieving = 100#**(-2)
n_chosen_ones = 5
n_classes = 2

# generate the data
univariate_gmm = tfp.distributions.MixtureSameFamily(
    mixture_distribution=tfp.distributions.Categorical(probs=class_probs_true),
    components_distribution=tfp.distributions.Normal(
        loc=mus_true,
        scale=sigmas_true,
    )
)

dataset = univariate_gmm.sample(n_samples, seed=random_seed).numpy()

# for i in range(10):
dataset = univariate_gmm.sample(n_samples, seed=random_seed).numpy()
class_probs, mus, sigmas, log_likelihood_histories = es.em_sieved(
    dataset,
    n_classes,
    n_iterations_pre_sieving,
    n_candidates,
    n_iterations_post_sieving,
    n_chosen_ones,
    random_seed,
) 

print(class_probs)
print(mus)
print(sigmas)
print("---")

100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 326.26it/s]


5 	 [0.49669923 0.50330077] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 313.17it/s]


5 	 [2.05483644e-09 9.99999998e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 326.11it/s]


5 	 [9.99863032e-01 1.36968389e-04] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 322.18it/s]


5 	 [9.99999552e-01 4.48198544e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 334.00it/s]


5 	 [5.51690534e-04 9.99448309e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 331.41it/s]


5 	 [0.80519394 0.19480606] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 334.85it/s]


5 	 [6.17157662e-07 9.99999383e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 337.18it/s]


5 	 [0.72634364 0.27365636] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 326.39it/s]


5 	 [5.31545969e-04 9.99468454e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 341.63it/s]


5 	 [0.01871001 0.98128999] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 316.40it/s]


5 	 [0.00119991 0.99880009] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 337.52it/s]


5 	 [0.98863264 0.01136736] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 326.89it/s]


5 	 [6.80938603e-09 9.99999993e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 329.06it/s]


5 	 [0.89614613 0.10385387] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 314.28it/s]


5 	 [9.99998168e-01 1.83202359e-06] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 317.61it/s]


5 	 [0.98906587 0.01093413] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 323.30it/s]


5 	 [9.99997957e-01 2.04320322e-06] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 328.21it/s]


5 	 [1.00000000e+00 7.65133469e-11] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 328.04it/s]


5 	 [0.00116877 0.99883123] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 326.37it/s]


5 	 [9.99988885e-01 1.11145485e-05] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 317.10it/s]


5 	 [0.98096862 0.01903138] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 330.93it/s]


5 	 [5.16015497e-06 9.99994840e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 329.27it/s]


5 	 [0.86435092 0.13564908] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 327.38it/s]


5 	 [9.99999997e-01 3.00839597e-09] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 338.13it/s]


5 	 [6.00971311e-04 9.99399029e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 336.45it/s]


5 	 [0.86970573 0.13029427] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 328.08it/s]


5 	 [1.00000000e+00 2.30071294e-10] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 338.86it/s]


5 	 [0.00120753 0.99879247] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 332.19it/s]


5 	 [0.31819612 0.68180388] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 329.12it/s]


5 	 [9.99998688e-01 1.31151997e-06] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 333.20it/s]


5 	 [0.71463591 0.28536409] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 327.86it/s]


5 	 [0.36755524 0.63244476] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 326.40it/s]


5 	 [0.91314045 0.08685955] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 339.41it/s]


5 	 [0.83961412 0.16038588] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 330.08it/s]


5 	 [0.90444936 0.09555064] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 335.35it/s]


5 	 [9.99934775e-01 6.52253282e-05] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 323.84it/s]


5 	 [0.34941299 0.65058701] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 318.76it/s]


5 	 [9.99999592e-01 4.07828125e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 331.94it/s]


5 	 [6.76195818e-04 9.99323804e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 335.44it/s]


5 	 [0.97514014 0.02485986] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 333.99it/s]


5 	 [0.03733928 0.96266072] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 330.81it/s]


5 	 [0.25535915 0.74464085] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 334.27it/s]


5 	 [2.10051025e-06 9.99997899e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 327.41it/s]


5 	 [0.00200065 0.99799935] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 318.15it/s]


5 	 [8.44576911e-09 9.99999992e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 334.00it/s]


5 	 [9.99485108e-01 5.14892348e-04] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 328.33it/s]


5 	 [0.1406766 0.8593234] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 323.47it/s]


5 	 [9.99999998e-01 1.83105263e-09] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 336.75it/s]


5 	 [0.641445 0.358555] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 323.48it/s]


5 	 [9.99998690e-01 1.30960794e-06] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 331.38it/s]


5 	 [3.27078601e-04 9.99672921e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 322.37it/s]


5 	 [0.00220158 0.99779842] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 322.09it/s]


5 	 [0.96034367 0.03965633] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 325.48it/s]


5 	 [0.67804884 0.32195116] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 329.79it/s]


5 	 [0.40805079 0.59194921] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 318.02it/s]


5 	 [0.9771544 0.0228456] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 322.04it/s]


5 	 [0.0307657 0.9692343] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 318.73it/s]


5 	 [9.99999831e-01 1.69344974e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 329.71it/s]


5 	 [0.0027783 0.9972217] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 321.65it/s]


5 	 [4.26516876e-07 9.99999573e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 327.64it/s]


5 	 [0.00121312 0.99878688] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 322.19it/s]


5 	 [1.90647300e-06 9.99998094e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 330.04it/s]


5 	 [9.99557554e-01 4.42446373e-04] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 279.74it/s]


5 	 [9.99999882e-01 1.17727808e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 327.62it/s]


5 	 [9.64884517e-04 9.99035115e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 330.85it/s]


5 	 [0.9973989 0.0026011] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 322.59it/s]


5 	 [9.99999995e-01 4.56574040e-09] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 339.18it/s]


5 	 [9.99995266e-01 4.73364057e-06] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 338.38it/s]


5 	 [2.24961394e-04 9.99775039e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 337.23it/s]


5 	 [0.15381064 0.84618936] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 327.60it/s]


5 	 [9.99997971e-01 2.02870907e-06] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 337.62it/s]


5 	 [0.99475478 0.00524522] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 316.47it/s]


5 	 [0.8472034 0.1527966] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 299.53it/s]


5 	 [0.01464703 0.98535297] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 276.71it/s]


5 	 [nan nan] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 340.10it/s]


5 	 [1.95332711e-06 9.99998047e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 338.81it/s]


5 	 [3.05831870e-05 9.99969417e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 344.60it/s]


5 	 [0.0126278 0.9873722] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 339.67it/s]


5 	 [0.81368476 0.18631524] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 333.48it/s]


5 	 [9.99999873e-01 1.27083731e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 342.04it/s]


5 	 [3.03413159e-07 9.99999697e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 337.25it/s]


5 	 [0.00401146 0.99598854] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 339.11it/s]


5 	 [0.48473664 0.51526336] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 326.08it/s]


5 	 [9.99999898e-01 1.02039580e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 282.36it/s]


5 	 [nan nan] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 344.77it/s]


5 	 [1.52727903e-04 9.99847272e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 313.41it/s]


5 	 [nan nan] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 336.14it/s]


5 	 [9.99999985e-01 1.52264379e-08] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 270.43it/s]


5 	 [9.99999795e-01 2.04528339e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 324.50it/s]


5 	 [0.08690162 0.91309838] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 309.99it/s]


5 	 [0.8866531 0.1133469] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 264.92it/s]


5 	 [nan nan] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 302.78it/s]


5 	 [0.25727441 0.74272559] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 328.00it/s]


5 	 [9.68380126e-04 9.99031620e-01] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 321.61it/s]


5 	 [9.99999838e-01 1.62124104e-07] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 325.96it/s]


5 	 [0.90649259 0.09350741] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 315.85it/s]


5 	 [0.07908596 0.92091404] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 329.65it/s]


5 	 [0.26011451 0.73988549] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 285.07it/s]


5 	 [nan nan] 




100%|████████████████████████████████████████████| 5/5 [00:00<00:00, 324.87it/s]


5 	 [1.80035038e-05 9.99981996e-01] 




100%|████████████████████████████████████████| 100/100 [00:00<00:00, 337.83it/s]


100 	 [0.40511554 0.59488446] 




100%|████████████████████████████████████████| 100/100 [00:00<00:00, 342.19it/s]


100 	 [0.40511554 0.59488446] 




100%|████████████████████████████████████████| 100/100 [00:00<00:00, 343.21it/s]


100 	 [0.59488446 0.40511554] 




100%|████████████████████████████████████████| 100/100 [00:00<00:00, 343.10it/s]


100 	 [0.59488446 0.40511554] 




100%|████████████████████████████████████████| 100/100 [00:00<00:00, 341.96it/s]

100 	 [0.59488446 0.40511554] 


[0.40511554 0.59488446]
[4.8054906  2.51388581]
[0.29521281 0.59199797]
---





In [None]:
for x, y in zip([0.57106892, 0.42893108] ,[0.57106891, 0.42893109]):
    print(round(x-y, 9))

In [None]:
import matplotlib.pyplot as plt

plt.figure()
for log_likelihood_history in log_likelihood_histories:
    plt.plot(log_likelihood_history)
plt.xlabel("Iteration")
plt.ylabel("Log Likelihood")
plt.show()

In [11]:
random_seed = 142 # for reproducability

n_iterations_pre_sieving = 10 # Пороговое значение разности приближений на соседних итерациях. Крит-рий останова
n_candidates = 100
n_iterations_post_sieving = 200 # Кол-во итераций ЕМ для конкретного набора
n_chosen_ones = 3
n_classes = 3 # Кол-во выделяемых параметров смеси

class_probs, mus, sigmas, log_likelihood_histories = es.em_sieved(
    data_clean['BX'].values,
    n_classes,
    n_iterations_pre_sieving,
    n_candidates,
    n_iterations_post_sieving,
    n_chosen_ones,
    random_seed,
) 

print(class_probs)
print(mus)
print(sigmas)



100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.30it/s]


10 	 [0.02952343 0.00356142 0.00637382 0.45266703 0.50524834 0.00262596] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 46.36it/s]


10 	 [1.95635332e-05 1.99770591e-05 2.71072036e-04 1.69962429e-05
 9.99502088e-01 1.70302946e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 49.14it/s]


10 	 [3.87060565e-03 6.33500858e-01 1.39950896e-01 2.51787386e-04
 2.22181919e-01 2.43933328e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.57it/s]


10 	 [3.47990513e-03 2.87594589e-05 1.93713592e-02 4.30906537e-03
 9.30438918e-01 4.23719925e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.08it/s]


10 	 [3.78011248e-03 4.92105535e-06 9.29733425e-01 2.94523880e-02
 3.67570285e-02 2.72125406e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.81it/s]


10 	 [2.64352603e-05 2.09560887e-04 2.43523451e-04 2.90929912e-02
 8.09907257e-02 8.89436763e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.86it/s]


10 	 [0.00085114 0.01620457 0.69098463 0.14041682 0.12971257 0.02183027] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 48.95it/s]


10 	 [9.86584797e-04 2.13659864e-02 1.30756876e-02 2.40451086e-05
 1.02469136e-02 9.54300782e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.87it/s]


10 	 [0.32043979 0.52435514 0.00058688 0.10905129 0.00296753 0.04259938] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.44it/s]


10 	 [8.70820879e-01 3.74342145e-02 1.17024576e-04 3.50525720e-02
 1.04675583e-03 5.55285544e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 49.63it/s]


10 	 [6.65092338e-05 1.98110572e-03 9.29534945e-01 9.19366063e-05
 6.78075264e-02 5.17976990e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 53.66it/s]


10 	 [4.95920533e-04 8.11923168e-03 2.35312744e-02 6.42429077e-04
 7.96529356e-01 1.70681788e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.33it/s]


10 	 [0.03203671 0.00602743 0.69723151 0.09733393 0.00074452 0.16662591] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.31it/s]


10 	 [3.64955907e-04 5.03121293e-02 7.76719068e-05 9.46673108e-01
 2.22994790e-04 2.34914041e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.52it/s]


10 	 [6.73521764e-01 3.20008390e-01 1.56074396e-05 2.72067772e-03
 9.86640163e-05 3.63489696e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.94it/s]


10 	 [1.01824428e-03 5.89731254e-02 6.63622054e-05 4.02467378e-05
 9.38492865e-01 1.40915637e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.08it/s]


10 	 [3.08586121e-02 1.08351776e-02 1.81378252e-05 3.21054615e-03
 7.53906303e-05 9.55002136e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.82it/s]


10 	 [4.18519036e-04 1.27262030e-01 2.45788534e-02 1.94916464e-01
 6.21026086e-01 3.17980478e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.44it/s]


10 	 [7.19924398e-04 6.93541831e-05 7.54248660e-05 1.06884285e-01
 6.38066714e-01 2.54184298e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.08it/s]


10 	 [0.45026665 0.50331202 0.03332303 0.00354687 0.00598582 0.00356562] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.97it/s]


10 	 [1.13596014e-01 1.42491617e-03 4.34263215e-04 1.50661126e-01
 1.31098899e-03 7.32572691e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.93it/s]


10 	 [9.54169451e-01 4.07969703e-02 8.15360407e-05 1.25722318e-03
 3.66025103e-03 3.45680418e-05] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 53.43it/s]


10 	 [6.48645165e-05 6.43615200e-01 6.84311225e-02 3.11517418e-04
 2.86139704e-01 1.43759206e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 53.71it/s]


10 	 [4.81404854e-05 1.32125316e-04 7.86084052e-01 1.33546752e-03
 2.11143829e-01 1.25638602e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.25it/s]


10 	 [0.00097492 0.18067254 0.44557418 0.36183773 0.00787692 0.0030637 ] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.61it/s]


10 	 [0.01421536 0.22328846 0.3202999  0.01609998 0.04990232 0.37619398] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.95it/s]


10 	 [0.00719543 0.00412932 0.171591   0.32616795 0.14856392 0.34235238] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 49.49it/s]


10 	 [1.76088823e-04 8.64630372e-05 7.86893592e-05 1.26051315e-04
 3.34435129e-05 9.99499264e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.36it/s]


10 	 [2.20695724e-02 1.16456031e-05 9.50724872e-01 9.80249800e-03
 1.70100822e-02 3.81329355e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.94it/s]


10 	 [6.25329169e-03 3.79527853e-01 5.93764809e-02 5.54154279e-01
 2.72348055e-04 4.15747620e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.05it/s]


10 	 [1.71416408e-04 1.57600194e-03 1.02337979e-04 1.08863126e-01
 2.33915729e-01 6.55371388e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.10it/s]


10 	 [9.89318801e-03 8.73162033e-01 6.61416987e-05 1.06633085e-01
 9.88046145e-03 3.65091642e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.39it/s]


10 	 [3.52085205e-01 1.96171107e-01 4.48558834e-01 7.54534665e-05
 1.88596510e-03 1.22343530e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.97it/s]


10 	 [6.85144191e-02 1.23093388e-04 9.28807206e-01 1.46338697e-04
 1.68383582e-03 7.25106716e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.39it/s]


10 	 [2.52231967e-04 1.28774700e-02 1.79425678e-04 3.94191078e-05
 3.58637646e-03 9.83065077e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.87it/s]


10 	 [3.74996205e-02 1.27409589e-03 1.08679747e-01 6.87679426e-04
 7.94868547e-01 5.69903097e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.17it/s]


10 	 [7.80481947e-03 4.67840578e-01 5.23393993e-01 2.33467475e-04
 6.49745010e-04 7.73968002e-05] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.05it/s]


10 	 [0.13917261 0.06611627 0.61534396 0.10251858 0.01552051 0.06132808] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 53.67it/s]


10 	 [9.03068811e-04 7.37111039e-05 6.49981651e-02 4.44172400e-03
 3.33458461e-03 9.26248746e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.22it/s]


10 	 [2.38629611e-03 2.07371248e-04 2.95144232e-01 3.62759357e-02
 2.76007145e-03 6.63226093e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.56it/s]


10 	 [8.89904466e-01 5.41518511e-04 8.19243159e-04 8.47129832e-02
 2.39068146e-02 1.14974891e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.68it/s]


10 	 [3.11323086e-04 2.31836277e-01 4.20171807e-03 7.49849825e-01
 2.14189511e-04 1.35866677e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 57.19it/s]


10 	 [9.81287621e-03 5.11547375e-02 9.24938307e-01 2.52320858e-04
 1.36515826e-02 1.90176214e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.91it/s]


10 	 [4.23572770e-02 7.41302398e-01 3.84173867e-02 1.77605071e-01
 3.04629021e-04 1.32385001e-05] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.92it/s]


10 	 [1.41986995e-05 5.76842747e-04 5.93694194e-02 4.02092778e-01
 5.01062668e-01 3.68840930e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.44it/s]


10 	 [7.02909244e-05 1.05163382e-04 1.02693739e-03 3.82092161e-02
 3.08261912e-03 9.57505773e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.28it/s]


10 	 [5.78420475e-04 2.91246135e-03 8.72401989e-05 6.57065496e-01
 1.84951035e-01 1.54405347e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.63it/s]


10 	 [3.00049605e-05 2.74807392e-05 2.70571878e-03 9.75829700e-01
 1.65899314e-03 1.97481028e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.35it/s]


10 	 [0.0258045  0.76790741 0.04557002 0.14593638 0.01389612 0.00088557] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.33it/s]


10 	 [4.55530032e-04 2.12984042e-01 5.00806687e-01 7.10538821e-04
 1.27753659e-04 2.84915448e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 53.86it/s]


10 	 [6.09374180e-03 7.00584670e-05 9.86839736e-01 5.06963370e-05
 4.40795349e-05 6.90168797e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.59it/s]


10 	 [4.18217895e-02 1.90105555e-03 8.58680282e-04 3.92334341e-04
 1.65452838e-01 7.89573302e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 48.07it/s]


10 	 [4.87013979e-04 4.88884817e-02 1.88517487e-02 6.83333965e-02
 8.63360884e-01 7.84749191e-05] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.24it/s]


10 	 [1.00526547e-02 9.77648235e-01 2.99500802e-05 1.10094686e-04
 2.68310220e-04 1.18907556e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.95it/s]


10 	 [2.40398067e-01 3.80133354e-03 6.32847098e-01 1.21987917e-01
 6.92043515e-04 2.73541415e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 53.36it/s]


10 	 [0.1900884  0.19861861 0.00209966 0.05144059 0.00783794 0.54991482] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.81it/s]


10 	 [8.22129741e-01 1.39060281e-01 1.11428096e-03 5.08742886e-03
 3.24746305e-02 1.33637624e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.75it/s]


10 	 [6.60175461e-02 7.80165790e-03 8.46818055e-01 6.86949144e-05
 7.92015719e-02 9.24737380e-05] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.34it/s]


10 	 [0.01313032 0.09335641 0.01255862 0.08318902 0.38943012 0.40833551] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.42it/s]


10 	 [1.53142706e-04 1.47000045e-04 1.37239563e-05 1.30486283e-03
 9.98234550e-01 1.46720047e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.36it/s]


10 	 [1.31066564e-02 6.40457358e-05 2.10985572e-01 2.95733755e-03
 7.62964102e-01 9.92228668e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.08it/s]


10 	 [0.04750393 0.55014952 0.00138738 0.17572099 0.08380902 0.14142916] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.09it/s]


10 	 [2.33312764e-02 8.33570024e-01 1.32696151e-04 1.41739855e-01
 1.03346774e-03 1.92680787e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.83it/s]


10 	 [1.43685191e-04 1.36768338e-01 7.72464705e-01 2.84548449e-04
 1.61609068e-03 8.87226322e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.22it/s]


10 	 [1.03444892e-04 1.22701235e-02 2.88175537e-05 1.52304841e-04
 9.82754217e-01 4.69109235e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.47it/s]


10 	 [4.11954027e-03 3.23179322e-05 9.42594108e-02 1.01785700e-06
 8.47526255e-05 9.01502960e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.12it/s]


10 	 [1.22655858e-04 1.14635092e-04 4.02508580e-05 7.59230374e-02
 9.23078774e-01 7.20646392e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.59it/s]


10 	 [1.71417927e-04 6.19190628e-06 4.26003368e-01 5.95993731e-04
 4.76963924e-05 5.73175332e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.61it/s]


10 	 [0.0335159  0.41992367 0.00222045 0.21297845 0.00051833 0.33084319] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 55.91it/s]


10 	 [0.61209042 0.15086898 0.03940587 0.00454401 0.19089242 0.0021983 ] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.06it/s]


10 	 [5.08378028e-06 1.21087983e-02 2.26794622e-04 9.87576358e-01
 7.88972221e-05 4.06822567e-06] 




  responsibilities /= np.linalg.norm(responsibilities, axis=1, ord=1, keepdims=True)
100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 44.35it/s]


10 	 [nan nan nan nan nan nan] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.65it/s]


10 	 [5.15142453e-04 6.50153735e-06 4.04691674e-02 9.55849038e-01
 1.36940006e-04 3.02321104e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.05it/s]


10 	 [7.65302392e-01 2.36637860e-02 4.76979466e-04 6.86952081e-02
 1.41530189e-01 3.31444828e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 53.25it/s]


10 	 [1.99646234e-03 2.64410101e-01 1.13580493e-04 3.40743727e-03
 4.55295505e-03 7.25519464e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.56it/s]


10 	 [0.06132764 0.32516088 0.00106392 0.00761016 0.00310462 0.60173277] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 49.17it/s]


10 	 [2.67144736e-02 4.24117640e-04 4.00329259e-05 1.84421783e-04
 9.03255344e-01 6.93816096e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.36it/s]


10 	 [0.00638326 0.21442164 0.00176242 0.08814629 0.21675337 0.47253303] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.97it/s]


10 	 [1.62066442e-04 8.59945884e-01 3.03567549e-02 4.51741743e-04
 1.08863303e-01 2.20250088e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.84it/s]


10 	 [1.89279028e-01 6.47030912e-01 1.32713540e-01 8.26640354e-05
 2.89307357e-02 1.96311948e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.19it/s]


10 	 [0.05391353 0.00494378 0.46489943 0.01559014 0.45829742 0.0023557 ] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.77it/s]


10 	 [2.40842188e-02 1.58308392e-01 4.66739049e-01 3.49591811e-01
 1.98245919e-04 1.07828347e-03] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.19it/s]


10 	 [9.52877686e-01 3.76879554e-04 4.59344767e-02 4.10663416e-04
 3.28760087e-04 7.15341698e-05] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.80it/s]


10 	 [1.69264188e-02 1.48659108e-02 6.88140820e-05 6.28884657e-01
 8.07970655e-04 3.38446228e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.52it/s]


10 	 [4.64959268e-02 6.21449117e-05 1.64284210e-03 1.90067124e-04
 3.64584370e-03 9.47963175e-01] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 52.09it/s]


10 	 [0.03610789 0.15231174 0.00123345 0.35067476 0.45545977 0.00421239] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 48.66it/s]


10 	 [4.02596752e-02 6.24190435e-05 2.29717286e-04 9.59314714e-01
 5.31698066e-05 8.03049676e-05] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.10it/s]


10 	 [1.15044861e-03 8.93067107e-02 4.13413421e-04 8.65519354e-01
 2.24203013e-02 2.11897720e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 51.57it/s]


10 	 [2.89139944e-05 1.14434383e-04 2.75736910e-02 8.47528481e-01
 2.78422060e-02 9.69122735e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 50.50it/s]


10 	 [6.62776687e-05 9.77921081e-01 2.83310130e-05 8.06129004e-05
 1.35946171e-04 2.17677514e-02] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 54.57it/s]


10 	 [7.76763199e-01 1.51895440e-03 9.80176761e-05 1.33100018e-01
 8.84138762e-02 1.05935145e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 56.34it/s]


10 	 [9.57115478e-05 2.35934658e-02 2.93475477e-03 9.72661789e-01
 3.31948520e-04 3.82330268e-04] 




100%|███████████████████████████████████████████| 10/10 [00:00<00:00, 57.19it/s]


10 	 [8.25679990e-01 9.32799135e-03 3.10412180e-02 3.17138464e-02
 1.02048546e-01 1.88408934e-04] 




 90%|███████████████████████████████████████▌    | 9/10 [00:00<00:00, 49.10it/s]


KeyboardInterrupt: 

In [None]:
hp.static2D_mixture(clean_mix_dicts, data_clean['BX'], mode='subplots')

hp.static2D_mixture(clean_mix_dicts, data_clean['BX'])

In [None]:
import matplotlib.pyplot as plt
llhs = [es.log_likelihood(mixture3, series.values),
        es.log_likelihood(mixture6, series.values)]
colors = ['r','b']
for l, color in zip(llhs,colors):
    plt.plot(l,color=color)
plt.title(f"Точности: (1) для отбора - {conv_initial}\n(2) для лучших наборов - {conv_prime}")

In [None]:
series = data_clean['BX'][:4000]
conv_prime=0.00001000
conv_initial=0.000100
window = 3000

mixture3 = es.mixture_extraction(series,
                            n_class=3,
                            conv_prime=conv_prime,
                            conv_initial=conv_initial,
                            rseed=45,
                            step=50,
                            window_size=window,
                            xaxis_id=data_clean['ydhm_id'],
                            EM_prog_bar=False)

# mixture6 = es.mixture_extraction(series,
#                             n_class=6,
#                             conv_prime=conv_prime,
#                             conv_initial=conv_initial,
#                             rseed=46,
#                             step=50,
#                             window_size=window,
#                             xaxis_id=data_clean['ydhm_id'],
#                             EM_prog_bar=False)

In [None]:
mixture3["LL_hist"].plot()

In [None]:
mixture3["LL_hist"].plot()

In [None]:
mixture = es.mixture_extraction(data_clean['BX'],
                            n_class=3,
                            conv_prime=conv_prime*100,
                            conv_initial=conv_initial*10,
                            rseed=24012000,
                            step=10,
                            window_size=4000,
                            xaxis_id=data_clean['ydhm_id'],
                            EM_prog_bar=False)

In [None]:
hp.construct_mixture_2Dplot(mixture)#.write_html(f"/home/oplora/Desktop/mix3.html")

In [None]:
WS = 4500
EPS = 0.1
STEP = 10
SEED = 42

In [None]:
param_df.loc[:,'lpl']

In [None]:
BX_mixtures3 = es.mixture_extraction(data_clean['BX'], n_class=3, conv_initial=EPS, rseed=SEED,
                            step=STEP, window_size=WS, xaxis_id=data_clean['ydhm_id'], EM_prog_bar=True)
plot3 = hp.construct_mixture_2Dplot(BX_mixtures3)
plot3

In [None]:
BX_mixtures6 = es.mixture_param(data_clean['BX'], n_class=6, eps=EPS,
                            step=STEP, window_size=WS, xaxis_id=data_clean['ydhm_id'])
plot6 = hp.construct_mixture_2Dplot(BX_mixtures6)
plot6

In [None]:
name = '_seed'+f'{SEED}_eps{EPS}_w{WS}_st{STEP}'
BX_mixtures3.to_csv(PATH_DATA+f'bestBX_3c{name}.csv', index=False)
plot3.write_html(f"/home/oplora/Desktop/3c{name}.html")
#plot3.write_html(f"/home/oplora/Documents/VMK/Dissertation/Magfield/Images/mixtures/3 comp/3c{name}.html")

In [None]:
name = '_seed'+'27121954'
BX_mixtures6.to_csv(PATH_DATA+f'BX_6c{name}.csv', index=False)
plot6.write_html(f"/home/oplora/Documents/VMK/Dissertation/Magfield/Images/mixtures/6 comp/6c{name}.html")

# Черновики

In [None]:
len(class_prob_values)

In [None]:
np.array(indexes[0])
#st_dev_values[:,i][0]

In [None]:
st_dev_values[:,i]

In [None]:
BX_mixtures6.columns

In [None]:
import pandas as pd
import plotly.graph_objects as go
import plotly.express as px
# plotly.offline.init_notebook_mode()

# Предположим, у нас есть DataFrame df с данными
# Ваш DataFrame с мульти-индексными колонками
df = BX_mixtures6

# Подготовка данных для графика
# Получение значений math_exp, st_dev, индексов и времени из DataFrame
math_exp_values = df['math_exp'].values
st_dev_values = df['st_dev'].values
indexes = df.index
indexes = df.attrs.get('custom_xaxis')
class_prob_values = df['cl_prob'].values

# Создаем график
fig = go.Figure()


# Добавляем линии для каждого набора значений low1, low2, low3
for i in range(6):
    fig.add_trace(go.Scatter3d(
        x=indexes, 
        y=st_dev_values[:,i], 
        z=math_exp_values[:,i],
        mode='lines',
        line=dict(color=class_prob_values[:,i],
                  colorscale=[(0, "#86001A"), (1, '#00FF00')],
                  colorbar=dict(title='Вес',len=0.75),
                  cmin=0, cmax=1
                 ),
        name=f'закон{i+1}',
        # Добавляем информацию о значении цвета
        text=[f'вес: {round(c, 5)}' for c in class_prob_values[:,i]],
        hoverlabel_font_color='blue') # текст слева при наведении курсора
                 )
    
    fig.add_trace(go.Scatter3d(
        x=np.array(indexes[0]), 
        y=st_dev_values[:1,i], 
        z=math_exp_values[:1,i],
        mode='markers',
        name=f'FFFF{i+1}')
        )
    
# Персонализация осей
    custom_scene = dict(
                xaxis = dict(
                    title='Дата',
                    color='grey'),
                yaxis = dict(
                    title='Среднекв-е откл-е, нТ$',
                    color='grey'),
                zaxis = dict(
                    title = "Мат-е ож-е, нТ",
                    color = 'grey'))
# Настройка макета графика
fig.update_layout(
    scene=custom_scene,
    legend=dict(
        yanchor="top",
        y=0.99,
        xanchor="left",
        x=0.01
    ),
    title='3D График параметров смеси с цветовой шкалой для значения весов',
    coloraxis_colorbar=dict(
        x=-1.1,  # Расположение по оси X
        y=1.0   # Расположение по оси Y
    ),
    width=1000, 
    height=800,
    autosize=False
)

# Отображаем график
fig.show()

In [None]:
df2 = pd.read_csv(PATH_DATA + "BX_3c.csv", dtype=TYPES)