## Практика

Использовать все ваши знания:
- 1) Провести разведовательный анализ данных, построить различные зависимости, корреляции, изучить особенности, etc. Сделать выводы и обязательно их записать. 
- 2) Обучить различные модели (минимум две), подобрать гиперпараметры, сравнить качество на тестовом наборе (возьмите обязательно 20% с random_state = 22, для возможности последующего сравнения разных решений от разных людей)* 

*train_test_split(X, y, test_size=0.2, random_state=22)

In [1]:
import pandas as pd
import numpy as np

In [2]:
# 1) Загрузите данные. Имя файла: output.npz
#    Информация о хитах по ключу hits
#    Информация о энергии, координатам и импульсе события по ключу primaries

In [3]:
data = np.load("output.npz", allow_pickle=True)
hits = data['hits']
primaries = data['primaries']

In [4]:
# 2) Ознакомьтесь с размерностью массивов и их структурой (*полезно: .shape)

In [5]:
primaries.shape

(1000,)

In [6]:
primaries[0]

{'E': 13.430036680333961,
 'x': -0.497242087752667,
 'y': 0.8660663754823456,
 'z': 2.0,
 'px': 0.24274030089841248,
 'py': -0.19226906630328325,
 'pz': -0.9508468606787382}

In [7]:
hits.shape

(1000,)

In [8]:
hits[0].shape

(18, 4)

In [9]:
# 3) Создадим список со всеми энергиями событий. Энергия будет для нас целевой переменной

In [10]:
energies = []

for evt in primaries:
    energies.append(evt['E'])

In [11]:
# 4) hits — это список сработавших ячеек в событии:
#[ [ix, iy, nHits, fHitTime_ns], 
# ... ]

# Давайте визуалируем событие.

In [34]:
import itertools
import plotly.graph_objs as go
import plotly.io as pio
from plotly.subplots import make_subplots
pio.templates.default = 'plotly_dark'


def plot_event(hit):
    fig = make_subplots(
        rows=1, cols=2, column_widths=[0.5, 0.5],
        specs=[[{'type': 'scene'}, {'type': 'scene'}]]
    )    
    
    colorscale_pe=[
        'rgb(150, 30, 70)', 'rgb(255, 200, 70)', 'rgb(255, 255, 100)'
    ]
    
    x_size = 16
    y_size = 16
    x_grid = np.arange(x_size)
    y_grid = np.arange(y_size)
    grid =  np.array(
        list(itertools.product(x_grid, y_grid))
    ) 
    
    list1 = list(hit[:, 2].round(2))
    list2 = list(hit[:, 3].round(2))
    str1 = ', '.join(
        "nHits: " + str(list1[i]) + " FHT: " + str(list2[i]) for i in range(len(list1))
    )
    scatter_text = str1.split(", ")
    
    grid_trace = go.Scatter3d(
                    x=grid[:, 0],
                    y=grid[:, 1],
                    z=np.zeros(grid.shape[0]),
                    mode='markers',
                    showlegend=False,
                    marker=dict(
                        symbol='square',
                        color='rgb(100, 100, 100)',
                        opacity=0.8
                    )
                )
    
    fig.add_trace(grid_trace, row=1, col=1)
    fig.add_trace(grid_trace, row=1, col=2)
        
    fig.add_trace(
        go.Scatter3d(
            x=hit[:, 0],
            y=hit[:, 1],
            z=np.zeros(x_size),
            mode='markers',
            name='nHits',
            text=scatter_text,
            marker=dict(
                symbol='square',
                color=hit[:, 2],
                colorscale=colorscale_pe,
            )
        ),
        col=1, row=1
    )
    
    fig.add_trace(
        go.Scatter3d(
            x=hit[:, 0],
            y=hit[:, 1],
            z=np.zeros(x_size),
            mode='markers',
            name='FHT',
            text=scatter_text,
            marker=dict(
                symbol='square',
                color=hit[:, 3],
                colorscale='ice',
            )
        ),
        col=2, row=1
    )

    fig.update_layout(
        legend=dict(
            orientation="h",
            yanchor="bottom",
            y=1.05,
            xanchor="right",
            x=1
        )
    )
    
    fig.show()

In [35]:
plot_event(hits[np.random.randint(1000)])
plot_event(hits[np.random.randint(1000)])