In [1]:
import uproot
import awkward as ak

In [2]:
from tqdm import tqdm
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

In [3]:
from pathlib import Path
import h5py

### set I/O path
data_dir = Path.cwd().parent.joinpath('data')
root_dir = data_dir.joinpath('root')
h5_dir = data_dir.joinpath('hdf5')
h5_dir.mkdir(parents=True, exist_ok=True)

root_train_path = root_dir.joinpath('train_50k.root')
root_test_path = root_dir.joinpath('test_40k.root')
h5_train_path = h5_dir.joinpath('train.h5')
h5_test_path = h5_dir.joinpath('test_small.h5')

In [4]:
f = uproot.open(root_train_path)
f['particle_mctruth_tree'].arrays('_part_v._pdg', entry_stop=1)['_part_v._pdg']

In [7]:
avgs = []
for i in tqdm(range(5)):
    intv = 10000
    start = i*intv
    ak_img = f["image2d_data_tree"].arrays("_image_v._img",  entry_start=start, entry_stop=start+intv)["_image_v._img"]
    avgs.append(ak.mean(ak_img))
avg = np.mean(avgs)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [07:05<00:00, 85.00s/it]


In [8]:
print(avg)

0.37174486416699054


In [14]:
diffs_squared = []
for i in tqdm(range(5)):
    intv = 10000
    start = i*intv
    ak_img = f["image2d_data_tree"].arrays("_image_v._img",  entry_start=start, entry_stop=start+intv)["_image_v._img"]
    diffs = ak_img-avg
    diffs_squared.append(np.sum(np.power(diffs, 2)))
    
std = np.sqrt(np.sum(diffs_squared)/50000)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5/5 [07:05<00:00, 85.18s/it]


In [15]:
print(std)

4439.282558540287
