# Canaux
Visualisation de la distribution des valeurs sur chacun des canaux.

In [1]:
import h5py
import random
import numpy as np

In [2]:
PATH_DATA = 'data/train/eightieth.h5'

In [3]:
data = h5py.File(PATH_DATA,'r')

Au vu de la quantité de données, on ne peut effectuer la visualisation sur son ensemble. On ne garde qu'un échantillon de 10000 valeurs (échantilloné aléatoirement sur l'ensemble des données) pour chacun des canaux.

In [4]:
import plotly.offline as py
py.init_notebook_mode(connected=True)
from plotly import tools
import plotly.graph_objs as go

fig = tools.make_subplots(rows=4, cols=1, print_grid=False)
samples = 10000

trace1 = go.Histogram(
    x=np.random.choice(data["S2"][:,:,:,0].flatten(), samples),
    name='Red',
    marker=dict(
        color='rgb(255, 50, 50)'
    ),
    xbins=dict(
        start=0,
        end=3000,
        size=20
    )
)
trace2 = go.Histogram(
    x=np.random.choice(data["S2"][:,:,:,1].flatten(), samples),
    name='Green',
    marker=dict(
        color='rgb(50, 200, 50)'
    ),
    xbins=dict(
        start=0,
        end=3000,
        size=20
    )
)
trace3 = go.Histogram(
    x=np.random.choice(data["S2"][:,:,:,2].flatten(), samples),
    name='Blue',
    marker=dict(
        color='rgb(50, 50, 255)'
    ),
    xbins=dict(
        start=0,
        end=3000,
        size=20
    )
)
trace4 = go.Histogram(
    x=np.random.choice(data["S2"][:,:,:,3].flatten(), samples),
    name='Infrared',
    marker=dict(
        color='rgb(50, 50, 50)'
    ),
)

fig.append_trace(trace1, 1, 1)
fig.append_trace(trace2, 2, 1)
fig.append_trace(trace3, 3, 1)
fig.append_trace(trace4, 4, 1)

fig['layout']['xaxis1'].update(range=[0, 3000])
fig['layout']['xaxis2'].update(range=[0, 3000])
fig['layout']['xaxis3'].update(range=[0, 3000])
fig['layout']['xaxis4'].update(range=[0, 5000], title='feature value')

fig['layout'].update(height=600, width=600, title='Each channels distribution')
py.iplot(fig, filename='simple-subplot')


In [5]:
max_r = np.max(data["S2"][:,:,:,0].flatten())
print('Valeur max sur le canal R: {}'.format(max_r))
max_r = np.max(data["S2"][:,:,:,1].flatten())
print('Valeur max sur le canal G: {}'.format(max_r))
max_r = np.max(data["S2"][:,:,:,2].flatten())
print('Valeur max sur le canal B: {}'.format(max_r))
max_r = np.max(data["S2"][:,:,:,3].flatten())
print('Valeur max sur le canal I: {}'.format(max_r))

Valeur max sur le canal R: 7068.0
Valeur max sur le canal G: 6792.0
Valeur max sur le canal B: 5835.0
Valeur max sur le canal I: 8986.0
