# AIS-PARSER DATA PLOTING

Dans cette démo, nous examinerons un fichier csv prétraité contenant des transitions id-état-action-état pour tracer les trajectoires discrétisées correspondantes des navires sur une carte. Pour plus d'informations sur la façon dont ce csv a été généré, veuillez vous référer à `` README.md '' ou `` processplotter.py ''.

In [1]:
import yaml
import numpy as np
import pandas as pd
import plotly
import plotly.graph_objs as go

Tout d'abord, nous chargeons les métadonnées. Les métadonnées spécifient les dimensions et la résolution de la grille en longitude et latitude (et plus) afin que nous puissions tracer les trajectoires discrétisées sur une carte en mappant les coordonnées sur les états. Le `` grid_params ['grid_len'] `` est la longueur de côté d'un carré en degrés d'une grille euclidienne régulière avec des colonnes `` grid_params ['num_cols'] ``. Avec ces informations, nous pouvons déduire les limites d'un carré de grille à partir d'un état entier. Les métadonnées contiennent également une copie de la façon dont le prétraitement a été effectué afin que nous puissions connaître le format du csv. Le csv aura 2 colonnes supplémentaires de longitude et de latitude si `` options ['append_coords'] `` est vrai

In [2]:
meta_file= 'meta_data.yml'
ais_meta = {}
with open(meta_file, 'r') as stream:
    try:
        ais_meta = yaml.safe_load(stream)
    except yaml.YAMLError as exc:
        print(exc)

all_files_meta = ais_meta['all_files_meta']
options = ais_meta['options']
directories = ais_meta['directories']
grid_params = ais_meta['grid_params']

# spécifie le répertoire d'entrée et les fichiers d'intérêt
in_dir_path = directories['in_dir_path']
in_dir_data = directories['in_dir_data']

ais_meta

{'all_files_meta': {'AIS_2020_01_02.csv': {'day': 2, 'month': 1, 'year': 2020},
  'AIS_2020_01_03.csv': {'day': 3, 'month': 1, 'year': 2020},
  'AIS_2020_01_04.csv': {'day': 4, 'month': 1, 'year': 2020},
  'AIS_2020_01_05.csv': {'day': 5, 'month': 1, 'year': 2020},
  'AIS_2020_01_06.csv': {'day': 6, 'month': 1, 'year': 2020},
  'AIS_2020_01_07.csv': {'day': 7, 'month': 1, 'year': 2020},
  'AIS_2020_01_08.csv': {'day': 8, 'month': 1, 'year': 2020},
  'AIS_2020_01_09.csv': {'day': 9, 'month': 1, 'year': 2020},
  'AIS_2020_01_10.csv': {'day': 10, 'month': 1, 'year': 2020},
  'AIS_2020_01_11.csv': {'day': 11, 'month': 1, 'year': 2020},
  'AIS_2020_01_12.csv': {'day': 12, 'month': 1, 'year': 2020},
  'AIS_2020_01_13.csv': {'day': 13, 'month': 1, 'year': 2020},
  'AIS_2020_01_14.csv': {'day': 14, 'month': 1, 'year': 2020},
  'AIS_2020_01_15.csv': {'day': 15, 'month': 1, 'year': 2020},
  'AIS_2020_01_16.csv': {'day': 16, 'month': 1, 'year': 2020},
  'AIS_2020_01_17.csv': {'day': 17, 'month': 

Maintenant, nous chargeons les séquences.

Dans cet ensemble de données, il pourrait y avoir des milliers de trajectoires.

In [3]:
# lit dans le premier fichier d'intérêt
ais_data = pd.read_csv(in_dir_path + in_dir_data)

ais_data.head()

FileNotFoundError: [Errno 2] No such file or directory: '../filtered_data_for_visualization/ais_data_output.csv'

Nous définissons une fonction qui convertit les `` state_id``s de `` ais_data`` en coordonnées correspondant au milieu de ce carré de la grille pour le traçage si `` options ['append_coords'] `` n'était pas défini sur `` True '' avant le prétraitement.

In [None]:
def state_to_coord(state):
    state_col = state % grid_params['num_cols']
    state_row = state // grid_params['num_cols']
    state_lon = grid_params['min_lon'] + grid_params['grid_len'] * (state_col + 0.5)
    state_lat = grid_params['min_lat'] + grid_params['grid_len'] * (state_row + 0.5)
    return state_lon, state_lat

Nous utilisons des pandas pour ajouter des colonnes de coordonnées à notre dataframe qui contiendront les coordonnées du centre de chaque état dans chaque séquence, si cela n'a pas été fait dans le prétraitement en définissant `` options ['append_coords'] `` sur `` True` ».

In [None]:
if not options['append_coords']:
    ais_data[['lon', 'lat']] = ais_data.apply(lambda x: state_to_coord(x['from_state_id']), axis=1, result_type='expand')
ais_data.head()

Avec les latitudes et longitudes maintenant disponibles, nous ajoutons une dernière ligne à chaque trajectoire avec juste le dernier état afin qu'une cartographie un à un de l'état aux coordonnées soit formée, si cela n'a pas déjà été fait lors du prétraitement.

In [5]:
if not options['append_coords']:
    sequence_dfs = pd.DataFrame(columns=['sequence_id', 'from_state_id', 'action_id', 'to_state_id', 'lon', 'lat'])
    for traj_num, traj in ais_data.groupby('sequence_id'):
        # ajoute la dernière ligne fictive à chaque séquence avec juste l'état final de la trajectoire
        last_state = traj['to_state_id'].iloc[-1]
        last_lon, last_lat = state_to_coord(last_state)

        final_state = {'sequence_id': traj_num, 'from_state_id': last_state, 'action_id': -1, 'to_state_id': -1, 'lon': last_lon, 'lat': last_lat}
        final_df = pd.DataFrame(final_state, index=[0, ])
        traj = pd.concat([traj, final_df], ignore_index=True)
        
        sequence_dfs = pd.concat([sequence_dfs, traj], ignore_index=True)
    
    ais_data = sequence_dfs
        
    print(sequence_dfs)

Nous utilisons ensuite plotly pour tracer les données sur une carte interactive, avec la possibilité de limiter le nombre de trajectoires que nous traçons dans l'intérêt de la performance et de l'esthétique. Les trajectoires peuvent être cliquées pour les agrandir afin de mieux discerner où va une trajectoire individuelle.

In [4]:
# contrôle le nombre de trajectoires à tracer - mis à -1 pour tracer toutes les trajectoires disponibles
MAX_TRAJECTORIES = 250

plotly.offline.init_notebook_mode(connected=True)

if MAX_TRAJECTORIES > -1:
    ais_data = ais_data[ais_data['sequence_id'] < MAX_TRAJECTORIES]

ais_unique = ais_data[['lon', 'lat']].drop_duplicates()  # obtient les coordonnées uniques que nous allons tracer
    
ais_states = [go.Scattergeo(
    locationmode = 'USA-states',
    lon = ais_unique['lon'],
    lat = ais_unique['lat'],
    hoverinfo = 'text',
    text = ais_data['sequence_id'],
    mode = 'markers',
    marker = go.scattergeo.Marker(
        size = 2,
        color = 'red',
        line = go.scattergeo.marker.Line(
            width = 3,
            color = 'rgba(68, 68, 68, 50)'
        )
    ))]


ais_trajectories = []
for traj_num, traj_data in ais_data.groupby('sequence_id'):
    # obtient une couleur aléatoire pour chaque trajectoire
    red = str(np.random.randint(0, high=230))
    green = str(np.random.randint(0, high=230))
    blue = str(np.random.randint(0, high=230))
    ais_trajectories.append(
        go.Scattergeo(
            lon = traj_data['lon'],
            lat = traj_data['lat'],
            mode = 'lines',
            line = go.scattergeo.Line(
                width = 1,
                color = 'rgb(' + red + ', ' + blue + ', ' + green + ')',
            ),
        )
    )

layout = go.Layout(
    autosize=False,
    width=900,
    height=750,
    title = go.layout.Title(
        text = 'Shipping Data States Scatter'
    ),
    showlegend = False,
    geo = go.layout.Geo(
        scope = 'north america',
        resolution = 50,
        projection = go.layout.geo.Projection(
            type = 'equirectangular'
        ),
        showland = True,
        showlakes = True,
        coastlinewidth = 2,
        landcolor = 'rgb(204, 204, 204)',
        lakecolor = 'rgb(255,255,255)',
        countrycolor = 'rgb(190, 190, 190)',
        lonaxis = go.layout.geo.Lonaxis(
            range = [grid_params['min_lon'] - 25, grid_params['max_lon'] + 25],
            showgrid = True,
            dtick = grid_params['grid_len']
        ),
        lataxis = go.layout.geo.Lataxis(
            range = [grid_params['min_lat'] - 15, grid_params['max_lat'] + 15],
            showgrid = True,
            dtick = grid_params['grid_len']
        ),
    ),
)

fig = go.FigureWidget(data = ais_states + ais_trajectories, layout = layout)

lines = fig.data[1:]

# create our callback function
def update_point(trace, points, selector):
    if len(points.point_inds) > 0:
        trace.line.width += 1

for line in lines:
    line.on_click(update_point)

fig

NameError: name 'ais_data' is not defined