# Abstand zwischen GPS Lokationen

In diesem Jupyter Notebook geht es darum den mittleren Abstand zwischen GPS Lokationen der Merkmale von den Datensätzen zu berechnen. Auch ist es möglich die Gesamtkilometer und bestimmen. Bei der Berechnung der Abstände wird ein Grenzwert in Metern angegeben. Dieser gibt an, in welchem Bereich der Abstand gültig ist. Wenn die Anzahl der Meter zwischen zwei GPS Lokationen groß ist liegt dies daran, dass die Daten nicht zeitlich hintereinander erfasst worden. Für die Berechnung wird das Python Paket Haversine genutzt.

Datensatz | Mittlerer Abstand in Metern zwischen zwei GPS Lokationen | Grenzwert in Metern | Anzahl der GPS Lokationen | Gesamtmeter | Gesamtkilometer |
  --- |   ---   | --- | ---    |    ---     |    ---   |
15-22 | 1,2446  | 20  | 100962 | 125662,71  | 125,6627 |
26-27 | 5,0101  | 20  | 4955   | 24825,19   | 24,82    |
28-29 | 3,3234  | 20  | 6228   | 20698,3842 | 20,6984  |
30    | 1,1942  | 20  | 1448   | 1729,2360  | 1.7292   |
31    | 1,4057  | 20  | 14522  | 20413,6242 | 20.4136  |

 
Tabelle 1: Berechnete Abstände von GPS Lokationen

In [1]:
import pandas
import os
from haversine import haversine

In [3]:
featuresDf = pandas.read_csv(filepath_or_buffer="../daten/merkmale_datensatz_31/merkmaleRoh.csv")

In [4]:
featuresDf.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14523 entries, 0 to 14522
Data columns (total 15 columns):
Zeitstempel in Unixzeit                                               14523 non-null int64
Breitengrad                                                           14523 non-null float64
Laengengrad                                                           14523 non-null float64
Geschwindigkeit in km/h                                               14523 non-null float64
Z-Achse Beschleunigungswerte in m/s^2                                 14523 non-null object
Y-Achse Beschleunigungswerte in m/s^2                                 14523 non-null object
Nick Messwerte in rad                                                 14523 non-null object
Zeitstempel der Messwerte in ns                                       14523 non-null object
Anzahl der Messwerte                                                  14523 non-null int64
Start des Zeitfensters in ns seit Start der JVM               

In [5]:
haversine([featuresDf['Breitengrad'].iloc[0],featuresDf['Laengengrad'].iloc[0]], [featuresDf['Breitengrad'].iloc[0],featuresDf['Laengengrad'].iloc[0]]) * 1000

0.0

In [6]:
i = 0 
m = 0
sumMeters = 0
dataCounter = 0
stopIndex = featuresDf.shape[0] - 2
while i <= stopIndex:  
    m = haversine([featuresDf['Breitengrad'].iloc[i],featuresDf['Laengengrad'].iloc[i]], [featuresDf['Breitengrad'].iloc[i+1],featuresDf['Laengengrad'].iloc[i+1]]) * 1000
    if m > 20:
        i = i + 1
        continue
    sumMeters = sumMeters + m
    dataCounter = dataCounter + 1 
    i = i + 1
totalKilometre = sumMeters / 1000
meanM          = sumMeters / dataCounter
print('Anzahl der GPS Lokationen: ' + str(dataCounter))
print('Gesamtmeter: ' + str(sumMeters))
print('Gesamtkilometer: ' + str(totalKilometre))
print('Mittlerer Abstand in Metern zwischen zwei GPS Lokationen: ' + str(meanM))

Anzahl der GPS Lokationen: 14522
Gesamtmeter: 20413.624257828098
Gesamtkilometer: 20.413624257828097
Mittlerer Abstand in Metern zwischen zwei GPS Lokationen: 1.405703364400778
