# Abstand zwischen GPS Lokationen

In diesem Jupyter Notebook geht es darum den mittleren Abstand zwischen GPS Lokationen der Merkmale von den Datensätzen zu berechnen. Auch ist es möglich die Gesamtkilometer und bestimmen. Bei der Berechnung der Abstände wird ein Grenzwert von 20 Metern angegeben. Dieser gibt an, in welchem Bereich der Abstand zwischen zwei GPS Signalen maximal gültig ist. Wenn die Anzahl der Meter zwischen zwei GPS Lokationen groß ist liegt dies daran, dass die Daten nicht zeitlich hintereinander erfasst worden. Für die Berechnung wird das Python Paket Haversine genutzt.

Datensatz | Mittlerer Abstand in Metern zwischen zwei GPS Lokationen | Anzahl der GPS Lokationen | Gesamtmeter | Gesamtkilometer |
--- |   ---   |  ---    |    ---     |    ---   |
15-22 | 1,2446  | 100962 | 125662,71  | 125,6627 |
26-27 | 5,0101  | 4955   | 24825,19   | 24,82    |
28-29 | 3,3234  | 6228   | 20698,3842 | 20,6984  |
30    | 1,1942  | 1448   | 1729,2360  | 1,7292   |
31    | 1,4057  | 14522  | 20413,6242 | 20,4136  |
32    | 1,2795  | 12485  | 15974,7494 | 15,9747  |
33    | 1,4936  | 21823  | 32595,3194 | 32,5953  |
34    | 1,5148  | 14978  | 22688,4920 | 22,6884  | 
35    | 2,7265  | 11673  | 31826,0563 | 31,8260  |
36    | 1,53    | 18534  | 28357,6455 | 28,3576  |
37    | 1,5025  | 27902  | 41923,9413 | 41,9239  |
38    | 1,3590  | 35531  | 48287,2397 | 48,2872  |
39    | 1,4535  | 17576  | 25546,6910 | 25,5467  |
40    | 1,2639  | 13143  | 16611,2923 | 16,6113  |
41    | 1,4191  | 5939   | 8428,3781  | 8,4284   |
42    | 1,4887  | 15792  | 23509,4329 | 23,5094  |
43    | 1,3428  | 19065  | 25601,23   | 25,6013  |
44    | 2,3512  | 7640   | 17962,842  | 17,9628  |
45    | 1,479   | 9580   | 12912,05   | 12,129   |
46    | 1,2761  | 20134  | 25692,7021 | 25,6927  |
47    | 1,3786  | 18596  | 25637,3289 | 25,6373  |
48    | 1,4247  | 18134  | 25836      | 25,836   |
49    | 1,5531  | 16685  | 25915,02   | 25,915   |
50    | 1,3871  | 8733   | 12113,521  | 12,1135  |
51    | 1,3678  | 9477   | 12963,0072 | 12,963   |
37-42     | 1,4191 | 115774 | 164292,5875 | 164,2926 |
43, 45-51 | 1,3872 | 120183 | 166726,2784 | 166,7263 |
Tabelle 1: Berechnete Abstände von GPS Lokationen

In [2]:
import pandas
import os
from haversine import haversine

In [8]:
featuresDf = pandas.read_csv(filepath_or_buffer="../daten/merkmale_datensatz_25/merkmaleRoh.csv")

In [4]:
featuresDf.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 120193 entries, 0 to 120192
Data columns (total 29 columns):
Zeitstempel in Unixzeit                                               120193 non-null int64
Anzahl der Messwerte                                                  120193 non-null int64
Belichtungszeit in ns                                                 120193 non-null int64
Breitengrad                                                           120193 non-null float64
Erster Zeitstempel der Teilliste in ns seit Start der JVM             120193 non-null int64
Genauigkeit der Geschwindigkeit speedAccuracyMetersPerSecond          120193 non-null float64
Geschwindigkeit in km/h                                               120193 non-null float64
Laengengrad                                                           120193 non-null float64
Letzter Zeitstempel der Messwerterfassung in ns seit Start der JVM    120193 non-null int64
Lokations Zeitstempel in Unixzeit                    

In [5]:
haversine([featuresDf['Breitengrad'].iloc[0],featuresDf['Laengengrad'].iloc[0]], [featuresDf['Breitengrad'].iloc[0],featuresDf['Laengengrad'].iloc[0]]) * 1000

0.0

In [9]:
i = 0 
m = 0
sumMeters = 0
dataCounter = 0
stopIndex = featuresDf.shape[0] - 2
while i <= stopIndex:  
    m = haversine([featuresDf['Breitengrad'].iloc[i],featuresDf['Laengengrad'].iloc[i]], [featuresDf['Breitengrad'].iloc[i+1],featuresDf['Laengengrad'].iloc[i+1]]) * 1000
    if m > 20:
        i = i + 1
        continue
    sumMeters = sumMeters + m
    dataCounter = dataCounter + 1 
    i = i + 1
totalKilometre = sumMeters / 1000
meanM          = sumMeters / dataCounter
print('Anzahl der GPS Lokationen: ' + str(dataCounter))
print('Gesamtmeter: ' + str(sumMeters))
print('Gesamtkilometer: ' + str(totalKilometre))
print('Mittlerer Abstand in Metern zwischen zwei GPS Lokationen: ' + str(meanM))

Anzahl der GPS Lokationen: 1090
Gesamtmeter: 1205.3383218602944
Gesamtkilometer: 1.2053383218602944
Mittlerer Abstand in Metern zwischen zwei GPS Lokationen: 1.1058149741837564
