## Merkmal CSV Dateien konkatenieren

In diesem Notebook ist es möglich merkmal CSV Dateien zusammenzufügen.   
In der Android App für die Datenerfassung wird nach 2000 Bildern und Reihen in der Merkmal Datei ein neuer Ordner erstellt.  
Hier ist es möglich aus den einzelnen Feature Dateien eine Datei zu erstellen.

In [1]:
import pandas
import os
# Regex Vergleiche
import re

In [30]:
# Lesen der Merkmal CSV Dateien
path = "C:/Users/morro/Documents/datenRoh/22/2018_3_6_15_15/" 
files = os.listdir(path)
featuresDF = []
for file in files:
    if re.match('[0-9]', file) is not None:
        featuresDF.append(pandas.read_csv(filepath_or_buffer= path + file + "/merkmaleRoh.csv"))  

In [32]:
files

['1', '2', '3', '4', '5', 'befestigt', 'unbefestigt']

In [6]:
# Jeder Panda Dataframe wird konkateniert
length = len(featuresDF)
if length >= 2:
    result = featuresDF[0]
    for df in featuresDF[1:]:
        frames = [result, df]
        result = pandas.concat(frames, ignore_index=True)

In [7]:
# Schreibe neue Features CSV Datei
result.set_index('Zeitstempel in Unixzeit', inplace=True)
print(result.head(2))
result.to_csv("merkmaleRoh.csv")

                         Anzahl der Messwerte  Belichtungszeit in ns  \
Zeitstempel in Unixzeit                                                
1.528121e+12                             75.0             10001839.0   
1.528121e+12                             74.0             10001839.0   

                         Breitengrad  \
Zeitstempel in Unixzeit                
1.528121e+12                53.61359   
1.528121e+12                53.61359   

                         Erster Zeitstempel der Teilliste in ns seit Start der JVM  \
Zeitstempel in Unixzeit                                                              
1.528121e+12                                                  3.176885e+13           
1.528121e+12                                                  3.176898e+13           

                         Geschwindigkeit in km/h  Laengengrad  \
Zeitstempel in Unixzeit                                         
1.528121e+12                                5.94    10.137835   
1.528121e+

In [10]:
result.shape

(17571, 17)

In [11]:
result.info()

<class 'pandas.core.frame.DataFrame'>
Float64Index: 17571 entries, 1.52812078326e+12 to 1.52812925274e+12
Data columns (total 17 columns):
Anzahl der Messwerte                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                               15578 non-null float64
Belichtungszeit in ns                                                                                                                                                                                                              

Mit den folgenden Zellen können von einem kompletten Datensatz die Bilder zugeschnitten werden. 

In [2]:
# Hier können die Datensätze ausgewählt werden mit den entsprechenden Ordner Namen
datasets = pandas.DataFrame([['39'],['2018_5_4_15_58']])
# Die Pfade zu den Ordnern in welchem sich die Merkmale befinden
paths = []
datasets

Unnamed: 0,0
0,39
1,2018_5_4_15_58


In [3]:
for date, dataset in datasets.iteritems(): # Für jeden Datensatz merke Pfad
    paths.append("E:/bachelor/daten/" + dataset.iloc[0] + "/" + dataset.iloc[1] + "/")

In [4]:
paths

['E:/bachelor/daten/39/2018_5_4_15_58/']

In [5]:
featuresDF = [] 
for path in paths: # Für jeden Pfad hole die Namen der Ordner
    folders = os.listdir(path)
    folders = sorted(folders, key=int)
    for folder in folders: # Aus der Liste der Ordner wird ein Ordner ausgewählt
        print(folder)
        if re.match('[0-9]', folder) is not None: 
            filesPath = path + folder + "/merkmaleRoh.csv"
            featuresDF.append(pandas.read_csv(filepath_or_buffer=filesPath))
# Anschließend nachdem alle Merkmal Dateien in der Liste stehen muss Zeile 4 & 5 ausgeführt werden,
# um die Dateien zu konkatenieren

1
2
3
4
5
6
7
8
9
