## 1. 일단 필요한 라이브러리를 호출합니다.

In [1]:
#라이브러리 호출

import gpxpy
import pandas as pd
import os
from glob import glob

## 2. 다수의 GPX 파일에서 필요한 피쳐를 가져오기 위해, 아래 함수를 사용합니다.
* 파일(이름), 트랙(길이, 최고속도, 최저고도, 움직인시간, 쉬는시간, Elevation_gain), 포인트 정보(트랙 첫 포인트 위도 , 트랙 첫 포인트 경도, 트랙 첫 포인트 시간)까지 11개 항목을 컬럼 추가하는 내용입니다.

In [2]:
def load_run_data(gpx_path):
    gpx_files = glob(os.path.join(gpx_path, "*.gpx"))
    run_data = []
    
    for file_idx, gpx_file in enumerate(gpx_files):
        data = []
        try:
            gpx = gpxpy.parse(open(gpx_file, 'r', encoding='utf-8'))
        except:
            continue
            
        for point_idx, point in enumerate(gpx.tracks[0].segments[0].points):
            data.append(gpx.tracks[0].segments[0].get_speed(point_idx))

        
        run_data.append([os.path.basename(gpx_file), # 파일 이름
                         gpx.tracks[0].length_3d() / 1000, # 트랙길이(km)
                         gpx.tracks[0].get_moving_data().max_speed * 3.6, # 최고속도(km/h)
                         pd.Series(data).median()*3.6 # 속도 중앙값 
                         gpx.tracks[0].get_elevation_extremes().minimum, # 최저고도(m)
                         gpx.tracks[0].get_elevation_extremes().maximum, # 최고고도(m)
                         gpx.tracks[0].get_moving_data().moving_time, # 움직인 시간(s)
                         gpx.tracks[0].get_moving_data().stopped_time, # 쉬는 시간(s)
                         gpx.tracks[0].get_uphill_downhill().uphill, # 누적 고도 이득(m)
                         gpx.tracks[0].segments[0].points[0].latitude, # 트랙 첫 포인트 위도 
                         gpx.tracks[0].segments[0].points[0].longitude, # 트랙 첫 포인트 경도
                         gpx.tracks[0].segments[0].points[0].time # 트랙 첫 포인트 시간(yyyy-mm-dd hh:mm:ss)
                        ])
    return run_data

### 3. 트랭글 데이터(GPX 파일)에서 필요한 피처 추출하여 데이터 프레임 만들기

In [None]:
# 2019년 데이터

data1 = load_run_data('D:/Trangle_Data/Trangle_GPX/2019_done')

df1 = pd.DataFrame(data1, columns=['f_name',
                                 'track_length','top_speed', 'speed_median', 'lowest_ele', 'top_ele',
                                 'moving_time', 'stopped_time', 'elevation_gain',
                                 'p1_lat', 'p1_lon', 'p1_time'])
df1

In [None]:
# 2020년 데이터 

data2 = load_run_data('D:/Trangle_Data/Trangle_GPX/2020_done')

df2 = pd.DataFrame(data2, columns=['f_name',
                                 'track_length','top_speed', 'speed_median', 'lowest_ele', 'top_ele',
                                 'moving_time', 'stopped_time', 'elevation_gain',
                                 'p1_lat', 'p1_lon', 'p1_time'])
df2

### 4. 만들어진 데이터 프레임을 CSV파일로 저장
* 이전까지 Python 'gpxpy' 라이브러리를 이용하여 GPX 파일을pandas.DataFrame으로 변환하는 과정을 정리해 봤습니다.
* 이제는 만들어진 pandas.DataFrame을 CSV파일로 저장하여 활용하면 됩니다.

In [None]:
# pandas.DataFrame을 csv파일로 변환(2019년 데이터)   


df.to_csv("D:/Trangle_Data/Trangle_GPX/2019_done.csv")

In [None]:
# pandas.DataFrame을 csv파일로 변환(2020년 데이터)

df.to_csv("D:/Trangle_Data/Trangle_GPX/2020_done.csv")