In [1]:
import numpy as np
from tkinter import *
from tkinter import ttk
import tkinter.scrolledtext as tkst
from matplotlib.figure import Figure
from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg
from matplotlib.animation import FuncAnimation
import math
import pandas as pd

marathon_2015_2017 = pd.read_csv("./marathon_2015_2017.csv")

In [2]:
# 읽어온 데이터에서 성별, 나이, 페이스, 10K, 20K, 30K, 최종기록을 필터링
# 최종기록으로 정렬 - record 변수에 저장
record = pd.DataFrame(marathon_2015_2017, columns= ['M/F', 'Age', 'Pace', \
           '10K', '20K', '30K', 'Official Time']).sort_values(by=['Official Time'])

# 성별의 데이터릴 'M', 'F'에서 0과 1로 변환
record['M/F'] = record['M/F'].map({'M':1, 'F':0})

# 데이터 프레임을 리스트로 변환
record_list = record.values.tolist()

# gender_list 생성
gender_list = ['Femail','Mail']

# 버튼이 클릭되면 화면에 표시될 차트를 생성하여 구색을 갖추고,
# gn변수에 등록해두어, 차트 표시명령 시 세트명령을 사용하도록 준비합니다
grad_fig = Figure( figsize=(10,4), dpi=100)
grad_ax = grad_fig.add_subplot(111)
grad_ax.set_xlim(15,88)
grad_ax.set_ylim(0,1300)
grad_ax.set_xlabel("Age : Age on race day")
grad_ax.set_ylabel("Pace : Runner's overall minute per mile pace")

g_xdata, g_ydata = [], []
gn, =grad_ax.plot([], [], 'ro')

In [3]:
def histogram():
    # t_gCbbox.get()의 값은 선택된 'Male' 또는 'Female'
    gender = t_gCbbox.get()
    # gender_list.index(gender) 선택된 값을 gender_list의 인덱스를 이용해서 0 또는 1로 변환
    t_g = int(gender_list.index(gender))
    
    # 나머지 스핀박스 값 추출
    t_a = int(t_aSpbox.get())  # 나이
    t_p = int(t_pSpbox.get())  # 페이스
    
    # 차트에 표시할 성별에 따른 점 색깔 설정
    if(t_g):
        gender_color = 'b'
    else:
        gender_color = 'r'
    
    # 선택된 성별에 따라 필터링
    gender_record = record[ record['M/F'] == t_g]
    # 선택된 나이에 따라서 필터링
    gender_age_record = gender_record[ gender_record.Age == t_a ]
    # 필터링된 데이터들을 모두 리스트로 변환
    gender_age_record_list = gender_age_record.values.tolist()
    
    # 성별에 따른 색깔의 점으로 같은 연령별(x축) 페이스들(y축)을 표시
    grad_ax.plot(gender_record.Age, gender_record.Pace, '.', \
                                         color = gender_color, alpha=0.3)
    # 선택된 연령과 페이스로 노란색 다이아몬드 표시
    grad_ax.plot(t_a, t_p, 'yd')
    # 나이로 필터링 된 데이터에서 페이스에 대한 기술 통계값 계산
    stat = gender_age_record['Pace'].describe()
    
    # 차트 타이틀 제작
    title = 'Gender : '+gender_list[t_g]+', Age :'+str(t_a)
    grad_ax.set_title(title)
    
    # 오른쪽 상단 위치에 annotate로 인원, 사분위 값들을 차례로 표시
    grad_ax.annotate("%10s %7i"%('Count : ', stat[0]), (75, 1200), fontsize=10)
    grad_ax.annotate("%10s %7.3f"%('Mean : ', stat[1]), (75, 1150), fontsize=10)
    grad_ax.annotate("%10s %7.3f"%('25% : ', stat[3]), (75, 1100), fontsize=10)
    grad_ax.annotate("%10s %7.3f"%('75% : ', stat[5]), (75, 1050), fontsize=10)
    grad_fig.canvas.draw()

In [4]:
def seconds_to_hhmmss(seconds):
    hours = seconds // (60*60)
    seconds %= (60*60)
    minutes = seconds // 60
    seconds %= 60
    return "%02i:%02i%02i" % (hours, minutes, seconds)

In [5]:
def learning():
    import tensorflow as tf
    import numpy as np
    # 성별 나이 페이스 추출
    gender = t_gCbbox.get()
    t_g = int(gender_list.index(gender))  
    t_a = int(t_aSpbox.get())  # 대상 데이터의 순위
    t_p = int(t_pSpbox.get())
    
    # train 횟수, learning rate 추출
    t_t = int(t_tSpbox.get())  
    t_r = float(t_rSpbox.get())  
    
    # 성별 나이 페이스를 feature로, 최종기록을 target으로 분리
    x_train = [ r[0:3] for r in record_list ]
    y_train = [ r[-1] for r in record_list ]
    
    # Sequential model 생성
    model = tf.keras.models.Sequential()
    # 입력 값 종류 3개, 출력 1개
    model.add(tf.keras.layers.Dense(1, input_shape=(3,)))
    # 최적화 도구로 sgd
    sgd = tf.keras.optimizers.SGD(lr=t_r)
    # 평가도구 mse로 설정하고, 위 사항으로 모델을 완성
    model.compile(loss='mse', optimizer=sgd)
    # 학습 전에 컴파일된 모델을 요약하여 출력
    model.summary()
    # 학습
    history = model.fit(np.array(x_train), np.array(y_train), epochs=t_t)
    
    # 예측값 및 중간 코스트값 출력을 위한 제목들
    log_ScrolledText.insert(END, '\nGender:'+gender_list[t_g]+'\, Age:'+str(t_a)+\
                           ', Pace:'+str(t_p)+'\n', 'TITLE')
    log_ScrolledText.insert(END, '\n\nCost Decent\n\n', 'HEADER')
    log_ScrolledText.insert(END, '%20s %20s' % ('Step', 'Cost')+'\n\n')
    
    # 100회 학습마다 코스트 값 출력
    for step in range(t_t):
        if step % 100 == 0:
            cost_val = history.history['loss'][step]
            log_ScrolledText.insert(END, "%20i %20.5f" % (step, cost_val)+'\n')
    
    # predict 예측(선택한 성별 나이 페이스로 최종 기록 예측)
    winner = [t_g, t_a, t_p]
    time = model.predict(np.array([winner]))
    # 시분초 형식의 예측기록과 초단위의 예측 기록을 한 번에 출력하기 위한 텍스트 구성
    ml_time = seconds_to_hhmmss(time[0][0])+ '('+str(time[0][0])+')'
    # 예측값 출력을 위한 제목
    log_ScrolledText.insert(END, "%20s" % ('\n\nThe Prediction Recoreds\n\n'), \
                            'HEADER')
    # 출력 내용의 열 제목들
    log_ScrolledText.insert(END, "%10s %10s %10s %50s" % ('Gender','Age','Pace',\
                                    'Record Prediction(Second) at 42.195km')+'\n\n')
    # 예측값 출력
    log_ScrolledText.insert(END, "%10s %10s %10s %50s" % (gender_list[t_g], str(t_a), \
                                                         str(t_p), ml_time)+'\n')

In [None]:
# 메인윈도우 생성 : 타이틀 - Multi Variable Matrix Linear Regression
main = Tk()
main.title("Multi Variable Matrix Linear Regression")
main.geometry()

# 라벨생성 - 라벨 텍스트 : Multi Variable Matrix Linear Regression
# 굴림체, 18포인트, row=0, column=0, columnspan=6
label = Label(main, text='Multi Variable Matrix Linear Regression')
label.config(font=("굴림", 18))
label.grid(row=0, column=0, columnspan=6)

# 콤보상자 생성 - 콤보상자 내 item : gender_list, 위치( 1(row), 0(column) )
t_gVal = StringVar(value=gender_list[0]) # 연결된 변수 값 - 최초표시값을 저장
t_gCbbox = ttk.Combobox(main, textvariable=t_gVal)
t_gCbbox['values'] = gender_list  # 전체 보유 item설정
t_gCbbox.config(state='readonly')
t_gCbbox.grid(row=1, column=1)

# 라벨생성 텍스트 : Gender # row=1, column=0
t_gLabel = Label(main, text='Gender : ')
t_gLabel.grid(row=1, column=0)

# 스핀박스 생성
# 초기값 45, 시작값 18, 끝 값 84, 증가량 1, 오른쪽정렬, 스핀박스버튼 외 수정불가
# row=1, column=3
# 라벨 생성 # 텍스트 Age : row=1, column=4
t_aVal = IntVar(value=45)
t_aSpbox = Spinbox(main, textvariable=t_aVal, from_=18, to=84, increment=1, \
                                                                       justify=RIGHT)
t_aSpbox.config(state='readonly')
t_aSpbox.grid(row=1, column=3)
t_aLabel=Label(main, text='Age : ')
t_aLabel.grid(row=1, column=4)

# 스핀박스2 생성
# 초기값 500, 시작값 0, 끝 값 1500, 증가량 1, 오른쪽 정렬, 스핀박스버튼 외 수정불가
# row=1, column=5
# 라벨 생성 # 텍스트 Pace : row=1, column=4
t_pVal = IntVar(value=500)
t_pSpbox = Spinbox(main, textvariable=t_pVal, from_=0, to=1500, increment=1, \
                                                                       justify=RIGHT)
t_pSpbox.config(state='readonly')
t_pSpbox.grid(row=1, column=5)
t_pLabel=Label(main, text='Pace : ')
t_pLabel.grid(row=1, column=4)

# 스핀박스3 생성
# 초기값 2000, 시작값 0, 끝 값 100000, 증가량 1000, 오른쪽 정렬,
# row=2, column=1
# 라벨생성 #텍스트 Number of train : row=2, column=0
t_tVal = IntVar(value=2000)
t_tSpbox = Spinbox(main, textvariable=t_tVal, from_=0, to=100000, increment=1000, \
                                                                       justify=RIGHT)
t_tSpbox.grid(row=2, column=1)
t_tLabel=Label(main, text='Number of train : ')
t_tLabel.grid(row=2, column=0)

# 스핀박스4 생성
# 초기값 0.000001, 시작값 0, 끝 값 1, 증가량 0.000001, 오른쪽 정렬,
# row=2, column=3
# 라벨 생성 # 텍스트 Learning rate : row=2, column=2
t_rVal = DoubleVar(value=1e-6)
t_rSpbox = Spinbox(main, textvariable=t_rVal, from_=0, to=1, increment=(1e-6), \
                                                                       justify=RIGHT)
t_rSpbox.grid(row=2, column=3)
t_rLabel=Label(main, text='Learning rate : ')
t_rLabel.grid(row=2, column=2)

# 버튼 생성 
btn1 = Button(main, text="Histogram", height=2,command=lambda:histogram())
btn1.grid(row=2, column=4, columnspan=1, sticky=(W,E))
btn2 = Button(main, text="Prediction", height=2,command=lambda:learning())
btn2.grid(row=2, column=5, columnspan=1, sticky=(W,E))

# 차트 캔버스
grad_canvas = FigureCanvasTkAgg(grad_fig, main)
grad_canvas.get_tk_widget().grid(row=3, column=0, columnspan=6)

# Scrolled Text
log_ScrolledText = tkst.ScrolledText(main,height=15)
log_ScrolledText.grid(row=4, column=0, columnspan=6, sticky=(N, S, W, E))
log_ScrolledText.configure(font='굴림')
log_ScrolledText.tag_config('RESULT', foreground='blue', font=("굴림", 12))
log_ScrolledText.tag_config('HEADER', foreground='black', font=("굴림", 14))
log_ScrolledText.tag_config('TITLE', foreground='red', font=("굴림", 18))

# 어제 데이터 : [5,10,15,20,21.098,25,30,35]과 [321, 758, 1470, 2145 ... 5021]
# 오늘 데이터세트를 입력하고 특정 연령, 성별의 최종기록 예측


main.mainloop()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 1)                 4         
Total params: 4
Trainable params: 4
Non-trainable params: 0
_________________________________________________________________
Epoch 1/2000
Epoch 2/2000
Epoch 3/2000
Epoch 4/2000
Epoch 5/2000
Epoch 6/2000
Epoch 7/2000
Epoch 8/2000
Epoch 9/2000
Epoch 10/2000
Epoch 11/2000
Epoch 12/2000
Epoch 13/2000
Epoch 14/2000
Epoch 15/2000
Epoch 16/2000
Epoch 17/2000
Epoch 18/2000
Epoch 19/2000
Epoch 20/2000
Epoch 21/2000
Epoch 22/2000
Epoch 23/2000
Epoch 24/2000
Epoch 25/2000
Epoch 26/2000
Epoch 27/2000
Epoch 28/2000
Epoch 29/2000
Epoch 30/2000
Epoch 31/2000
Epoch 32/2000
Epoch 33/2000
Epoch 34/2000
Epoch 35/2000
Epoch 36/2000
Epoch 37/2000
Epoch 38/2000
Epoch 39/2000
Epoch 40/2000
Epoch 41/2000
Epoch 42/2000
Epoch 43/2000
Epoch 44/2000
Epoch 45/2000
Epoch 46/2000
Epoch 47/2000
Epoch 4

Epoch 86/2000
Epoch 87/2000
Epoch 88/2000
Epoch 89/2000
Epoch 90/2000
Epoch 91/2000
Epoch 92/2000
Epoch 93/2000
Epoch 94/2000
Epoch 95/2000
Epoch 96/2000
Epoch 97/2000
Epoch 98/2000
Epoch 99/2000
Epoch 100/2000
Epoch 101/2000
Epoch 102/2000
Epoch 103/2000
Epoch 104/2000
Epoch 105/2000
Epoch 106/2000
Epoch 107/2000
Epoch 108/2000
Epoch 109/2000
Epoch 110/2000
Epoch 111/2000
Epoch 112/2000
Epoch 113/2000
Epoch 114/2000
Epoch 115/2000
Epoch 116/2000
Epoch 117/2000
Epoch 118/2000
Epoch 119/2000
Epoch 120/2000
Epoch 121/2000
Epoch 122/2000
Epoch 123/2000
Epoch 124/2000
Epoch 125/2000
Epoch 126/2000
Epoch 127/2000
Epoch 128/2000
Epoch 129/2000
Epoch 130/2000
Epoch 131/2000
Epoch 132/2000
Epoch 133/2000
Epoch 134/2000
Epoch 135/2000
Epoch 136/2000
Epoch 137/2000
Epoch 138/2000
Epoch 139/2000
Epoch 140/2000
Epoch 141/2000
Epoch 142/2000
Epoch 143/2000
Epoch 144/2000
Epoch 145/2000
Epoch 146/2000
Epoch 147/2000
Epoch 148/2000
Epoch 149/2000
Epoch 150/2000
Epoch 151/2000
Epoch 152/2000
Epoch 153

Epoch 176/2000
Epoch 177/2000
Epoch 178/2000
Epoch 179/2000
Epoch 180/2000
Epoch 181/2000
Epoch 182/2000
Epoch 183/2000
Epoch 184/2000
Epoch 185/2000
Epoch 186/2000
Epoch 187/2000
Epoch 188/2000
Epoch 189/2000
Epoch 190/2000
Epoch 191/2000
Epoch 192/2000
Epoch 193/2000
Epoch 194/2000
Epoch 195/2000
Epoch 196/2000
Epoch 197/2000
Epoch 198/2000
Epoch 199/2000
Epoch 200/2000
Epoch 201/2000
Epoch 202/2000
Epoch 203/2000
Epoch 204/2000
Epoch 205/2000
Epoch 206/2000
Epoch 207/2000
Epoch 208/2000
Epoch 209/2000
Epoch 210/2000
Epoch 211/2000
Epoch 212/2000
Epoch 213/2000
Epoch 214/2000
Epoch 215/2000
Epoch 216/2000
Epoch 217/2000
Epoch 218/2000
Epoch 219/2000
Epoch 220/2000
Epoch 221/2000
Epoch 222/2000
Epoch 223/2000
Epoch 224/2000
Epoch 225/2000
Epoch 226/2000
Epoch 227/2000
Epoch 228/2000
Epoch 229/2000
Epoch 230/2000
Epoch 231/2000
Epoch 232/2000
Epoch 233/2000
Epoch 234/2000
Epoch 235/2000
Epoch 236/2000
Epoch 237/2000
Epoch 238/2000
Epoch 239/2000
Epoch 240/2000
Epoch 241/2000
Epoch 242/

Epoch 265/2000
Epoch 266/2000
Epoch 267/2000
Epoch 268/2000
Epoch 269/2000
Epoch 270/2000
Epoch 271/2000
Epoch 272/2000
Epoch 273/2000
Epoch 274/2000
Epoch 275/2000
Epoch 276/2000
Epoch 277/2000
Epoch 278/2000
Epoch 279/2000
Epoch 280/2000
Epoch 281/2000
Epoch 282/2000
Epoch 283/2000
Epoch 284/2000
Epoch 285/2000
Epoch 286/2000
Epoch 287/2000
Epoch 288/2000
Epoch 289/2000
Epoch 290/2000
Epoch 291/2000
Epoch 292/2000
Epoch 293/2000
Epoch 294/2000
Epoch 295/2000
Epoch 296/2000
Epoch 297/2000
Epoch 298/2000
Epoch 299/2000
Epoch 300/2000
Epoch 301/2000
Epoch 302/2000
Epoch 303/2000
Epoch 304/2000
Epoch 305/2000