# Python Basics for Data Science - PART 6
(파이낸스 데이터 분석을 위한 파이썬 언어 기본)

###  날짜와 시간, 요약 통계, 파일 입출력

<img width="300" src="http://i.imgur.com/tHmNhjm.png" >


#### 2018 FinanceData.KR http://financedata.kr
<!-- TEASER_END -->

# time
* 유닉스 타임(Unix time, Epoch time, POSIX time)
* 1970년 1월 1일 0시 이후 경과시간을 초로 환산        

In [1]:
# 타임스탬프
import time

timestamp = time.time()
print("1970년 1월 1일 이후 초:", timestamp)

1970년 1월 1일 이후 초: 1520673789.2706378


In [2]:
# 타임스탬프를 datetime로 변환
from datetime import datetime

dt = datetime.fromtimestamp(timestamp)
dt

datetime.datetime(2018, 3, 10, 18, 23, 9, 270638)

# datetime

In [3]:
# 현재 시간 얻기
from datetime import datetime
now = datetime.now() 

print (now)

2018-03-10 18:23:09.304421


In [4]:
dt.year, dt.month, dt.day

(2018, 3, 10)

In [5]:
dt.hour, dt.minute, dt.second, dt.microsecond

(18, 23, 9, 270638)

In [6]:
# 날짜와 시간을 지정하여 날짜 객체 만들기

dt = datetime(2018, 10, 5)
dt

datetime.datetime(2018, 10, 5, 0, 0)

In [7]:
# 날짜와 시간을 지정하여 날짜 객체 만들기

dt = datetime(2018, 10, 5, 14, 50, 10)
dt

datetime.datetime(2018, 10, 5, 14, 50, 10)

In [8]:
# 현재 시간과 날짜 포맷팅

from datetime import datetime
now = datetime.now()

print (now)
print (now.year, now.month, now.day, now.hour, now.minute)
print ("%d-%02d-%02d" % (now.year, now.month, now.day))
print ("{:d}-{:02d}-{:02d}".format(now.year, now.month, now.day))

2018-03-10 18:23:09.361050
2018 3 10 18 23
2018-03-10
2018-03-10


# datetime 과 문자열

In [9]:
# 문자열을 시간으로 strptime()

s = "2017년 3월 10일 11:00"
dt = datetime.strptime(s, "%Y년 %m월 %d일 %H:%M")
print(dt)

2017-03-10 11:00:00


In [10]:
# 시간을 문자열로  strftime()

print( now.strftime("%Y-%m-%d") )
print( now.strftime("%Y-%m-%d %H:%M:%S") )

2018-03-10
2018-03-10 18:23:09


# 날짜 연산

In [11]:
# 오늘 날짜, 현재 시간

datetime.now()

datetime.datetime(2018, 3, 10, 18, 23, 9, 393881)

In [12]:
# 3.1운동 이후 경과 년 수

start = datetime(1919, 3, 1)
today = datetime.now() 

delta = today - start
int(delta.days / 365)

99

In [13]:
# 오늘 부터 100일전 날짜
from datetime import datetime, timedelta

theday = datetime.now() - timedelta(days=100)
theday

datetime.datetime(2017, 11, 30, 18, 23, 9, 417610)

In [14]:
# 현재 부터 48시간 이후

theday = datetime.now() + timedelta(hours=48)
theday

datetime.datetime(2018, 3, 12, 18, 23, 9, 428190)

# 요약 통계량

In [15]:
data = [0.13, -0.05, 0.15, 0.11, 0.15, -0.07, 0.25, 0.28, -0.14, -0.08 ]

print( 'count = ', len(data) )
print( 'sum = ', sum(data) )
print( 'max = ', max(data) )
print( 'min = ', min(data) )

count =  10
sum =  0.73
max =  0.28
min =  -0.14


In [16]:
data = [0.13, -0.05, 0.15, 0.11, 0.15, -0.07, 0.25, 0.28, -0.14, -0.08 ]

avg = sum(data) / len(data)

print( "평균 수익률 = {:.1f}".format(avg * 100) )

평균 수익률 = 7.3


In [17]:
# 분산과 표준편차

data = [0.13, -0.05, 0.15, 0.11, 0.15, -0.07, 0.25, 0.28, -0.14, -0.08 ]

def ret_variance(data):
    avg = sum(data) / len(data)
    var_sum = 0
    for val in data:
        var_sum += (val - avg) ** 2
    return var_sum / len(data)

def red_std_dev(variance):
    return variance ** 0.5

In [18]:
# 분산(variance)은 편차 제곱의 평균
var = ret_variance(data)
print ("분산(variance) = {:.2f}".format(var))

# 표준편차(SD, standard deviation): 분산(variance)의 제곱근
sd = red_std_dev(var)
print ("표준편차(standard deviation) = {:.2f}".format(sd))

분산(variance) = 0.02
표준편차(standard deviation) = 0.14


# 파일 입출력

In [19]:
# 쓰기
my_list = [i**2 for i in range(1,11)]

fn = "output.txt"
with open(fn, "w") as f:
    f.write(str(my_list))

In [20]:
# 읽기
fn = "output.txt"
with open(fn, "r") as f:
    contents = f.read()
    
print(contents)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


# 리뷰
* time, datetime
* datetime과 문자열 사이 변환 strptime(), strftime()
* 날짜 연산 timedelta()
* len(), sum(), max(), min(), 평균, 분산, 표준편차
* 파일 입출력: open(), f.read(), f.write()

----
#### 2017 FinanceData.KR http://fb.com/financedata