# Data Science (JULIA)

## 1. Julia Standard Library

### 1.1 Dates

* python -> pandas의 date type 이용

* R -> tidyverse의 lubridate의 date type 이용

* Julia -> Dates 패키지 이용

In [1]:
using Dates

#### 1.1.1 ```Date``` and ```DateTime``` Types

* **```Date```** : 날짜 단위로 시간을 표시(representing time in days)

* **```DateTime```** : 밀리초의 정밀도로 시간을 표시(representing time in millisecond precision)

* both are subtypes of the abstract TimeType.

* **기본 생성자(constructor)를 이용한 Date 및 DateTime 타입 생성** (Int 정수 이용)

In [2]:
Date(1987) # year

1987-01-01

In [3]:
Date(1987, 9) # year, month

1987-09-01

In [4]:
Date(1987, 9, 13) # year, month, day

1987-09-13

In [5]:
DateTime(1987, 9, 13, 21) # year, month, day, hour

1987-09-13T21:00:00

In [6]:
DateTime(1987, 9, 13, 21, 21) # year, month, day, hour, minute

1987-09-13T21:21:00

* For the curious, September 13th 1987, 21:21 is the official time of birth of the first author, Jose.

* **Period** 하위 데이터 유형

In [7]:
subtypes(Period)

2-element Vector{Any}:
 DatePeriod
 TimePeriod

In [8]:
subtypes(DatePeriod)

5-element Vector{Any}:
 Day
 Month
 Quarter
 Week
 Year

In [9]:
subtypes(TimePeriod)

6-element Vector{Any}:
 Hour
 Microsecond
 Millisecond
 Minute
 Nanosecond
 Second

In [10]:
DateTime(Year(1987), Month(9), Day(13), Hour(21), Minute(21))

1987-09-13T21:21:00

#### 1.1.2 Parsing Dates

* string -> Date 또는 DateTime으로 파싱

In [11]:
Date("19870913", "yyyymmdd")

1987-09-13

In [12]:
# Datetime을 이용한 timestamps 파싱

DateTime("1987-09-13T21:21:00", "yyyy-mm-ddTHH:MM:SS")

1987-09-13T21:21:00

* DateFormat type을 이용해 fromat string(형식 문자열) 대신 사용할 수 있음

In [13]:
format = DateFormat("yyyymmdd")
Date("19870913", format)

1987-09-13

* 성능저하 없이 접두사로 붙여서 사용 가능 

In [14]:
Date("19870913", dateformat"yyyymmdd")

1987-09-13

#### 1.1.3 날짜 및 시간 정보 추출하기(Extracting Date Information)

In [15]:
my_birthday = Date("1987-09-13")

1987-09-13

In [16]:
year(my_birthday)

1987

In [17]:
month(my_birthday)

9

In [18]:
day(my_birthday)

13

* 줄리아의 ```Dates``` 모듈은 튜플(tuple) 형태로 타입 값을 반환하는 복합 함수(compound function)를 제공함

In [19]:
yearmonth(my_birthday)

(1987, 9)

In [20]:
monthday(my_birthday)

(9, 13)

In [21]:
yearmonthday(my_birthday)

(1987, 9, 13)

* 요일명, 주중 몇번째 날짜인지, 몇번째 주인지 추출하는 함수도 지원함

In [22]:
dayofweek(my_birthday)

7

In [23]:
dayname(my_birthday)

"Sunday"

In [24]:
dayofweekofmonth(my_birthday)

2

Yep, Jose was born on the second Sunday of September.

* 만약 워킹데이(비즈니스 데이)를 추출하고 싶다면 아래 노트 참조

> NOTE: Here’s a handy tip to just recover weekdays from Dates instances. Just use a filter on dayofweek(your_date) <= 5. For business day you can checkout the BusinessDays.jl package.

#### 1.1.4 Date Operations

* Dates instances들에 대한 연산

In [25]:
my_birthday + Day(90)

1987-12-12

* 연도, 월, 일 등을 동시에 연산 가능

In [26]:
my_birthday + Day(90) + Month(2) + Year(1)

1989-02-11

Date 타입의 가능한 연산 확인(method 확인)

In [27]:
first(methodswith(Date), 20)

In [28]:
# Date의 기본 시간 단위는 days이기 때문에 days로 연산됨

today() - my_birthday

12796 days

In [29]:
# DateTime의 기본 시간 단위는 milliseconds이기 때문에 milliseconds로 연산됨

DateTime(today()) - DateTime(my_birthday) 

1105574400000 milliseconds

In [30]:
canonicalize(today() - my_birthday)

1828 weeks

#### 1.1.5 Date Intervals

* Dates 모듈은 쉽게 날짜와 시간 간격을 구성할 수 있다.

* **```:```** colon operator로 시간 간격을 나타내는 StepRange 타입을 만든다.

In [31]:
Date("2021-01-01"):Day(1):Date("2021-01-07")

Date("2021-01-01"):Day(1):Date("2021-01-07")

In [32]:
Date("2021-01-01"):Day(3):Date("2021-01-07")

Date("2021-01-01"):Day(3):Date("2021-01-07")

* ```collect``` 함수를 이용해 **vector**로 변환할 수 있음

In [33]:
collect(Date("2021-01-01"):Day(1):Date("2021-01-07"))

7-element Vector{Date}:
 2021-01-01
 2021-01-02
 2021-01-03
 2021-01-04
 2021-01-05
 2021-01-06
 2021-01-07

In [34]:
collect(Date("2021-01-01"):Day(3):Date("2021-01-07"))

3-element Vector{Date}:
 2021-01-01
 2021-01-04
 2021-01-07

In [35]:
println(Date("2021-01-01"):Month(3):Date("2021-03-01"))

Date("2021-01-01"):Month(3):Date("2021-01-01")


In [36]:
date_interval = Date("2021-01-01"):Month(1):Date("2021-03-01")
typeof(date_interval)

StepRange{Date, Month}

In [37]:
collected_date_interval = collect(date_interval)

3-element Vector{Date}:
 2021-01-01
 2021-02-01
 2021-03-01

* collect 함수를 이용해 vector로 변환한 데이터는 array functionalities가 가능하다.

In [38]:
collected_date_interval[end]

2021-03-01

In [39]:
collected_date_interval[1:2]

2-element Vector{Date}:
 2021-01-01
 2021-02-01

* 브로드캐스팅도 가능하다. (broadcast date operations)

In [40]:
collected_date_interval .+ Day(10)

3-element Vector{Date}:
 2021-01-11
 2021-02-11
 2021-03-11

In [41]:
collected_date_interval .+ Month(3) .+ Day(10)

3-element Vector{Date}:
 2021-04-11
 2021-05-11
 2021-06-11