## Define and Set Up

In [None]:
import pandas as pd
df = pd.read_csv('data/ETH_1h.csv')

df.head(5)

## Working with Date Times 
Dưới đây là một số method hỗ trợ làm việc với kiểu dữ liệu Date Times

In [None]:
df.dtypes

Ta chỉ quan tâm tới cột **Date**, có thể thấy nó ở đang ở dạng object - string chứ không phải kiểu dữ liệu **Date Times**. Cho nên ta phải convert về kiểu dữ liệu **Date Times** chính tắc như sau

### Convert Date Times
Do kiểu dữ liệu của cột Date đang ở dạng string, ko theo một quy tắc chuẩn, nên ta phải format string đó về Date Times theo dạng chuẩn với strftime và strptime như ở [link](https://docs.python.org/3/library/datetime.html#strftime-and-strptime-behavior) này. Mình sẽ làm ví dụ mẫu

In [None]:
df['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d %I-%p')
df

Ta thấy nó đã được chuyển đổi sang dạng chính tắc, chuỗi format hoàn toàn dựa trên cột Date gốc và tra bảng ở cái link mới viết ra được như vậy

Ngoài ra ta hoàn toàn có thể thực hiện việc này ở bước Define and Set Up như sau

In [None]:
from datetime import datetime
import pandas as pd
d_parse = lambda x: datetime.strptime(x, '%Y-%m-%d %I-%p')
df = pd.read_csv('data/ETH_1h.csv', parse_dates = ['Date'], date_parser = d_parse)

df.head(5)

### Hàm hỗ trợ xem ngày đó là thứ mấy

In [None]:
df.loc[0, 'Date'].day_name()

Cũng giống như df.str.contains, ta cũng có một số thứ để thao tác với Date Times cho một Series có kiểu dữ liệu Date Times như sau

In [None]:
df['Date'].dt.day_name()

### Tìm ngày nhỏ nhất hay cũ nhất

In [None]:
df['Date'].min()

### Tìm ngày lớn nhất hay mới nhất

In [None]:
df['Date'].max()

### Khoảng cách giữa 2 ngày

In [None]:
df['Date'].max() - df['Date'].min()

### Filter Date Times

In [None]:
df.loc[df['Date'] >= '2019']

Với column kiểu dữ liệu Date Time khi filter, số đầu tiên theo ta format nó sẽ tự hiểu là Year. Ngoài ra ta có thể truyền đầy đủ tháng ngày cho nó nếu ta muốn

In [None]:
df.loc[df['Date'] >= datetime.strptime('2019-01-01', '%Y-%m-%d')]