In [1]:
import pandas as pd
import numpy as np
from datetime import datetime
from datetime import timedelta
from dateutil.parser import parse

In [2]:
# datetime, time, calendarモジュールで時間のデータ型を使用
now = datetime.now()
now

datetime.datetime(2018, 6, 3, 23, 3, 24, 716277)

In [3]:
now.year, now.month, now.day

(2018, 6, 3)

In [4]:
# timedeltaという日時の差分を扱うdatetimeオブジェクト
# datetimeを引き算することで得られる
# timedeltaは日にちと秒数の情報しか持たない
# timedelta(日にち, 秒数)
delta = datetime(2011, 1, 7) - datetime(2008, 6, 24, 8, 15)
delta

datetime.timedelta(926, 56700)

In [5]:
# timedeltaの一部を取り出すことができる
# 下記は日にちの情報
delta.days

926

In [6]:
# 下記は秒数の情報
delta.seconds

56700

In [7]:
# datetimeにtimedeltaを加算できる
# timedelta(12)は日にちの情報をもつ
start = datetime(2011, 1, 7)
start + timedelta(12)

datetime.datetime(2011, 1, 19, 0, 0)

In [8]:
# timedeltaはこのように柔軟に計算できる
start - 2 * timedelta(12)

datetime.datetime(2010, 12, 14, 0, 0)

In [9]:
# datetimeは文字列に変換できる
stamp = datetime(2011, 1, 3)
str(stamp)

'2011-01-03 00:00:00'

In [10]:
# 文字列に変換するときに形式を指定する
stamp.strftime('%Y-%m-%d')

'2011-01-03'

In [11]:
# 文字列をdatetime型に変換できる
value = '2011-01-03'
datetime.strptime(value, '%Y-%m-%d')

datetime.datetime(2011, 1, 3, 0, 0)

In [12]:
datestrs = ['7/6/2011', '8/6/2011']
[datetime.strptime(x, '%m/%d/%Y') for x in datestrs]

[datetime.datetime(2011, 7, 6, 0, 0), datetime.datetime(2011, 8, 6, 0, 0)]

In [13]:
# dateutilでより柔軟に時間を表す文字列をパースしてdatetime型に変換できる
parse('2011-01-03')

datetime.datetime(2011, 1, 3, 0, 0)

In [14]:
# 人間が理解できる日付表現はだいたいパース出来る
parse('Jan 31, 1997 10:45 PM')

datetime.datetime(1997, 1, 31, 22, 45)

In [15]:
# 日が月より前に現れる場合はdayfirst=Trueを指定する
parse('6/12/2011', dayfirst=True)

datetime.datetime(2011, 12, 6, 0, 0)

In [16]:
datestrs

['7/6/2011', '8/6/2011']

In [17]:
# pandasのto_datetimeを使えば日付文字列の配列を簡単にパースできる
pd.to_datetime(datestrs)

DatetimeIndex(['2011-07-06', '2011-08-06'], dtype='datetime64[ns]', freq=None)

In [18]:
# 欠損値があってもパースできる
idx = pd.to_datetime(datestrs + [None])
idx

DatetimeIndex(['2011-07-06', '2011-08-06', 'NaT'], dtype='datetime64[ns]', freq=None)

In [19]:
idx[2]

NaT

In [20]:
pd.isnull(idx)

array([False, False,  True], dtype=bool)