# Lec6-DataAnalysis_Date

## 目錄
1. 數據前處理
2. 獲取特定時間資料
    1. 按年度獲取
    2. 按月份獲取資料
    3. 按日獲取資料
    4. 獲取某個時段之前/之後資料
3. 以日期做統計資料
    1. 按週計算
    2. 按月計算
    3. 按季計算
    4. 按年計算

## 0. 建立DataFrame(Series)

In [1]:
import pandas as pd
import numpy as np

df = pd.read_csv('Data.csv')
df.columns = ['date', 'number']

## 1. 數據前處理

In [2]:
df['date'] = pd.to_datetime(df['date']) # 必須為datetime
df = df.set_index('date') # 並將datetime欄位設為index

## 2. 獲取特定時間資料

### 2.A 按年度獲取 

In [3]:
print('---------獲取2017年數據-----------')
print(df['2017'].head(2))
print('-------獲取2016-2017年數據-------')
print(df['2016':'2017'].head(2))

---------獲取2017年數據-----------
            number
date              
2017-06-06      59
2017-08-17      99
-------獲取2016-2017年數據-------
            number
date              
2016-11-29      38
2017-06-06      59


### 2.B 按月份獲取

In [4]:
print('---------獲取11月資料-----------')
print(df['2017-11'])
print('-------獲取10~11月資料-----------')
print(df['2017-10':'2017-11'])

---------獲取11月資料-----------
            number
date              
2017-11-24      51
2017-11-04      80
2017-11-28      58
-------獲取10~11月資料-----------
            number
date              
2017-10-16      94
2017-11-24      51
2017-10-07      90
2017-11-04      80
2017-11-28      58
2017-10-07      90
2017-10-21      30
2017-10-18      88
2017-10-20       5
2017-10-25      44
2017-10-30       3


### 2.C 按日獲取

In [5]:
print('---------獲取11/3資料-----------')
print(df['2017-11-3'])
print('-------獲取11/3~11/5資料-----------')
print(df['2017-11-3':'2017-11-5'])

---------獲取11/3資料-----------
Empty DataFrame
Columns: [number]
Index: []
-------獲取11/3~11/5資料-----------
            number
date              
2017-11-04      80


### 2.D 獲取某個時段之前/之後

In [6]:
df_sort = df.sort_index() # index一定要先排序!
print('---------獲取某個時段之前/之後資料-----------')
print('--------after------------')
print(df_sort.truncate(after = '2001-04'))
print('--------before------------')
print(df_sort.truncate(before = '2017-12'))

---------獲取某個時段之前/之後資料-----------
--------after------------
            number
date              
2001-03-05      48
2001-03-16      85
--------before------------
            number
date              
2017-12-04      22
2017-12-09      77
2017-12-28      75
2017-12-29      16


## 3. 以日期做統計資料

### 3.A 按週計算

In [7]:
print(df.resample('w').sum().head(2))
print('----顯示幾日到幾日')
print(df.resample('w').sum().to_period('w').head(2))

            number
date              
2001-03-11      48
2001-03-18      85
----顯示幾日到幾日
                       number
date                         
2001-03-05/2001-03-11      48
2001-03-12/2001-03-18      85


### 3.B 按月計算

In [8]:
print('------日期以月初顯示------')
print(df.resample('MS').sum().head(2))
print('------日期以月底顯示------')
print(df.resample('M').sum().head(2))
print('------日期顯示至月份------')
print(df.resample('M').sum().to_period('M').head(2))

------日期以月初顯示------
            number
date              
2001-03-01     133
2001-04-01     435
------日期以月底顯示------
            number
date              
2001-03-31     133
2001-04-30     435
------日期顯示至月份------
         number
date           
2001-03     133
2001-04     435


### 3.C 按季計算

In [9]:
print('------日期以季初顯示------')
print(df.resample('QS').sum().head(2))
print('------日期以季末顯示------')
print(df.resample('Q').sum().head(2))
print('------日期顯示至季------')
print(df.resample('Q').sum().to_period('Q').head(2))

------日期以季初顯示------
            number
date              
2001-01-01     133
2001-04-01    1361
------日期以季末顯示------
            number
date              
2001-03-31     133
2001-06-30    1361
------日期顯示至季------
        number
date          
2001Q1     133
2001Q2    1361


### 3.D 按年計算

In [10]:
print('------日期以年初顯示------')
print(df.resample('AS').sum().head(2))
print('------日期以年末顯示------')
print(df.resample('A').sum().head(2))
print('------日期顯示至年份------')
print(df.resample('A').sum().to_period('A').head(2))

------日期以年初顯示------
            number
date              
2001-01-01    3375
2002-01-01    3153
------日期以年末顯示------
            number
date              
2001-12-31    3375
2002-12-31    3153
------日期顯示至年份------
      number
date        
2001    3375
2002    3153
