# 日付データの追加

* **このノートブックでやること**
  * ダウンロードしたイベントデータに日付を追加する
  * 3種類のイベントデータを縦結合する
* **このノートブックの前にやったこと**
  * アタポン形式、Groove形式の途中で200001位が追加されて列がズレるので、手作業で削除

## インポート

In [1]:
import glob
import re
import numpy as np
import pandas as pd
import datetime

## csv読み込み

In [2]:
input_dir = '../event_data/'

In [3]:
files = glob.glob(input_dir + '*.csv')
files

['../event_data\\Carnival形式.csv',
 '../event_data\\Groove形式.csv',
 '../event_data\\アタポン形式.csv']

In [4]:
pattern = '(?<=\\\\).+(?=.csv)'
dfs = {re.search(pattern, file).group(): pd.read_csv(file) for file in files}

In [5]:
dfs

{'Carnival形式':               イベント       1位     501位    2001位
 0  Stage Bye Stage  240,778  199,091  178,840
 1      TRUE COLORS  254,095  198,794  176,743
 2          夢をのぞいたら  286,410  226,738  210,672,
 'Groove形式':                     イベント  属性         期間         1位    2001位  10001位  20001位  \
 0                夢色ハーモニー  Vo   9日(198h)    363,877   45,587  29,979  25,984   
 1                 流れ星キセキ  Vo  10日(222h)    405,805   48,673  31,825  28,345   
 2       ゴキゲン Party Night  Da  10日(222h)    490,000   45,128  31,182  27,954   
 3                  Tulip  Vi   8日(174h)    324,148   46,600  28,139  24,625   
 4          Absolute NIne  Vo   9日(198h)    454,545   51,069  30,601  26,933   
 5              ハイファイ☆デイズ  Da   8日(174h)    380,000   40,096  27,738  24,937   
 6           生存本能 ヴァルキュリア  Vi   9日(198h)    465,440   62,279  38,005  33,722   
 7           純情Midnight伝説  Vo   8日(174h)    341,507   42,544  30,544  27,669   
 8           Love∞Destiny  Da   8日(174h)    431,697   53,567  32,

## 列揃える

In [6]:
# イベント名、属性、期間、2001位のボーダーのみ取り出す
dfs['Groove形式'] = dfs['Groove形式'].loc[:, ['イベント', '属性', '期間', '2001位']]
dfs['Groove形式']['形式'] = 'Groove'
dfs['Groove形式']

Unnamed: 0,イベント,属性,期間,2001位,形式
0,夢色ハーモニー,Vo,9日(198h),45587,Groove
1,流れ星キセキ,Vo,10日(222h),48673,Groove
2,ゴキゲン Party Night,Da,10日(222h),45128,Groove
3,Tulip,Vi,8日(174h),46600,Groove
4,Absolute NIne,Vo,9日(198h),51069,Groove
5,ハイファイ☆デイズ,Da,8日(174h),40096,Groove
6,生存本能 ヴァルキュリア,Vi,9日(198h),62279,Groove
7,純情Midnight伝説,Vo,8日(174h),42544,Groove
8,Love∞Destiny,Da,8日(174h),53567,Groove
9,サマカニ！！,Vi,9日(198h),46300,Groove


In [7]:
# イベント名、属性、期間、2001位のボーダーのみ取り出す
dfs['アタポン形式'] = dfs['アタポン形式'].loc[:, ['イベント (2015)', '期間', '2001位']].rename(columns={'イベント (2015)': 'イベント'})
dfs['アタポン形式']['形式'] = 'アタポン'
dfs['アタポン形式']

Unnamed: 0,イベント,期間,2001位,形式
0,アタシポンコツアンドロイド,11日(249h),78330,アタポン
1,Nation Blue,9日(198h),67627,アタポン
2,Orange Sapphire,7日(150h),42944,アタポン
3,Snow Wings,10日(222h),50954,アタポン
4,パステルピンクな恋,8日(174h),43854,アタポン
5,オルゴールの小箱,8日(174h),56737,アタポン
6,絶対特権主張しますっ！,8日(174h),51353,アタポン
7,つぼみ,8日(174h),47907,アタポン
8,明日また会えるよね,9日(198h),58517,アタポン
9,咲いてJewel,8日(174h),77930,アタポン


In [8]:
# イベント名と2001位のボーダーのみ取り出す
dfs['Carnival形式'] = dfs['Carnival形式'].loc[:, ['イベント', '2001位']]
# 属性はなし
dfs['Carnival形式']['形式'] = 'Carnival'
dfs['Carnival形式']

Unnamed: 0,イベント,2001位,形式
0,Stage Bye Stage,178840,Carnival
1,TRUE COLORS,176743,Carnival
2,夢をのぞいたら,210672,Carnival


## 開催日追加
イベント開始日

### Groove形式

In [9]:
# 日付の表記ゆれを修正し、日付型にする
def trans_date(date_str):
    """
    1. yyyy年mm月dd日をyyyy/m/dにする
    2. 日付型に変換
    """
    # 1
    date_str = date_str.replace('年', '/').replace('月', '/').replace('日', '')
    # 2
    year, month, day = map(int, date_str.split('/'))
    date = datetime.date(year, month, day)
    return date

# test
print(trans_date('2015年10月31日'))
print(trans_date('2015年12月4日'))
print(trans_date('2020/1/31'))
print(trans_date('2020/02/02'))

2015-10-31
2015-12-04
2020-01-31
2020-02-02


In [10]:
# 攻略wikiからコピペ
event_date = {
    '夢色ハーモニー': '2015年10月31日',
    '流れ星キセキ': '2015年12月4日',
    'ゴキゲン Party Night': '2015年12月30日',
    'Tulip': '2016年1月31日',
    'Absolute NIne': '2016年2月29日',
    'ハイファイ☆デイズ': '2016年3月31日',
    '生存本能 ヴァルキュリア': '2016年4月30日',
    '純情Midnight伝説': '2016年5月31日',
    'Love∞Destiny': '2016年6月30日',
    'サマカニ！！': '2016年7月31日',
    'BEYOND THE STARLIGHT': '2016年8月31日',
    'あいくるしい': '2016/10/31',
    '命燃やして 恋せよ乙女': '2016/12/31',
    '桜の頃': '2017/02/28',
    'Nothing but You': '2017/04/30',
    'リトルリドル': '2017/06/30',
    'イリュージョニスタ！': '2017/08/31',
    '秋風に手を振って': '2017/10/31',
    'Happy New Yeah！': '2018/01/01',
    'ツインテールの風': '2018/02/28',
    '桜の風': '2018/04/30',
    '銀のイルカと熱い風': '2018/06/30',
    'ガールズ・イン・ザ・フロンティア': '2018/08/31',
    'Starry-Go-Round': '2018/10/31',
    'Palette': '2019/01/01',
    'Fascinate': '2019/02/28',
    '無重力シャトル': '2019/04/30',
    '夏恋 -NATSU KOI-': '2019/08/01',
    'ミラーボール・ラブ': '2019/10/31',
    'Unlock Starbeat': '2020/1/31',
    'Great Journey': '2020年4月2日',
    'ほほえみDiary': '2020/05/31',
}

In [11]:
# 日付列追加
dfs['Groove形式']['日付'] = dfs['Groove形式']['イベント'].map(event_date).apply(trans_date)

In [12]:
dfs['Groove形式']

Unnamed: 0,イベント,属性,期間,2001位,形式,日付
0,夢色ハーモニー,Vo,9日(198h),45587,Groove,2015-10-31
1,流れ星キセキ,Vo,10日(222h),48673,Groove,2015-12-04
2,ゴキゲン Party Night,Da,10日(222h),45128,Groove,2015-12-30
3,Tulip,Vi,8日(174h),46600,Groove,2016-01-31
4,Absolute NIne,Vo,9日(198h),51069,Groove,2016-02-29
5,ハイファイ☆デイズ,Da,8日(174h),40096,Groove,2016-03-31
6,生存本能 ヴァルキュリア,Vi,9日(198h),62279,Groove,2016-04-30
7,純情Midnight伝説,Vo,8日(174h),42544,Groove,2016-05-31
8,Love∞Destiny,Da,8日(174h),53567,Groove,2016-06-30
9,サマカニ！！,Vi,9日(198h),46300,Groove,2016-07-31


### アタポン形式

In [13]:
# 攻略wikiからコピペ
event_date = {
    'アタシポンコツアンドロイド': '2015年9/25',
    'Nation Blue': '2015/10/19',
    'Orange Sapphire': '2015/11/20',
    'Snow Wings': '2015年12月18日',
    'パステルピンクな恋': '2016/1/20',
    'オルゴールの小箱': '2016/2月18日',
    '絶対特権主張しますっ！': '2016/3月20日',
    'つぼみ': '2016/4/19',
    '明日また会えるよね': '2016/5/19',
    '咲いてJewel': '2016/6/20',
    'きみにいっぱい☆': '2016/7/19',
    'Near to You': '2016/8/19',
    'ラブレター': '2016/09/20',
    'Jet to the Future': '2016/10/20',
    'Flip Flop': '2016/11/19',
    'あんきら!?狂騒曲': '2016/12/21',
    'Lunatic Show': '2017/1/20',
    '情熱ファンファンファーレ': '2017/2/17',
    '∀NSWER': '2017/03/21',
    'Nocturne': '2017/04/19',
    'モーレツ★世直しギルティ！': '2017/05/19',
    'Yes！ Party Time！！': '2017/06/19',
    'Kawaii make MY day！': '2017/07/20',
    '双翼の独奏歌': '2017/08/21',
    'Twin☆くるっ★テール': '2017/09/20',
    'Halloween♥Code': '2017/10/20',
    'Trinity Field': '2017/11/19',
    '冬空プレシャス': '2017/12/20',
    '美に入り彩を穿つ': '2018/01/12',
    'Frost': '2018/02/19',
    'キラッ！満開スマイル': '2018/03/20',
    'Spring Screaming': '2018/04/19',
    'HARURUNRUN': '2018/05/21',
    'エチュードは1曲だけ': '2018/06/19',
    'SUN♡FLOWER': '2018/07/19',
    'クレイジークレイジー': '2018/08/19',
    'Pretty Liar': '2018/09/19',
    'アンデッド・ダンスロック': '2018/10/19',
    'Sunshine See May': '2018/11/19',
    'Trust me': '2018/12/19',
    'スパイスパラダイス': '2019/01/21',
    'Needle Light': '2019/02/19',
    '未完成の歴史': '2019/03/20',
    'きゅん・きゅん・まっくす': '2019/04/19',
    'Max Beat': '2019/05/21',
    'TAKAMARI☆CLIMAXXX！！！！！': '2019/06/21',
    'バベル ': '2019/07/22',
    'comic cosmic': '2019/08/20',
    'ステップ＆スキップ': '2019/09/20',
    '空想探査計画': '2019/10/21',
    'Secret Daybreak': '2019/11/20',
    'ギュっとMilky Way': '2019/12/20',
    '幸せの法則 ～ルール～': '2020/01/20',
    '印象': '2020/02/18',
    '輝け！ビートシューター ': '2020/03/21',
    'Athanasia': '2020/04/20',
    '不埒なCANVAS': '2020/05/19',
    'Sing the Prologue♪': '2020/06/19',
    '太陽の絵の具箱': '2020/07/20',
    'ヒーローヴァーサスレイナンジョー': '2020/08/19',
}

In [14]:
# 日付列追加
dfs['アタポン形式']['日付'] = dfs['アタポン形式']['イベント'].map(event_date).apply(trans_date)

In [15]:
dfs['アタポン形式']

Unnamed: 0,イベント,期間,2001位,形式,日付
0,アタシポンコツアンドロイド,11日(249h),78330,アタポン,2015-09-25
1,Nation Blue,9日(198h),67627,アタポン,2015-10-19
2,Orange Sapphire,7日(150h),42944,アタポン,2015-11-20
3,Snow Wings,10日(222h),50954,アタポン,2015-12-18
4,パステルピンクな恋,8日(174h),43854,アタポン,2016-01-20
5,オルゴールの小箱,8日(174h),56737,アタポン,2016-02-18
6,絶対特権主張しますっ！,8日(174h),51353,アタポン,2016-03-20
7,つぼみ,8日(174h),47907,アタポン,2016-04-19
8,明日また会えるよね,9日(198h),58517,アタポン,2016-05-19
9,咲いてJewel,8日(174h),77930,アタポン,2016-06-20


### Carnival形式

In [16]:
# 攻略wikiからコピペ
event_date = {
    'Stage Bye Stage': '2019/07/02',
    'TRUE COLORS': '2019/08/31',
    '夢をのぞいたら': '2020/01/01',
}

In [17]:
# 日付列追加
dfs['Carnival形式']['日付'] = dfs['Carnival形式']['イベント'].map(event_date).apply(trans_date)

In [18]:
dfs['Carnival形式']

Unnamed: 0,イベント,2001位,形式,日付
0,Stage Bye Stage,178840,Carnival,2019-07-02
1,TRUE COLORS,176743,Carnival,2019-08-31
2,夢をのぞいたら,210672,Carnival,2020-01-01


## 結合

In [19]:
df = pd.concat(dfs, axis=0, ignore_index=True)

In [20]:
df

Unnamed: 0,イベント,2001位,形式,日付,属性,期間
0,Stage Bye Stage,178840,Carnival,2019-07-02,,
1,TRUE COLORS,176743,Carnival,2019-08-31,,
2,夢をのぞいたら,210672,Carnival,2020-01-01,,
3,夢色ハーモニー,45587,Groove,2015-10-31,Vo,9日(198h)
4,流れ星キセキ,48673,Groove,2015-12-04,Vo,10日(222h)
...,...,...,...,...,...,...
90,Athanasia,75775,アタポン,2020-04-20,,8日(174h)
91,不埒なCANVAS,188652,アタポン,2020-05-19,,9日(198h)
92,Sing the Prologue♪,85574,アタポン,2020-06-19,,8日(174h)
93,太陽の絵の具箱,107142,アタポン,2020-07-20,,8日(174h)


In [21]:
save_dir = '../event_data'
df.to_pickle(save_dir + '/a2_output_df.pkl')