# 開始實驗

我們以較小型的設定做為例子，模擬2018/7/1上午前6小時10000名觀眾的收視行為。以下為方便起見只保留出現密度較高的觀眾數據呈現；同時詳細的實驗產生程式碼定義於*exp*套件中。

In [1]:
from exp import Audience, Experiment
import datetime

myExp = Experiment(
    id = 1, 
    audNum = 10000, 
    startTime = datetime.datetime(2018, 7, 1, 2, 0), 
    endTime = datetime.datetime(2018, 7, 1, 8, 0)
)
myExp.startExp()

# 結果分析

我們選取資料密度(收視時間)較多的前100名觀眾作為分析資料來源。表格中的數據即代表當下該觀眾正在觀看的頻道。

In [12]:
import pandas as pd

channels = []
for aud in myExp.audiences:
    channels.append(list(aud.getRec().values()))
    if len(channels) > 100: break

index = {}
for idx, t in enumerate(list(myExp.audiences[0].getRec().keys())):
    index[idx] = t.strftime("%Y-%m-%d %H:%M:%S")
        
cTable = pd.DataFrame(channels).transpose()
cTable.rename(index=index, inplace=True)
cTable

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,91,92,93,94,95,96,97,98,99,100
2018-07-01 02:00:00,900,79,911,91,313,69,8,67,40,80,...,77,69,310,68,310,37,69,64,89,63
2018-07-01 02:15:00,312,32,55,57,80,68,66,68,77,69,...,50,37,69,312,42,900,65,57,62,63
2018-07-01 02:30:00,55,66,58,77,900,78,8,54,900,68,...,62,69,77,61,8,8,69,61,64,312
2018-07-01 02:45:00,94,94,94,76,52,94,94,94,94,94,...,94,94,246,50,94,94,94,94,94,69
2018-07-01 03:00:00,69,77,65,313,911,64,310,69,313,57,...,77,911,79,89,50,54,66,61,68,69
2018-07-01 03:15:00,911,313,66,64,311,66,54,66,70,71,...,65,62,69,77,49,56,71,65,57,66
2018-07-01 03:30:00,69,313,32,57,9,69,69,55,57,61,...,313,68,70,313,313,62,79,54,65,55
2018-07-01 03:45:00,77,65,298,69,52,77,53,53,55,65,...,49,57,313,76,65,53,900,68,9,69
2018-07-01 04:00:00,62,78,55,900,900,8,65,9,911,58,...,79,61,62,61,63,55,67,68,79,69
2018-07-01 04:15:00,64,76,66,62,65,65,66,78,72,65,...,76,911,51,62,900,61,76,67,9,55


我們可以利用凱擘所提供的API將頻道號碼轉換為其名稱，方便進行下一步觀察。

In [19]:
import requests

channelMapper = {}
res = requests.get("http://175.98.115.29/hkton/chdata.php").json()["data"]
for r in res:
    channelMapper[r["ch"]] = r["cn"]
    
for col in cTable.columns:
    cTable[col].replace(channelMapper, inplace=True)

cTable

Unnamed: 0,0,1,2,3,4,5,6,7,8,9,...,91,92,93,94,95,96,97,98,99,100
2018-07-01 02:00:00,900,FOX HD,911,中華財經台,Arirang TV,FOX MOVIES HD,台視HD,AXN HD,東森戲劇台HD,JET綜合台HD,...,緯來日本台HD,FOX MOVIES HD,彭博財經頻道,好萊塢電影台,彭博財經頻道,東風衛視台HD,FOX MOVIES HD,LS龍祥電影台,三立iNEWS HD,緯來電影台
2018-07-01 02:15:00,BBC世界新聞台,東森綜合台HD,TVBS新聞台HD,東森財經新聞HD,JET綜合台HD,好萊塢電影台,東森洋片台HD,好萊塢電影台,緯來日本台HD,FOX MOVIES HD,...,年代新聞HD,東風衛視台HD,FOX MOVIES HD,BBC世界新聞台,TVBS歡樂台HD,900,HBO,東森財經新聞HD,東森電影台HD,緯來電影台
2018-07-01 02:30:00,TVBS新聞台HD,東森洋片台HD,非凡新聞HD,緯來日本台HD,900,國興衛視HD,台視HD,三立新聞HD,900,好萊塢電影台,...,東森電影台HD,FOX MOVIES HD,緯來日本台HD,衛視電影台HD,台視HD,台視HD,FOX MOVIES HD,衛視電影台HD,LS龍祥電影台,BBC世界新聞台
2018-07-01 02:45:00,誠心電視台HD,誠心電視台HD,誠心電視台HD,Win 綜合台HD,中天新聞HD,誠心電視台HD,誠心電視台HD,誠心電視台HD,誠心電視台HD,誠心電視台HD,...,誠心電視台HD,誠心電視台HD,博斯電玩台,年代新聞HD,誠心電視台HD,誠心電視台HD,誠心電視台HD,誠心電視台HD,誠心電視台HD,FOX MOVIES HD
2018-07-01 03:00:00,FOX MOVIES HD,緯來日本台HD,HBO,Arirang TV,911,LS龍祥電影台,彭博財經頻道,FOX MOVIES HD,Arirang TV,東森財經新聞HD,...,緯來日本台HD,911,FOX HD,三立iNEWS HD,年代新聞HD,三立新聞HD,東森洋片台HD,衛視電影台HD,好萊塢電影台,FOX MOVIES HD
2018-07-01 03:15:00,911,Arirang TV,東森洋片台HD,LS龍祥電影台,CNBC Asia,東森洋片台HD,三立新聞HD,東森洋片台HD,CINEMAX HD,緯來育樂台,...,HBO,東森電影台HD,FOX MOVIES HD,緯來日本台HD,壹電視新聞,TVBS HD,緯來育樂台,HBO,東森財經新聞HD,東森洋片台HD
2018-07-01 03:30:00,FOX MOVIES HD,Arirang TV,東森綜合台HD,東森財經新聞HD,大愛HD,FOX MOVIES HD,FOX MOVIES HD,TVBS新聞台HD,東森財經新聞HD,衛視電影台HD,...,Arirang TV,好萊塢電影台,CINEMAX HD,Arirang TV,Arirang TV,東森電影台HD,FOX HD,三立新聞HD,HBO,TVBS新聞台HD
2018-07-01 03:45:00,緯來日本台HD,HBO,好消息2台HD,FOX MOVIES HD,中天新聞HD,緯來日本台HD,民視新聞台HD,民視新聞台HD,TVBS新聞台HD,HBO,...,壹電視新聞,東森財經新聞HD,Arirang TV,Win 綜合台HD,HBO,民視新聞台HD,900,好萊塢電影台,大愛HD,FOX MOVIES HD
2018-07-01 04:00:00,東森電影台HD,國興衛視HD,TVBS新聞台HD,900,900,台視HD,HBO,大愛HD,911,非凡新聞HD,...,FOX HD,衛視電影台HD,東森電影台HD,衛視電影台HD,緯來電影台,TVBS新聞台HD,AXN HD,好萊塢電影台,FOX HD,FOX MOVIES HD
2018-07-01 04:15:00,LS龍祥電影台,Win 綜合台HD,東森洋片台HD,東森電影台HD,HBO,HBO,東森洋片台HD,國興衛視HD,緯來體育台HD,HBO,...,Win 綜合台HD,911,東森新聞HD,東森電影台HD,900,衛視電影台HD,Win 綜合台HD,AXN HD,大愛HD,TVBS新聞台HD


我們亦可以隨機選擇一個觀眾作為分析對象，更進一步觀察其所觀看的節目為何，並配合資策會的社群聲量API進行交叉比對。

In [54]:
from data import Channel, Show, session

audShow = []
sampleRec = myExp.audiences[0].getRec()
for rec in sampleRec:
    shs = pd.read_sql(session.query(Show.dt, Show.tm, Show.dur, Show.p).filter(Show.channel == sampleRec[rec]).filter(Show.dt == rec.strftime("%Y%m%d")).statement, session.bind)
    columns = Show.mapToColNames(list(shs.columns))
    shs.columns = columns

    start = []
    for dt in zip(shs["startDate"], shs["startTime"]):
        d = "{0} {1}".format(dt[0], dt[1])
        start.append(datetime.datetime.strptime(d, "%Y%m%d %H%M%S"))

    del shs["startDate"]
    del shs["startTime"]
    shs["start"] = start
    if len(list(shs[shs["start"] < rec]["showName"])) == 0: audShow.append("")
    else: audShow.append(list(shs[shs["start"] < rec]["showName"])[0])
        
audDf = pd.DataFrame([list(cTable[0]), audShow]).transpose()
audDf.rename(index=index, inplace=True)
audDf

Unnamed: 0,0,1
2018-07-01 02:00:00,900,
2018-07-01 02:15:00,BBC世界新聞台,BBC World News
2018-07-01 02:30:00,TVBS新聞台HD,十點熱話題
2018-07-01 02:45:00,誠心電視台HD,誠心來作伙
2018-07-01 03:00:00,FOX MOVIES HD,即刻救援2
2018-07-01 03:15:00,911,
2018-07-01 03:30:00,FOX MOVIES HD,即刻救援2
2018-07-01 03:45:00,緯來日本台HD,移居世界秘境日本人好吃驚
2018-07-01 04:00:00,東森電影台HD,特工爺爺
2018-07-01 04:15:00,LS龍祥電影台,出水芙蓉


搭配繪圖工具，則可以更進一步將模擬的結果繪出。以下我們以本次實驗時段的頻道熱門程度為例，可以方便觀察各個頻道收視人數在該次模擬下的變化情形。

In [85]:
import matplotlib.pyplot as plt
%matplotlib notebook

cDict = dict()
cList = cTable.values.tolist()
for c in cList:
    for cc in c:
        cDict[cc] = []
        
for idx, c in enumerate(cList):
    for cc in c:
        if len(cDict[cc]) != idx + 1:
            cDict[cc].append(1)
        else:
            cDict[cc][idx] += 1
    for cD in cDict:
        if len(cDict[cD]) != idx +1:
            cDict[cD].append(0)

for cD in cDict:
    try: plt.plot(list(range(24)), cDict[cD], label=next(key for key, value in channelMapper.items() if value == cD))
    except: plt.plot(list(range(24)), cDict[cD], label=cD)

plt.xlabel("Time")
plt.ylabel("Number of people watching")
plt.legend()
plt.grid(True)
plt.plot()

<IPython.core.display.Javascript object>

[]