# Jupyter環境の準備

JupyterからSupersetなどの他のコンテナへの操作を行えるようにDockerをインストールしておきます。Jupyter上でdockerコマンドを実行するために/var/run/docker.sockのボリュームマウントが必要ですが、これはコンテナ起動時に使うdocker-compose.ymlに記述済みです。

本Jupyterコンテナ[niicloudoperation/notebook](https://hub.docker.com/r/niicloudoperation/notebook/)は[Dockerfile](https://github.com/NII-cloud-operation/Jupyter-LC_docker/blob/master/Dockerfile)を確認すると分かるようにdebian:jessieベースなので[公式ドキュメント：debianへのインストール方法](https://docs.docker.com/engine/installation/linux/docker-ce/debian/#install-using-the-repository)の手順を用います。

In [None]:
!sudo sed -i '$a\deb http://cdn-fastly.deb.debian.org/debian jessie-backports main' /etc/apt/sources.list
!sudo apt-get update && sudo apt-get upgrade -y && \
sudo apt-get install -y apt-transport-https ca-certificates curl gnupg2 software-properties-common && \
sudo apt-get install -y -t jessie-backports postgresql-client-9.6

In [None]:
!curl -fsSL https://download.docker.com/linux/debian/gpg | sudo apt-key add -
!sudo add-apt-repository "deb [arch=amd64] https://download.docker.com/linux/debian $(lsb_release -cs) stable"
!sudo apt-get update && sudo apt-get install -y docker-ce

dockerコマンドの動作確認を行います。
psで起動しているコンテナを確認すると、このJupyterの他に、Supersetとその動作に必要なRedis、PostgreSQLのコンテナが起動していて、
合計4つのコンテナが動作中であることが確認できます。

In [None]:
!sudo docker -v
!sudo docker ps -a

# Supersetの初期化

Supersetを使うためには、管理ユーザを作成するなどの初期化が必要です。dockerコマンド経由で、Supersetコンテナに、初期化スクリプトを実行させます。この時、引数として、管理ユーザ作成のための情報を渡します。必要なら、usernameやpasswordを修正して、実行してください。

この初期化を行うとSupersetにアクセスし管理ユーザでログインできるようになります。コンテナの動いているサーバの8088番ポートにwebブラウザでアクセスし、確認してください。

In [None]:
!sudo docker exec superset superset-init \
--username admin --firstname admin --lastname user --email admin@fab.org --password password

# Supersetのevaluation-tracer化

evaluation-tracerの中にはメテオラが入っていなければなりません。cssを改変して、メテオラを入れます。

Supersetにアクセスし、webブラウザの開発者機能を使って、stylesheetの適用状況を確認してみたところ、/static/assets/dist/theme.09939b5e6e0a613c0653.cssの7481行から記述されているbodyセクションに背景画像を設定することができそうだと分かりました。
このpathがSupersetコンテナ内のどこのディレクトリになるのか分かれば、改変できることになります。

このコンテナを作った[Dockerfile](https://github.com/mnagaku/superset/blob/master/Dockerfile)を確認すると、supersetはpipでインストールされていることが分かるので、pipでインストールされたモジュールがどこのディレクトリに置かれるのかが分かれば良いことになります。

グーグル先生に質問しながらコンテナ内を探ってみると、/usr/local/lib/python3.6/site-packages/superset/static/assets/dist/theme.09939b5e6e0a613c0653.cssを見つけることができました。

このcssに背景画像を設定する行を追記します。

貼り込む画像は、同じディレクトリの「bg.jpg」を指定しています。もし、別の形式の画像ファイルを貼り込みたい場合は、適切な拡張子を指定するようにしてください。

In [None]:
!sudo docker exec superset sed -i '7482a\  background-image: url("bg.jpg");' /usr/local/lib/python3.6/site-packages/superset/static/assets/dist/theme.09939b5e6e0a613c0653.css

wgetを使って、貼り込む画像をSupersetのコンテナ内にダウンロードします。ダウンロードする画像のURL指定は、お好みに合わせて変更してください。jpg以外の画像形式にしたい場合も、保存先の名前の拡張子を変更してください。

In [None]:
!sudo docker exec superset wget https://img.animatetimes.com/news/visual/2017/1499070324_1_7_fe618586985b5ddc3b8da42e58b81d2e.jpg -O /usr/local/lib/python3.6/site-packages/superset/static/assets/dist/bg.jpg

# データの準備

承認力の観測のためTwitterのデータをPostgreSQLに投入します。20分ほど時間がかかります。

In [None]:
!sudo $CONDA3_DIR/bin/conda install --quiet --yes sqlalchemy psycopg2 requests beautifulsoup4

In [None]:
import sys
import re
import datetime
import sqlalchemy as sa
import requests
from bs4 import BeautifulSoup

print("start : ", datetime.datetime.now())

repatter = re.compile(r"[0-9]+")

engine = sa.create_engine('postgres://superset:superset@postgres/superset')
engine.execute('DROP TABLE evaluation')
engine.execute('CREATE TABLE evaluation (tw_id VARCHAR(30), keyword VARCHAR(30), day TIMESTAMP, PRIMARY KEY (tw_id, keyword))')
ins = "INSERT INTO evaluation (tw_id, keyword, day) VALUES (%s, %s, %s) ON CONFLICT DO NOTHING"

keywords = [{'name':'セレジア・ユピティリア', 'words':['セレジア', 'フォーゲルシュバリエ', 'リベリオン']},
            {'name':'メテオラ・エスターライヒ', 'words':['メテオラ', 'めっちん', 'アヴァルケン', 'イヴァリュエーション・トレーサー', '万理']},
            {'name':'鹿屋瑠偉', 'words':['鹿屋', '瑠偉', 'モノマギア', 'ギガスマキナ']},
            {'name':'弥勒寺優夜', 'words':['弥勒寺', '優夜', '板額', 'カマキリメガネ', '荒塵', 'Arajin', '黒那岐丸', '閉鎖区', 'underground', 'アンダーグラウンド']},
            {'name':'星河ひかゆ', 'words':['星河', 'ひかゆ', 'ミルキーウェイ', 'エクストリームファイナルレジェンドマーシャルアーティスト']},
            {'name':'アルタイル', 'words':['アルタイル', '軍服の姫君', 'シリウス', 'メガロスフィア', 'シロツメクサ', '森羅万象', 'ホロプシコン']},
            {'name':'アリステリア・フェブラリィ', 'words':['アリステリア', 'アリスちゃん', 'ウルターシュタイン', 'ベルリヒンゲン', 'グルファクシ']},
            {'name':'煌樹まみか', 'words':['煌樹', 'まみか', 'マジカルスレイヤー', 'スプラッシュ', 'フレアー']},
            {'name':'ブリッツ・トーカー', 'words':['ブリッツ', 'エリナ', 'コードバビロン', 'code babylon', '重力弾']},
            {'name':'白亜翔', 'words':['白亜', '翔', 'バイヤール', '三節棍', '閉鎖区', 'underground', 'アンダーグラウンド']},
            {'name':'カロン・セイガ', 'words':['カロン']},
            {'name':'築城院真鍳', 'words':['築城院', '真鍳', 'まがねちゃん', '夜窓鬼録', '言葉無限欺', 'それはくるりと']}
            ]

date_range = [' since:2017-04-01 until:2017-09-23']

for dr in date_range:
    print(dr)
    for c in keywords:
        print(c['name'])
        for k in c['words']:
            print(k)
            url = "https://mobile.twitter.com/search?q=レクリエイターズ " + k + dr
            try:
                while len(url) > 0:
                    sys.stdout.write('.')
                    resp = requests.get(url)
                    soup = BeautifulSoup(resp.text, "html.parser")
                    tw_items = soup.find_all("td", attrs={"class": "timestamp"})
                    for t in tw_items:
                        item_a = t.find("a")
                        md = repatter.findall(item_a.string)
                        if len(md) == 1:
                            md2 = datetime.datetime.now() + datetime.timedelta(hours=-(int(md[0])))
                            md[0] = md2.strftime('%m')
                            md.append(md2.strftime('%d'))
                        engine.execute(ins, item_a['name'], c['name'], md[0]+"/"+md[1]+"/2017")
                    next_div = soup.find("div", attrs={"class": "w-button-more"})
                    if next_div != None:
                        next_a = next_div.find("a")
                        next_url = next_a['href']
                        url = "https://mobile.twitter.com" + next_url
                    else:
                        url = ""
                print("")
            except:
                print("")
                print("except catch")
                print("url = " + url)
                print("tw_id = " + item_a['name'])
                print("name = " + c['name'])
                print("word = " + k)
                print("str = " + item_a.string)
                print("md = ", md)
                print("day = " + md[0]+"/"+md[1]+"/2017")
                raise

print("finish : ", datetime.datetime.now())


# New heading

# ダッシュボードの作成