Skip to content
首都大日本語 Twitter コーパス
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
OAuthKey.ini
README.md
init.py
public_data.txt
requirements.txt
urls.txt

README.md

首都大日本語 Twitter コーパス

Requirements

  • Python 3.4.3
  • requests 2.9.1
  • requests_oauthlib 0.6.1

上記の依存モジュールは以下でインストールできます。
pip install -r requirements.txt

Downloads

  1. このリポジトリをクローン
    git clone https://github.com/tmu-nlp/TwitterCorpus.git
  2. Twitter developersへログインし、認証キーを入手する(参考:http://hello-apis.blogspot.jp/2013/03/twitterapi.html)
  3. OAuthKey.ini内のアスタリスクを取得した認証キー4種類に書き換える
    CK: Consumer key, CS: Consumer secret, AT: Access Token, AS: Access Token Secret
  4. init.pyを実行
    python init.py

上記手順で出力されたannotated.txtがアノテーションされたツイッターコーパスです。

Notes

  • Twitter APIを利用してツイートデータを取得しているため、アカウントに鍵がかかったり、ツイートが削除されていたりしてデータサイズが変わることがあります。
You can’t perform that action at this time.