StreamingAPIが廃止されたため使えなくなりました

Twitter Scraper

Scraping twitter content from twitter streaming API, in python3.

このレポジトリは，Marsam-Ma-zz/twitter_scraperを日本語リプライ収集用に独自改良したものです．

ChatBot，クソリプ収集目的等にご利用ください．

環境

Twitter Streaming API
Python 3.6+

使い方

Set up

Twitter API tokens を入手．
config.yml.default をコピーして config.yml を作成．
config.yml に 1. で入手した自分の tokens をそれぞれ記入．
pip install -r requirments.txt

実行

screenコマンド等を用いると便利です．

python twitter.py

corpus/ja_YYYYMMDD_HHMMSS.txtに保存されます．

また，このスクリプトは問題が発生する限り半永久的に収集しますのでご注意ください．

出力

(例)　実際には日本語

Line number	Sentences
1	誕生日おめでとう!
2	ありがとう！
3	おはようー
4	おは！

それぞれ Line number(1,2),(3,4) がそれぞれ独立した会話のペアになっており，
奇数行が発言，偶数行がそれに対する返信となっています．

フィルター

stream.filterを用いて監視を行います．

trackに指定した文字列により，指定の検索ワードでストリーミングが行えます．デフォルトでは，

track=['私','あなた','俺','ー','する','です','ます','けど','何','@', '#', '＃', '。', '，', '！','？','…', '.', '!','?', ',', ':', '：', '』', ')', '）', '...']

という適当な文字列を指定しています．

さらに自分でフィルターを改良することができます．
詳しくは公式ガイドを参照ください．

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
.gitignore		.gitignore
.python-version		.python-version
LICENSE		LICENSE
README.md		README.md
config.yml.default		config.yml.default
requirements.txt		requirements.txt
twitter.py		twitter.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.gitignore

.gitignore

.python-version

.python-version

LICENSE

LICENSE

README.md

README.md

config.yml.default

config.yml.default

requirements.txt

requirements.txt

twitter.py

twitter.py

Repository files navigation

StreamingAPIが廃止されたため使えなくなりました

Twitter Scraper

環境

使い方

Set up

実行

出力

フィルター

About

Releases

Packages

Languages

License

muemulag/twitter_scraper

Folders and files

Latest commit

History

Repository files navigation

StreamingAPIが廃止されたため使えなくなりました

Twitter Scraper

環境

使い方

Set up

実行

出力

フィルター

About

Topics

Resources

License

Stars

Watchers

Forks

Languages