Skip to content

doragon/python-scraping

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

概要

ポケモンカードゲーム サン&ムーン Wiki からスクレイピングするスクリプト。

上記wikiにてリンク切れとなっている個所に関しては、当然ですが失敗します。
また、リンク先がカード情報でなく、ゲーム情報になっているケースが見つかりました。その場合も取得はできません。

出力失敗例: SM5+:ポケモンカードゲーム サン&ムーン 強化拡張パック ウルトラフォース
リオルのリンクがカードではなくゲームとなっているため、失敗します。

029/050,ポケモン,闘,リオル,- の取得に失敗しました。

CSV形式のテキストファイルへ出力

python .\src\scraping.py

結果の抜粋

ファイルはoutput下に出力される。

output/csv/xxx_csv.txt

110/150,ポケモン,無,タイプ:ヌル,-
111/150,ポケモン,無,シルヴァディGX,RR
112/150,トレーナーズ,グッズ,エネくじ,-
121/150,トレーナーズ,ポケモンのどうぐ,ウォーターメモリ,-
128/150,トレーナーズ,サポート,アセロラ,-
145/150,トレーナーズ,スタジアム,ワンダーラビリンス◇,PR
146/150,エネルギー,無,カウンターエネルギー,-
151/150,トレーナーズ,サポート,エーテル財団職員,SR
161/150,ポケモン,草,ストライク,S
250/150,ポケモン,竜,ウルトラネクロズマGX,UR

output/detail/xxx_detail.txt

{'no': ['No.010'], 'name': ['キャタピー(C)'], '種類': ['たねポケモン'], 'HP': ['50'], '色': ['草'], 'ワザ1': ['ひとやすみ', '無', '', 'このポケモンのHPを「20」回復する。'], 'ワザ2': ['かじる', '無無', '20', ''], 'にげるコスト': ['-無'], '弱点': ['炎×2'], '抵抗力': ['なし'], 'イラスト': ['KanakoEo'], 'シリーズ': ['コレクションサン'], 'レアリティ': ['C(●)'], 'コレクションナンバー': ['001/060']}
{'no': ['No.011'], 'name': ['トランセル(C)'], '種類': ['1進化ポケモン'], '進化': ['キャタピーから進化'], 'HP': ['80'], '色': ['草'], 'ワザ1': ['てっぺき', '無', '', 'コインを1回投げオモテなら、次の相手の番、このポケモンはワザのダメージを受けない。'], 'ワザ2': ['むしくい', '無無無', '40', ''], 'にげるコスト': ['-無無無'], '弱点': ['炎×2'], '抵抗力': ['なし'], 'イラスト': ['YukaMorii'], 'シリーズ': ['コレクションサン'], 'レアリティ': ['C(●)'], 'コレクションナンバー': ['002/060']}
{'no': ['No.012'], 'name': ['バタフリー(C)'], '種類': ['2進化ポケモン'], '進化': ['トランセルから進化'], 'HP': ['130'], '色': ['草'], 'ワザ1': ['ねんりき', '無', '30', 'コインを1回投げオモテなら、相手のバトルポケモンをマヒにする。'], 'ワザ2': ['ふきとばし', '無無無', '80', '相手のバトルポケモンをベンチポケモンと入れ替える。[バトル場に出すポケモンは相手が選ぶ。]'], 'にげるコスト': ['-無'], '弱点': ['炎×2'], '抵抗力': ['なし'], 'イラスト': ['chibi'], 'シリーズ': ['コレクションサン'], 'レアリティ': ['U(◆)'], 'コレクションナンバー': ['003/060']}

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages