In [2]:
import sys, os,re, time
import urllib.request as req
import urllib.parse as parse
import json

PHOTOZOU_API = "http://api.photozou.jp/rest/search_public.json"
CACHE_DIR = "./image/cache"

def search_photo(keyword,offset=0,limit=100):
    keyword_enc = parse.quote_plus(keyword)
    q = "keyword={0}&offset={1}&limit={2}".format(keyword_enc,offset,limit)
    url = PHOTOZOU_API + "?" + q
    if not os.path.exists(CACHE_DIR):
        os.makedirs(CACHE_DIR)
    cache = CACHE_DIR + "/" +re.sub(r'[^a-zA-Z0-9\%\#]+','_',url)
    if os.path.exists(cache):
        return json.load(open(cache,"r",encoding="utf-8"))
    print("[API] " + url)
    req.urlretrieve(url,cache)
    time.sleep(1)
    return json.load(open(cache,"r",encoding="utf-8"))

In [3]:
def download_thumb(info,save_dir):
    if not os.path.exists(save_dir): os.makedirs(save_dir)
    if info is None: return
    if not "photo" in info["info"]:
        print("[ERROR] broken info")
        return
    photolist = info["info"]["photo"]
    for photo in photolist:
        title = photo["photo_title"]
        photo_id = photo["photo_id"]
        url = photo["thumbnail_image_url"]
        path = save_dir+"/"+str(photo_id)+"_thumb.jpg"
        if os.path.exists(path) : continue
        try :
            print("[download]",title,photo_id)
            req.urlretrieve(url,path)
            time.sleep(1)
        except Exception as e:
            print("[Error] failed to download url=",url)


In [4]:
def download_all(keyword,save_dir,maxphoto = 1000):
    offset = 0
    limit = 100
    while True:
        info = search_photo(keyword,offset=offset,limit=limit)
        if info is None:
            print("[Error] no result")
            return
        if (not "info" in info) or (not "photo_num" in info["info"]):
            print("[Error] broken data")
            return
        photo_num = info["info"]["photo_num"]
        if photo_num ==0:
            print("photo_num = 0, offset =",offset)
            return 
        
        print("*** download offset=",offset)
        download_thumb(info,save_dir)
        offset += limit
        if offset >= maxphoto:break

In [5]:
if __name__ == '__main__':
    #download_all("牛丼","./image/gydon")

[API] http://api.photozou.jp/rest/search_public.json?keyword=%E7%89%9B%E4%B8%BC&offset=0&limit=100
*** download offset= 0
[download] 吉野家牛丼 244958138
[download] 牛丼トン汁セット（すき家） 244954381
[download] 牛肉 244894862
[download] 肉 244894858
[download] 満州にらラーメン（醤油）＠さかえや本店・花巻市 244894034
[download] 牛丼(すき家→吉野家→松屋)3杯目途中 244876834
[download] 170119 244858335
[download] 豚肉 244695195
[download] 野菜 244695193
[download] 豚汁 244695191
[download] 丼 244596032
[download] 断面 244596031
[download] 唐揚 244596030
[download] 薬味 244596027
[download] 薬味 244596026
[download] 丼 244568457
[download] 丼 244568455
[download] 牛丼と伊勢うどんのセット＠... 244546181
[download] すき家のとろ～り3種のチーズ牛丼♪ 244393142
[download] 20161226「牛丼」399円 244311704
[download] 吉野家の牛丼 244293316
[download] 牛丼弁当 244286923
[download] すき家にて、牛丼とん汁たまごセット大盛♪ 244109968
[download] すき家にて、牛丼とん汁たまごセット大盛♪ 244109959
[download] 20150327「牛丼 アタマの大盛(つゆだくだく)」480円と、「生野菜サラダ」100円＋「みそ汁」60円がセットになった「A(生野菜サラダ)セット」130円に「ポテト」30円と追加…計640円 244054163
[download] DSCN2023 244031327
[download] 牛丼と飲

[download] すき家 上越高土店 高菜明太マヨ牛丼（中盛） 盛り付けの様子 236544739
[download] すき家 上越高土店 高菜明太マヨ牛丼（中盛） 断面図 236544566
[download] すき家 上越高土店 高菜明太マヨ牛丼（中盛） 器の様子 236544465
[download] すき家 上越高土店 高菜明太マヨ牛丼（中盛）￥590 236544458
[download] すき家 上越高土店 高菜明太マヨ牛丼（中盛） アップ 236544452
[download] すき家 上越高土店 牛丼（中盛り、テイクアウト）￥470 235989103
[download] すき家 上越高土店 牛丼（中盛り、テイクアウト）＆にんにく増し増し増し増し 断面図 235988995
[download] すき家 上越高土店 牛丼（中盛り、テイクアウト）＆にんにく増し増し増し増し 235988987
[download] すき家 上越高土店 牛丼（中盛り、テイクアウト） 器の様子 235988972
[download] すき家 上越高土店 牛丼（中盛り、テイクアウト） パッケージ 235988967
[download] 20160429 牛丼とん汁おしんこセット 235961782
[download] 20160423「牛めし(並)(汁だくだく)」290円＋「ポテト」50円…計340円 235732169
[download] 丼 235699956
[API] http://api.photozou.jp/rest/search_public.json?keyword=%E7%89%9B%E4%B8%BC&offset=200&limit=100
*** download offset= 200
[download] 丼と汁 235699953
[download] 野菜 235699949
[download] 牛丼弁当　22Apr.Fri. 235699685
[download] 鴨つけそば＆牛丼 235609118
[download] やっぱ朝は牛丼でしょ(^O^) 235547085
[download] すき家にて、牛丼とん汁たまごセット♪ 235497897
[download] お昼ご飯は道の駅あぐりーむで牛丼。赤城牛

[download] 今年33杯目は【幸楽苑】で... 219349213
[download] 吉野家の牛丼★つゆダクダク... 219310273
[download] 150302 219265963
[download] ここに牛丼アタマの大盛りネギだくチーズ乗せと牛皿特盛があるじゃろ？ 219118598
[download] 淡路島牛丼＠ホテルニューア... 219106853
[download] 昨日、すき焼きラーメン食べ... 219101956
[download] 週末パラダイスヘヴン前昼飯... 219088462
[download] 写真は名古屋コーチン食... 219037889
[download] 夜中の牛丼うめぇ!! 219035328
[download] 昨日、某所のご主人様たちと... 219006363
[download] たまには牛肉を食え(´▼ω... 218925672
[download] 牛丼弁当 Box lunch "Gudon bento“ mined beef meat stewed with soysource on rice . 218798384
[download] 久々にがっつり服と靴買っ(... 218797174
[download] たんす屋創業祭@日本橋プラ... 218751371
[download] 吉野家の牛丼を旨いという人... 218744777
[download] 牛丼!!デカい方キングやで... 218728574
[download] ２月１７日夕食(牛丼風煮) #病院食 218685470
[download] 昼食は吉野家の牛丼並盛り... 218676154
[download] きつねや（築地市場、場外） 218623709
[API] http://api.photozou.jp/rest/search_public.json?keyword=%E7%89%9B%E4%B8%BC&offset=400&limit=100
*** download offset= 400
[download] お昼はボクが２０年来通って... 218535101
[download] サタデーパラダイスヘヴン昼... 218516414
[download] バスの時間かんち

[download] はいっ(^-^ゞ 歌舞伎町... 212266980
[download] 今日の朝ごはんは吉野家で、... 212073432
[download] 今日の昼食は秋葉原の牛丼専... 212054012
[download] 牛丼買いました。 212039521
[download] 地下の牛丼屋松じゃなくって... 212032239
[download] P9190390 牛丼￥1,620は高すぎる 212014718
[download] #代々木 駅前の『牛丼太郎... 211989585
[download] ギガ盛り牛丼Ｏ(≧∇≦)Ｏ 211960397
[download] 夜ご飯は、秋葉原岡むら屋に... 211936397
[download] 松屋プレミアム牛丼。  味... 211925612
[API] http://api.photozou.jp/rest/search_public.json?keyword=%E7%89%9B%E4%B8%BC&offset=600&limit=100
*** download offset= 600
[download] すき家モバイルニュース... 211912604
[download] 牛丼じゃないよ！ でも、... 211840041
[download] 昼飯！ねぎたま牛丼＠吉野家！ 211699311
[download] マイコも昨日のダイゴと同じ... 211621664
[download] おぼん・こぼん… 211609331
[download] 牛丼大盛り 吉野家 211540121
[download] お昼ご飯～牛丼食べる 211539902
[download] 要するに１人勤務？ 211538286
[download] おはようございます。 今... 211530021
[download] 最近、吉野家のクオリティに... 211507984
[download] 友達が食った牛丼、紅生姜乗... 211493388
[download] 昼飯ﾍﾞｯﾃｨﾝｸﾞ 第二問正解 牛丼? 211492056
[download] 昼飯ﾍﾞｯﾃｨﾝｸﾞ 第二問正解 牛丼? 211492047
[download] すき家モバイルニュース... 21148

[download] 帰宅。夕食の牛丼に金箔を散... 206095102
[download] 牛丼 206093387
[download] 今日も昼食はすき家で牛丼(... 206027002
[download] きつねや（築地市場、場外） 206020045
[download] きつねや（築地市場、場外） 206020033
[download] すき家なう。チーズ牛丼のチ... 206015505
[download] 吉野家 牛丼 アタマの大盛... 206006966
[API] http://api.photozou.jp/rest/search_public.json?keyword=%E7%89%9B%E4%B8%BC&offset=800&limit=100
*** download offset= 800
[download] ?俺だけの「牛丼トッピング... 205998932
[download] 吉野家特注の60人前牛丼わ... 205998755
[download] ?牛丼のトッピングって日に... 205998709
[download] 出来た！材料が材料なだけに... 205908916
[Error] failed to download url= http://art3.photozou.jp/pub/797/2221797/photo/205908916_thumbnail.jpg
[download] 今週の〆は松屋の牛丼。仕事... 205853254
[download] 本日の昼食もすき家でキムチ... 205845886
[download] 牛丼的どんぶりで豚丼を食べる罪 205820836
[download] 冷やし肉うどん、味噌汁、野... 205768485
[download] 02c　時間によっては間抜けな牛丼屋。もう無くなってしまった 205724980
[download] すき家 上越高土店 うな牛 牛丼の具側アップ 205720373
[download] ６月１７日夕食(牛丼風煮) 205707719
[download] 病院内の食堂で牛丼。 205692984
[download] はう～……。という訳で、ね... 205685239
[download] 東京チカラめし  元祖

[download] IMG_20140419_173209 201875650
[download] タクシーの運ちゃんに教えて... 201860468
[download] 今日は？ 今日も？ 特別(... 201854829
[download] 三種のチーズ牛丼ー！んまっ 201841700
[download] 久しぶり…でもない牛丼ヾ(≧∇≦*)/ 201808285
[download] 夜食は牛丼。摂生なんぞ知ら... 201785993
[download] 今日はなんとなく吉野家の気... 201785627
[download] 仕事でしょうもないミスした... 201764743
[download] 夜ごはんは牛丼とサラダとお... 201729875
[download] お弁当(^〇^) 今日は牛... 201729784
[download] buta_4537 201629357
[Error] failed to download url= http://art1.photozou.jp/pub/816/2316816/photo/201629357_thumbnail.jpg
[download] buta_4536 201629350
[download] やっぱこれが一番好きかもしれん。すき家の牛丼♪(´ε` ) 201599790
[download] 怒涛の6連戦、無事乗り切りましたぁ！毎日20～30分は激徒歩する状態だ... 201553572
[download] 牛丼弁当。 201553420
[download] 米沢牛W牛丼。駅弁風味の味... 201526431
[download] 松坂牛霜降り牛丼(*^.^*) 201519503
[Error] failed to download url= http://art1.photozou.jp/pub/460/1561460/photo/201519503_thumbnail.jpg
[download] ラーメンもコロッケも売り切... 201514946
[download] もうすぐゴールだけど食べな... 201511774
[download] 深夜帰宅。就寝前牛丼やばい！ 201486719
[download] とっても久しぶりにすき家の.