# 0. Web APIを用いたマンガ雑誌データの取得

　[文化庁メディア芸術データベース　マンガ分野　WebAPI](https://mediaarts-db.bunka.go.jp/webapi_proto_documents.pdf)を用いて，分析に必要なデータを入手します．なお，python3を使ったweb APIの利用については，[Python3でjsonを返却するwebAPIにアクセスして結果を出力するまで](http://qiita.com/sakura1116/items/4a11a9f7db9f535397fa)を参考にさせて頂きました．

## 環境構築

```bash
conda env create -f env.yml
```

## 準備

In [1]:
import json
import urllib.request
from time import sleep

## 雑誌巻号検索結果の取得

　以下の関数`search_magazine()`を使って，週刊少年ジャンプの雑誌巻号情報を検索し，結果を変数`magazines`に保存します．ここで取得したユニークIDは，次節の「雑誌巻号情報の取得」に必要になります．

In [2]:
def search_magazine(key='JUMPrgl', n_pages=25):
    """
    「ユニークID」「雑誌巻号ID」あるいは「雑誌コード」にkey含む雑誌を，
    n_pages分取得する関数です．
    """
    
    url = 'https://mediaarts-db.bunka.go.jp/mg/api/v1/results_magazines?id=' + \
        key + '&page='
    magazines = []
    
    for i in range(1, n_pages):
        response = urllib.request.urlopen(url + str(i))
        content = json.loads(response.read().decode('utf8'))
        magazines.extend(content['results'])
    return magazines

　WebAPIでは，パラメータ`id`で「ユニークID」「雑誌巻号ID」あるいは「雑誌コード」を，`page`で検索結果の取得ページ番号（1ページあたり100件，デフォルトは1）を指定することができます．ここで，週刊少年ジャンプは「雑誌巻号ID」に`JUMPrgl`を含むため，`id=JUMPrgl`を指定します．また，週刊少年ジャンプの検索結果は合計24ページ（2320件）あるため，`page`に1から24を順次指定する必要があります．
詳細は[WebAPI仕様](https://mediaarts-db.bunka.go.jp/webapi_proto_documents.pdf)をご参照ください．

　なお，2017年3月31日より文化庁メディア芸術データベースのURLが変更されたため，[WebAPI仕様](https://mediaarts-db.bunka.go.jp/webapi_proto_documents.pdf)に記載のリクエストURL（`https://mediaarts-db.jp/mg/api/v1/results_magazines`）ではなく，新しいURL（`https://mediaarts-db.bunka.go.jp/mg/api/v1/results_magazines`）を使用する必要があることにご注意ください．

In [3]:
magazines = search_magazine()

In [4]:
len(magazines)

2320

In [5]:
magazines[0]

{'date_indication': '1969/11/03',
 'id': 323270,
 'magazine_id': 'JUMPrgl19691103',
 'name': '週刊少年ジャンプ',
 'number_assist': '',
 'number_indication': '20',
 'owner_kawasaki': 0,
 'owner_kikuyo': 0,
 'owner_kyoto': 1,
 'owner_meiji': 0,
 'owner_ndl': 0,
 'owner_osaka': 0,
 'publisher': '集英社',
 'vol_num_totalval': '2巻24号(通巻35)'}

In [6]:
magazines[-1]

{'date_indication': '2016/12/12',
 'id': 475979,
 'magazine_id': 'JUMPrgl20161212',
 'name': '週刊少年ジャンプ',
 'number_assist': '',
 'number_indication': '52',
 'owner_kawasaki': 0,
 'owner_kikuyo': 0,
 'owner_kyoto': 0,
 'owner_meiji': 0,
 'owner_ndl': 1,
 'owner_osaka': 0,
 'publisher': '',
 'vol_num_totalval': '49巻48号(通巻2389)'}

## 雑誌巻号情報の取得

　以下の関数`extract_data()`で必要な目次情報を抽出し，`save_data()`で目次情報を保存します．

In [7]:
def extract_data(content):
    """
    contentに含まれる目次情報を取得する関数です．
    - year: 発行年
    - no: 号数
    - title: 作品名
    - author: 著者
    - color: カラーか否か
    - pages: 掲載ページ数
    - start_page: 作品のスタートページ
    - best: 巻頭から数えた掲載順
    - worst: 巻末から数えた掲載順
    """
    
    # マンガ作品のみ抽出します．
    comics = [comic for comic in content['contents'] 
             if comic['category']=='マンガ作品'] 
    data = []
    year = int(content['basics']['date_indication'][:4])
    
    # 号数が記載されていない場合があるので，例外処理が必要です．
    try:
        no = int(content['basics']['number_indication'])
    except ValueError:
        no = content['basics']['number_indication']
    
    for comic in comics:
        title= comic['work']
        if not title:
            continue
            
        # ページ数が記載されていない作品があるので，例外処理が必要です．
        # 特に理由はないですが，無記載の作品は10ページとして処理を進めます．
        try:
            pages = int(comic['work_pages'])
        except ValueError:
            pages = 10

        # 「いぬまるだしっ」等，1週に複数話掲載されている作品に対応するため
        # data中にすでにtitleが含まれる場合は，新規datumとして登録せずに，
        # 既存のdatumのページ数のみ加算します．
        if len(data) > 0 and title in [datum['title'] for datum in data]:
            data[[datum['title'] for datum in 
                  data].index(title)]['pages'] += pages
        else:
            data.append({
                'year': year,
                'no': no,
                'title': comic['work'],
                'author': comic['author'],
                'subtitle': comic['subtitle'],
                'color': comic['note'].count('カラー'),
                'pages': int(comic['work_pages']),
                'start_pages': int(comic['start_page'])
            })

    # 企画物のミニマンガを除外するため，合計5ページ以下のdatumはリストから除外します．
    filterd_data = [datum for datum in data if datum['pages'] > 5]
    for n, datum in enumerate(filterd_data):
        datum['best'] = n + 1
        datum['worst'] = len(filterd_data) - n
        
    return filterd_data

　泥臭い話ですが，一部のギャグ漫画の扱いに苦労しました．例えば，「[いぬまるだしっ](https://mediaarts-db.bunka.go.jp/mg/magazine_works/545?ids%5B%5D=545)」は，基本的に一週間に2話ずつ掲載していましたが，データベースでは各話が別々の行に記載されています．これらを１つの作品として見なす必要があるので，当該`comic`の`title`が`data`中にある場合は，別`datum`として`data`に追加せず，既存の`datum`の`pages`を加算する処理を行っています．また，例えば「[ピューと吹く!ジャガー](https://mediaarts-db.bunka.go.jp/mg/comic_works/83870)」は，その人気に関係なく（実際めちゃくちゃ面白かったです），連載中は常に雑誌の最後に掲載されていました．これを外れ値として除外するかどうかで悩みましたが，結局残すことにしました．

In [10]:
def save_data(magazines, offset=0, file_name='data/wj-api.json'):
    """
    magazinesに含まれる全てのmagazineについて，先頭からoffset以降の巻号の
    目次情報を取得し，file_nameに保存する関数です．
    """
    
    url = 'https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id='
    
    #　ファイル先頭行
    if offset == 0:
        with open(file_name, 'w') as f:
            f.write('[\n')
        
    with open(file_name, 'a') as f:
        
        # magazines中のmagazine毎にWeb APIを叩きます．
        for m, magazine in enumerate(magazines[offset:]):
            response = urllib.request.urlopen(url + str(magazine['id']),
                                              timeout=30)
            content = json.loads(response.read().decode('utf8'))
            
            # 前記の関数extract_data()で，必要な情報を抽出します．
            comics = extract_data(content)
            print('{0:4d}/{1}: Extracted data from {2}'.\
                  format(m + offset, len(magazines), url + str(magazine['id'])))
            
            # comics中の各comicについて，file_nameに情報を保存します．
            for n, comic in enumerate(comics):
                
                # ファイル先頭以外の，magazineの最初のcomicの場合は，
                # まず',\n'を追記．
                if m + offset > 0 and n == 0:
                    f.write(',\n')
                
                json.dump(comic, f, ensure_ascii=False)
                
                # 最後のcomic以外は',\n'を追記．
                if not n == len(comics) - 1:
                    f.write(',\n')
            print('{0:9}: Saved data to {1}'.format(' ', file_name))
            
            # サーバへの負荷を抑えるため，必ず一時停止します．
            sleep(3)
            
    # ファイル最終行
    with open(file_name, 'a') as f:

        
        f.write(']')

　タイムアウトに柔軟に対応するため，目次情報を一括処理せず，無理やり逐次処理にしています．また，サーバに負荷をかけないよう，`sleep()`で一時停止していることにご注意ください．
 
　なお，2017年3月31日より文化庁メディア芸術データベースのURLが変更されたため，[WebAPI仕様](https://mediaarts-db.bunka.go.jp/webapi_proto_documents.pdf)に記載のリクエストURL（`https://mediaarts-db.jp/mg/api/v1/magazine`）ではなく，新しいURL（`https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine`）を使用する必要があることにご注意ください．
 
 　以下を実行し，`wj-api.json`にデータを保存します．

In [11]:
save_data(magazines)

   0/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323270
         : Saved data to data/wj-api.json
   1/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323269
         : Saved data to data/wj-api.json
   2/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323268
         : Saved data to data/wj-api.json
   3/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323267
         : Saved data to data/wj-api.json
   4/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323266
         : Saved data to data/wj-api.json
   5/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323265
         : Saved data to data/wj-api.json
   6/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323264
         : Saved data to data/wj-api.json
   7/2320: Extracted data from https://mediaarts-db.bun

  61/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323223
         : Saved data to data/wj-api.json
  62/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323222
         : Saved data to data/wj-api.json
  63/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323220
         : Saved data to data/wj-api.json
  64/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323219
         : Saved data to data/wj-api.json
  65/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323218
         : Saved data to data/wj-api.json
  66/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323217
         : Saved data to data/wj-api.json
  67/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323216
         : Saved data to data/wj-api.json
  68/2320: Extracted data from https://mediaarts-db.bun

 122/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323161
         : Saved data to data/wj-api.json
 123/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323160
         : Saved data to data/wj-api.json
 124/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323159
         : Saved data to data/wj-api.json
 125/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323158
         : Saved data to data/wj-api.json
 126/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323157
         : Saved data to data/wj-api.json
 127/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323156
         : Saved data to data/wj-api.json
 128/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323155
         : Saved data to data/wj-api.json
 129/2320: Extracted data from https://mediaarts-db.bun

 183/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323100
         : Saved data to data/wj-api.json
 184/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323099
         : Saved data to data/wj-api.json
 185/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323098
         : Saved data to data/wj-api.json
 186/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323097
         : Saved data to data/wj-api.json
 187/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323096
         : Saved data to data/wj-api.json
 188/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323095
         : Saved data to data/wj-api.json
 189/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323094
         : Saved data to data/wj-api.json
 190/2320: Extracted data from https://mediaarts-db.bun

 244/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323038
         : Saved data to data/wj-api.json
 245/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323037
         : Saved data to data/wj-api.json
 246/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323036
         : Saved data to data/wj-api.json
 247/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323035
         : Saved data to data/wj-api.json
 248/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323034
         : Saved data to data/wj-api.json
 249/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323033
         : Saved data to data/wj-api.json
 250/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=323032
         : Saved data to data/wj-api.json
 251/2320: Extracted data from https://mediaarts-db.bun

 305/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322974
         : Saved data to data/wj-api.json
 306/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=396533
         : Saved data to data/wj-api.json
 307/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322973
         : Saved data to data/wj-api.json
 308/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322972
         : Saved data to data/wj-api.json
 309/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322971
         : Saved data to data/wj-api.json
 310/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322970
         : Saved data to data/wj-api.json
 311/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322969
         : Saved data to data/wj-api.json
 312/2320: Extracted data from https://mediaarts-db.bun

 366/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322914
         : Saved data to data/wj-api.json
 367/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322913
         : Saved data to data/wj-api.json
 368/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322912
         : Saved data to data/wj-api.json
 369/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322911
         : Saved data to data/wj-api.json
 370/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322910
         : Saved data to data/wj-api.json
 371/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322909
         : Saved data to data/wj-api.json
 372/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322908
         : Saved data to data/wj-api.json
 373/2320: Extracted data from https://mediaarts-db.bun

 427/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322853
         : Saved data to data/wj-api.json
 428/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322852
         : Saved data to data/wj-api.json
 429/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322851
         : Saved data to data/wj-api.json
 430/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322850
         : Saved data to data/wj-api.json
 431/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322849
         : Saved data to data/wj-api.json
 432/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322848
         : Saved data to data/wj-api.json
 433/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322847
         : Saved data to data/wj-api.json
 434/2320: Extracted data from https://mediaarts-db.bun

URLError: <urlopen error [Errno -3] Temporary failure in name resolution>

タイムアウトした場合は，`offset`を利用して再開します．例えば，`447/2320`でタイムアウトした場合は，`save_data(offset=448)`を実行します．

In [12]:
save_data(magazines, offset=448)

 448/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322832
         : Saved data to data/wj-api.json
 449/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322831
         : Saved data to data/wj-api.json
 450/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322830
         : Saved data to data/wj-api.json
 451/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322829
         : Saved data to data/wj-api.json
 452/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322828
         : Saved data to data/wj-api.json
 453/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322827
         : Saved data to data/wj-api.json
 454/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322826
         : Saved data to data/wj-api.json
 455/2320: Extracted data from https://mediaarts-db.bun

URLError: <urlopen error [Errno -3] Temporary failure in name resolution>

In [13]:
save_data(magazines, offset=500)

 500/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322780
         : Saved data to data/wj-api.json
 501/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322779
         : Saved data to data/wj-api.json
 502/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322778
         : Saved data to data/wj-api.json
 503/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322777
         : Saved data to data/wj-api.json
 504/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322776
         : Saved data to data/wj-api.json
 505/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322775
         : Saved data to data/wj-api.json
 506/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322774
         : Saved data to data/wj-api.json
 507/2320: Extracted data from https://mediaarts-db.bun

 561/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322718
         : Saved data to data/wj-api.json
 562/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322717
         : Saved data to data/wj-api.json
 563/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322716
         : Saved data to data/wj-api.json
 564/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322715
         : Saved data to data/wj-api.json
 565/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322714
         : Saved data to data/wj-api.json
 566/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322713
         : Saved data to data/wj-api.json
 567/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322712
         : Saved data to data/wj-api.json
 568/2320: Extracted data from https://mediaarts-db.bun

 622/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322657
         : Saved data to data/wj-api.json
 623/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322656
         : Saved data to data/wj-api.json
 624/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322655
         : Saved data to data/wj-api.json
 625/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322654
         : Saved data to data/wj-api.json
 626/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322653
         : Saved data to data/wj-api.json
 627/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322652
         : Saved data to data/wj-api.json
 628/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322650
         : Saved data to data/wj-api.json
 629/2320: Extracted data from https://mediaarts-db.bun

 683/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322597
         : Saved data to data/wj-api.json
 684/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322596
         : Saved data to data/wj-api.json
 685/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322595
         : Saved data to data/wj-api.json
 686/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322594
         : Saved data to data/wj-api.json
 687/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322593
         : Saved data to data/wj-api.json
 688/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322592
         : Saved data to data/wj-api.json
 689/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322591
         : Saved data to data/wj-api.json
 690/2320: Extracted data from https://mediaarts-db.bun

 744/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322534
         : Saved data to data/wj-api.json
 745/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322533
         : Saved data to data/wj-api.json
 746/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322532
         : Saved data to data/wj-api.json
 747/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322531
         : Saved data to data/wj-api.json
 748/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322530
         : Saved data to data/wj-api.json
 749/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322529
         : Saved data to data/wj-api.json
 750/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322528
         : Saved data to data/wj-api.json
 751/2320: Extracted data from https://mediaarts-db.bun

 805/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322471
         : Saved data to data/wj-api.json
 806/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322470
         : Saved data to data/wj-api.json
 807/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322469
         : Saved data to data/wj-api.json
 808/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322468
         : Saved data to data/wj-api.json
 809/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322467
         : Saved data to data/wj-api.json
 810/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322466
         : Saved data to data/wj-api.json
 811/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322465
         : Saved data to data/wj-api.json
 812/2320: Extracted data from https://mediaarts-db.bun

 866/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322408
         : Saved data to data/wj-api.json
 867/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322407
         : Saved data to data/wj-api.json
 868/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322406
         : Saved data to data/wj-api.json
 869/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322405
         : Saved data to data/wj-api.json
 870/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322404
         : Saved data to data/wj-api.json
 871/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322403
         : Saved data to data/wj-api.json
 872/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322402
         : Saved data to data/wj-api.json
 873/2320: Extracted data from https://mediaarts-db.bun

 927/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322349
         : Saved data to data/wj-api.json
 928/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322348
         : Saved data to data/wj-api.json
 929/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322347
         : Saved data to data/wj-api.json
 930/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322346
         : Saved data to data/wj-api.json
 931/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322345
         : Saved data to data/wj-api.json
 932/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322344
         : Saved data to data/wj-api.json
 933/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322343
         : Saved data to data/wj-api.json
 934/2320: Extracted data from https://mediaarts-db.bun

 988/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322284
         : Saved data to data/wj-api.json
 989/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322283
         : Saved data to data/wj-api.json
 990/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322282
         : Saved data to data/wj-api.json
 991/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322281
         : Saved data to data/wj-api.json
 992/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322280
         : Saved data to data/wj-api.json
 993/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322279
         : Saved data to data/wj-api.json
 994/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322278
         : Saved data to data/wj-api.json
 995/2320: Extracted data from https://mediaarts-db.bun

1049/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322223
         : Saved data to data/wj-api.json
1050/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322222
         : Saved data to data/wj-api.json
1051/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322221
         : Saved data to data/wj-api.json
1052/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322220
         : Saved data to data/wj-api.json
1053/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322219
         : Saved data to data/wj-api.json
1054/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322218
         : Saved data to data/wj-api.json
1055/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322217
         : Saved data to data/wj-api.json
1056/2320: Extracted data from https://mediaarts-db.bun

1110/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322161
         : Saved data to data/wj-api.json
1111/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322160
         : Saved data to data/wj-api.json
1112/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322159
         : Saved data to data/wj-api.json
1113/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322158
         : Saved data to data/wj-api.json
1114/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322157
         : Saved data to data/wj-api.json
1115/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322156
         : Saved data to data/wj-api.json
1116/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322155
         : Saved data to data/wj-api.json
1117/2320: Extracted data from https://mediaarts-db.bun

1171/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322099
         : Saved data to data/wj-api.json
1172/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322098
         : Saved data to data/wj-api.json
1173/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322097
         : Saved data to data/wj-api.json
1174/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322096
         : Saved data to data/wj-api.json
1175/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322095
         : Saved data to data/wj-api.json
1176/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322094
         : Saved data to data/wj-api.json
1177/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322093
         : Saved data to data/wj-api.json
1178/2320: Extracted data from https://mediaarts-db.bun

1232/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322033
         : Saved data to data/wj-api.json
1233/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322032
         : Saved data to data/wj-api.json
1234/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322031
         : Saved data to data/wj-api.json
1235/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322030
         : Saved data to data/wj-api.json
1236/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322029
         : Saved data to data/wj-api.json
1237/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322028
         : Saved data to data/wj-api.json
1238/2320: Extracted data from https://mediaarts-db.bunka.go.jp/mg/api/v1/magazine?id=322027
         : Saved data to data/wj-api.json
1239/2320: Extracted data from https://mediaarts-db.bun

URLError: <urlopen error [Errno -3] Temporary failure in name resolution>

以下，確認用のコード．不要になったら消すこと．また，magazinesの抽出も関数化すること．

In [48]:
with open('data/wj-api.json', 'r', encoding='utf-8') as f:
    comics2 = json.load(f)
comics2

JSONDecodeError: Expecting value: line 40701 column 1 (char 6764365)