# RESAS基本情報確認用API集

** 初期設定 **

In [None]:
import get_env

import urllib
import urllib.request
import json
import pprint
import os
import pandas as pd
import numpy as np

In [None]:
#取得したアプリケーションIDを設定
appId = get_env.API_KEY

In [None]:
##都道府県コード取得
def get_pref():
    #URL
    url = "https://opendata.resas-portal.go.jp/api/v1/prefectures"

    #設定するキー
    keys = {
            'Content-Type':'application/json',
            'X-API-KEY': appId
    }
    
    #keysからヘッダの文字列を生成
    req = urllib.request.Request(url, headers=keys)

    #JSONデータの取得
    rObj   = urllib.request.urlopen(req)
    resStr = rObj.read()

    #json形式として読み込む
    res = json.loads(resStr)

    #JSON構造確認
    #pprint.pprint(res, depth=8)

    table = res["result"]

    #pandas.DataFrame変換
    df = pd.io.json.json_normalize(table, sep='_')
    #都道府県コードを0埋め2桁化
    df['prefCode'] = df['prefCode'].astype(str).str.zfill(2)
    #df = df.set_index('prefCode')
    #display(df)
    
    return df

In [None]:
##市町村コード取得
##prefCodeは文字型先0の2桁コード
def get_city(prefCode = '-'):
    #URL
    url = "https://opendata.resas-portal.go.jp/api/v1/cities?"

    #設定するキー
    keys = {
            'Content-Type':'application/json',
            'X-API-KEY': appId
    }

    #パラメーター
    para = {
            'prefCode':int(prefCode)
    }
    paramStr = urllib.parse.urlencode(para) 

    #keysからヘッダの文字列を生成
    req = urllib.request.Request(url + paramStr, headers=keys)

    #JSONデータの取得
    rObj   = urllib.request.urlopen(req)
    resStr = rObj.read()

    #json形式として読み込む
    res = json.loads(resStr)

    #JSON構造確認
    #pprint.pprint(res, depth=8)

    table = res["result"]

    #pandas.DataFrame変換
    df = pd.io.json.json_normalize(table, sep='_')
    #都道府県コードを0埋め2桁化
    df['prefCode'] = df['prefCode'].astype(str).str.zfill(2)
    #df = df.set_index('prefCode')
    #display(df)
    
    return df    

In [None]:
##産業大分類コード取得
def get_sicCode():
    #URL
    url = "https://opendata.resas-portal.go.jp/api/v1/industries/broad"

    #設定するキー
    keys = {
            'Content-Type':'application/json',
            'X-API-KEY': appId
    }

    #keysからヘッダの文字列を生成
    req = urllib.request.Request(url, headers=keys)

    #JSONデータの取得
    rObj   = urllib.request.urlopen(req)
    resStr = rObj.read()

    #json形式として読み込む
    res = json.loads(resStr)

    #JSON構造確認
    #pprint.pprint(res, depth=8)

    table = res["result"]

    #pandas.DataFrame変換
    df = pd.io.json.json_normalize(table, sep='_')
    #df = df.set_index('prefCode')
    #display(df)

    return df

In [None]:
##産業中分類コード取得
##sicCodeは文字型1桁コード
def get_simcCode(sicCode = '-'):
    #URL
    url = "https://opendata.resas-portal.go.jp/api/v1/industries/middle?"

    #設定するキー
    keys = {
            'Content-Type':'application/json',
            'X-API-KEY': appId
    }

    #パラメーター
    para = {
            'sicCode':sicCode
    }
    paramStr = urllib.parse.urlencode(para) 

    #keysからヘッダの文字列を生成
    req = urllib.request.Request(url + paramStr, headers=keys)

    #JSONデータの取得
    rObj   = urllib.request.urlopen(req)
    resStr = rObj.read()

    #json形式として読み込む
    res = json.loads(resStr)

    #JSON構造確認
    #pprint.pprint(res, depth=8)

    table = res["result"]

    #pandas.DataFrame変換
    df = pd.io.json.json_normalize(table, sep='_')
    #display(df)
    
    return df

In [None]:
##産業小分類コード取得
##simcCodeは文字型先0の2桁コード
def get_siscCode(simcCode = '-'):
    #URL
    url = "https://opendata.resas-portal.go.jp/api/v1/industries/narrow?"

    #設定するキー
    keys = {
            'Content-Type':'application/json',
            'X-API-KEY': appId
    }

    #パラメーター
    para = {
            #'simcCode':'{0:02d}'.format(int(simcCode)) #強制的に文字型変更
            'simcCode':simcCode    
    }
    paramStr = urllib.parse.urlencode(para) 

    #keysからヘッダの文字列を生成
    req = urllib.request.Request(url + paramStr, headers=keys)

    #JSONデータの取得
    rObj   = urllib.request.urlopen(req)
    resStr = rObj.read()

    #json形式として読み込む
    res = json.loads(resStr)

    #JSON構造確認
    #pprint.pprint(res, depth=8)

    table = res["result"]

    #pandas.DataFrame変換
    df = pd.io.json.json_normalize(table, sep='_')
    #display(df)

    return df

In [None]:
以下、参考コード

In [None]:
##キーワードから統計表情報取得（statsDataの検索）
#e-StatのURL
url = "http://api.e-stat.go.jp/rest/2.1/app/json/getStatsList?"

#設定するキー
keys = {
        "appId": appId,
        "lang": "J" ,
        "searchWord": "科学技術", #検索キーワード（テキスト） AND OR NOT利用可
        "statsNameList":"Y",
        "limit":"10"   #検索結果取得上限数
}

#keysからパラメータの文字列を生成
paramStr = urllib.parse.urlencode(keys)

#JSONデータの取得
rObj   = urllib.request.urlopen(url + paramStr)
resStr = rObj.read()

#json形式として読み込む
res = json.loads(resStr)

#JSON構造確認
#pprint.pprint(res, depth=8)

table_meta_info = res["GET_STATS_LIST"]["DATALIST_INF"]["LIST_INF"]

#pandas.DataFrame変換
df = pd.io.json.json_normalize(table_meta_info, sep='_')

#@や$等の記号類を変換
df.columns = [s.replace('@', '').replace('$', 'val') for s in df.columns]

df_list = df[["id","GOV_ORG_val","STAT_NAME_val","STAT_NAME_code"]]
display(df_list)

In [None]:
##統計表のデータカタログ情報取得（statsDataからデータセットIDの検索）
#e-StatのURL
url = "http://api.e-stat.go.jp/rest/2.1/app/json/getStatsList?"

#設定するキー
keys = {
        "appId": appId,
        "lang": "J" ,
        "statsCode": "00200543", #00200543 科学技術研究調査
        #"searchWord":"大学 AND 組織 AND 学問 AND 研究関係従業者数 AND 受入研究費 AND 内部使用研究費 NOT 分析表", #検索キーワード　AND OR NOT利用可
        "searchWord":"大学 NOT 分析表",
        "limit":""   #取得上限
}

#keysからパラメータの文字列を生成
paramStr = urllib.parse.urlencode(keys)

#JSONデータの取得
rObj   = urllib.request.urlopen(url + paramStr)
resStr = rObj.read()

#json形式として読み込む
res = json.loads(resStr)

#JSON構造確認
#pprint.pprint(res, depth=8)

table_meta_info = res["GET_STATS_LIST"]["DATALIST_INF"]["TABLE_INF"]

#pandas.DataFrame変換
df = pd.io.json.json_normalize(table_meta_info, sep='_')

##data.frameのindex確認
#print(df.columns)
#print('----------------')
#print(df.info())
#print('----------------')
#print(df.index)

#@や$等の記号類を変換
df.columns = [s.replace('@', '').replace('$', 'val') for s in df.columns]
##変換後のdata.frameのindex確認
df_list = df[["id","OPEN_DATE","TITLE_val","TITLE_no","SURVEY_DATE"]]
display(df_list)
#特定条件のリストの統計表のみ表示
df_list.query('TITLE_no == "02501"')

#CSV出力
#path = "C:/Pytmp/"
#os.chdir(path)
#filename = 'stat_list.csv'
#df.to_csv(filename, encoding="shift_jis")

In [None]:
#e-StatのURL
url = "http://api.e-stat.go.jp/rest/2.1/app/json/getStatsData?"

#設定するキー
keys = {
        "appId"              : appId,
        "lang"                : "J" ,
        #"statsDataId"      : "0003191360",  #犯罪統計
        #"statsDataId"      : "0003130148", #自動車輸送 貨物輸送 業態別・車種別・品目別輸送トン数
        "statsDataId"      : "0003207780",#[大学] 組織，大学等の種類別研究関係従業者数，内部使用研究費，受入研究費及び外部支出研究費
        "metaGetFlg"      : "Y" ,
        "cntGetFlg"         : "N",
        "sectionHeaderFlg" : "1"
}

#keysからパラメータの文字列を生成
paramStr = urllib.parse.urlencode(keys)

#JSONデータの取得
rObj   = urllib.request.urlopen(url + paramStr)
resStr = rObj.read()

#json形式として読み込む
res = json.loads(resStr)

In [None]:
##JSON構造確認
pprint.pprint(res, depth=4)

In [None]:
table_meta_info = res["GET_STATS_DATA"]["STATISTICAL_DATA"]["CLASS_INF"]["CLASS_OBJ"]

In [None]:
#print(type(table_meta_info))
print(len(table_meta_info))
#pprint.pprint(table_meta_info)
print(table_meta_info[0]['@id'])

l = range(len(table_meta_info[0]['@id']))
print(l)
for i in l:
    print(i)

In [None]:
df = pd.DataFrame()

for i in range(len(table_meta_info[0]['@id']) - 1):
    
    df_tmp = []
    #pandas.DataFrame変換
    df_tmp = pd.io.json.json_normalize(table_meta_info[i],  ['CLASS'], errors='ignore')
    df_tmp = df_tmp.assign(cat=table_meta_info[i]['@id'])
    
    df = df.append(df_tmp, ignore_index=True)

df = df.loc[:,['cat','@code','@name']]
#@や$等の記号類を変換
df.columns = [s.replace('@', '').replace('$', 'val') for s in df.columns]

display(df)

In [None]:
table_meta_info = res["GET_STATS_DATA"]["STATISTICAL_DATA"]["CLASS_INF"]["CLASS_OBJ"]

In [None]:
print(type(table_meta_info))
print(len(table_meta_info))
pprint.pprint(table_meta_info)

In [None]:
table_info_list = res["GET_STATS_DATA"]["STATISTICAL_DATA"]["DATA_INF"]

In [None]:
##DATA_INFO下の構造確認
print(type(table_info_list))
print(len(table_info_list))
pprint.pprint(table_info_list)