# JSON（JavaScript Object Notation）
データフォーマットの一種<br>
プログラミング言語の種類を問わずに使われる．

## JSON形式
- Key（キー）と値（バリュー）で成り立っている
    ```
    {
        キー : 値
    }
    ```

- 複数のデータを扱う場合
    ```
    {
        キー1 : 値1,
        キー2 : 値2
    }
    ```
    
- バリューの中身を配列にすることも可能
    ```
    {
        キー : [値1, 値2, 値3]
    }
    ```
    
- バリューの値を階層的に表現することも可能
    ```
    {
        キー : {サブキー : 値}
    }
    ```
    
### 注意点
- 数値はそのまま
- 文字を扱う場合は，ダブルクオート(")
- 空データを表現する際は，`null`
- Boolean型は，小文字の`true/false`

### 特殊記号
`\`を用いることで，ダブルクォーテーションなどを用いることが可能になる
- `\"` : ダブルクォーテーション
- `\\` : バックスラッシュ

In [1]:
import json

## Pythonの辞書をJSONのテキストデータに変換
`json.dumps()`を用いる

In [2]:
# Pythonの辞書オブジェクト
obj = {'item' : 'apple', 'price' : 120, 'is_fruit' : True, 'state' : None}

# json形式に変換することで，文字列の表記やBoolean，Noneの表記が変化しているのが確認できる
json_obj = json.dumps(obj)
print(json_obj)

{"item": "apple", "price": 120, "is_fruit": true, "state": null}


In [3]:
obj = {'category' : '果物', 'item' : ['orange', 'apple', 'banana']}

# 日本語が含まれる場合，文字化けが発生する
json_obj = json.dumps(obj)
print('修正前 : ', json_obj)

# 回避するためには，ensure_ascii=Falseを引数に追加する必要がある
json_obj = json.dumps(obj, ensure_ascii=False)
print('修正後 : ', json_obj)

修正前 :  {"category": "\u679c\u7269", "item": ["orange", "apple", "banana"]}
修正後 :  {"category": "果物", "item": ["orange", "apple", "banana"]}


In [4]:
obj = {'id' : r'ab"12'}

json_obj = json.dumps(obj)
print(json_obj)

{"id": "ab\"12"}


## JSON形式のテキストデータをPythonの辞書に変換
`json.loads()`を用いる

In [5]:
# JSON形式の文字列
text = '{"item": "apple", "price": 120, "is_fruit": true, "state": null}'

# Pythonの辞書型に変換
obj = json.loads(text)
print(obj)
print(obj['item'])

{'item': 'apple', 'price': 120, 'is_fruit': True, 'state': None}
apple


In [6]:
text = r'{"id": "ab\"12"}'

obj = json.loads(text)
print(obj['id'])

ab"12
