JSON(JavaScript Object Notation)은 XML, YAML과 함께 효율적으로 데이터를 저장하고 교환하는데 사용하는 텍스트 데이터 포맷중 하나이다. JSON은 사람이 읽고 쓰기에 쉬우며, 또한 기계가 파싱하고 생성하기에도 매우 쉽다. JSON은 그 이름에서 유추할 수 있듯이 JavaScript의 프로그래밍 언어의 부분에 기반하고 있으며, C-family 프로그래밍 언어 (C, C++, C#, Java, JavaScript, Perl, Python 등)의 규약을 따르고 있어서 C-family 프로그래밍 언어 간 데이터를 교환하는데 적합하다.

<br>
JSON은 아래의 두개의 구조로 이루어져 있다 <br>
- 이름/값 쌍의 집합(A collection of name/value paris) <br>
- 정렬된 값의 리스트 (An ordered list of values)

In [1]:
# (1) Python 객체를 JSOn 데이터로 쓰기, 직렬화, 인코딩 (Write Python object to JSON, Serialization, Encoding)
# (2) JSON 포맷 데이터를 Python 객체로 읽기, 역직렬화, 디코딩 (Read JSON to Python, Deserialization, Decoding)

In [1]:
py_dict = {    "1.FirstName": "Gildong",
    "2.LastName": "Hong",
    "3.Age": 20,
    "4.University": "Awesome University",
    "5.Courses": [
        {
            "Classes": [
                "Probability",
                "Generalized Linear Model",
                "Categorical Data Analysis"
            ],
            "Major": "Statistics"
        },
        {
            "Classes": [
                "Data Structure",
                "Programming",
                "Algorithms"
            ],
            "Minor": "ComputerScience"
        }
    ]
}


In [5]:
# 1-1 json.dump()를 사용해서 파이썬 객체를 json포맷 데이터를 디스크에 json 파일로 쓰기 
## 주의 dump! not dumps ##

import json

with open('./my_json.json','w') as json_file:
    json.dump(py_dict, json_file)

In [9]:
# 1-2. json.dumps()를 사용해서 JSON 포맷 데이터를 메모리에 만들기
import json

json_object = json.dumps(py_dict)  # json.dumps()는 1 argument를 받고 python object를 json_object <'str'>로 만든다., s는 string의 약자임
print(type(json_object))
print('=======')
print(json_object) # type <'str'>

<class 'str'>
{"1.FirstName": "Gildong", "2.LastName": "Hong", "3.Age": 20, "4.University": "Awesome University", "5.Courses": [{"Classes": ["Probability", "Generalized Linear Model", "Categorical Data Analysis"], "Major": "Statistics"}, {"Classes": ["Data Structure", "Programming", "Algorithms"], "Minor": "ComputerScience"}]}


In [7]:
# json.dumps 의 indent option

import json

json_object = json.dumps(my_dict, indent=4)
print(json_object) # type <'str'>

{
    "1.FirstName": "Gildong",
    "2.LastName": "Hong",
    "3.Age": 20,
    "4.University": "Awesome University",
    "5.Courses": [
        {
            "Classes": [
                "Probability",
                "Generalized Linear Model",
                "Categorical Data Analysis"
            ],
            "Major": "Statistics"
        },
        {
            "Classes": [
                "Data Structure",
                "Programming",
                "Algorithms"
            ],
            "Minor": "ComputerScience"
        }
    ]
}


In [10]:
# 또한 sort_keys=True 옵션을 통해 키(keys)를 기준으로 정렬해서 직렬화 하여 내보닐 수도 있다.
import json
json_object2 = json.dumps(my_dict, indent=4, sort_keys=True)
print(json_object2)

{
    "1.FirstName": "Gildong",
    "2.LastName": "Hong",
    "3.Age": 20,
    "4.University": "Awesome University",
    "5.Courses": [
        {
            "Classes": [
                "Probability",
                "Generalized Linear Model",
                "Categorical Data Analysis"
            ],
            "Major": "Statistics"
        },
        {
            "Classes": [
                "Data Structure",
                "Programming",
                "Algorithms"
            ],
            "Minor": "ComputerScience"
        }
    ]
}


정리하면 json.dump()는 JSON문자열을 파일에 직접 쓰기 위해 사용하고, 
<br>json.dumps()는 JSON 문자열을 생성한 뒤 반환하여 파이썬 내 다른 곳에서 이용하기 위해서 쓴다.

In [13]:
# (2) JSON 포맷 데이터를 Python 객체로 읽기, 역직렬화, 디코딩 : json.loads()
import json

with open("my_json.json", 'r') as json_file:
    json_dict = json.load(json_file)

json_dict

{'1.FirstName': 'Gildong',
 '2.LastName': 'Hong',
 '3.Age': 20,
 '4.University': 'Awesome University',
 '5.Courses': [{'Classes': ['Probability',
    'Generalized Linear Model',
    'Categorical Data Analysis'],
   'Major': 'Statistics'},
  {'Classes': ['Data Structure', 'Programming', 'Algorithms'],
   'Minor': 'ComputerScience'}]}

In [18]:
# 메모리에 저장된 json_object는 <'str'> 자료형이다. 이를 json.loads()를 이용하여 파이썬 객체로 읽는다. (json포맷 데이터 -> Python객체)

print(type(json_object))
print('============')
json_object

<class 'str'>


'{\n    "1.FirstName": "Gildong",\n    "2.LastName": "Hong",\n    "3.Age": 20,\n    "4.University": "Awesome University",\n    "5.Courses": [\n        {\n            "Classes": [\n                "Probability",\n                "Generalized Linear Model",\n                "Categorical Data Analysis"\n            ],\n            "Major": "Statistics"\n        },\n        {\n            "Classes": [\n                "Data Structure",\n                "Programming",\n                "Algorithms"\n            ],\n            "Minor": "ComputerScience"\n        }\n    ]\n}'

In [21]:
import json

json_dict2 = json.loads(json_object)
json_dict2

{'1.FirstName': 'Gildong',
 '2.LastName': 'Hong',
 '3.Age': 20,
 '4.University': 'Awesome University',
 '5.Courses': [{'Classes': ['Probability',
    'Generalized Linear Model',
    'Categorical Data Analysis'],
   'Major': 'Statistics'},
  {'Classes': ['Data Structure', 'Programming', 'Algorithms'],
   'Minor': 'ComputerScience'}]}

# YAML 파일 다루기

YAML은 "YAML Ain't Markup Language"의 약어로서, 인간이 읽을 수 있는 데이터 직렬화 언어(human-readable data-serialization language) 입니다.<br>
YAML은 데이터가 저장되거나 전송되는 구성 파일(configuration file)과 애플리케이션에서 종종 사용됩니다.<br>
YAML은 XML과 동일한 커뮤니케이션 애플리케이션을 대상으로 하지만 최소한의 구문을 가지고 있습니다.

In [25]:
import yaml

with open('./vegetables.yaml') as f:
    vegetables = yaml.load(f, Loader=yaml.FullLoader)
    print(vegetables)

{'Vegetables': ['Pepper', 'Tomato', 'Garlic']}


key, value(list)로 구성된 Dictionary로 YAML을 파싱함

In [27]:
with open('./k8s_deployment.yaml') as f:
    k8s = yaml.load(f, Loader=yaml.FullLoader)

k8s

{'apiVersion': 'apps/v1',
 'kind': 'Deployment',
 'metadata': {'name': 'frontend',
  'labels': {'app': 'mywebsite', 'tier': 'frontend'}},
 'spec': {'replicas': 3,
  'template': {'metadata': {'name': 'myapp-pod', 'labels': {'app': 'myapp'}},
   'spec': {'containers': [{'name': 'nginx', 'image': 'nginx'}]}},
  'selector': {'matchLabels': {'app': 'myapp'}}}}

In [None]:
# 2. 여러개의 YAML 파일들을 파싱하여 읽어오기 : yaml.load_all()

In [None]:
# 3. 읽어온 YAML 파일을 정렬하기

In [28]:
with open('cars.yaml') as f:
    cars_original = yaml.load(f, Loader=yaml.FullLoader)
    print(cars_original)

    print('==================')

    # sorting by key
    cars_sorted = yaml.dump(cars_original, sort_keys=True)
    print(cars_sorted)

{'hyundai': 45000, 'tesla': 65000, 'chevrolet': 42000, 'audi': 51000, 'mercedesbenz': 80000}
audi: 51000
chevrolet: 42000
hyundai: 45000
mercedesbenz: 80000
tesla: 65000



In [30]:
import yaml

data = {
    "name": "John",
    "age": 30,
    "city": "New York"
}

with open('data.yaml', 'w') as yaml_file:
    yaml.dump(data, yaml_file)


json.dump(), yaml.dump()는 직렬화 함수임을 명시!