## 파이썬으로 JSON 형식 다루기
* javascript object notation
* 자바스크립트에서 객체를 표현하는 방식을 이용해서 각종 프로그래밍 언어에서 데이터를 표현함
* 예전에는 csv, xml로 데이터를 표현했다면 지금은 json으로 거의 대부분 이용해서 표현
* NoSQL 데이터베이스 중에서 MongoDB나 neo4j 역시 데이터를 다룰 때에는 json형식을 주로 사용
* json은 파이썬의 dict 자료형과 유사
    + [{'키':''값}, {...}, {...}]
    + {'userid':'abc123', 'apsswd':'987xyz', 'email':'abc123@xyz987.com'}
* xml 표기법
    + \<data>
        \<userid>abc123\</userid> <br>
        \<passwd>987xyz\</passwd> <br>
        \<email>abc123@xyz987.com\</email> <br>
      \</data>

In [1]:
# 파이썬에서 json 내장객체 초기화
import json

In [2]:
# JSON 파일을 만들기 위해 사전dict형 객체 생성
from collections import OrderedDict

## JSON 객체 생성 1 - text 이용
* python의 dict처럼 정의

In [3]:
member = {'userid':'abc123', 'apsswd':'987xyz', 'email':'abc123@xyz987.com'}
print(member)

{'userid': 'abc123', 'apsswd': '987xyz', 'email': 'abc123@xyz987.com'}


In [4]:
# dumps 함수를 이용해서 파이썬에서 만든 dict객체를 json객체로 만들 수 있음
obj = json.dumps(member)
print(obj)

{"userid": "abc123", "apsswd": "987xyz", "email": "abc123@xyz987.com"}


In [5]:
# indent 속성을 이용하면 json객체를 보기좋게 출력
obj = json.dumps(member, indent=True)
print(obj)

{
 "userid": "abc123",
 "apsswd": "987xyz",
 "email": "abc123@xyz987.com"
}


In [6]:
# 이름, 전화번호를 person이라는 json 객체로 생성
# 속성값이 여러개 존재할 경우 리스트로 정의
# 객체가 여러개 존재할 경우 dict로 정의
person = {'name':'홍길동', 'phone':'123-4567-8910',
          'friends':['혜교','지현','수지'],
          'schools':{'mid':'서울중학교','high':'서울고등학교'}}
print(person)

{'name': '홍길동', 'phone': '123-4567-8910', 'friends': ['혜교', '지현', '수지'], 'schools': {'mid': '서울중학교', 'high': '서울고등학교'}}


In [7]:
# dumps 함수는 텍스트를 강제로 ascii인코딩을 하기때문에
# 한글의 경우 제대로 출력되지 않음
# 따라서, 강제 ascii 인코딩을 중지해야만 제대로 출력됨
obj = json.dumps(person, indent=True, ensure_ascii=False)
print(obj)

{
 "name": "홍길동",
 "phone": "123-4567-8910",
 "friends": [
  "혜교",
  "지현",
  "수지"
 ],
 "schools": {
  "mid": "서울중학교",
  "high": "서울고등학교"
 }
}


## JSON 객체 생성 2 - OrderedDict 이용
* python의 dict를 이용하는 것보다 효율적임

In [8]:
person2 = OrderedDict()
person2['name'] = '홍길동'
person2['phone'] = '123-4567-8910'
person2['friends'] = ['혜교','지현','수지']
print(person2)

OrderedDict([('name', '홍길동'), ('phone', '123-4567-8910'), ('friends', ['혜교', '지현', '수지'])])


In [9]:
schools = OrderedDict()
schools['mid'] = '서울중학교'
schools['high'] = '서울고등학교'
person2['school2'] = schools

In [10]:
obj = json.dumps(person2, indent=True, ensure_ascii=False)
print(obj)

{
 "name": "홍길동",
 "phone": "123-4567-8910",
 "friends": [
  "혜교",
  "지현",
  "수지"
 ],
 "school2": {
  "mid": "서울중학교",
  "high": "서울고등학교"
 }
}


In [11]:
# 메모리에 생성된 json객체를 파일로 저장
# dump(json객체, 파일객체, 옵션)
with open('json/person.json', 'w', encoding='utf-8') as f:
    json.dump(person, f, ensure_ascii=False)

In [12]:
# 파일에 생성된 json 객체를 메모리로 불러옴
# load(파일객체)
with open('json/person.json', encoding='utf-8') as f:
    person_data = json.load(f)

print(person_data)

{'name': '홍길동', 'phone': '123-4567-8910', 'friends': ['혜교', '지현', '수지'], 'schools': {'mid': '서울중학교', 'high': '서울고등학교'}}
