### 파이썬으로 json 다루기
* javascript object notation
* 자바스크립트에서 객체를 표현하는 방식을 이용해 각종 프로그래밍 언어에서 데이터를 표현함
* 예전에는 csv, xml로 데이터를 표현했다면 지금은 json으로 거의 대부분 이용해서 표현
* NoSQL 데이터베이스 중에서 MongoDB나 neo4j 역시 데이터를 다룰 때에는 json 형식을 주로 사용
* json은 파이썬의 dict 자료형과 유사 
    + [{'키':'값, {...}, {...}]
    + { 'userid':'abc123', 'passwd':'987xyz', 'email':'abc123@xyz987.com'}



In [5]:
# xml 표기법
    # <data>
    #   <userid>abc123</userid>
    #   <passwd>987xyz</passwd>
    #   <email>abc123@xyz987.com</email>
    # </data>
    

#### 파이썬에서 json 내장객체 초기화


In [3]:
import json

#### JSON 파일을 만들기 위해 사전dict형 객체 생성

In [4]:
from collections import OrderedDict

#### json 객체 생성 1- text 이용
+ python의 dict처럼 정의

In [9]:
member = { 'userid':'abc123', 'passwd':'987xyz', 'email':'abc123@xyz987.com'}

In [10]:
print(member)

{'userid': 'abc123', 'passwd': '987xyz', 'email': 'abc123@xyz987.com'}


#### dumps 함수를 이용해서 파이썬에서 만든 dict 객체를 json 객체로 만들 수 있음

In [11]:
obj  = json.dumps(member)

In [12]:
print(obj)

{"userid": "abc123", "passwd": "987xyz", "email": "abc123@xyz987.com"}


#### indent 속성을 이용하면 json 객체를 보기좋게 출력

In [13]:
obj = json.dumps(member, indent=True)
print(obj)

{
 "userid": "abc123",
 "passwd": "987xyz",
 "email": "abc123@xyz987.com"
}


#### 이름, 전화번호를 person이라는 json 객체로 생성 
+ 속성값이 여러개일 경우 친구 list 추가
+ 객체가 여러개 존재할 경우 dict로 정의

In [40]:
person1 = {'name' : '홍길동', 'phone' : '01045543392', 'friends' : ['혜교','지현','수지'], 'schools' : {'mid':'서울중학교', 'high':'서울고등학교'}}

In [41]:
person = json.dumps(person1, indent=True)
print(person)

{
 "name": "\ud64d\uae38\ub3d9",
 "phone": "01045543392",
 "friends": [
  "\ud61c\uad50",
  "\uc9c0\ud604",
  "\uc218\uc9c0"
 ],
 "schools": {
  "mid": "\uc11c\uc6b8\uc911\ud559\uad50",
  "high": "\uc11c\uc6b8\uace0\ub4f1\ud559\uad50"
 }
}


#### 한글의 경우 제대로 출력이 되지 않음. 따라서 강제 ascii 인코딩 중지 필요

In [42]:
obj = json.dumps(person1, indent=True, ensure_ascii=False)
print(obj)

{
 "name": "홍길동",
 "phone": "01045543392",
 "friends": [
  "혜교",
  "지현",
  "수지"
 ],
 "schools": {
  "mid": "서울중학교",
  "high": "서울고등학교"
 }
}


#### json 객체 생성 2 - OrderedDict 이용 - python dict보다 효율적

In [43]:
person2 = OrderedDict()

In [44]:
person2['name'] = '홍길동'
person2['phone'] = '123-4567-9876'
person2['friends'] = '혜교','지현','수지'


In [49]:
schools = OrderedDict()
schools['mid'] = '서울중학교'
schools['high'] = '서울고등학교'

In [53]:
person2['schools'] = schools

In [54]:
print(person2)

OrderedDict([('name', '홍길동'), ('phone', '123-4567-9876'), ('friends', ('혜교', '지현', '수지')), ('schools', OrderedDict([('mid', '서울중학교'), ('high', '서울고등학교')]))])


In [55]:
obj = json.dumps(person2, indent=True, ensure_ascii=False)
print(obj)

{
 "name": "홍길동",
 "phone": "123-4567-9876",
 "friends": [
  "혜교",
  "지현",
  "수지"
 ],
 "schools": {
  "mid": "서울중학교",
  "high": "서울고등학교"
 }
}


#### 메모리에 존재하는 json 객체를 파일로 저장
+ dump(json객체, 파일객체, 옵션) 

In [56]:
with open('person.json', 'w', encoding='utf-8') as f:
    json.dump(person1, f, ensure_ascii=False)

#### 파일에 생성된 json 객체를 메모리로 불러옴
+ load(파일객체)

In [57]:
with open('person.json', encoding='utf-8') as f:
           person_data = json.load(f)
print(person_data)

{'name': '홍길동', 'phone': '01045543392', 'friends': ['혜교', '지현', '수지'], 'schools': {'mid': '서울중학교', 'high': '서울고등학교'}}
