# JSON 데이터 다루기

**[목차]**
* JSON이란?
* JSON 데이터 다루기


## 1. JSON 이란?
* JSON(JavaScript Object Notation)은 **키-값 쌍으로 이루어진 데이터**를 전달 또는 저장하기 위해 사람이 사용할 수 있는 텍스트를 사용한 개방형 표준 포맷 </br>
주로 웹 애플리케이션과 다양한 소프트웨어 간에 데이터를 전송하거나 저장하는 용도로 사용 

* JSON은 단순한 데이터 포맷일 뿐이며 어떠한 통신 방법도 아니고 프로그래밍 문법도 아님

* JSON 공식 홈페이지 : https://www.json.org/json-ko.html


### 1.1 JSON 데이터 구성
JSON은 `문자열`, `숫자`, `불리언`, `객체`, `배열` 등 다양한 데이터 타입을 지원

![](./img/value.png)

![](./img/object.png)

![](./img/array.png)

### 1.2 JSON 데이터 예시
```json
{
    "employee": {
        "id": 123, 
        "name": "Queen", 
        "department": "HR", 
        "skills": ["communication", "teamwork"]
    }
}
```

## 2. JSON 데이터 다루기
데이터를 분석하고 원하는 데이터를 추출하는 과정을 **데이터 파싱(Data Parsing)** 이라 함 </br>
예를 들면, 주행 중에 발생하고 JSON 타입으로 저장된 데이터에서 원하는 데이터를 추출하기 위해서는 데이터 타입에 맞는 파싱 방법이 필요

### 2.1 JSON Library

* Python 에는 `json 라이브러리`가 내장되어 있어 JSON 데이터를 처리할 수 있음 </br>
* 내장 라이브러리이기 때문에 별도의 설치 과정이 필요 없음 </br>
* JSON 형식으로 된 문자열 또는 파일을 읽고 Python 객체(Dictionary or List type)로 만들어서 분석함

* 출처 : https://docs.python.org/ko/3/library/json.html

In [1]:
# json 라이브러리 호출하기
import json

### 2.2 json.load

JSON 파일 객체를 Python에서 사용할 수 있는 객체로 변환하는 함수 

In [5]:
from pprint import pprint

In [6]:
# target.json 파일을 읽어 Python 객체로 변환
with open('data/target.json') as json_file :
    parsed_data = json.load(json_file)

pprint(parsed_data)

{'employee': {'department': 'HR',
              'id': 123,
              'name': 'Queen',
              'skills': ['communication', 'teamwork']}}


파싱된 데이터가 딕셔너리 형태일 경우, Python에서 딕셔너리 자료형을 사용하는 것과 동일하게 사용할 수 있음

In [3]:
print(type(parsed_data))

<class 'dict'>


In [7]:
pprint(parsed_data["employee"])

{'department': 'HR',
 'id': 123,
 'name': 'Queen',
 'skills': ['communication', 'teamwork']}


In [8]:
print(parsed_data["employee"]['skills'])

['communication', 'teamwork']


In [9]:
print(type(parsed_data["employee"]['skills']))

<class 'list'>


### 2.3 json.dump
Python 객체를 JSON 파일 객체로 변환하는 함수

##### (1) Dictionary → JSON

In [10]:
json_data_dic = {"name" : "elice", "age" : 25, "email" : "rabbit@elicer.com"}

print(type(json_data_dic))

<class 'dict'>


In [11]:
with open("create_file1.json", "w") as f :
    json.dump(json_data_dic, f)

##### (2) List → JSON

In [12]:
json_data_list = [{"name" : "elice", "age" : 25}, {"name" : "Queen", "age" : 47}, {"name" : "Carrot", "age" : 1}]

print(type(json_data_list))

<class 'list'>


In [13]:
with open("create_file2.json", "w") as f :
    json.dump(json_data_list, f)

### 2.4 json.loads
문자열로 표현된 JSON 데이터를 Python 객체로 변환하는 함수

In [14]:
str_json = '{"employee": {"id": 123, "name": "Queen", "department": "HR", "skills": ["communication", "teamwork"]}}'

print(type(str_json))

<class 'str'>


In [15]:
loads_data = json.loads(str_json)

print(loads_data)

{'employee': {'id': 123, 'name': 'Queen', 'department': 'HR', 'skills': ['communication', 'teamwork']}}


In [16]:
print(type(loads_data))

<class 'dict'>


In [17]:
print(loads_data["employee"]['skills'])
print(type(loads_data["employee"]['skills']))

['communication', 'teamwork']
<class 'list'>


### 2.5 json.dumps
Python 객체를 문자열로 표현된 JSON 데이터로 변환하는 함수

In [18]:
dic_data = {"employee": {"id": 123, "name": "Queen", "department": "HR", "skills": ["communication", "teamwork"]}}

print(type(dic_data))

<class 'dict'>


In [19]:
dumps_data = json.dumps(dic_data)

print(dumps_data)
print(type(dumps_data))

{"employee": {"id": 123, "name": "Queen", "department": "HR", "skills": ["communication", "teamwork"]}}
<class 'str'>


* dumps_data를 출력하면 한 줄로 출력되어 가독성이 매우 떨어짐
* `dumps` 함수에 *indent* 인자를 추가하면 들여쓰기를 할 수 있음

In [23]:
dumps_data2 = json.dumps(dic_data, indent=4)
print(dumps_data2)

{
    "employee": {
        "id": 123,
        "name": "Queen",
        "department": "HR",
        "skills": [
            "communication",
            "teamwork"
        ]
    }
}


### 2.6 정리
`json 라이브러리`를 사용하면 JSON 데이터에서 원하는 데이터를 추출할 수 있는 데이터 파싱 가능

| 함수 명 | 설명 | 주요 매개변수 | 반환 값 |
| -------- | -------- | -------- | -------- |
| **json.load( )**     | JSON 파일 객체를 Python 객체로 변환하는 함수     | 읽을 JSON 데이터가 담긴 파일 객체    | Pyhthon 객체 (보통 dict 또는 list)   |
| **json.dump( )**     | Python 객체를 JSON 파일 객체로 변환하는 함수     | 읽을 JSON 데이터가 담긴 문자열 & 쓰기를 할 파일 객체     |   None |
| **json.loads( )**     | 문자열로 표현된 JSON 데이터를 Python 객체로 변환하는 함수     | JSON으로 변환할 Python 객체     |  JSON 문자열  |
| **json.dumps( )**     | Python 객체를 문자열로 표현된 JSON 데이터로 변환하는 함수      | JSON으로 변환할 Python 객체     |    문자열 | 



### [TODO] JSON 파일을 파싱하여 새로 저장하기
* data 폴더에 있는 `parsing_target.json` 은 자동차 주행 중에 센서로 습득한 데이터의 일부분입니다.
* 해당 데이터를 읽고 GPS 위도(latitude)와 경도(longitude) 데이터를 추출하여 `result1.json`에 저장하는 코드를 작성하세요.

In [24]:
json_path = "data/parsing_target.json"


# JSON 파일을 읽는 코드를 작성해주세요.
with open(json_path) as json_file :
    parsed_data = json.load(json_file)


# 추출한 데이터를 확인하는 코드입니다.
pprint(parsed_data)

{'data_purpose': 'train',
 'filename': 'parsing_target',
 'framerate': 10,
 'gps_latitude': 37.41473487066775,
 'gps_longitude': 127.12871262424409,
 'lat_accel': -0.01,
 'lat_velocity': -0.13,
 'length': 11,
 'location': '야탑동 487-1',
 'long_accel': 0.25,
 'long_velocity': 14.86,
 'region_name': '경기 성남시 분당구',
 'road_feature': 'r_cityroad',
 'time': 'day',
 'vehicle_id': 'AIMMO-ADCV1'}


읽은 파일에서 gps 위도(latitude)와 경도(longitude) 데이터를 파싱하여 저장하는 코드를 작성해주세요.

In [25]:
# 추출한 데이터에서 위도와 경도 데이터를 추출하는 코드를 작성해주세요.
latitude = parsed_data['gps_latitude']
longitude = parsed_data['gps_longitude']

추출한 위도와 경도 데이터를 배열(array) 형태로 하여, `result1.json` 파일로 저장하는 코드를 작성해주세요. 

파일 경로가 달라지면 채점이 정상적으로 동작하지 않을 수 있습니다.

In [26]:
# 추출한 데이터를 배열 형태로 저장하는 코드를 작성하세요.
gps_data = [latitude, longitude]

In [27]:
# 추출한 데이터를 JSON 파일로 저장하는 코드를 작성하세요. 
with open("result1.json", "w") as f :
    json.dump(gps_data, f)