## json 파일
>> (출처: 위키백과)
- JSON(JavaScript Object Notation)은 속성-값 쌍(attribute–value pairs and array data types (or any other serializable value)) 또는 "키-값 쌍"으로 이루어진 데이터 오브젝트를 전달하기 위해 인간이 읽을 수 있는 텍스트를 사용하는 개방형 표준 포맷입니다.
- 비동기 브라우저/서버 통신 (AJAX)을 위해, 넓게는 XML(AJAX가 사용)을 대체하는 주요 데이터 포맷이다.

>> - 특히, 인터넷에서 자료를 주고받을 때 그 자료를 표현하는 방법으로 알려져 있다. 자료의 종류에 큰 제한은 없으며, 특히 컴퓨터 프로그램의 변수 값을 표현하는 데 적합하다. 본래는 자바스크립트 언어로부터 파생되어 자바스크립트의 구문 형식을 따르지만 언어 독립형 데이터 포맷이다.
>>> - 즉, 프로그래밍 언어나 플랫폼에 독립적이므로, 구문 분석 및 JSON 데이터 생성을 위한 코드는 C, C++, C#, 자바, 자바스크립트, 펄, 파이썬 등 수많은 프로그래밍 언어에서 쉽게 이용할 수 있다.
>>>> ※ JSON 파일에서 Comment를 사용하지 않는다. 표준으로 사용하기 위해

In [1]:
# JSON 파일 예
sample = {
   "이름": "이순신",                          # → 스트링
   "나이": 57,                                # → 숫자 (정수)
   "특기": ["수영", "골프"],                  # → list 표현 가능
   "부모관계": {"아버지": "이퇴계", "어머니": "장희빈"},  # → array 표현 가능
   "가족관계": {"부인": "양귀비", "자녀": ["아이유", "조용필"]},  # → array 표현 가능
   "종교여부": True                          # → Boolean
}

<img src = 'https://miro.medium.com/v2/resize:fit:1400/format:webp/1*PA8yUhgId2jyIrJULvNbvw.png' width=500>

>> ### **JSON 파일 쓰기**

In [2]:
import json    # json 모듈 import

In [3]:
with open('sample_out.json', 'w') as w:
    json.dump(sample, w, indent='\t')    #  파이썬 객체 sample을 file w에 저장함

>> ### **JSON 파일 읽기(json 라이브러리 사용)**

In [4]:
with open('sample_out.json', 'r') as f:        # 파일 읽기 f
    sample = json.load(f)   #  json.load() 함수에서 sample 읽어옴

In [5]:
sample

{'이름': '이순신',
 '나이': 57,
 '특기': ['수영', '골프'],
 '부모관계': {'아버지': '이퇴계', '어머니': '장희빈'},
 '가족관계': {'부인': '양귀비', '자녀': ['아이유', '조용필']},
 '종교여부': True}

In [6]:
sample.keys()

dict_keys(['이름', '나이', '특기', '부모관계', '가족관계', '종교여부'])

In [7]:
sample['이름']

'이순신'

In [8]:
sample['나이']

57

In [9]:
[sample[key] for key in sample.keys()]

['이순신',
 57,
 ['수영', '골프'],
 {'아버지': '이퇴계', '어머니': '장희빈'},
 {'부인': '양귀비', '자녀': ['아이유', '조용필']},
 True]

> ## **pandas 로만 json 읽기**
>> #### **(1) DICT 파일 데이터프레임으로 읽기**

In [10]:
type(sample)

dict

In [11]:
import pandas as pd
df = pd.DataFrame.from_dict(sample, orient='index')
df

Unnamed: 0,0
이름,이순신
나이,57
특기,"[수영, 골프]"
부모관계,"{'아버지': '이퇴계', '어머니': '장희빈'}"
가족관계,"{'부인': '양귀비', '자녀': ['아이유', '조용필']}"
종교여부,True


>> #### **(2) JSON 파일 데이터프레임으로 읽기**

In [12]:
type('sample_out.json')     # json 파일

str

In [13]:
pd.read_json('sample_out.json')

ValueError: Mixing dicts with non-Series may lead to ambiguous ordering.

In [14]:
df = pd.read_json('sample_out.json', orient='index')
df

Unnamed: 0,0
이름,이순신
나이,57
특기,"[수영, 골프]"
부모관계,"{'아버지': '이퇴계', '어머니': '장희빈'}"
가족관계,"{'부인': '양귀비', '자녀': ['아이유', '조용필']}"
종교여부,True


>> ### **컬럼안의 사전/리스트 자료를 풀어서 컬럼으로 만들기**

In [15]:
df       # dict or json을 데이터프레임으로 만들든 아래와 같은 형식임

Unnamed: 0,0
이름,이순신
나이,57
특기,"[수영, 골프]"
부모관계,"{'아버지': '이퇴계', '어머니': '장희빈'}"
가족관계,"{'부인': '양귀비', '자녀': ['아이유', '조용필']}"
종교여부,True


In [16]:
df.to_dict

In [17]:
df_dict = df.to_dict
df_dict

In [18]:
df.index

Index(['이름', '나이', '특기', '부모관계', '가족관계', '종교여부'], dtype='object')

In [19]:
# Convert nested dictionaries and lists into separate columns
sf = pd.json_normalize(df.to_dict(orient='records'))
sf

Unnamed: 0,0,0.아버지,0.어머니,0.부인,0.자녀
0,이순신,,,,
1,57,,,,
2,"[수영, 골프]",,,,
3,,이퇴계,장희빈,,
4,,,,양귀비,"[아이유, 조용필]"
5,True,,,,


In [20]:
sf.index = df.index

In [21]:
sf

Unnamed: 0,0,0.아버지,0.어머니,0.부인,0.자녀
이름,이순신,,,,
나이,57,,,,
특기,"[수영, 골프]",,,,
부모관계,,이퇴계,장희빈,,
가족관계,,,,양귀비,"[아이유, 조용필]"
종교여부,True,,,,
