# **파이썬에서 JSON 데이터 다루기**

- 파이썬 객체를 JSON 문자열로 변환 (직렬화)




In [1]:
d = {"name": "혼자 공부하는 데이터 분석"}
print(d['name'])
# 딕셔너리 만들었음

혼자 공부하는 데이터 분석


In [2]:
import json
d_str = json.dumps(d, ensure_ascii=False)
print(d_str)
# json 임포트 후 딕셔너리를 JSON 형식에 맞는 문자열로 바꾸기
# ensure_ascii=False 얘는 딕셔너리에 한글이 포함되어 있어서 저장된 문자 그대로 출력하게 한 것.

{"name": "혼자 공부하는 데이터 분석"}


In [3]:
print(type(d_str))
# 데이터 타입 확인 :'str' 즉 문자열로 바뀌었음을 알 수 있음.

<class 'str'>


- JSON 문자열을 다시 파이썬 객체로 변환 (역직렬화)

In [4]:
d2 = json.loads(d_str)
print(d2['name'])
print(type(d2))
# 딕셔너리로 다시 변환 및 타입 확인

혼자 공부하는 데이터 분석
<class 'dict'>


In [5]:
d3 = json.loads('{"name": "혼자 공부하는 데이터 분석", "author": "박해선", "year": 2022}')
# 여러개 문자열을 한번에 전달
print(d3['name'])
print(d3['author'])
print(d3['year'])

혼자 공부하는 데이터 분석
박해선
2022


In [13]:
d3 = json.loads('{"name": "혼자 공부하는 데이터 분석", "author": ["박해선","홍길동"], \
                  "year": 2022}')
# "author": ["박해선","홍길동"] 이렇게 키 하나에 여러 항목이 들어가있으면
print(d3['author'][1])
print(d3['author'][0])
print(d3['author'])
# 딕셔너리 안에 리스트가 중첩된 모습

홍길동
박해선
['박해선', '홍길동']


In [15]:
d4_str = """
[
  {"name": "혼자 공부하는 데이터 분석", "author": "박해선", "year": 2022},
  {"name": "혼자 공부하는 머신러닝+딥러닝", "author": "박해선", "year": 2020}
]
"""
d4 = json.loads(d4_str)
# 문자열 여러개를 한번에 파이썬 객체로 변환

print(d4[0]['name']) # 첫번째 name
print(d4[1]['name']) # 두번째 name
print(d4[1]['name'][0]) # 두번째 name에서 1번째 글자

혼자 공부하는 데이터 분석
혼자 공부하는 머신러닝+딥러닝
혼


- JSON 문자열을 데이터프레임으로 변환하기

In [16]:
import pandas as pd
pd.read_json(d4_str)
# JSON 문자열을 읽어서 데이터프레임으로 변환
# pd.DataFrame(d4) 요건 파이썬 객체로 변환 후 데이터 프레임을 만든 것.

Unnamed: 0,name,author,year
0,혼자 공부하는 데이터 분석,박해선,2022
1,혼자 공부하는 머신러닝+딥러닝,박해선,2020


# **파이썬에서 XML 데이터 다루기**

- XML 문자열을 파이썬 객체로 변환

In [17]:
x_str = """
<book>
    <name>혼자 공부하는 데이터 분석</name>
    <author>박해선</author>
    <year>2022</year>
</book>
"""

In [20]:
import xml.etree.ElementTree as et
book = et.fromstring(x_str)

print(type(book))
print(book.tag)

<class 'xml.etree.ElementTree.Element'>
book


- 자식 엘리먼트 확인하기

In [21]:
book_childs = list(book)
print(book_childs)

[<Element 'name' at 0x7f14a6173a60>, <Element 'author' at 0x7f14a6173ab0>, <Element 'year' at 0x7f14a6173b00>]


In [22]:
name, author, year = book_childs

print(name.text)
print(author.text)
print(year.text)

혼자 공부하는 데이터 분석
박해선
2022


In [23]:
name = book.findtext('name')
author = book.findtext('author')
year = book.findtext('year')

print(name)
print(author)
print(year)
# 자식 엘리먼트 탐색하여 자동으로 매

혼자 공부하는 데이터 분석
박해선
2022


In [25]:
x2_str = """
<books>
    <book>
        <name>혼자 공부하는 데이터 분석</name>
        <author>박해선</author>
        <year>2022</year>
    </book>
    <book>
        <name>혼자 공부하는 머신러닝+딥러닝</name>
        <author>박해선</author>
        <year>2020</year>
    </book>
</books>
"""

In [26]:
books = et.fromstring(x2_str)
print(books.tag)

books


In [27]:
for book in books.findall('book'):
    name = book.findtext('name')
    author = book.findtext('author')
    year = book.findtext('year')

    print(name)
    print(author)
    print(year)
    print()

혼자 공부하는 데이터 분석
박해선
2022

혼자 공부하는 머신러닝+딥러닝
박해선
2020



## ----요부분까지 이해 잘 안 감----

# **파이썬으로 API 호출하기**

In [32]:
import requests

In [33]:
# 내 인증키 받아옴
url = "http://data4library.kr/api/loanItemSrch?format=json&startDt=2021-04-01&endDt=2021-04-30&age=20&authKey=6f9f93548d7b3a465dacbc6e826fff54e8440d68e10d72abf8a99824c072cf1e"

In [34]:
r = requests.get(url)

In [35]:
data = r.json()
print(data)
# 인증키 승인 대기중이라 API 활성화 상태가 아닌 것으로 뜸.

{'response': {'error': 'API 활성화 상태가아닙니다.'}}


In [36]:
data
# 데이터도 뜨지 않음.

{'response': {'error': 'API 활성화 상태가아닙니다.'}}