# JSON 데이터 살펴보기
## 딕셔너리와 호환되는 웹 상의 데이터 표준 규격


### 라이브러리 불러오기

In [1]:
import requests
from pandas import DataFrame

### 웹 데이터 요청하기

In [3]:
with requests.Session() as session:
    session.headers.update({
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
    })

    # 요청할 데디터의 URL
    url = "https://data.hossam.kr/py/departments.json"
    r = session.get(url)

    if r.status_code != 200:
        msg = "[%d Error] %s 에러가 발생함" % (r.status_code, r.reason)
        raise Exception(msg)
    
    print(r)

<Response [200]>


### 응답 결과 확인

In [4]:
# 수신된 데이터의 인코딩 설정(한글이 깨지면 euc-kr)
r.encoding = "utf-8"

# 수신된 결과를 딕셔너리로 변환
my_dict = r.json()
my_dict

{'result': [{'id': 101,
   'dname': '컴퓨터공학과',
   'loc': '공학관',
   'phone': '051-123-4567',
   'email': 'cs@myschool.ac.kr'},
  {'id': 102,
   'dname': '소프트웨어학과',
   'loc': '디자인관',
   'phone': '051-124-4567',
   'email': 'media@myschool.ac.kr'},
  {'id': 201,
   'dname': '전자공학과',
   'loc': '공학관',
   'phone': '051-125-4567',
   'email': 'ee@myschool.ac.kr'},
  {'id': 202,
   'dname': '기계공학과',
   'loc': '공학관',
   'phone': '051-126-4567',
   'email': 'me@myschool.ac.kr'},
  {'id': 203,
   'dname': '건축학과',
   'loc': '건축관',
   'phone': '051-127-4567',
   'email': 'arch@myschool.ac.kr'},
  {'id': 204,
   'dname': '산업디자인학과',
   'loc': '디자인관',
   'phone': '051-128-4567',
   'email': 'id@myschool.ac.kr'},
  {'id': 301,
   'dname': '경영학과',
   'loc': '경영관',
   'phone': '051-129-4567',
   'email': 'biz@myschool.ac.kr'},
  {'id': 302,
   'dname': '경제학과',
   'loc': '경영관',
   'phone': '051-130-4567',
   'email': 'econ@myschool.ac.kr'},
  {'id': 401,
   'dname': '영어영문학과',
   'loc': '인문사회관',
   'phone':

### 응답 결과 활용

In [5]:
# 데이터 프레임으로 변환한다.

df = DataFrame(my_dict["result"])
df

Unnamed: 0,id,dname,loc,phone,email
0,101,컴퓨터공학과,공학관,051-123-4567,cs@myschool.ac.kr
1,102,소프트웨어학과,디자인관,051-124-4567,media@myschool.ac.kr
2,201,전자공학과,공학관,051-125-4567,ee@myschool.ac.kr
3,202,기계공학과,공학관,051-126-4567,me@myschool.ac.kr
4,203,건축학과,건축관,051-127-4567,arch@myschool.ac.kr
5,204,산업디자인학과,디자인관,051-128-4567,id@myschool.ac.kr
6,301,경영학과,경영관,051-129-4567,biz@myschool.ac.kr
7,302,경제학과,경영관,051-130-4567,econ@myschool.ac.kr
8,401,영어영문학과,인문사회관,051-131-4567,eng@myschool.ac.kr
9,402,심리학과,인문사회관,051-132-4567,psy@myschool.ac.kr


In [6]:
with requests.Session() as session:
    session.headers.update({
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
    })

    # 요청할 데이터의 URL
    url = "https://data.hossam.kr/py/titanic.json"
    r = session.get(url)

    if r.status_code != 200:
        msg = "[%d Error] %s 에러가 발생함" % (r.status_code, r.reason)
        raise Exception(msg)
    
    print(r)

<Response [200]>


In [10]:
# 수신된 데이터의 인코딩 설정(한글이 깨지면 euc-kr)
r.encoding = "utf-8"

# 수신된 결과를 딕셔너리로 변환
my_dict = r.json()

# 리스트 형식의 데이터만 추출하여 상위 2건만 확인
passengers = my_dict['passengers']
print(passengers[:2])

[{'id': 1, 'survived': False, 'pclass': 3, 'name': 'Braund, Mr. Owen Harris', 'sex': 'male', 'age': 22, 'sibsp': 1, 'parch': 0, 'ticket': 'A5 21171', 'fare': 7.25, 'cabin': None, 'embarked': 'S'}, {'id': 2, 'survived': True, 'pclass': 1, 'name': 'Cumings, Mrs. John Bradley (Florence Briggs Thayer)', 'sex': 'female', 'age': 38, 'sibsp': 1, 'parch': 0, 'ticket': 'PC 17599', 'fare': 71.2833, 'cabin': 'C85', 'embarked': 'C'}]


In [12]:
# 생존 비율 구하기
total = len(passengers)

# 생존자 수 구하기
survived = 0

# 생존자 명단을 탐색
for p in passengers:
    # 생존자일 경우 생존자 수 1 증가
    if p['survived'] == True:
        survived += 1

# 전체 비율 구하기
rate = survived * 100 / total
print("전체 탑승객 %d명 중에서 %0.2f%%의 탑승객만 생존했다" % (total, rate))

전체 탑승객 891명 중에서 38.38%의 탑승객만 생존했다


### 웹 상의 바이너리 데이터 가져오기

In [None]:
# 이미지나 문서 등 다운로드 가능한 형태의 파일 요청하기

with requests.Session() as session:
    session.headers.update({"User-Agent": "..."})

    # 요청할 데이터의 URL
    url = "..."
    # 바이너리(이진형식) 데이터 가져옴
    r = session.get(url, stream=True)   # Text, json,Html 외에 다운로드가 필요한 형태의 데이터 요청시 명시

    # 인코딩 형식 지정
    r.encoding = "utf-8"

    # 수신 결과를 파일로 저장
    with open()

MissingSchema: Invalid URL '...': No scheme supplied. Perhaps you meant https://...?

In [16]:
with requests.Session() as session:
    session.headers.update({
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36"
    })

    # 요청할 데이터의 URL
    url = "https://data.hossam.kr/py/sample.png"
    r = session.get(url, stream=True)

    if r.status_code != 200:
        msg = "[%d Error] %s 에러가 발생함" % (r.status_code, r.reason)
        raise Exception(msg)
    
    print(r)

<Response [200]>


In [19]:
# 인코딩 형식 지정
r.encoding = "utf-8"

with open("sample.png", "wb") as f:
    f.write(r.raw.read())

# 저장된 이미지 파일 출력
Image("sample.png")

NameError: name 'Image' is not defined