## **🔍 Objectives**

### **1. 실습 개요**
- 📊 **공공데이터 API 실습**  
- 🔄 **JSON, CSV, XML 데이터 처리 실습**  

---

### **2. 실습 진행 목적 및 배경**
- **공공데이터 API**를 통해 구조화된 데이터를 요청하고 응답받는 기술을 익힙니다.  
- **JSON, CSV, XML**과 같은 다양한 데이터 포맷의 구조를 이해하고 이를 변환하거나 저장하는 방법을 학습합니다.  
- 학습자는 데이터를 수집, 처리, 저장하는 유연한 워크플로우를 체득하게 됩니다.  

---

### **3. 실습 수행으로 얻어갈 수 있는 역량**
- 실시간 데이터를 **수집**하고 **분석**하는 기술 습득  
- 데이터를 다룰 때 **포맷 변환 및 저장 능력** 향상

---

### **4. 데이터셋 개요 및 저작권 정보**

#### **📁 데이터 개요**
- **데이터셋 이름**: 노령 인구 통계 데이터  
- **데이터 제공자**: 공공데이터포털 (대한민국 정부)  
- **내용**:  
  - 특정 연도의 노령 인구 통계를 제공 (전체 및 연령대별 인구).  
  - **분석 목적**: 정책 분석, 학술 연구, 보고서 작성 등.  
  - **형식**: XML 또는 JSON 응답 데이터.  
- **컬럼명 설명**:  
  - `year`: 데이터의 연도  
  - `all`: 전체 노령 인구 수  
  - `age65-69`: 65-69세 연령대 인구 수  
  - `age70-74`: 70-74세 연령대 인구 수  
  - `age75-79`: 75-79세 연령대 인구 수  
  - `age80-84`: 80-84세 연령대 인구 수  
  - `age85-89`: 85-89세 연령대 인구 수  
  - `age90u`: 90세 이상 인구 수  

#### **📜 저작권 정보**
- **소유자**: 보건복지부  
- **저작권 표시**: 공공의 이익을 위해 제공되며, 특정 조건에서 재사용 가능.  
- **출처**: [공공데이터포털](https://www.data.go.kr/)  

---

### **5. 실습 핵심 내용**
- 🔑 **API 키 발급 및 활용법 학습**  
- 📂 **JSON, CSV, XML 데이터 포맷 처리 실습**  


### **Prerequisites**

```
requests>=2.28.1
pandas>=1.3.0
jsonschema>=4.0.0
urllib3>=1.26.12

```

# API 데이터 수집

- JSON과 XML 데이터 구조 숙달
- 공공데이터 API 활용해보기
- 네이버 API 활용해보기


### 1. JSON

### 1-1. 데이터 저장

- 구글 드라이브를 마운트하여 구글 드라이브에 JSON 파일 저장

In [3]:
from google.colab import drive
drive.mount('/content/gdrive', force_remount=True)

ModuleNotFoundError: No module named 'google.colab'

- 파일을 저장할 디렉토리 생성

In [4]:
import os
# my_path: 각자 데이터셋 파일이 있는 경로로 설정 바랍니다.
my_path = "/content/gdrive/MyDrive/"
if not os.path.exists(my_path):
    os.makedirs(my_path)
    print(f"'{my_path}' 폴더가 생성되었습니다.")
else:
    print(f"'{my_path}' 폴더가 이미 존재합니다.")


'/content/gdrive/MyDrive/' 폴더가 생성되었습니다.


- 여러 사이트의 아이디와 비밀번호 관리하는 JSON 파일

- 다른 사용자가 접근할 수 없는 곳에 저장해두고 불러서 사용

In [5]:
import json
admin={
    '1.name' : "hong gildong",
    '2.mysql' : { "id" :"mysql", "pass" : "12345" },
    '3.naver_api':{
        'id' : 'gildong',
        'api_key': 'my_naver_6789',
        'api_secret': "12345" },
    }
with open(os.path.join(my_path, 'admin_ex.json'), 'w') as f:
    json.dump(admin, f) #들여쓰기 옵션

### 1-2. JSON 읽기, 활용하기

- 코랩에서 프로그리맹할 때 구글 드라이브에 저장해놓고 보안키를 불러서 사용

- 타 사용자는 읽기 불가

In [6]:
import json
import os


# JSON 파일 경로 생성
json_file_path = os.path.join(my_path, 'admin_ex.json')

# JSON 파일 읽기
with open(json_file_path, 'r') as f:
    s = f.read()
    admin = json.loads(s)
    admin1 = admin['3.naver_api']  # JSON 데이터 접근

# 데이터 출력
print(s)
print(json.dumps(admin, indent=4))  # JSON 데이터 가독성 있게 출력
print(admin['3.naver_api']['api_key'])  # API 키 출력
print(admin1['api_key'], admin1['api_secret'])  # API 키와 시크릿 출력



{"1.name": "hong gildong", "2.mysql": {"id": "mysql", "pass": "12345"}, "3.naver_api": {"id": "gildong", "api_key": "my_naver_6789", "api_secret": "12345"}}
{
    "1.name": "hong gildong",
    "2.mysql": {
        "id": "mysql",
        "pass": "12345"
    },
    "3.naver_api": {
        "id": "gildong",
        "api_key": "my_naver_6789",
        "api_secret": "12345"
    }
}
my_naver_6789
my_naver_6789 12345


- f.read()로 텍스트 읽기

- json.loads() 함수를 사용하여 파일 인식 처리

### 1-3. 데이터프레임으로 변환 저장

In [7]:
import json
import pandas as pd
df = pd.json_normalize(admin['2.mysql'])
json_csv = df.to_csv()
print(json_csv)
df

,id,pass
0,mysql,12345



Unnamed: 0,id,pass
0,mysql,12345


<hr>

# 2. XML

### 2-1.데이터 구조

- HTML과 유사한 구조

- JSON과 유사하게 데이터를 주고 받음

In [8]:
%%writefile test.xml
<?xml version="1.0" encoding="utf-8"?>
<world name = "주소록과 네이버 API 서비스키">
    <people name='김민국'>
        <age>15</age>
        <tall>183cm</tall>
        <add>서울시 서대문구</add>
    </people>
    <people name='박한솔' >
        <age>30</age>
        <tall>175cm</tall>
        <add>서울시 용산구</add>
    </people>
    <naver_api>
        <client_id>JXRlq56Db1L0PA</client_id>
        <client_secret>hwiniqqkgvH</client_secret>
    </naver_api>
</world>


Writing test.xml


### 2-2. XML 데이터 파싱

- root 노드에 world
- 하위 자식 노드에 두 개의 people 존재
- <> 태그 내에 들어가 있는 것 : 속성 (attributes)
- 속성의 이름인 name의 value인 '김민국', '박한솔'
- 파이썬에서 xml 문서를 파싱하기 위해서는 xml.etree.ElementTree 모듈 사용
- 시작 태그와 /의 종료 태그 사이에 위치한 텍스트들이 실제 표현하고자 하는 내용
-XML을 읽어 특정 내용을 추출하기 위해서 XML 문서를 ET.parse로 파싱하고 getroot() 메소드를 이용해 루트 태그를 추출하고 반복문을 이용해 자식 노드의 태그와 속성 추출