In [None]:
# uv add requests python-dotenv 
## python-dotenv : .env에 있는 정보를 가져오는 도구
## requests: API 요청하는 도구

# API KEY 불러오기

In [None]:
from dotenv import load_dotenv

load_dotenv()

In [None]:
# API 확인
import os 

print(os.getenv("SEOUL_PUBLIC_API_KEY"))
## !!!! API 유출 방지를 위해 출력이 확인되면 출력 내용을 지워야 한다. 

# 1. 서울 열린데이터 광장

## 1) URL 만들기

In [None]:
# 데이터 사이트: https://data.seoul.go.kr/dataList/OA-13252/F/1/datasetView.do

# http://openapi.seoul.go.kr:8088/(인증키)/json/tbCycleStationInfo/1/5/
base_url = "http://openapi.seoul.go.kr:8088"

key = os.getenv("SEOUL_PUBLIC_API_KEY")
request_type = "json"
service = "tbCycleStationInfo"
start_index = 1
end_index = 5

url = f"{base_url}/{key}/{request_type}/{service}/{start_index}/{end_index}"
print(url)

## 2) 요청하기

In [None]:
import requests 

response = requests.get(url)
print(response)

## 3) 데이터 확인하기

In [None]:
# 데이터를 텍스트로 가져오기
print(type(response.text))
print(response.text)

In [None]:
# 데이터를 딕셔너리로 가져오기
print(type(response.json()))
print(response.json())

In [None]:
data = response.json()
data

In [None]:
print(data.keys())

In [None]:
print(data["stationInfo"].keys())

In [None]:
items = data["stationInfo"]["row"]
print(len(items))
print(items)

## 4) 데이터 요청 제한 확인하기

### (1) URL 만들기

In [None]:
# 데이터 사이트: https://data.seoul.go.kr/dataList/OA-13252/F/1/datasetView.do

# http://openapi.seoul.go.kr:8088/(인증키)/json/tbCycleStationInfo/1/5/
base_url = "http://openapi.seoul.go.kr:8088"

key = os.getenv("SEOUL_PUBLIC_API_KEY")
request_type = "json"
service = "tbCycleStationInfo"
start_index = 1
end_index = 1001 # 3210, 1001로 바꿔보세요.

url = f"{base_url}/{key}/{request_type}/{service}/{start_index}/{end_index}"
print(url)

### (2) 요청하기

In [None]:
import requests 

response = requests.get(url)
print(response)

### (3) 데이터 확인하기

In [None]:
# 데이터를 텍스트로 가져오기
print(type(response.text))
print(response.text)

In [None]:
# 한 번 요청할 때 1000개만 가져올 수 있다. -- 반복문
## 전체가 3210개 -- 몇 번 요청 4
## start - end 
## 1 - 1000
## 1001 - 2000
## 2001 - 3000
## 3001 - 4000

In [None]:
## 0. start = 1 변수를 만든다. item_list를 만든다. 
## 1. 4번 반복하는 반복문을 만든다. 
## 2. 반복할 때마다 end를 생성하고, start, end를 출력한다. 
## 3. start, end가 반영된 URL를 만든다. 
## 4. URL을 요청한다.  
## 5. 응답받은 데이터에서 items를 추출한다. 
## 6. 그리고 start를 업데이트한다. 
## 7. 반복문이 끝난 후, item_list의 개수를 출력한다. - 3210개가 맞는지 확인한다. 
## 8. 데이터프레임으로 바꾼다. 
## 9. 데이터를 저장한다. 

In [None]:
## (추가 미션) range(start, end, step) 이용해보기 , While True: 이용해보기

In [None]:
import pandas as pd

In [None]:
def getUrl(start, end):
    return f"{base_url}/{key}/{request_type}/{service}/{start}/{end}"

def save(item_list):
    df = pd.DataFrame(item_list)
    df.to_csv(
        "../data/seoul_open_square.csv"
    )

In [None]:
# Hint:
item_list = []
start = 1 

for i in range(4):
    end = start + 1000 - 1
    print(start, end)
    url = getUrl(start, end)
    response = requests.get(url)
    data = response.json()
    item_list.append(data["stationInfo"]["row"])
    start += 1000

print(len(item_list))

save(item_list)
    

In [None]:
# Hint:
item_list = []

for start in range(1, 4001, 1000):
    end = start + 1000 - 1 
    print(start, end)
    url = getUrl(start, end)
    response = requests.get(url)
    data = response.json()
    item_list.append(data["stationInfo"]["row"])

print(len(item_list))

save(item_list)

In [None]:
item_list = []

start = 1
count = 0

while True:
    if count < 4:
        break
    end = start + 1000 -1
    count += 1
    url = getUrl(start, end)
    response = requests.get(url)
    data = response.json()
    item_list.append(data["stationInfo"]["row"])

print(len(item_list))

save(item_list)   