#**1. 서울 열린데이터 광장**
[서울 열린데이터 광장(Seoul Open Data Plaza)](https://data.seoul.go.kr/)은 서울시에서 운영하는 공공데이터 개방 플랫폼입니다. 시민, 연구자, 기업 등이 서울시에서 생성한 다양한 공공데이터를 자유롭게 활용할 수 있도록 제공하고 있습니다. 이를 통해 데이터 기반의 창의적인 아이디어와 혁신을 촉진하며, 시민들의 정보 접근성을 높이고 공공서비스를 개선하는 데 기여하고 있습니다.

#**2. 서울시 공공자전거 실시간 대여정보**
1. 인증키를 발급 받습니다.

2. "서울시 공공자전거 실시간 대여정보" 를 검색합니다.

인증키 정보: 524e677a5a77623035354651727871

In [1]:
# xml : xml or json파일 : json: 어떤 언어로 데이터를 받을 것인지
# 인증키 넣고 사이트 들어가보면 JSON언어 나옴

#**2.JSON**
JSON(JavaScript Object Notation)은 자바스크립트 객체 표기법을 기반으로 한 데이터 교환 형식으로, 사람도 읽기 쉽고 기계도 쉽게 분석하고 생성할 수 있는 텍스트 기반의 데이터 포맷입니다. 일반적으로 서버와 클라이언트 간에 데이터를 주고받을 때 많이 사용되며, 구조는 키-값 쌍으로 이루어진 객체 형태나 배열 형태를 사용합니다. 자바스크립트에서는 JSON.stringify()를 사용해 객체를 JSON 문자열로 변환하고, JSON.parse()를 사용해 JSON 문자열을 다시 객체로 변환할 수 있습니다. 언어에 독립적이면서도 자바스크립트와 호환성이 뛰어나 웹 개발뿐만 아니라 다양한 API 통신, 데이터 저장 및 전송 등에 널리 활용됩니다.

In [2]:
# 데이터를 저장할 때, 형식을 이렇게 하면 서로 데이터 주고 받기도 편할 거야 라고 만들어진 언어
# 데이터를 주고 받을 때 포맷을 해주는 녀석

### JSON 문법 구조

1. 객체(Object)
- 중괄호 {} 사용
- 내부에 "key": value 형식으로 속성-값 쌍을 나열
- 각 쌍은 쉼표 ,로 구분
- 값으로는 문자열, 숫자, 불리언, 배열, 객체 모두 가능

```
{
  "name": "김사과",
  "age": 20,
  "isStudent": true,
  "skills": ["HTML", "CSS", "JavaScript"]
}
```

In [3]:
# 키는 무조건 쌍따옴표

2. 배열(Array)
- 대괄호 [] 사용
- 여러 개의 값을 순서대로 나열
- 요소는 숫자, 문자열, 객체 등 다양한 데이터 가능

```
[
  "사과",
  "바나나",
  "오렌지"
]
```

3. JSON 안에 JSON (중첩 구조)
- 객체 안에 객체, 객체 안에 배열도 가능
- 실제 API 응답이나 설정 파일에서 많이 사용됨
```
{
  "name": "김사과",
  "address": {
    "city": "서울",
    "zipcode": "12345"
  },
  "skills": ["HTML", "CSS", "JavaScript"]
}
```

4. JSON 규칙 (중요)
- 문자열은 반드시 큰따옴표 " ", 작은따옴표 ' '는 - 에러 발생
- 키(key)도 반드시 쌍따옴표 " "로 감싸야 함
- 값(value)에는 객체, 배열, 문자열, 숫자, 불리언, null 사용 가능
- 마지막 항목 뒤에는 쉼표 금지
- JSON은 순수 데이터 형식이기 때문에 //, /* */ 같은 주석 사용 불가


#**3. 서울시 공공자전거 실시간 대여정보**


In [4]:
import requests # 서울시 공공데이터의 인터넷으로 접속해가지고 거기 있는 정보를 가져오기 위해서 쓰는 모듈/ 즉, 서버에 접속하는 모듈
import folium  # 지도에 그리는 모듈
import json    # 제이쓴 데이터를 다룰 수 있는 모듈
import pandas as pd   # 판다스 데이터 프레임 만들 때 쓰는 모듈
import warnings    # 우리가 프로그램을 짜다 보면 에러는 아닌데 가끔 원인이 뜨는 경우가 있음 , 이렇게 좀 했으면 좋겠어하면서 원인이 뜨는 경우 있는데 이건 에러가 아니라서
#만약에 보기 싫다면 이렇게 워닝 모듈을 가져다가 '필터워닝'이라고 써서 '이그노'라고 써주시면 원인이 뜨지 않는다 에러인 경우에만 뜨고
warnings.filterwarnings('ignore')

In [5]:
base_url = 'http://openapi.seoul.go.kr:8088/524e677a5a77623035354651727871/json/bikeList/1/5/'
response = requests.get(base_url) # 접속하겠단 의미, 위에 서버에 접속하겠다는 얘기 거기에 돌려받는 값을 여기(response)에 저장
response  # 정보 다 가져온 상태, 담겨진 상태/ 200 이라는 의미는 정상적으로 결과가 돌려받았다는 얘기/400번 때는 페이지가 없어서 호출 못했어 이런 의미

<Response [200]>

In [6]:
json_data = response.json() # 제이쓴이라는 메소드를 사용하게 되면 실제 이 안에 들어있는 제이스만 꺼내 가지고 여기다 담아 준다
json_data

{'rentBikeStatus': {'list_total_count': 5,
  'RESULT': {'CODE': 'INFO-000', 'MESSAGE': '정상 처리되었습니다.'},
  'row': [{'rackTotCnt': '15',
    'stationName': '102. 망원역 1번출구 앞',
    'parkingBikeTotCnt': '20',
    'shared': '133',
    'stationLatitude': '37.55564880',
    'stationLongitude': '126.91062927',
    'stationId': 'ST-4'},
   {'rackTotCnt': '14',
    'stationName': '103. 망원역 2번출구 앞',
    'parkingBikeTotCnt': '19',
    'shared': '136',
    'stationLatitude': '37.55495071',
    'stationLongitude': '126.91083527',
    'stationId': 'ST-5'},
   {'rackTotCnt': '13',
    'stationName': '104. 합정역 1번출구 앞',
    'parkingBikeTotCnt': '4',
    'shared': '31',
    'stationLatitude': '37.55073929',
    'stationLongitude': '126.91508484',
    'stationId': 'ST-6'},
   {'rackTotCnt': '5',
    'stationName': '105. 합정역 5번출구 앞',
    'parkingBikeTotCnt': '1',
    'shared': '20',
    'stationLatitude': '37.55000687',
    'stationLongitude': '126.91482544',
    'stationId': 'ST-7'},
   {'rackTotCnt': '12',

In [7]:
# 크롤링: 인터넷에 있는 데이터를 끌어와서 내가 데이터를 저장하는 것

In [8]:
# json 데이터 가져오려면 Key를 가지고 값을 가져오면 된다
# 딕셔너리에 get()가 실제 키를 주면 값을 가져온다 , get()사용

In [9]:
json_data.get("rentBikeStatus", {}).get("RESULT", {}).get("CODE", "")
# 없으면 , {} 중괄호 써줘 라는 의미/ 빈데이터라면 ""/빈데이터라면{}
# rentBikeStatus 안에 있는 RESULT 안에 있는 "CODE"의 값을 가져옴 =>INFO-000
# 순차적으로 해서 데이터 가져올 수 있다
# 아래 것보다 이게 베스트 코드 => 값이 없으면 에러가 나지않고 대체값이 있기 때문에 더 좋은 방법이라 생각

'INFO-000'

In [10]:
json_data["rentBikeStatus"]["RESULT"]["CODE"] # 이렇게도 가능

'INFO-000'

In [14]:
def fetch_bike_data():
    base_url = "http://openapi.seoul.go.kr:8088/524e677a5a77623035354651727871/json/bikeList/" # 접속할 주소
    start = 1
    end = 1000  # 공공데이터 서울시 데이터 보면 천개씩만 가져올 수 있다고 되어있다, 한번호출할때 천개씩만 가져올 수 있다 근데 이 데이터가 실질적으로 2000개이다
                #/ 그러면 데이터를 1부터 1000까지 한번 부르고 그다음에 1000부터 2000까지 부르고 그런다음 2000부터 끝까지 불러줘야함 그런식으로 나눠서 호출 해줘야 한다 한번에 호출 못함
                # 그래서 step 1000개씩/ 점프점프하면서 나중에 가져오려고
    step = 1000
    data_frames = []
# 데이터를 저장하려는 것, 계속 실시간으로 오는 데이터를 이제 데이터 프레임에다가 저장해서 메모리에 저장

    while True:  # shile를 쓴 이유는 일부터 천까지 다음에 1000(여기를) 바꿔가면서 하기 위해
        # "http://openapi.seoul.go.kr:8088/524e677a5a77623035354651727871/json/bikeList/1/1000"
        url = f"{base_url}{start}/{end}/"   # start =1, end=1000
        response = requests.get(url) #그 정보 천개를 가져와서 여기다가 저장

        if response.status_code != 200:   # 200은 제대로 가져온것 그러나 200이 아니라면
            print(f"Status Code: {response.status_code}")
            break

        json_data = response.json()

        try:
            rent_bike_status = json_data["rentBikeStatus"]
            result_code = rent_bike_status["RESULT"]["CODE"]
        except KeyError:   # KeyError 에러가 날 경우
            print("JSON 오류")
            break

        if result_code == "INFO-200":  #INFO-200 데이터 없음이라는 의미
            print("데이터 없음")
            break
        elif result_code == "INFO-000":
            print(f"시작: {start} 끝: {end}.")
            try:  #값을 뽑아내기
                bike_data = rent_bike_status["row"]
                if bike_data:  #bike_data 가 있으면(True)
                    df = pd.DataFrame(bike_data)
                    data_frames.append(df) #리스트의 0번째에는,ㅣ1~1000까지 있는 데이터프레임이 있다/ 리스트의 1번째는 1001~1002까지 있는 데이터프레임/리스트의 2번째에는 2001~~3000까지 데이터프레임
            except KeyError:   #에러날 경우
                print("데이터를 찾을 수 없음")

        elif result_code == "ERROR-336": # 데이터 개수1000개 넘길경우
            print("데이터요청은 한번에 최대 1,00건을 넘을 수 없습니다")
            break

        else:  # 전체적으로 아닐때
            print(f"result code: {result_code}")
            break

        start += step   #1, 1001,2001, ...
        end += step

    if data_frames:         #data_frames 이 리스트가 만얀 들어 있다면
        final_df = pd.concat(data_frames, ignore_index=True)  #ignore_index=True 인덱스를 제외하고 새로 합쳐줘/인덱스 새롭게 생성
        return final_df
    else:
        return pd.DataFrame()  # 없다면 빈데이터프레임 생성

In [15]:
bike_data_df = fetch_bike_data() # 마지막에 데이터가 없기 때문에 오류

시작: 1 끝: 1000.
시작: 1001 끝: 2000.
시작: 2001 끝: 3000.
JSON 오류


In [16]:
bike_data_df  #잘 가져옴

Unnamed: 0,rackTotCnt,stationName,parkingBikeTotCnt,shared,stationLatitude,stationLongitude,stationId
0,15,102. 망원역 1번출구 앞,20,133,37.55564880,126.91062927,ST-4
1,14,103. 망원역 2번출구 앞,19,136,37.55495071,126.91083527,ST-5
2,13,104. 합정역 1번출구 앞,19,146,37.55073929,126.91508484,ST-6
3,5,105. 합정역 5번출구 앞,1,20,37.55000687,126.91482544,ST-7
4,12,106. 합정역 7번출구 앞,2,17,37.54864502,126.91282654,ST-8
...,...,...,...,...,...,...,...
2743,32,6184. 한강버스 마곡 선착장,44,138,37.57402039,126.84357452,ST-2492
2744,8,6185.가양나들목,12,150,37.57341003,126.84345245,ST-3418
2745,12,6187.마곡119안전센터 맞은편,38,317,37.55534744,126.82072449,ST-3415
2746,10,6188.금호아파트,19,190,37.55619049,126.86463928,ST-3419


In [17]:
bike_data_df.info()  #OBJECT문자형

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2748 entries, 0 to 2747
Data columns (total 7 columns):
 #   Column             Non-Null Count  Dtype 
---  ------             --------------  ----- 
 0   rackTotCnt         2748 non-null   object
 1   stationName        2748 non-null   object
 2   parkingBikeTotCnt  2748 non-null   object
 3   shared             2748 non-null   object
 4   stationLatitude    2748 non-null   object
 5   stationLongitude   2748 non-null   object
 6   stationId          2748 non-null   object
dtypes: object(7)
memory usage: 150.4+ KB


In [19]:
'''
rackTotCnt	거치대개수
parkingBikeTotCnt	자전거주차총건수
shared	거치율
stationLatitude	위도
stationLongitude	경도
stationId	대여소ID
stationName	대여소이름
'''
bike_data_df.columns

Index(['rackTotCnt', 'stationName', 'parkingBikeTotCnt', 'shared',
       'stationLatitude', 'stationLongitude', 'stationId'],
      dtype='object')

In [None]:
# 위,경도로 해보기 근데 지금 문자여서 type을 바꿔야함

In [20]:
bike_data_df['stationLongitude'] = bike_data_df['stationLongitude'].astype(float)
bike_data_df['stationLatitude'] = bike_data_df['stationLatitude'].astype(float)
# astype => type바꾸기

In [21]:
bike_map = folium.Map(location=[bike_data_df['stationLatitude'].mean(),   # 위경도 평균 구해서 지도의 중앙 찾기
                                bike_data_df['stationLongitude'].mean()],
                                zoom_start=12)

for index, data in bike_data_df.iterrows():  #iterrows() : "bike_data_df의 데이터를 하나씩 꺼내면서" index,data 각각 하나씩 숫자증가,한줄한줄 들어간다
    popup_str = '{} 자전거주차총건수:{}대'.format(      # 반복을 하면서 앞에 {}에는 stationName'/ 뒤에 {}에는 parkingBikeTotCnt
      data['stationName'], data['parkingBikeTotCnt']
    )
    popup = folium.Popup(popup_str, max_width=600) # 그것을 Popup객체로 바로 600픽셀로 만들어준 후
    folium.Marker(location=[data['stationLatitude'], data['stationLongitude']], #marker로 찍어준다
                  popup=popup).add_to(bike_map)

bike_map  #서울에 있는 따릉이 위치
