## CURL 커맨드 연습

In [2]:
import curl

In [3]:
!curl http://httpbin.org/ip

{
  "origin": "124.50.126.65"
}


In [4]:
!curl http://httpbin.org/get

{
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Host": "httpbin.org", 
    "User-Agent": "curl/7.71.1", 
    "X-Amzn-Trace-Id": "Root=1-613ea783-15dae1a95db789dd45503d98"
  }, 
  "origin": "124.50.126.65", 
  "url": "http://httpbin.org/get"
}


In [5]:
!curl http://httpbin.org/get?myname='js'

zsh:1: no matches found: http://httpbin.org/get?myname=js


In [6]:
!curl http://httpbin.org

<!DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <title>httpbin.org</title>
    <link href="https://fonts.googleapis.com/css?family=Open+Sans:400,700|Source+Code+Pro:300,600|Titillium+Web:400,600,700"
        rel="stylesheet">
    <link rel="stylesheet" type="text/css" href="/flasgger_static/swagger-ui.css">
    <link rel="icon" type="image/png" href="/static/favicon.ico" sizes="64x64 32x32 16x16" />
    <style>
        html {
            box-sizing: border-box;
            overflow: -moz-scrollbars-vertical;
            overflow-y: scroll;
        }

        *,
        *:before,
        *:after {
            box-sizing: inherit;
        }

        body {
            margin: 0;
            background: #fafafa;
        }
    </style>
</head>

<body>
    <a href="https://github.com/requests/httpbin" class="github-corner" aria-label="View source on Github">
        <svg width="80" height="80" viewBox="0 0 250 250" style="fill:#151513;

## Requests 연습

In [7]:
import requests

In [8]:
r = requests.options("http://httpbin.org/")

In [9]:
print(r.headers['allow'])

HEAD, OPTIONS, GET


### Response value
- 200 성공
- 300 우회
- 404 클라이언트 오류 / 403 접근 금지
- 500 서버 오류 / 501 미구현 오류

## Get

In [10]:
print(r)
print(r.status_code)

<Response [200]>
200


In [11]:
bad_r = requests.get("http://httpbin.org/status/404")
print(bad_r)

<Response [404]>


## Post
- 무언가를 가져오는게 주인 수업이기에 자주 사용하진 않을 것
- 업데이트 (추가) 시켜줌

In [12]:
r = requests.post("http://httpbin.org/post", data = { "name" : "js" })

In [13]:
r.json()

{'args': {},
 'data': '',
 'files': {},
 'form': {'name': 'js'},
 'headers': {'Accept': '*/*',
  'Accept-Encoding': 'gzip, deflate',
  'Content-Length': '7',
  'Content-Type': 'application/x-www-form-urlencoded',
  'Host': 'httpbin.org',
  'User-Agent': 'python-requests/2.24.0',
  'X-Amzn-Trace-Id': 'Root=1-613ea78b-7ba415300c0dfaca52373980'},
 'json': None,
 'origin': '124.50.126.65',
 'url': 'http://httpbin.org/post'}

## Head

In [14]:
# 헤더 정보를 가져와줌
r = requests.head("http://httpbin.org/")

In [15]:
print(r.headers)

{'Date': 'Mon, 13 Sep 2021 01:21:17 GMT', 'Content-Type': 'text/html; charset=utf-8', 'Content-Length': '9593', 'Connection': 'keep-alive', 'Server': 'gunicorn/19.9.0', 'Access-Control-Allow-Origin': '*', 'Access-Control-Allow-Credentials': 'true'}


In [16]:
r.headers["Content-Type"]

'text/html; charset=utf-8'

## Urllib
- 마찬가지로 수업에서 간혹 사용 예정

In [17]:
import urllib

class HeadRequest(urllib.request.Request):
    def get_method(self):
        return "HEAD"

response = urllib.request.urlopen(HeadRequest("http://httpbin.org/"))

In [18]:
print(response.info())
print(response.geturl())

Date: Mon, 13 Sep 2021 01:21:22 GMT
Content-Type: text/html; charset=utf-8
Content-Length: 9593
Connection: close
Server: gunicorn/19.9.0
Access-Control-Allow-Origin: *
Access-Control-Allow-Credentials: true


http://httpbin.org/


# XML
- Extensible Markup Language

In [19]:
import lxml.etree

In [20]:
input = '''
<students>
    <student x="1">
        <id>001</id>
        <name>Kim</name>
    </student>
    <student x="2">
        <id>002</id>
        <name>Lee</name>
    </student>
</students>
'''

In [21]:
# 읽기 방법, string에서 or file에서
root = lxml.etree.fromstring(input)
root

<Element students at 0x7f84005c2d00>

In [22]:
from io import StringIO
tree = lxml.etree.parse(StringIO(input))
root2 = tree.getroot()

In [23]:
root2

<Element students at 0x7f83e0242040>

In [84]:
%%writefile src/ds_open_hello.xml
<students>
<student x="1">
    <id>001</id>
    <name>Kim</name> 
</student>
<student x="2"> 
    <id>002</id>
    <name>Lee</name> 
</student>
</students>

Overwriting src/ds_open_hello.xml


In [24]:
!ls src

201611125_homework_week2.json ds_open_hello.xml
201611125_homework_week2.xml


In [25]:
import os
os.getcwd()

'/Users/jeongxoo/Desktop/BigDataAnalysis/201611125'

In [26]:
tree2 = lxml.etree.parse(os.path.join("src", "ds_open_hello.xml"))
root3 = tree2.getroot()

In [27]:
root3

<Element students at 0x7f83e0245280>

### 이렇게 읽어온 루트의 내용(tag 등)은 다 str 타입이기에 파싱이 필요함

In [28]:
type(root.tag)

str

In [29]:
for e in root:
    print(e.tag)

student
student


In [30]:
# 그냥 루트 안에 요소를 반복시킨것과 비슷하게 루트 하위 요소를 리스트로 반환
child_list = root.getchildren()

In [31]:
for a in child_list:
    for b in a.getchild():
        if not e.text:
            text = "no"

AttributeError: 'lxml.etree._Element' object has no attribute 'getchild'

# 문제 1: IP 주소에서 지역정보 알아내기
- ipstack api를 사용하여 ip주소의 국가, 위경도, 지역을 알아내는 API 제공
- 수업 인증키 : d7cdd0602f68e39767eba8a0e245e849
- url : "http://api.ipstack.com/<ip주소>?access_key=<key값>"

In [36]:
url = "http://api.ipstack.com/124.50.126.65?access_key=d7cdd0602f68e39767eba8a0e245e849"

In [37]:
response = requests.get(url)

json 형태로 불러와지지만 실제는 문자열이기 때문에 이걸 json으로 바꿔주는 함수 사용
- json.loads()

In [40]:
response.text

'{"ip": "124.50.126.65", "type": "ipv4", "continent_code": "AS", "continent_name": "Asia", "country_code": "KR", "country_name": "South Korea", "region_code": "11", "region_name": "Seoul", "city": "Seoul", "zip": "140-701", "latitude": 37.53200149536133, "longitude": 126.97750091552734, "location": {"geoname_id": 1835848, "capital": "Seoul", "languages": [{"code": "ko", "name": "Korean", "native": "\\ud55c\\uad6d\\uc5b4"}], "country_flag": "https://assets.ipstack.com/flags/kr.svg", "country_flag_emoji": "\\ud83c\\uddf0\\ud83c\\uddf7", "country_flag_emoji_unicode": "U+1F1F0 U+1F1F7", "calling_code": "82", "is_eu": false}}'

In [41]:
import json

In [45]:
geo = json.loads(response.text)
geo

{'ip': '124.50.126.65',
 'type': 'ipv4',
 'continent_code': 'AS',
 'continent_name': 'Asia',
 'country_code': 'KR',
 'country_name': 'South Korea',
 'region_code': '11',
 'region_name': 'Seoul',
 'city': 'Seoul',
 'zip': '140-701',
 'latitude': 37.53200149536133,
 'longitude': 126.97750091552734,
 'location': {'geoname_id': 1835848,
  'capital': 'Seoul',
  'languages': [{'code': 'ko', 'name': 'Korean', 'native': '한국어'}],
  'country_flag': 'https://assets.ipstack.com/flags/kr.svg',
  'country_flag_emoji': '🇰🇷',
  'country_flag_emoji_unicode': 'U+1F1F0 U+1F1F7',
  'calling_code': '82',
  'is_eu': False}}

In [47]:
print(type(geo))

<class 'dict'>


json 파일에서 key를 사용해 값을 찾기

In [46]:
print(geo.get("ip"))
print(geo["ip"])

124.50.126.65
124.50.126.65


In [48]:
# 반복을 통한 전체 출력
for key, value in geo.items():
    print("%s  ->  %s" % (key, value))

ip  ->  124.50.126.65
type  ->  ipv4
continent_code  ->  AS
continent_name  ->  Asia
country_code  ->  KR
country_name  ->  South Korea
region_code  ->  11
region_name  ->  Seoul
city  ->  Seoul
zip  ->  140-701
latitude  ->  37.53200149536133
longitude  ->  126.97750091552734
location  ->  {'geoname_id': 1835848, 'capital': 'Seoul', 'languages': [{'code': 'ko', 'name': 'Korean', 'native': '한국어'}], 'country_flag': 'https://assets.ipstack.com/flags/kr.svg', 'country_flag_emoji': '🇰🇷', 'country_flag_emoji_unicode': 'U+1F1F0 U+1F1F7', 'calling_code': '82', 'is_eu': False}


# 공공데이터
- 정부에서 포털 형식으로 제공, 다양한 데이터 존재
- 지역구 별로 열린데이터도 존재 data.시군구.go.kr로 구성
- 공공 데이터 -> data.go.kr
- url에 query parameter를 추가하여 사용 url?키=값&키=값 의형태
- 열린 데이터 -> data.시군구.go.kr (data.seoul.go.kr)
- http://openAPI.seoul.go.kr:/8088 처럼 /로 구분

In [1]:
%%writefile src/mylib.py
def getKey(keyPath):
    d = dict()
    f = open(keyPath, 'r')
    for line in f.readlines():
        row = line.split("=")
        row0 = row[0]
        d[row0] = row[1].strip()
    return d

Overwriting src/mylib.py


In [2]:
import src.mylib as my
# from src import mylib as my

In [3]:
my_key = my.getKey("src/key.properties")
# key_path = os.path.join(os.getcwd(), "src", "key.properties")
# my_key = my.getKey(key_path)

In [4]:
my_key

{'seoul': '6c434d45767761743130365a72697948',
 'gokr': '8107VbWaEhOG6C3lQPQORjhLXAP3z%2B8gbdHoZ1XY8NIjoxP3vgCuHH%2BLuYP9sIASx2uM6c1nneYhcq1TljaWyw%3D%3D'}

In [5]:
my_key["seoul"]

'6c434d45767761743130365a72697948'

# 문제 2: 서울시 지하철 역 정보 수집
- SearchSTNBySubwayLineInfo 사용
- KEY	String	발급받은 인증키
- TYPE	String	xml, xmlf, xls, json 데이터 형식
- SERVICE	String	서비스명
- START_INDEX	Integer	페이징 시작번호
- END_INDEX	Integer	페이징 끝번호
- STATION_CD	String (선택)	전철역코드
- STATION_NM	String (선택)	전철역명
- LINE_NM	String (선택)	호선 1~9: 1~9호선, I: 인천1호선, K: 경의중앙선, B: 분당선, A:공항철도, G: 경춘선, S:신분당선, SU:수인선. 현재 서울교통공사관할인 1~9호선 정보만 제공.

- 샘플 url : http://openapi.seoul.go.kr:8088/73725974496a736c34395757705847/json/SearchSTNBySubwayLineInfo/1/10///2%ED%98%B8%EC%84%A0

In [6]:
import os
import urllib
import requests
from src import mylib as my

keyPath = os.path.join(os.getcwd(), "src", "key.properties")
key = my.getKey(keyPath)
KEY = str(key["seoul"])

JSON으로 불러오기

In [7]:
TYPE = "json"
SERVICE = "SearchSTNBySubwayLineInfo"
START_INDEX = str(1)
END_INDEX = str(10)
LINE_NUM = str(2)

In [8]:
params = "/".join([KEY, TYPE, SERVICE, START_INDEX, END_INDEX, "", "", LINE_NUM])

In [9]:
params

'6c434d45767761743130365a72697948/json/SearchSTNBySubwayLineInfo/1/10///2'

In [10]:
# 잘못된 형태
_url = "http://openAPI.seoul.go.kr:8088/"
url = urllib.parse.urljoin(_url, params)
print(url)

http://openAPI.seoul.go.kr:8088/6c434d45767761743130365a72697948/json/SearchSTNBySubwayLineInfo/1/10/2


In [11]:
# 정상 형태
_url = "http://openAPI.seoul.go.kr:8088"
url = "/".join([_url, params])
print(url)

http://openAPI.seoul.go.kr:8088/6c434d45767761743130365a72697948/json/SearchSTNBySubwayLineInfo/1/10///2


In [12]:
response = requests.get(url)
stations = response.json()

In [14]:
type(stations)

dict

In [96]:
for info in stations["SearchSTNBySubwayLineInfo"]["row"]:
    print ("{0:4s}\t{1:15s}\t{2:3s}\t{3:2s}".format(info['STATION_CD'], info['STATION_NM'], info['FR_CODE'], info['LINE_NUM']))

0159	동묘앞            	127	01호선
0309	지축             	319	03호선
0321	충무로            	331	03호선
0333	매봉             	343	03호선
101C	회기             	K118	경의선
0228	서울대입구          	228	02호선
0242	아현             	242	02호선
0310	구파발            	320	03호선
0338	일원             	348	03호선
0229	봉천             	229	02호선


## 일괄 실행 프로그램
- 결과는 json, DB 저장 없이 단순 출력

In [16]:
import requests

In [30]:
%%writefile src/ds_open_subway_json.py
import os
import urllib
import requests
import mylib as my


def doIt():
    keyPath = os.path.join(os.getcwd(), "src", "key.properties")
    key = my.getKey(keyPath)
    KEY = str(key["seoul"])
    
    TYPE = "json"
    SERVICE = "SearchSTNBySubwayLineInfo"
    START_INDEX = str(1)
    END_INDEX = str(10)
    LINE_NUM = str(2)
    params = "/".join([KEY, TYPE, SERVICE, START_INDEX, END_INDEX, "", "", LINE_NUM])
    
    # 정상 형태
    _url = "http://openAPI.seoul.go.kr:8088"
    url = "/".join([_url, params])
    
    response = requests.get(url)
    stations = response.json()
    
    for info in stations["SearchSTNBySubwayLineInfo"]["row"]:
        print ("{0:4s}\t{1:15s}\t{2:3s}\t{3:2s}".format(info['STATION_CD'], info['STATION_NM'], info['FR_CODE'], info['LINE_NUM']))
    
if __name__ == "__main__":
    doIt()

Overwriting src/ds_open_subway_json.py


In [32]:
!python src/ds_open_subway_json.py

0159	동묘앞            	127	01호선
0416	미아사거리          	416	04호선
0423	충무로            	423	04호선
1004	노량진            	136	01호선
1010	한남             	K113	경의선
0309	지축             	319	03호선
0321	충무로            	331	03호선
0333	매봉             	343	03호선
0340	가락시장           	350	03호선
0424	명동             	424	04호선


## 결과가 없을때 까지 반복

In [101]:
%%writefile src/ds_open_subway_iter_json.py
#!/usr/bin/env python
# coding: utf-8
import os
import requests
import urllib
import mylib as my # NO! src.mylib

def doIt():
    keyPath = os.path.join(os.getcwd(), 'src', 'key.properties')
    key = my.getKey(keyPath)
    KEY = str(key['seoul'])
    TYPE = 'json'
    SERVICE = 'SearchSTNBySubwayLineInfo'
    LINE_NUM = str(2)
    START_INDEX = str(1)
    END_INDEX = str(10)
    startIndex = 1
    endIndex = 10
    list_total_count = 0    # set later
    
    while True:
        START_INDEX = str(startIndex)
        END_INDEX = str(endIndex)
       
        params="/".join([KEY,TYPE,SERVICE,START_INDEX,END_INDEX,'','',LINE_NUM])
        _url='http://openAPI.seoul.go.kr:8088' #NOTE slash: do not use 'http://openAPI.seoul.go.kr:8088/'
        url="/".join([_url,params])

        r = requests.get(url)
        stations=r.json()

        if(startIndex==1):
            list_total_count=stations['SearchSTNBySubwayLineInfo']['list_total_count']
            print("- Total Count: ", list_total_count)
        
        for e in stations['SearchSTNBySubwayLineInfo']['row']:
            print (u"{0:4s}\t{1:15s}\t{2:3s}\t{3:2s}".format(e['STATION_CD'], e['STATION_NM'], e['FR_CODE'], e['LINE_NUM']))
       
        startIndex+=10
        endIndex+=10
        
        if(endIndex > list_total_count):
            print("----- Ending endIndex=",endIndex)
            break  # exit from the while loop

if __name__ == "__main__":
    doIt()

Writing src/ds_open_subway_iter_json.py


In [102]:
!python3 src/ds_open_subway_iter_json.py

- Total Count:  748
0159	동묘앞            	127	01호선
0309	지축             	319	03호선
0321	충무로            	331	03호선
0333	매봉             	343	03호선
101C	회기             	K118	경의선
0228	서울대입구          	228	02호선
0242	아현             	242	02호선
0310	구파발            	320	03호선
0338	일원             	348	03호선
0229	봉천             	229	02호선
0328	잠원             	338	03호선
0335	대치             	345	03호선
0230	신림             	230	02호선
0244	용답             	211-1	02호선
1729	당정             	P151	01호선
0154	종로5가           	129	01호선
0231	신대방            	231	02호선
0247	도림천            	234-1	02호선
0314	홍제             	324	03호선
0206	신당             	206	02호선
0237	당산             	237	02호선
0316	독립문            	326	03호선
0322	동대입구           	332	03호선
0336	학여울            	346	03호선
1890	신포             	K271	수인분당선
0220	선릉             	220	02호선
0238	합정             	238	02호선
0248	양천구청           	234-2	02호선
0317	경복궁            	327	03호선
0334	도곡             	344	03호선
2562	강일             	554	05호선
0239	홍대입구           	239	02호선
0245	신답    

1754	상록수            	448	04호선
1755	한대앞            	449	04호선
1756	중앙             	450	04호선
1757	고잔             	451	04호선
1758	초지             	452	04호선
1759	안산             	453	04호선
1760	신길온천           	454	04호선
1761	정왕             	455	04호선
1762	오이도            	456	04호선
1763	수리산            	445	04호선
1801	개봉             	143	01호선
1802	오류동            	144	01호선
1803	역곡             	146	01호선
1804	부천             	148	01호선
1805	송내             	150	01호선
1806	부평             	152	01호선
1807	백운             	153	01호선
1808	동암             	154	01호선
1809	주안             	156	01호선
1810	제물포            	158	01호선
1811	동인천            	160	01호선
1812	인천             	161	01호선
1813	구일             	142	01호선
1720	진위             	P161	01호선
1800	오이도            	K258	수인분당선
1814	소사             	147	01호선
1815	부개             	151	01호선
1816	간석             	155	01호선
1817	도원             	159	01호선
1821	온수             	145	01호선
1822	중동             	149	01호선
1823	도화             	157	01호선
1830	한대앞            	K251	수인분당선
1831	

3116	작전             	I116	인천선
3117	갈산             	I117	인천선
3118	부평구청           	I118	인천선
3119	부평시장           	I119	인천선
3120	부평             	I120	인천선
3121	동수             	I121	인천선
3122	부평삼거리          	I122	인천선
3123	간석오거리          	I123	인천선
3124	인천시청           	I124	인천선
3125	예술회관           	I125	인천선
3126	인천터미널          	I126	인천선
3127	문학경기장          	I127	인천선
3129	신연수            	I129	인천선
3130	원인재            	I130	인천선
3131	동춘             	I131	인천선
3132	동막             	I132	인천선
3133	캠퍼스타운          	I133	인천선
3134	테크노파크          	I134	인천선
3135	지식정보단지         	I135	인천선
3136	인천대입구          	I136	인천선
3137	센트럴파크          	I137	인천선
3138	국제업무지구         	I138	인천선
3139	송도달빛축제공원       	I139	인천선
3201	검단오류           	I201	인천2호선
3202	왕길             	I202	인천2호선
3203	검단사거리          	I203	인천2호선
3204	마전             	I204	인천2호선
3205	완정             	I205	인천2호선
3207	검암             	I207	인천2호선
3128	선학             	I128	인천선
3206	독정             	I206	인천2호선
3208	검바위            	I208	인천2호선
3209	아시아드경기장        	I20

## XML
- 데이터를 xml로 받아오기

In [35]:
import lxml
import lxml.etree
import requests

url = 'http://openAPI.seoul.go.kr:8088/73725974496a736c34395757705847/xml/SearchSTNBySubwayLineInfo/1/10///2'
data = requests.get(url).text
tree = lxml.etree.fromstring(data.encode('utf-8'))

Xpath 사용 "//STATION_NM"은 어느 계층에서나 일치하는 태그 검색

In [40]:
for node in tree.xpath('//STATION_NM'):
    print (node.text)

동묘앞
미아사거리
충무로
노량진
한남
지축
충무로
매봉
가락시장
명동


In [105]:
%%writefile src/ds_open_subway_xml.py
#!/usr/bin/env python
# coding: utf-8
import os
import requests
import urllib
import mylib as my # NO! src.mylib
import lxml
import lxml.etree
from io import StringIO

def doIt():
    keyPath = os.path.join(os.getcwd(), 'src', 'key.properties')
    key = my.getKey(keyPath)
    
    # (1) make params with resource IDs
    KEY = str(key['seoul'])
    TYPE = 'xml'
    #OLD: SERVICE='SearchSTNBySubwayLineService'
    SERVICE = 'SearchSTNBySubwayLineInfo'
    LINE_NUM = str(2)
    START_INDEX = str(1)
    END_INDEX = str(10)
    startIndex = 1
    endIndex = 10
    list_total_count = 0    # set later
    
    while True:
        START_INDEX = str(startIndex)
        END_INDEX = str(endIndex)

        params = "/".join([KEY,TYPE,SERVICE,START_INDEX,END_INDEX,'','',LINE_NUM])

        # (2) make a full url
        _url = 'http://openAPI.seoul.go.kr:8088' #NOTE slash: do not use 'http://openAPI.seoul.go.kr:8088/'
        url="/".join([_url,params])

        # (3) get data
        data=requests.get(url).text
        tree=lxml.etree.fromstring(data.encode('utf-8'))

        if(startIndex==1):
            for node in tree.xpath('//list_total_count'):
                list_total_count=int(node.text)
                print ("- Total_count=",list_total_count)
       
        for node in tree.xpath('//STATION_NM'):
            print (node.text, end=", ")
        startIndex+=10
        endIndex+=10
        
        if(endIndex > list_total_count):
            print("----- Ending endIndex=", endIndex)
            break

if __name__ == "__main__":
    doIt()

Writing src/ds_open_subway_xml.py


In [106]:
!python3 src/ds_open_subway_xml.py

- Total_count= 748
동묘앞, 지축, 충무로, 매봉, 회기, 서울대입구, 아현, 구파발, 일원, 봉천, 잠원, 대치, 신림, 용답, 당정, 종로5가, 신대방, 도림천, 홍제, 신당, 당산, 독립문, 동대입구, 학여울, 신포, 선릉, 합정, 양천구청, 경복궁, 도곡, 강일, 홍대입구, 신답, 연신내, 남부터미널, 구로디지털단지, 안국, 양재, 대청, 역삼, 고속터미널, 교대, 상왕십리, 대림, 신도림, 문래, 영등포구청, 신촌, 이대, 신정네거리, 용두, 불광, 녹번, 무악재, 종로3가, 을지로3가, 금호, 옥수, 압구정, 수서, 왕십리, 한양대, 뚝섬, 성수, 건대입구, 구의, 강변, 잠실나루, 잠실, 잠실새내, 종합운동장, 삼성, 강남, 교대, 서초, 방배, 사당, 낙성대, 동대문, 신설동, 제기동, 청량리, 까치산, 시청, 을지로입구, 을지로3가, 을지로4가, 동대문역사문화공원, 신설동, 대곡, 약수, 신사, 가락시장, 경찰병원, 오금, 당고개, 상계, 노원, 창동, 쌍문, 충정로, 수유, 미아, 미아사거리, 길음, 성신여대입구, 한성대입구, 혜화, 동대문, 동대문역사문화공원, 충무로, 명동, 회현, 서울역, 숙대입구, 신용산, 이촌, 동작, 총신대입구, 사당, 남태령, 남영, 용산, 노량진, 대방, 영등포, 신도림, 이촌, 용산, 한남, 옥수, 응봉, 왕십리, 회기, 외대앞, 신이문, 삼각지, 서빙고, 석계, 광운대, 월계, 녹천, 창동, 선릉, 한티, 도곡, 구룡, 개포동, 대모산입구, 왕십리, 수서, 복정, 신길, 중랑, 상봉, 망우, 양원, 구리, 도농, 양정, 덕소, 도심, 팔당, 운길산, 양수, 신원, 국수, 아신, 오빈, 양평, 용문, 지평, 서울역, 신촌, 효창공원앞, 청량리, 원덕, 공덕, 서강대, 홍대입구, 가좌, 디지털미디어시티, 화전, 강매, 행신, 능곡, 곡산, 백마, 풍산, 일산, 탄현, 야당, 운정, 금릉, 금촌, 월롱, 파주, 문산, 임진강, 청량리, 중랑, 상봉, 망우, 신내, 별내, 퇴계원, 사릉, 금곡, 평내호

# 문제 3: 행정동별 서울생활 인구 (단기체류 외국인)
- SPOP_FORN_TEMP_RESD_DONG 사용

- KEY	String	발급받은 인증키
- TYPE	String	xml, xmlf, xls, json 데이터 형식
- SERVICE	String	서비스명
- START_INDEX	Integer	페이징 시작번호
- END_INDEX	Integer	페이징 끝번호
- STDR_DE_ID	String (선택)	기준일
- TMZON_PD_SE	String (선택)	시간대구분
- ADSTRD_CODE_SE	String (선택)	행정동코드

- 샘플 주소
http://openapi.seoul.go.kr:8088/(%EC%9D%B8%EC%A6%9D%ED%82%A4)/xml/SPOP_FORN_TEMP_RESD_DONG/1/5/20200617

In [107]:
%%writefile src/ds_open_foreigners_xml.py
import os
import urllib
import requests
import lxml
import lxml.etree
import mylib #from src import mylib

def doIt():
    keyPath=os.path.join(os.getcwd(), 'src', 'key.properties')
    key=mylib.getKey(keyPath)
    KEY=str(key['seoul'])
    TYPE='xml'
    SERVICE='SPOP_FORN_TEMP_RESD_DONG'
    START_INDEX=str(1)
    END_INDEX=str(10)
    STDR_DE_ID=str(20200617)

    _url='http://openAPI.seoul.go.kr:8088' # NOTE: the slash at the end removed
    url="/".join([_url,KEY,TYPE,SERVICE,START_INDEX,END_INDEX,STDR_DE_ID])
    data=requests.get(url).text
    tree=lxml.etree.fromstring(data.encode('utf-8'))
    nodes=tree.xpath('//TOT_LVPOP_CO')
    for node in nodes:
        print (node.text)

if __name__ == "__main__":
    doIt()

Writing src/ds_open_foreigners_xml.py


In [42]:
!python3 src/ds_open_foreigners_xml.py

248.866
71.2628
150.1777
136.7137
174.824
0.4833
0.2163
35.2093
756.5433
87.6117


# 문제 4: 서울시 지하철역별 월별 승하차인원 구하기
- CardSubwayStatsNew 사용

- KEY	String	발급받은 인증키
- TYPE	String	xml, xmlf, xls, json 데이터 형식
- SERVICE	String	서비스명
- START_INDEX	Integer	페이징 시작번호
- END_INDEX	Integer	페이징 끝번호
- USE_DT	String (선택)	사용일자 YYYYMMDD 형식의 문자열

- 샘플 주소
http://openapi.seoul.go.kr:8088/(%EC%9D%B8%EC%A6%9D%ED%82%A4)/xml/CardSubwayStatsNew/1/5/20151101

In [50]:
from src import mylib as my

In [51]:
keyPath=os.path.join(os.getcwd(), 'src', 'key.properties')
key= my.getKey(keyPath)

In [52]:
key

{'seoul': '6c434d45767761743130365a72697948',
 'gokr': '8107VbWaEhOG6C3lQPQORjhLXAP3z%2B8gbdHoZ1XY8NIjoxP3vgCuHH%2BLuYP9sIASx2uM6c1nneYhcq1TljaWyw%3D%3D'}

In [53]:
_url='http://openAPI.seoul.go.kr:8088'
_key=str(key['seoul'])
_type='json'
_service='CardSubwayStatsNew'
_start_index=1
_end_index=5
_use_dt='20210801'

In [54]:
_api=os.path.join(_url,_key,_type,_service,str(_start_index),str(_end_index),_use_dt)
response = requests.get(_api)

In [55]:
_api

'http://openAPI.seoul.go.kr:8088/6c434d45767761743130365a72697948/json/CardSubwayStatsNew/1/5/20210801'

In [56]:
sub=response.json()
print(type(sub))
sub['CardSubwayStatsNew']['row']

<class 'dict'>


[{'USE_DT': '20210801',
  'LINE_NUM': '1호선',
  'SUB_STA_NM': '서울역',
  'RIDE_PASGR_NUM': 17896.0,
  'ALIGHT_PASGR_NUM': 15468.0,
  'WORK_DT': '20210804'},
 {'USE_DT': '20210801',
  'LINE_NUM': '1호선',
  'SUB_STA_NM': '동묘앞',
  'RIDE_PASGR_NUM': 7760.0,
  'ALIGHT_PASGR_NUM': 7771.0,
  'WORK_DT': '20210804'},
 {'USE_DT': '20210801',
  'LINE_NUM': '1호선',
  'SUB_STA_NM': '시청',
  'RIDE_PASGR_NUM': 4436.0,
  'ALIGHT_PASGR_NUM': 4308.0,
  'WORK_DT': '20210804'},
 {'USE_DT': '20210801',
  'LINE_NUM': '1호선',
  'SUB_STA_NM': '종각',
  'RIDE_PASGR_NUM': 7972.0,
  'ALIGHT_PASGR_NUM': 7438.0,
  'WORK_DT': '20210804'},
 {'USE_DT': '20210801',
  'LINE_NUM': '1호선',
  'SUB_STA_NM': '종로3가',
  'RIDE_PASGR_NUM': 8999.0,
  'ALIGHT_PASGR_NUM': 8604.0,
  'WORK_DT': '20210804'}]

In [115]:
for e in sub['CardSubwayStatsNew']['row']:
    print ("{0:5s}\t{1:10s}\t{2:9.1f}\t{3:9.1f}".format(e['LINE_NUM'],e['SUB_STA_NM'],e['RIDE_PASGR_NUM'],e['ALIGHT_PASGR_NUM']))

1호선  	서울역       	  17896.0	  15468.0
1호선  	동묘앞       	   7760.0	   7771.0
1호선  	시청        	   4436.0	   4308.0
1호선  	종각        	   7972.0	   7438.0
1호선  	종로3가      	   8999.0	   8604.0


# 문제 5: 서울시 지하철 호선별, 역별, 시간대별 승하차 인원 정보
- CardSubwayTime 사용
- 교통카드를 이용해 지하철 호선별, 역별, 시간대별 승하차인원을 표현한 정보


- 호출에 필요한 인자들
- KEY	String	발급받은 인증키
- TYPE	String	xml, xmlf, xls, json 데이터 형식
- SERVICE	String	서비스명
- START_INDEX	Integer	페이징 시작번호
- END_INDEX	Integer	페이징 끝번호
- USE_MON	String	사용월 YYYYMM형식의 문자열
- LINE_NUM	String(선택)	호선명 예) 1호선
- SUB_STA_NM	String(선택)	지하철역명



- 샘플 URL
http://openapi.seoul.go.kr:8088/(인증키)/xml/CardSubwayTime/1/5/201501/

### 키 생성

In [119]:
keyPath = os.path.join(os.getcwd(), "src", "key.properties")
key = my.getKey(keyPath)
print(key["seoul"])

6c434d45767761743130365a72697948


### 요청 인자

In [129]:
_url='http://openAPI.seoul.go.kr:8088'
_key=str(key['seoul'])
_type='xml'
_service='CardSubwayTime'
_start_index=1
_end_index=5
_use_mon='202106'

### url 생성

In [130]:
url = "/".join([_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon])
print(url)

http://openAPI.seoul.go.kr:8088/6c434d45767761743130365a72697948/xml/CardSubwayTime/1/5/202106


### 반복을 통해 생성 (xml로 불러온것)
최대 반복 횟수(maxIter)와 현재 반복 횟수(Iter)를 사용하여 지정된 스타트 엔드 크기만큼 몇번 반복할지 지정가능

In [132]:
_maxIter=3
_iter=0
while _iter<_maxIter:
    print("%d 번째" %( _iter + 1))
    url = "/".join([_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon])
    response = requests.get(url).text
    print(response)
    _start_index+=5
    _end_index+=5
    _iter+=1

1 번째
<?xml version="1.0" encoding="UTF-8"?>
<CardSubwayTime>
<list_total_count>608</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<USE_MON>202106</USE_MON>
<LINE_NUM>1호선</LINE_NUM>
<SUB_STA_NM>서울역</SUB_STA_NM>
<FOUR_RIDE_NUM>654</FOUR_RIDE_NUM>
<FOUR_ALIGHT_NUM>17</FOUR_ALIGHT_NUM>
<FIVE_RIDE_NUM>9008</FIVE_RIDE_NUM>
<FIVE_ALIGHT_NUM>6400</FIVE_ALIGHT_NUM>
<SIX_RIDE_NUM>12474</SIX_RIDE_NUM>
<SIX_ALIGHT_NUM>37203</SIX_ALIGHT_NUM>
<SEVEN_RIDE_NUM>37253</SEVEN_RIDE_NUM>
<SEVEN_ALIGHT_NUM>91875</SEVEN_ALIGHT_NUM>
<EIGHT_RIDE_NUM>59876</EIGHT_RIDE_NUM>
<EIGHT_ALIGHT_NUM>187805</EIGHT_ALIGHT_NUM>
<NINE_RIDE_NUM>44619</NINE_RIDE_NUM>
<NINE_ALIGHT_NUM>118679</NINE_ALIGHT_NUM>
<TEN_RIDE_NUM>42611</TEN_RIDE_NUM>
<TEN_ALIGHT_NUM>57710</TEN_ALIGHT_NUM>
<ELEVEN_RIDE_NUM>49533</ELEVEN_RIDE_NUM>
<ELEVEN_ALIGHT_NUM>50003</ELEVEN_ALIGHT_NUM>
<TWELVE_RIDE_NUM>59357</TWELVE_RIDE_NUM>
<TWELVE_ALIGHT_NUM>53317</TWELVE_ALIGHT_NUM>
<THIRTEEN_RIDE_NUM>61171</TH

### json으로 반환

In [133]:
_url='http://openAPI.seoul.go.kr:8088'
_key=str(key['seoul'])
_type='json'
_service='CardSubwayTime'
_start_index=1
_end_index=5
_use_mon='202106'

In [134]:
_maxIter=1
_iter=0
response = ""
while _iter<_maxIter:
    print("%d 번째" %( _iter + 1))
    url = "/".join([_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon])
    response = requests.get(url).text
    _start_index+=5
    _end_index+=5
    _iter+=1

1 번째


In [136]:
json_response = json.loads(response)

### 하나의 프로그램으로 변환

In [145]:
import os
from src import mylib
import requests

keyPath=os.path.join(os.getcwd(), 'src', 'key.properties')
key=mylib.getKey(keyPath)

_url='http://openAPI.seoul.go.kr:8088'
_key=str(key['seoul'])
_type='json'
_service='CardSubwayTime'
_start_index=1
_end_index=5
_use_mon='202106'

_maxIter=2
_iter=0
while _iter<_maxIter:
    _api="/".join([_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon])
    #print _api
    response = requests.get(url).text
    json_response = json.loads(response)
    for item in json_response["CardSubwayTime"]["row"]:
        for k, v in item.items():
            print(k, "  ->  ", v)
        print("*"*20)
    _start_index+=5
    _end_index+=5
    _iter+=1

USE_MON   ->   202106
LINE_NUM   ->   1호선
SUB_STA_NM   ->   서울역
FOUR_RIDE_NUM   ->   654.0
FOUR_ALIGHT_NUM   ->   17.0
FIVE_RIDE_NUM   ->   9008.0
FIVE_ALIGHT_NUM   ->   6400.0
SIX_RIDE_NUM   ->   12474.0
SIX_ALIGHT_NUM   ->   37203.0
SEVEN_RIDE_NUM   ->   37253.0
SEVEN_ALIGHT_NUM   ->   91875.0
EIGHT_RIDE_NUM   ->   59876.0
EIGHT_ALIGHT_NUM   ->   187805.0
NINE_RIDE_NUM   ->   44619.0
NINE_ALIGHT_NUM   ->   118679.0
TEN_RIDE_NUM   ->   42611.0
TEN_ALIGHT_NUM   ->   57710.0
ELEVEN_RIDE_NUM   ->   49533.0
ELEVEN_ALIGHT_NUM   ->   50003.0
TWELVE_RIDE_NUM   ->   59357.0
TWELVE_ALIGHT_NUM   ->   53317.0
THIRTEEN_RIDE_NUM   ->   61171.0
THIRTEEN_ALIGHT_NUM   ->   53687.0
FOURTEEN_RIDE_NUM   ->   53310.0
FOURTEEN_ALIGHT_NUM   ->   49094.0
FIFTEEN_RIDE_NUM   ->   65767.0
FIFTEEN_ALIGHT_NUM   ->   52788.0
SIXTEEN_RIDE_NUM   ->   76249.0
SIXTEEN_ALIGHT_NUM   ->   53969.0
SEVENTEEN_RIDE_NUM   ->   122928.0
SEVENTEEN_ALIGHT_NUM   ->   64693.0
EIGHTEEN_RIDE_NUM   ->   184907.0
EIGHTEEN_ALIGHT_NUM 

# 데이터 베이스 저장
mongo, pymongo가 설치되어 있어야 한다. colab에서는 아래와 같이 설치한다.

### !apt install mongodb
### !python -m pip install pymongo==3.7.2

- 1 단계: mongo 서버 실행

방법1: 서비스로 mongod 서버 실행 pymongo를 사용하려면, 서버를 백그라운드에 실행해 놓아야 한다. 서버는 mongod 명령어로 실행할 수 있다.

### !service mongodb start

방법2: 직접 호출로 서버 실행 또는 mongod를 직접 호출해서 실행할 수 있다. 
데이터베이스가 저장되어야 할 디렉토리가 필요하다. 
여기서는 data를 만들어 놓는다. 
데이터베이스가 저장되는 디렉토리를 서버를 시작할 때 적어준다. port는 생략해도 된다.

### import os
### os.mkdir('data')
### mongod --dbpath data/ --port 27017


- 2 단계: pymongo 실행
pymongo를 사용하려면, mongod가 백그라운드에서 실행되고 있어야 한다 (대기 상태 실행) 아래 명령어가 오류없이 실행된다면, "pymongo" 가 올바르게 설치되었고 실행된다고 본다.

mongo client shell을 사용하려면 프롬프트에서 mongo

In [58]:
!ls data/

201611125_homework_week2.json
201611125_homework_week2.xml
[1m[36mdb[m[m
ds_bigdata_wiki.txt
ds_open_hello.xml
경기도 의정부시_인구현황_20210910.csv
중고나라_소형음향기기_거래_데이터_20210919.csv
서울특별시_공공자전거 일별 대여건수_(2018_2019.03).csv
제주특별자치도 서귀포시_고령화비율및노령화지수현황_20210831.csv


In [63]:
import os
!mongod --dbpath data/ --port 27017

{"t":{"$date":"2021-10-19T13:42:24.182+09:00"},"s":"I",  "c":"CONTROL",  "id":23285,   "ctx":"thread1","msg":"Automatically disabling TLS 1.0, to force-enable TLS 1.0 specify --sslDisabledProtocols 'none'"}
{"t":{"$date":"2021-10-19T13:42:24.185+09:00"},"s":"I",  "c":"NETWORK",  "id":4915701, "ctx":"thread1","msg":"Initialized wire specification","attr":{"spec":{"incomingExternalClient":{"minWireVersion":0,"maxWireVersion":13},"incomingInternalClient":{"minWireVersion":0,"maxWireVersion":13},"outgoing":{"minWireVersion":0,"maxWireVersion":13},"isInternalClient":true}}}
{"t":{"$date":"2021-10-19T13:42:24.187+09:00"},"s":"W",  "c":"ASIO",     "id":22601,   "ctx":"thread1","msg":"No TransportLayer configured during NetworkInterface startup"}
{"t":{"$date":"2021-10-19T13:42:24.187+09:00"},"s":"I",  "c":"NETWORK",  "id":4648602, "ctx":"thread1","msg":"Implicit TCP FastOpen in use."}
{"t":{"$date":"2021-10-19T13:42:24.188+09:00"},"s":"W",  "c":"ASIO",     "id":22601,   "ctx":"thread1","msg":

{"t":{"$date":"2021-10-19T13:42:25.307+09:00"},"s":"I",  "c":"INDEX",    "id":20345,   "ctx":"LogicalSessionCacheRefresh","msg":"Index build: done building","attr":{"buildUUID":null,"namespace":"config.system.sessions","index":"_id_","commitTimestamp":null}}
{"t":{"$date":"2021-10-19T13:42:25.307+09:00"},"s":"I",  "c":"INDEX",    "id":20345,   "ctx":"LogicalSessionCacheRefresh","msg":"Index build: done building","attr":{"buildUUID":null,"namespace":"config.system.sessions","index":"lsidTTLIndex","commitTimestamp":null}}
{"t":{"$date":"2021-10-19T13:42:25.307+09:00"},"s":"I",  "c":"COMMAND",  "id":51803,   "ctx":"LogicalSessionCacheRefresh","msg":"Slow query","attr":{"type":"command","ns":"config.system.sessions","command":{"createIndexes":"system.sessions","v":2,"indexes":[{"key":{"lastUse":1},"name":"lsidTTLIndex","expireAfterSeconds":1800}],"ignoreUnknownIndexOptions":false,"writeConcern":{},"$db":"config"},"numYields":0,"reslen":114,"locks":{"ParallelBatchWriterMode":{"acquireCount"

In [64]:
import pymongo

ModuleNotFoundError: No module named 'pymongo'

In [2]:
client = pymongo.MongoClient('localhost', 27017)

In [231]:
db = client["test"]

In [233]:
collections = db.games

In [234]:
collections

Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test'), 'games')

In [235]:
game = {
    "게임명" : "메이플스토리",
    "출시" : 2003,
    "개발사" : "위젯 스튜디오"
}

In [236]:
collections.insert(game)

  collections.insert(game)


ObjectId('613f0528c202a93a5598ac53')

In [239]:
result = collections.find()
for r in result:
    print(r)

{'_id': ObjectId('613f0528c202a93a5598ac53'), '게임명': '메이플스토리', '출시': 2003, '개발사': '위젯 스튜디오'}


In [6]:
print(client.list_database_names())

['admin', 'config', 'local', 'test']


In [5]:
db = client["myDB"]
mycol = db["myPyCol"]

In [7]:
_id = 1
_name = 'js'
_age = 25
_country = 'ko'

db.myPyCol.insert_one({
    "id": _id,
    "name": _name,
    "age": _age,
    "country": _country
})

<pymongo.results.InsertOneResult at 0x7feab04c6100>

In [8]:
print(client.list_database_names())

['admin', 'config', 'local', 'myDB', 'test']


In [9]:
print(db.list_collection_names())

['myPyCol']


In [12]:
db2 = client["test"]

In [13]:
print(db2.list_collection_names())

['games']


# 문제 6: 지하철역 승하차 인원 수집, 저장
- 파일, nosql mongodb로 저장

- json 파일 저장 src/ds_open_subwayPassengers.json
    - dump()는 직렬화, dumps()는 문자열로 생성한다.
- mongo 저장한다. 한글 unicode 지원한다.
    - db명: 'use ds_open_subwayPassengersDb'
    - table (또는 Collection)명: 'db_open_subwayTable'

In [14]:
%%writefile src/ds_open_subwayTime.py
# coding: utf-8
import os
import requests
import json
from pymongo import MongoClient
import mylib as my

client = MongoClient('localhost:27017')
#db created by mongo. You do not have to create this.
_db = client['ds_open_subwayPassengersDb'] 
#collection
_table = _db['db_open_subwayTable'] 


def saveJson(_fname, _data):
    import io
    with io.open(_fname, "a", encoding = "utf-8") as json_file:
        _j = json.dump(_data, json_file, ensure_ascii = False)
        json_file.write(str(_j) + "\n")
        
def readJson(_fname):
    for line in open(_fname, "r").readlines():
        _j = json.loads(line)
        print(_j["id"])
    
def saveDB(_data):
    _table.insert_one(_data)
    
def readDB():
    for tweet in _table.find():
        print (tweet['id'],tweet['text'])
        
def saveFile(_fname, _data):
    fp = open(_fname, "a")
    fp.write(_data + "\n")
    fp.close()

def doIt():
    key_path = os.path.join(os.getcwd(), "src", "key.properties")
    key = my.getKey(key_path)
    
    _key = key["seoul"]
    _url = "http://openAPI.seoul.go.kr:8088"
    _type = "json"
    _service = 'CardSubwayTime'
    _start_index = 1
    _end_index = 5
    _use_mon ='202106'
    _maxIter = 10
    _iter = 0
    _jfname = 'src/ds_open_subwayTime.json'
    
    while _iter < _maxIter:
        _api = "/".join([_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon])
        response = requests.get(_api)
        _json = response.json()
        print(_json.keys())
        
        saveJson(_jfname,_json)
        saveDB(_json)
        
        _start_index += 5
        _end_index += 5
        _iter += 1
        
    
    
if __name__ == "__main__":
    doIt()

Writing src/ds_open_subwayTime.py


In [15]:
!python3 src/ds_open_subwayTime.py

dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])
dict_keys(['CardSubwayTime'])


In [18]:
!ls src/ds_open_*

src/ds_open_foreigners_xml.py   src/ds_open_subway_iter_json.py
src/ds_open_subwayTime.json     src/ds_open_subway_json.py
src/ds_open_subwayTime.py       src/ds_open_subway_xml.py


In [32]:
!ls data/db/journal

WiredTigerLog.0000000003     WiredTigerPreplog.0000000002
WiredTigerPreplog.0000000001


In [36]:
db = client.ds_open_subwayPassengersDb
db.list_collection_names()

['db_open_subwayTable']

In [37]:
db.db_open_subwayTable.count_documents({})

10

In [38]:
db.db_open_subwayTable.find_one()

{'_id': ObjectId('614085f4c202a96aaf429eab'),
 'CardSubwayTime': {'list_total_count': 608,
  'RESULT': {'CODE': 'INFO-000', 'MESSAGE': '정상 처리되었습니다'},
  'row': [{'USE_MON': '202106',
    'LINE_NUM': '1호선',
    'SUB_STA_NM': '서울역',
    'FOUR_RIDE_NUM': 654.0,
    'FOUR_ALIGHT_NUM': 17.0,
    'FIVE_RIDE_NUM': 9008.0,
    'FIVE_ALIGHT_NUM': 6400.0,
    'SIX_RIDE_NUM': 12474.0,
    'SIX_ALIGHT_NUM': 37203.0,
    'SEVEN_RIDE_NUM': 37253.0,
    'SEVEN_ALIGHT_NUM': 91875.0,
    'EIGHT_RIDE_NUM': 59876.0,
    'EIGHT_ALIGHT_NUM': 187805.0,
    'NINE_RIDE_NUM': 44619.0,
    'NINE_ALIGHT_NUM': 118679.0,
    'TEN_RIDE_NUM': 42611.0,
    'TEN_ALIGHT_NUM': 57710.0,
    'ELEVEN_RIDE_NUM': 49533.0,
    'ELEVEN_ALIGHT_NUM': 50003.0,
    'TWELVE_RIDE_NUM': 59357.0,
    'TWELVE_ALIGHT_NUM': 53317.0,
    'THIRTEEN_RIDE_NUM': 61171.0,
    'THIRTEEN_ALIGHT_NUM': 53687.0,
    'FOURTEEN_RIDE_NUM': 53310.0,
    'FOURTEEN_ALIGHT_NUM': 49094.0,
    'FIFTEEN_RIDE_NUM': 65767.0,
    'FIFTEEN_ALIGHT_NUM': 52788.0,
 

In [39]:
db.db_open_subwayTable.find_one({"CardSubwayTime.row.SUB_STA_NM":"서울역"})


{'_id': ObjectId('614085f4c202a96aaf429eab'),
 'CardSubwayTime': {'list_total_count': 608,
  'RESULT': {'CODE': 'INFO-000', 'MESSAGE': '정상 처리되었습니다'},
  'row': [{'USE_MON': '202106',
    'LINE_NUM': '1호선',
    'SUB_STA_NM': '서울역',
    'FOUR_RIDE_NUM': 654.0,
    'FOUR_ALIGHT_NUM': 17.0,
    'FIVE_RIDE_NUM': 9008.0,
    'FIVE_ALIGHT_NUM': 6400.0,
    'SIX_RIDE_NUM': 12474.0,
    'SIX_ALIGHT_NUM': 37203.0,
    'SEVEN_RIDE_NUM': 37253.0,
    'SEVEN_ALIGHT_NUM': 91875.0,
    'EIGHT_RIDE_NUM': 59876.0,
    'EIGHT_ALIGHT_NUM': 187805.0,
    'NINE_RIDE_NUM': 44619.0,
    'NINE_ALIGHT_NUM': 118679.0,
    'TEN_RIDE_NUM': 42611.0,
    'TEN_ALIGHT_NUM': 57710.0,
    'ELEVEN_RIDE_NUM': 49533.0,
    'ELEVEN_ALIGHT_NUM': 50003.0,
    'TWELVE_RIDE_NUM': 59357.0,
    'TWELVE_ALIGHT_NUM': 53317.0,
    'THIRTEEN_RIDE_NUM': 61171.0,
    'THIRTEEN_ALIGHT_NUM': 53687.0,
    'FOURTEEN_RIDE_NUM': 53310.0,
    'FOURTEEN_ALIGHT_NUM': 49094.0,
    'FIFTEEN_RIDE_NUM': 65767.0,
    'FIFTEEN_ALIGHT_NUM': 52788.0,
 