# REST

## R.1 학습내용

### 1) 목표

* API를 사용하여 열린데이터, 공공데이터포털 데이터를 가져올 수 있다.
* API로 가져온 xml, json 데이터를 분석가능한 형식으로 변환할 수 있다.
* nosql, 파일로 저장할 수 있다.
* 웹에서 사용되는 한글의 인코딩 방식을 사용할 수 있다.

### 2) 문제

* 문제 REST-1: ip주소에서 지역정보 알아내기
* 문제 REST-2: 키를 저장하고 읽기
* 문제 REST-3: 서울시 노선별 지하철역 목록 구하기 
* 문제 REST-4: 서울시 외국인 주민 자녀 국적취득 년도별 시군구 합계 구하기 
* 문제 REST-5: 2015년 서울시 지하철역별 월별 승하차인원 구하기
* 문제 REST-6: 2015년 1년 동안 지하철역 승하차 인원
* 문제 REST-7: '2015년 1년 동안 지하철역 승하차 인원' 저장하기
    * 파일, nosql 저장
* 문제 REST-8: 서울 7016번 광화문~상명대까지 2015년 승하차 인원 월별 정류장별 최대 최소 구하기
* 문제 REST-9: 서울시 종로구 관측소 현재 온도, 습도, 강수량 구하기
* 문제 REST-10: data.go.kr
    * 대기오염
    * 교통사고정보
    * 의료빅데이터

### 3) 연습

* 광화문 지역 2015년 11월 하루 동안 시간대별 미세먼지량
* 연습 REST: pandas로 웹 데이터 야후 주식 읽기
* 연습 REST: etc
    * 다음
    * http://kosis.kr
    * 지오코딩 - T Map, 다음, 네이버, 구글 (구글맵에 사용)

## R.2 REST

* REpresentational State Transfer는 '웹서비스'를 사용하기 위한 아키텍처를 말한다.
* '웹서비스'는 웹에서 제공하는 서비스, 자원을 가져오거나 저장하는 기능을 말한다.
* SOAP (Simple Object Access Protocol) 보다는 REST가 간편하여 많이 사용된다.
* '웹서비스'는 'http 프로토콜'을 통하여 '자원'을 사용할 수 있게 한다.
    * 자원 resource는 html pages, xml, videos 등을 말한다.
    * resource는 xml 또는 json으로 표현된다 (representation).
    * 클라이언트와 서버는 http request, http response 형식으로 데이터를 주고 받는다.
    * http 프로토콜과 같이 상태를 보관하지 않는 특성을 가진다 (stateless).
* REST uniform interface를 사용한다.
    * uri, 자원 id, 방법(HTTP의 post, delete, get, put)을 명시하여 resource를 읽어 온다.
    * 주로 XML, json 형식으로 정보를 제공한다.

http 방법 | 설명 | 예제
----------|----------|----------
GET | 자원을 읽어 온다. | http://httpbin.org/get
PUT | 새로운 자원을 입력하거나 갱신한다. | http://<url>/put (x) http://<url>/put/id (o)
POST | 새로운 자원을 입력하거나 갱신한다. | http://<url>/post (o)
DELETE | 자원을 삭제한다. | http://<url>/delete/id


## R.3 API 연습

* cURL 또는 python을 사용할 수 있다.
* [cURL](https://en.wikipedia.org/wiki/CURL)
    * 서버와 데이터를 교환하는 도구. 다양한 통신 프로토콜을 지원한다.
    * 리눅스 설치 apt install curl
    * 윈도우 설치
        * (cURL 다운로드)[https://curl.haxx.se/download.html]
        * 운영체제 선택 Win32 또는 Win64. 그리고 보통 윈도우면 Generic 선택.
        * unzip
        * PATH 설정 (C:\Windows\System32에 이동)
* 연습 사이트
    * http://httpbin.org
    * http://postbin.org


### postbin.org

* http:postbin.org post를 연습할 수 있는 사이트로, http://requestb.in/ 로 연결된다

* post에 이용될 resource는 임시로 만들어 준다.
* key, value로 입력할 데이터를 만들어 준다.

In [15]:
!curl -X POST -d "jsl=test" http://requestb.in/v6a6lhv6

ok

* python을 사용해서 입력한다.

In [19]:
import requests, time
r = requests.post('http://requestb.in/v6a6lhv6', data={"ts":time.time()})
print r.status_code
print r.content

200
ok


### httpbin.org

* (httpbin)[https://github.com/Runscope/httpbin] api를 테스트하기 좋은 사이트.
* postbin.org는 post 인터페이스만 제공한다.

In [35]:
!curl http://httpbin.org/ip

{
  "origin": "117.16.44.45"
}


In [36]:
!curl http://httpbin.org/get

{
  "args": {}, 
  "headers": {
    "Accept": "*/*", 
    "Host": "httpbin.org", 
    "User-Agent": "curl/7.47.0"
  }, 
  "origin": "117.16.44.45", 
  "url": "http://httpbin.org/get"
}


* param을 key,value 쌍으로 넘겨줄 수 있다.

In [37]:
!curl http://httpbin.org/get?show_env=1

{
  "args": {
    "show_env": "1"
  }, 
  "headers": {
    "Accept": "*/*", 
    "Host": "httpbin.org", 
    "Runscope-Service": "httpbin", 
    "User-Agent": "curl/7.47.0", 
    "X-Forwarded-For": "117.16.44.45", 
    "X-Real-Ip": "117.16.44.45"
  }, 
  "origin": "117.16.44.45", 
  "url": "http://httpbin.org/get?show_env=1"
}


* python requests 라이브러리를 사용해 본다

In [40]:
r = requests.options("http://httpbin.org/get")

In [42]:
r.status_code

200

In [43]:
bad_r = requests.get('http://httpbin.org/status/404')

In [44]:
bad_r.status_code

404

In [45]:
r.headers

{'Content-Length': '0', 'Access-Control-Max-Age': '3600', 'Server': 'nginx', 'Connection': 'keep-alive', 'Allow': 'HEAD, OPTIONS, GET', 'Access-Control-Allow-Credentials': 'true', 'Date': 'Sun, 09 Oct 2016 01:47:03 GMT', 'Access-Control-Allow-Origin': '*', 'Access-Control-Allow-Methods': 'GET, POST, PUT, DELETE, PATCH, OPTIONS', 'Content-Type': 'text/html; charset=utf-8'}

In [46]:
r.headers['Content-Type']

'text/html; charset=utf-8'

* post, put, delete 서비스는 사용할 자원이 저장되어 있지 않으므로, 실행 결과는 의미가 없다.
    ```
    r = requests.post("http://httpbin.org/post")
    r = requests.put("http://httpbin.org/put")
    r = requests.delete("http://httpbin.org/delete")
    ```

In [47]:
r = requests.post("http://httpbin.org/post")

In [48]:
r.json()

{u'args': {},
 u'data': u'',
 u'files': {},
 u'form': {},
 u'headers': {u'Accept': u'*/*',
  u'Accept-Encoding': u'gzip, deflate',
  u'Content-Length': u'0',
  u'Host': u'httpbin.org',
  u'User-Agent': u'python-requests/2.11.1'},
 u'json': None,
 u'origin': u'117.16.44.45',
 u'url': u'http://httpbin.org/post'}

## R.4 한글

* 운영체제에서 사용하는 인코딩 방식
    * unicode를 사용하는 것이 문제를 줄일 수 있다.
    * locale을 'utf-8'로 정의한다.
* urllib을 사용할 경우
    * urlencode: urlopen()에 사용될 param을 만든다.
        * dict형식을 key=value, '&' 문자로 분리.
    * urllib.quote (quote_plus()는 key, value를 따옴표)

In [49]:
!curl http://httpbin.org/encoding/utf8

<h1>Unicode Demo</h1>

<p>Taken from <a
href="http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt">http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt</a></p>

<pre>

UTF-8 encoded sample plain-text file
‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾

Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25


The ASCII compatible UTF-8 encoding used in this plain-text file
is defined in Unicode, ISO 10646-1, and RFC 2279.


Using Unicode/UTF-8, you can write in emails and source code things such as

Mathematics and sciences:

  ∮ E⋅da = Q,  n → ∞, ∑ f(i) = ∏ g(i),      ⎧⎡⎛┌─────┐⎞⎤⎫
                                            ⎪⎢⎜│a²+b³ ⎟⎥⎪
  ∀x∈ℝ: ⌈x⌉ = −⌊−x⌋, α ∧ ¬β = ¬(¬α ∨ β),    ⎪⎢⎜│───── ⎟⎥⎪
                                            ⎪⎢⎜⎷ c₈   ⎟⎥⎪
  ℕ ⊆ ℕ₀ ⊂ ℤ ⊂ ℚ ⊂ ℝ ⊂ ℂ,                   ⎨⎢⎜       ⎟⎥⎬
                                            ⎪⎢⎜ ∞     ⎟⎥⎪
  ⊥ < a ≠ b ≡ c ≤ d ≪ ⊤ ⇒ (⟦A⟧ ⇔ ⟪B⟫),      ⎪⎢⎜ ⎲     ⎟⎥⎪
             

* curl로 처리하면 결과를 볼 수 있지만, python은 unicode 문자열을 가지고 있다.

In [58]:
r = requests.get("http://httpbin.org/encoding/utf8")

* 맨 앞 u는 unicode라는 의미, 따옴표 안의 문자열이 유니코드이다.

In [63]:
r.text[0:500]

u'<h1>Unicode Demo</h1>\n\n<p>Taken from <a\nhref="http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt">http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt</a></p>\n\n<pre>\n\nUTF-8 encoded sample plain-text file\n\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\u203e\n\nMarkus Kuhn [\u02c8ma\u02b3k\u028as ku\u02d0n] <http://www.cl.cam.ac.uk/~mgk25/> \u2014 2002-07-25\n\n\nThe ASCII compatible UTF-8 encoding used in this plain-text file\nis defined in Unicode, ISO 10646-1, and RFC 2279.\n\n\nUsing Unicode/UTF-8, you can write in emails and so'

In [64]:
teststr=r.text[0:500]

* python print문은 시스템에서 사용하는 encoding을 사용한다.
    * locale은 utf-8을 사용하므로, 출력하면 unicode를 이해하고 출력한다.

In [71]:
import locale
locale.getdefaultlocale()

('en_US', 'UTF-8')

In [72]:
print teststr

<h1>Unicode Demo</h1>

<p>Taken from <a
href="http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt">http://www.cl.cam.ac.uk/~mgk25/ucs/examples/UTF-8-demo.txt</a></p>

<pre>

UTF-8 encoded sample plain-text file
‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾‾

Markus Kuhn [ˈmaʳkʊs kuːn] <http://www.cl.cam.ac.uk/~mgk25/> — 2002-07-25


The ASCII compatible UTF-8 encoding used in this plain-text file
is defined in Unicode, ISO 10646-1, and RFC 2279.


Using Unicode/UTF-8, you can write in emails and so


### python의 인코딩

* Python 3에서는 default to utf-8 (when LC_CTYPE is unicode-aware)

* Python의 print문은 기본 defaultencoding을 사용한다.

In [18]:
import sys
print sys.getdefaultencoding()
print sys.stdin.encoding
print sys.stdout.encoding

ascii
None
UTF-8


* os locale로 정의되어 있다.
* os env를 보면, LANG이 정의되어 있다.

In [19]:
!locale

LANG=en_US.UTF-8
LANGUAGE=en_US:en
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC=ko_KR.UTF-8
LC_TIME=ko_KR.UTF-8
LC_COLLATE="en_US.UTF-8"
LC_MONETARY=ko_KR.UTF-8
LC_MESSAGES="en_US.UTF-8"
LC_PAPER=ko_KR.UTF-8
LC_NAME=ko_KR.UTF-8
LC_ADDRESS=ko_KR.UTF-8
LC_TELEPHONE=ko_KR.UTF-8
LC_MEASUREMENT=ko_KR.UTF-8
LC_IDENTIFICATION=ko_KR.UTF-8
LC_ALL=


In [11]:
import os
os.environ['LANG']

'en_US.UTF-8'

* python의 기본 encoding을 변경한다.

import sys
reload(sys)
sys.setdefaultencoding('utf-8')

* ascii는 unicode로 encoding할 수 없다.

In [12]:
str('한')

'\xed\x95\x9c'

In [13]:
u'한'

u'\ud55c'

In [31]:
(u'한').encode('utf-8')

'\xed\x95\x9c'

In [33]:
'한'.encode('utf-8')

UnicodeDecodeError: 'ascii' codec can't decode byte 0xed in position 0: ordinal not in range(128)

* stdout encoding 'utf-8'에 따라 출력한다.

In [73]:
print u'한'

한


### 인터넷 한글 인코딩

* urllib.quote()- 공백, 특수문자 등을 %xx 형식으로 표현
* urllib.quote_plus()
    * urllib.quote()과 다른 점은 'spaces by plus signs'

In [23]:
import urllib

mystr = u"한"
utf8str=mystr.encode('utf-8')  # error without encoding
print urllib.quote(utf8str)
print urllib.quote_plus(utf8str)

%ED%95%9C
%ED%95%9C


* 물결표시 '~'가 %xx형식으로 변환된다.

In [31]:
urllib.quote('/~connolly/')

'/%7Econnolly/'

In [32]:
urllib.quote_plus('/~connolly/')

'%2F%7Econnolly%2F'

## R.5 XML

### XML 소개

* Extensible Markup Language (XML). html과 같은 마크업 언어.
* element는 (1) 루트 element (맨 처음 나오는 element) + (2) 루트 아래에 있는 elements로 계층적으로 구성
    * start tag $<$foo$>$
    * end tag $<$/foo$>$
* nesting element
* root 한 개만 허용. 아래와 같이 2개를 사용하면 xml이 아님.
    ```
    <kim></kim>
    <lee></lee>
    ```
    
* attributes
    * 여러 속성은 공백으로 구분
    * key=value 짝으로 구성
    * start tag안에 적음
    * value는 따옴표
    ```
    <kim x='1'>I am kim</kim>
    ```
    
* xml header
    * version - 1.0과 같이 버전 정보를 넣는다.
    * encoding - utf-8을 지정할 수 있다.
    * root 앞에 위치한다.
    ```
    <?xml version='1.0' encoding='utf-8'?>
    ```
    
* parser
    * built-in - ElementTree
    * larger xml - lxml (따로 설치해야 함)

### XML 읽기

* ElementTree를 사용하여 xml데이터 처리
* string에서 읽거나, 파일에서 읽어 온다. 루트는 getroot() 함수를 이용함.

구분 | string | file
---|---|---
읽기 | ET.fromstring() | ET.parse()
root | 읽으면 root | getroot()를 사용해서 root를 얻음

In [1]:
input = '''<students>
<student x="1">
    <id>001</id>
    <name>Kim</name>
</student>
<student x="2">
    <id>002</id>
    <name>Lee</name>
</student>
</students>
'''
print input
import xml.etree.ElementTree as ET
nodes=ET.fromstring(input)
for node in nodes.getiterator():
    print node.tag, node.attrib


<students>
<student x="1">
    <id>001</id>
    <name>Kim</name>
</student>
<student x="2">
    <id>002</id>
    <name>Lee</name>
</student>
</students>

students {}
student {'x': '1'}
id {}
name {}
student {'x': '2'}
id {}
name {}


In [2]:
%%writefile src/ds_rest_hello.xml
<students>
<student x="1">
    <id>001</id>
    <name>Kim</name>
</student>
<student x="2">
    <id>002</id>
    <name>Lee</name>
</student>
</students>

Writing src/ds_rest_hello.xml


In [5]:
xml=ET.parse('src/ds_rest_hello.xml')
root=xml.getroot()
for node in root.getiterator():
    print node.tag, node.attrib


students {}
student {'x': '1'}
id {}
name {}
student {'x': '2'}
id {}
name {}


In [6]:
std=root.find('student')
for node in std:
    print node.text

001
Kim


In [8]:
stds=root.findall('student')
for node in stds:
    for item in node:
        print item.text

001
Kim
002
Lee


In [9]:
print std.attrib
print stds[1].attrib
std.tag

{'x': '1'}
{'x': '2'}


'student'

## R.6 json

* json (JavaScript Object Notation)은 javascript에서 사용하는 표기
* python의 dictionary형식과 같다.

In [65]:
import json
input = '''[
    { "id" : "001", "x" : "2", "name" : "Chuck"},
    { "id" : "009","x" : "7","name" : "Brent" }
]'''

In [66]:
info = json.loads(input)
print 'User count:', len(info)

for item in info:
    print item['id'], item['name']

User count: 2
001 Chuck
009 Brent


In [67]:
import json
json.dumps(
    ['foo', {'bar': ('baz', None, 1.0, 2)}]
)

'["foo", {"bar": ["baz", null, 1.0, 2]}]'

## 문제 REST-1: ip주소에서 지역정보 알아내기

* freegeoip.net은 ip주소의 국가, 위경도, 지역을 조회

In [19]:
import requests
url='http://freegeoip.net/json/'
geostr=requests.get(url).text
print geostr

{"ip":"117.16.44.45","country_code":"KR","country_name":"Republic of Korea","region_code":"","region_name":"","city":"","zip_code":"","time_zone":"Asia/Seoul","latitude":37.5112,"longitude":126.9741,"metro_code":0}



* 읽어온 데이터가 string, unicode이다.
* json.loads()를 하면, unicode -> dictionary로 만들어 줌.

In [16]:
type(geostr)

unicode

In [20]:
import json
geojson=json.loads(geostr)

In [27]:
type(geojson)

dict

In [21]:
print geojson['ip']

117.16.44.45


* 앞에 보이는 u는 유니코드라는 의미.

In [22]:
geojson.get('ip')

u'117.16.44.45'

In [25]:
country=geojson.get('country_code')

In [26]:
print country.decode('utf-8')

KR


* getCountry()함수 만들어보기
    * urllib라이브러리 urlopen.read()로 읽어온다.
    * json자료에서 country_code key를 찾는다.

In [10]:
import json
import urllib

def getCountry(ipAddress):
    response = urllib.urlopen("http://freegeoip.net/json/"+ipAddress).read().decode('utf-8')
    responseJson = json.loads(response)
    return responseJson.get("country_code")

print(getCountry("39.118.87.152"))

KR


* requests.get(url)은 url에서 페이지를 가져오기

In [26]:
import requests
send_url = 'http://freegeoip.net/json/39.118.87.152'
r = requests.get(send_url)

In [47]:
j=json.loads(r.text)

In [48]:
type(j)

dict

In [49]:
print j.keys()

[u'city', u'region_code', u'region_name', u'ip', u'time_zone', u'longitude', u'metro_code', u'latitude', u'country_code', u'country_name', u'zip_code']


In [50]:
print j['city']

Seoul


In [61]:
for k,v in j.iteritems():
    print k,"\t: ",v

city 	:  Seoul
region_code 	:  11
region_name 	:  Seoul
ip 	:  39.118.87.152
time_zone 	:  Asia/Seoul
longitude 	:  126.9783
metro_code 	:  0
latitude 	:  37.5985
country_code 	:  KR
country_name 	:  Republic of Korea
zip_code 	:  


## 문제 REST-2: 키를 저장하고 읽기

* 사용자id, 비밀번호를 사용하는 방식은 보안에 취약하다.
* OAuth를 사용하여 제3자에게 접근권한을 부여하는 방법이 보다 안전하다.
* 파일에 안전하게 저장하여, '비밀번호'와 같은 보안내용이 프로그램에 직접 사용되지 않도록 주의한다.

In [5]:
def getKey(keyPath):
    d=dict()
    f=open(keyPath,'r')
    for line in f.readlines():
        row=line.split('=')
        row0=row[0]
        d[row0]=row[1].strip()
    return d

In [6]:
import os

keyPath=os.path.join(os.getcwd(), 'src', 'key.properties')
key=getKey(keyPath)

## 문제 REST-3: 서울시 노선별 지하철역 목록 구하기

* '서울시 노선별 지하철역 정보' - 호선, 역 명, 외부에 지하철 역 이름과 같이 적혀 있는 역 번호
* 샘플URL

호선 | 샘플URL
-----|-----
1호선 | http://openAPI.seoul.go.kr:8088/(인증키)/xml/SearchSTNBySubwayLineService/1/5/1/
2호선 | http://openAPI.seoul.go.kr:8088/(인증키)/xml/SearchSTNBySubwayLineService/1/5/2/
5호선 | http://openAPI.seoul.go.kr:8088/(인증키)/xml/SearchSTNBySubwayLineService/1/5/5/

* 호선
1~9: 1~9호선, I: 인천1호선, K: 경의중앙선, B: 분당선, A: 공항철도, G: 경춘선, S:신분당선, SU:수인선

* params 앞의 32자리 비밀번호는 제외하고 출력한다.
* 페이징을 하려면 INDEX를 조정한다.

In [125]:
KEY=str(key['dataseoul'])
TYPE='xml'
SERVICE='SearchSTNBySubwayLineService'
START_INDEX=str(1)
END_INDEX=str(10)
LINE_NUM=str(2)

params=os.path.join(KEY,TYPE,SERVICE,START_INDEX,END_INDEX,LINE_NUM)
print params[31:]

xml/SearchSTNBySubwayLineService/1/10/2


* 사례에는 모두 동일한 url이 사용된다. 'http://openAPI.seoul.go.kr:8088/'

In [126]:
import urlparse
_url='http://openAPI.seoul.go.kr:8088/'
url=urlparse.urljoin(_url,params)
#print url

In [127]:
import requests
data=requests.get(url).text
print data

<?xml version="1.0" encoding="UTF-8"?><SearchSTNBySubwayLineService>
<list_total_count>51</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<STATION_CD>0201</STATION_CD>
<STATION_NM>시청</STATION_NM>
<LINE_NUM>2</LINE_NUM>
<FR_CODE>201</FR_CODE>
</row>
<row>
<STATION_CD>0202</STATION_CD>
<STATION_NM>을지로입구</STATION_NM>
<LINE_NUM>2</LINE_NUM>
<FR_CODE>202</FR_CODE>
</row>
<row>
<STATION_CD>0203</STATION_CD>
<STATION_NM>을지로3가</STATION_NM>
<LINE_NUM>2</LINE_NUM>
<FR_CODE>203</FR_CODE>
</row>
<row>
<STATION_CD>0204</STATION_CD>
<STATION_NM>을지로4가</STATION_NM>
<LINE_NUM>2</LINE_NUM>
<FR_CODE>204</FR_CODE>
</row>
<row>
<STATION_CD>0205</STATION_CD>
<STATION_NM>동대문역사문화공원</STATION_NM>
<LINE_NUM>2</LINE_NUM>
<FR_CODE>205</FR_CODE>
</row>
<row>
<STATION_CD>0206</STATION_CD>
<STATION_NM>신당</STATION_NM>
<LINE_NUM>2</LINE_NUM>
<FR_CODE>206</FR_CODE>
</row>
<row>
<STATION_CD>0207</STATION_CD>
<STATION_NM>상왕십리</STATION_NM>
<LINE_NUM>2</LINE_NUM>
<FR_CODE>207<

In [76]:
type(data)

unicode

In [77]:
import re
p=re.compile('<STATION_NM>(.+?)</STATION_NM>')
res=p.findall(data)
for item in res:
    print item

시청
을지로입구
을지로3가
을지로4가
동대문역사문화공원
신당
상왕십리
왕십리
한양대
뚝섬


In [78]:
import xml.etree.ElementTree as ET
tree=ET.fromstring(data.encode('utf-8'))

In [110]:
stds=tree.findall('row')
for elements in stds:
    for elm in elements:
        print elm.text

0201
시청
2
201
0202
을지로입구
2
202
0203
을지로3가
2
203
0204
을지로4가
2
204
0205
동대문역사문화공원
2
205
0206
신당
2
206
0207
상왕십리
2
207
0208
왕십리
2
208
0209
한양대
2
209
0210
뚝섬
2
210


In [128]:
import lxml
import lxml.etree
import StringIO

#tree=lxml.etree.parse(StringIO.StringIO(data.encode('utf-8')))
tree=lxml.etree.fromstring(data.encode('utf-8'))

nodes=tree.xpath('//STATION_NM')
for node in nodes:
    print node.text

시청
을지로입구
을지로3가
을지로4가
동대문역사문화공원
신당
상왕십리
왕십리
한양대
뚝섬


## 문제 REST-4: 서울시 외국인 주민 자녀 국적취득 년도별 시군구 합계 구하기

* '서울시 외국인 주민 자녀 국적취득 현황 정보'
* 샘플URL
http://openapi.seoul.go.kr:8088/(인증키)/xml/ListLocaldata470401S/1/5/

* 년도별 시군구 합계

In [23]:
KEY=str(key['dataseoul'])
TYPE='xml'
SERVICE='ListLocaldata470401S'
START_INDEX=str(1)
END_INDEX=str(5)

params=os.path.join(KEY,TYPE,SERVICE,START_INDEX,END_INDEX)

print params[31:]

xml/ListLocaldata470401S/1/5


In [130]:
import urlparse
_url='http://openapi.seoul.go.kr:8088/'
url=urlparse.urljoin(_url,params)
#print url

In [131]:
import requests

data=requests.get(url).text
print data

<?xml version="1.0" encoding="UTF-8"?><ListLocaldata470401S>
<list_total_count>319</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<SITUYM>2012</SITUYM>
<CGGNM>서울특별시 양천구</CGGNM>
<KDDETAILSENM>국적취득한 자녀 만 18세 이하</KDDETAILSENM>
<STATMAN>41</STATMAN>
</row>
<row>
<SITUYM>2013</SITUYM>
<CGGNM>서울특별시 양천구</CGGNM>
<KDDETAILSENM>국적을 미취득한 자녀 만 19세 이상</KDDETAILSENM>
<STATMAN>1</STATMAN>
</row>
<row>
<SITUYM>2014</SITUYM>
<CGGNM>서울특별시 강서구</CGGNM>
<KDDETAILSENM>국적을 미취득한 자녀 만 19세 이상</KDDETAILSENM>
<STATMAN>2</STATMAN>
</row>
<row>
<SITUYM>2014</SITUYM>
<CGGNM>서울특별시 금천구</CGGNM>
<KDDETAILSENM>국적취득한 자녀 만 18세 이하</KDDETAILSENM>
<STATMAN>1409</STATMAN>
</row>
<row>
<SITUYM>2013</SITUYM>
<CGGNM>서울특별시 금천구</CGGNM>
<KDDETAILSENM>국적취득한 자녀 만 18세 이하</KDDETAILSENM>
<STATMAN>1397</STATMAN>
</row>
</ListLocaldata470401S>



In [122]:
print type(data.encode('utf-8'))

<type 'str'>


In [132]:
import lxml
import lxml.etree
import StringIO

#tree=lxml.etree.parse(StringIO.StringIO(data.encode('utf-8')))
tree=lxml.etree.fromstring(data.encode('utf-8'))

nodes=tree.xpath('//STATMAN')
for node in nodes:
    print node.text

41
1
2
1409
1397


## 문제 REST-5: 2015년 서울시 지하철역별 월별 승하차인원 구하기

* '서울시 지하철역별 승하차인원'
    * 월별 지하철역별 승하차 인원

* 샘플URL 2013년 6월의 지하철역 승하차인원
http://openAPI.seoul.go.kr:8088/(인증키)/xml/CardSubwayStatisticsService/1/5/201306/


In [None]:
import os
import requests
_url='http://openAPI.seoul.go.kr:8088'
_key=str(key['dataseoul'])
_type='xml'
_service='CardSubwayStatisticsService'
_start_index=1
_end_index=5
_use_mon='201306'
_api=os.path.join(_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon)

In [134]:
response = requests.get(_api).text
print response

<?xml version="1.0" encoding="UTF-8"?><CardSubwayStatisticsService>
<list_total_count>530</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>용문</SUB_STA_NM>
<RIDE_PASGR_NUM>111275</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>108878</ALIGHT_PASGR_NUM>
<WORK_DT>20130723</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>원덕</SUB_STA_NM>
<RIDE_PASGR_NUM>11495</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>10964</ALIGHT_PASGR_NUM>
<WORK_DT>20130723</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>양평</SUB_STA_NM>
<RIDE_PASGR_NUM>118103</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>116604</ALIGHT_PASGR_NUM>
<WORK_DT>20130723</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>오빈</SUB_STA_NM>
<RIDE_PASGR_NUM>10590</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>10020</ALIGHT_PASGR_NUM>
<WORK_DT>2013072

## 문제 REST-6: 2013년 1년 동안 지하철역 승하차 인원

* 2013년 1년 동안 호선별 승하차 인원을 계산한다.
* 페이징
    * index를 사용하여 모든 데이터를 가져올 수 있다.
    * 반복문을 사용하여 모든 데이터를 가져올 수 있다. 반복 종료 조건을 사용하려면 메시지를 판단한다.

메시지 | 메시지 설명
------|-------
INFO-000 | 정상 처리되었습니다.
INFO-100 | 인증키가 유효하지 않습니다.
INFO-200 | 해당하는 데이터가 없습니다.


In [None]:
import os
import requests
_url='http://openAPI.seoul.go.kr:8088'
_key=str(key['dataseoul'])
_type='xml'
_service='CardSubwayStatisticsService'
_start_index=1
_end_index=5
_use_mon='201306'

In [135]:
_maxIter=2
_iter=0
while _iter<_maxIter:
    _api=os.path.join(_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon)
    #print _api
    response = requests.get(_api).text
    print response
    _start_index+=5
    _end_index+=5
    _iter+=1

<?xml version="1.0" encoding="UTF-8"?><CardSubwayStatisticsService>
<list_total_count>530</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>용문</SUB_STA_NM>
<RIDE_PASGR_NUM>111275</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>108878</ALIGHT_PASGR_NUM>
<WORK_DT>20130723</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>원덕</SUB_STA_NM>
<RIDE_PASGR_NUM>11495</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>10964</ALIGHT_PASGR_NUM>
<WORK_DT>20130723</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>양평</SUB_STA_NM>
<RIDE_PASGR_NUM>118103</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>116604</ALIGHT_PASGR_NUM>
<WORK_DT>20130723</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201306</USE_MON>
<LINE_NUM>중앙선</LINE_NUM>
<SUB_STA_NM>오빈</SUB_STA_NM>
<RIDE_PASGR_NUM>10590</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>10020</ALIGHT_PASGR_NUM>
<WORK_DT>2013072

### 위 예제의 json 반환

In [137]:
_type='json'

In [138]:
_api=os.path.join(_url,_key,_type,_service,str(_start_index),str(_end_index),_use_mon)

In [141]:
data=requests.get(_api).text
print data

{"CardSubwayStatisticsService":{"list_total_count":530,"RESULT":{"CODE":"INFO-000","MESSAGE":"정상 처리되었습니다"},"row":[{"USE_MON":"201306","LINE_NUM":"중앙선","SUB_STA_NM":"도심","RIDE_PASGR_NUM":75553.0,"ALIGHT_PASGR_NUM":67667.0,"WORK_DT":"20130723","COMMT":""},{"USE_MON":"201306","LINE_NUM":"중앙선","SUB_STA_NM":"덕소","RIDE_PASGR_NUM":189783.0,"ALIGHT_PASGR_NUM":189419.0,"WORK_DT":"20130723","COMMT":""},{"USE_MON":"201306","LINE_NUM":"중앙선","SUB_STA_NM":"양정","RIDE_PASGR_NUM":27878.0,"ALIGHT_PASGR_NUM":23735.0,"WORK_DT":"20130723","COMMT":""},{"USE_MON":"201306","LINE_NUM":"중앙선","SUB_STA_NM":"도농","RIDE_PASGR_NUM":267402.0,"ALIGHT_PASGR_NUM":228445.0,"WORK_DT":"20130723","COMMT":""},{"USE_MON":"201306","LINE_NUM":"중앙선","SUB_STA_NM":"구리","RIDE_PASGR_NUM":399287.0,"ALIGHT_PASGR_NUM":418036.0,"WORK_DT":"20130723","COMMT":""}]}}


In [104]:
import json
jd = json.loads(data)
#print jd['STATION_NM']
#for key,value in jd.items():
#    print "---",key,value

print jd['SearchSTNBySubwayLineService']['row'][0]
#n=len(jd['SearchSTNBySubwayLineService']['row'])
#for i in range(0,n):
#    print jd['SearchSTNBySubwayLineService']['row'][i]
for item in jd['SearchSTNBySubwayLineService']['row']:
    print item.keys()
    for i in item.keys():
        if i=='STATION_NM':
            print ''.join(item.values())
            print item.values()[1]


{u'STATION_CD': u'0201', u'STATION_NM': u'\uc2dc\uccad', u'FR_CODE': u'201', u'LINE_NUM': u'2'}
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0201시청2012
시청
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0202을지로입구2022
을지로입구
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0203을지로3가2032
을지로3가
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0204을지로4가2042
을지로4가
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0205동대문역사문화공원2052
동대문역사문화공원
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0206신당2062
신당
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0207상왕십리2072
상왕십리
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0208왕십리2082
왕십리
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0209한양대2092
한양대
[u'STATION_CD', u'STATION_NM', u'FR_CODE', u'LINE_NUM']
0210뚝섬2102
뚝섬


## 문제 REST-7: '2013년 1년 동안 지하철역 승하차 인원' 저장하기

* 앞 문제를 python 일괄 실행하기
* 결과 저장하기 - 파일, nosql mongodb로 저장

### 결과의 저장

* json파일
* mongodb

* mongodb는 /var/lib/mongodb에 생성된다.

In [62]:
!ls -l /var/lib/mongodb/ds_*

-rw------- 1 mongodb nogroup 67108864 10월  9 21:35 /var/lib/mongodb/ds_rest_subwayPassengers_mongo_db.0
-rw------- 1 mongodb nogroup 16777216 10월  9 21:35 /var/lib/mongodb/ds_rest_subwayPassengers_mongo_db.ns


* mongo cli
    * db명: use ds_rest_subwayPassengers_mongo_db
    * table (또는 Collection)명: db_rest_subway
    * dictionary 하위 계층은 dot (.)으로 나타낸다.
        ```
        db.db_rest_subway.find({"CardSubwayStatisticsService.row.LINE_NUM":"분당선"})
        ```

In [3]:
%%writefile src/ds_rest_subway_mongo.js
use ds_rest_subwayPassengers_mongo_db
db.db_rest_subway.find({"CardSubwayStatisticsService.row.SUB_STA_NM":"강남구청"})

Overwriting src/ds_rest_subway_mongo.js


In [4]:
!mongo < src/ds_rest_subway_mongo.js

MongoDB shell version: 2.6.10
connecting to: test
switched to db ds_rest_subwayPassengers_mongo_db
{ "_id" : ObjectId("57fa3870f5e6e94359c033f8"), "CardSubwayStatisticsService" : { "row" : [ { "COMMT" : "", "RIDE_PASGR_NUM" : 206631, "WORK_DT" : "20130723", "LINE_NUM" : "분당선", "SUB_STA_NM" : "선정릉", "ALIGHT_PASGR_NUM" : 231260, "USE_MON" : "201306" }, { "COMMT" : "", "RIDE_PASGR_NUM" : 188076, "WORK_DT" : "20130723", "LINE_NUM" : "분당선", "SUB_STA_NM" : "강남구청", "ALIGHT_PASGR_NUM" : 215608, "USE_MON" : "201306" }, { "COMMT" : "", "RIDE_PASGR_NUM" : 345902, "WORK_DT" : "20130723", "LINE_NUM" : "분당선", "SUB_STA_NM" : "압구정로데오", "ALIGHT_PASGR_NUM" : 393142, "USE_MON" : "201306" }, { "COMMT" : "", "RIDE_PASGR_NUM" : 143459, "WORK_DT" : "20130723", "LINE_NUM" : "분당선", "SUB_STA_NM" : "서울숲", "ALIGHT_PASGR_NUM" : 136147, "USE_MON" : "201306" }, { "COMMT" : "", "RIDE_PASGR_NUM" : 180522, "WORK_DT" : "20130723", "LINE_NUM" : "분당선", "SUB_STA_NM" : "수서", "ALIGHT_PASGR_NUM" : 185810, "USE_MON" : "2013

## 문제 REST-8: 서울 7016번 광화문~상명대까지 2015년 승하차 인원 월별 정류장별 최대 최소 구하기

* 2015년 7016번 정류장별로 승하차인원을 월별로 합계구하기
* '서울시 버스노선별/정류장별 승하차인원 정보'
    * 월별 버스노선별, 정류장별 승하차 인원
* 샘플URL

조건 | 샘플URL
-----|-----
2013년 6월의 버스정류장별 승하차인원 | http://openAPI.seoul.go.kr:8088/(인증키)/xml/CardBusStatisticsService/1/5/201306/
2013년 6월의 7013B 노선에 대한 승하차인원 | http://openAPI.seoul.go.kr:8088/(인증키)/xml/CardBusStatisticsService/1/5/201306/7013B/

* 샘플 실행하기
* regex

In [17]:
import requests
import re
busstopurl='http://openAPI.seoul.go.kr:8088/sample/xml/CardBusStatisticsService/1/5/201510/7016'
data=requests.get(busstopurl).text
print data
p=re.compile('<BUS_STA_NM>(.+?)</BUS_STA_NM>')
res=p.findall(data)
for item in res:
    print item

<?xml version="1.0" encoding="UTF-8"?><CardBusStatisticsService>
<list_total_count>106</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<USE_MON>201510</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>신촌오거리.현대백화점</BUS_STA_NM>
<RIDE_PASGR_NUM>10423</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>11121</ALIGHT_PASGR_NUM>
<WORK_DT>20151108</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201510</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>갈월동4호선숙대입구</BUS_STA_NM>
<RIDE_PASGR_NUM>3912</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>5539</ALIGHT_PASGR_NUM>
<WORK_DT>20151108</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201510</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>원효로1동.주민센터</BUS_STA_NM>
<RIDE_PASGR_NUM>3268</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>2603</ALIGHT_PASGR_NUM>
<WORK_DT>20151108</WORK_DT>
<COMMT/>
</row>
<row

In [16]:
buspassengers='http://openAPI.seoul.go.kr:8088/sample/xml/CardBusStatisticsService/1/5/201510/7016/'
data=requests.get(busstopurl).text
print data
p=re.compile('<RIDE_PASGR_NUM>(.+?)</RIDE_PASGR_NUM>')
res=p.findall(data)
for item in res:
    print item

<?xml version="1.0" encoding="UTF-8"?><CardBusStatisticsService>
<list_total_count>106</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<USE_MON>201510</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>신촌오거리.현대백화점</BUS_STA_NM>
<RIDE_PASGR_NUM>10423</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>11121</ALIGHT_PASGR_NUM>
<WORK_DT>20151108</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201510</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>갈월동4호선숙대입구</BUS_STA_NM>
<RIDE_PASGR_NUM>3912</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>5539</ALIGHT_PASGR_NUM>
<WORK_DT>20151108</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201510</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>원효로1동.주민센터</BUS_STA_NM>
<RIDE_PASGR_NUM>3268</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>2603</ALIGHT_PASGR_NUM>
<WORK_DT>20151108</WORK_DT>
<COMMT/>
</row>
<row

* 자신의 키로 실행하기

In [15]:
KEY=str(key['dataseoul'])
TYPE='xml'
SERVICE='CardBusStatisticsService'
START_INDEX=str(1)
END_INDEX=str(5)
USE_MON=str(201512)
BUS_ROUTE_NO=str(7016)

params=os.path.join(KEY,TYPE,SERVICE,START_INDEX,END_INDEX,USE_MON,BUS_ROUTE_NO)
print params[31:]

xml/CardBusStatisticsService/1/5/201512/7016


In [22]:
import urlparse
_url='http://openapi.seoul.go.kr:8088/'
url=urlparse.urljoin(_url,params)
#print url

In [17]:
import requests

data=requests.get(url).text
print data

<?xml version="1.0" encoding="UTF-8"?><CardBusStatisticsService>
<list_total_count>106</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<USE_MON>201512</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>신촌오거리.현대백화점</BUS_STA_NM>
<RIDE_PASGR_NUM>10416</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>11279</ALIGHT_PASGR_NUM>
<WORK_DT>20160308</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201512</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>갈월동4호선숙대입구</BUS_STA_NM>
<RIDE_PASGR_NUM>3968</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>4525</ALIGHT_PASGR_NUM>
<WORK_DT>20160308</WORK_DT>
<COMMT/>
</row>
<row>
<USE_MON>201512</USE_MON>
<BUS_ROUTE_NO>7016</BUS_ROUTE_NO>
<BUS_ROUTE_NM>7016번(은평차고지~상명대)</BUS_ROUTE_NM>
<BUS_STA_NM>원효로1동.주민센터</BUS_STA_NM>
<RIDE_PASGR_NUM>3582</RIDE_PASGR_NUM>
<ALIGHT_PASGR_NUM>2481</ALIGHT_PASGR_NUM>
<WORK_DT>20160308</WORK_DT>
<COMMT/>
</row>
<row

## 문제 REST-9: 서울시 종로구 관측소 현재 온도, 습도, 강수량 구하기

* 서울시 관측소별 실시간 기상관측 현황
* 샘플URL

조건 | 샘플URL
-----|-----
관측소별 실시간 기상관측정보 조회 | http://openAPI.seoul.go.kr:8088/(인증키)/xml/RealtimeWeatherStation/1/5/
중구 관측소 실시간 기상관측정보 조회 | http://openAPI.seoul.go.kr:8088/(인증키)/xml/RealtimeWeatherStation/1/5/중구

* 결과
    ```
    1	SAWS_OBS_TM	측정일시
    2	STN_NM	지점명
    3	SAWS_TA_AVG	기온(℃)
    4	SAWS_HD	습도(%)
    5	CODE	풍향1
    6	NAME	풍향2
    7	SAWS_WS_AVG	풍속(m/s)
    8	SAWS_RN_SUM	강수(mm)
    9	SAWS_SOLAR	일사(Mj/㎡)
    10	SAWS_SHINE	일조(hour)
    ```

* 샘플 실행하기
* regex

In [3]:
import requests
import re
weatherurl='http://openAPI.seoul.go.kr:8088/sample/xml/RealtimeWeatherStation/1/5/'
data=requests.get(weatherurl).text
print data
p=re.compile('<SAWS_TA_AVG>(.+?)</SAWS_TA_AVG>')
res=p.findall(data)
for item in res:
    print item

<?xml version="1.0" encoding="UTF-8"?><RealtimeWeatherStation>
<list_total_count>1</list_total_count>
<RESULT>
<CODE>INFO-000</CODE>
<MESSAGE>정상 처리되었습니다</MESSAGE>
</RESULT>
<row>
<SAWS_OBS_TM>2015092216</SAWS_OBS_TM>
<STN_NM>성동</STN_NM>
<SAWS_TA_AVG>30.1</SAWS_TA_AVG>
<SAWS_HD>29.2</SAWS_HD>
<CODE>7.0</CODE>
<NAME>남동</NAME>
<SAWS_WS_AVG>1.9</SAWS_WS_AVG>
<SAWS_RN_SUM>0</SAWS_RN_SUM>
<SAWS_SOLAR/>
<SAWS_SHINE/>
</row>
</RealtimeWeatherStation>

30.1


* 자신의 키로 실행하기

In [18]:
KEY=str(key['dataseoul'])
TYPE='json'
SERVICE='RealtimeWeatherStation'
START_INDEX=str(1)
END_INDEX=str(5)
STN_NM=u'중구'

params=os.path.join(KEY,TYPE,SERVICE,START_INDEX,END_INDEX,STN_NM)
print params[31:]

json/RealtimeWeatherStation/1/5/중구


In [19]:
import urlparse
_url='http://openapi.seoul.go.kr:8088/'
url=urlparse.urljoin(_url,params)
#print url

In [20]:
import requests

data=requests.get(url).text
print data

{"RealtimeWeatherStation":{"list_total_count":1,"RESULT":{"CODE":"INFO-000","MESSAGE":"정상 처리되었습니다"},"row":[{"SAWS_OBS_TM":"2016100919","STN_NM":"중구","SAWS_TA_AVG":13.100000381469727,"SAWS_HD":39.70000076293945,"CODE":"13","NAME":"서","SAWS_WS_AVG":1.7999999523162842,"SAWS_RN_SUM":0.0,"SAWS_SOLAR":0.0,"SAWS_SHINE":0.0}]}}


## 연습 REST: pandas로 웹 데이터 야후 주식 읽기

* pandas data reading from Yahoo Finance

In [1]:
import datetime
import pandas.io.data as web
start = datetime.datetime(2015,11,1)
end = datetime.datetime(2015, 11, 10)
soil = web.DataReader("010950.KS", "yahoo", start, end)

In [2]:
print soil

             Open   High    Low  Close  Volume  Adj Close
Date                                                     
2015-11-02  67900  68400  66800  68400  206300   66836.65
2015-11-03  68600  69800  67600  69700  331900   68106.93
2015-11-04  70900  71500  70000  70300  286900   68693.22
2015-11-05  69800  70000  69100  69600  177600   68009.22
2015-11-06  69500  69600  68900  69500  141000   67911.50
2015-11-09  69300  69300  67600  67600  168800   66054.93
2015-11-10  66700  68300  66200  67300  175600   65761.79


In [3]:
import pandas.io.data as web

ncsoft = web.DataReader('KRX:036570', data_source='google', start='01/01/2015', end='09/02/2015')
sds = web.DataReader('KRX:018260', data_source='google', start='11/01/2015', end='11/10/2015')

print sds

              Open    High     Low   Close  Volume
Date                                              
2015-11-02  257500  259500  254500  255500  153443
2015-11-03  257500  259000  255000  255500  126434
2015-11-04  254500  255000  250500  253000  180937
2015-11-05  253000  256500  250500  254000   85396
2015-11-06  253500  261000  253000  258000   88942
2015-11-09  258500  258500  251000  252500   89752
2015-11-10  251500  252000  248500  250000   79362
