# 우리말 샘 이용하기
## 1. 우리말샘 오픈 API 서비스 
- 우리말샘 오픈 API는 검색 플랫폼을 외부에 공개하여 다양하고 재미있는 서비스 및 애플리케이션을 개발할 수 있도록 외부 개발자와 사용자들이 공유하는 프로그램
- 우리말샘에 구축된 양질의 사전 정보를 개인 또는 기관에서 오픈 API를 이용해 자유롭게 이용할 수 있도록 제공

## 2. 우리말샘 오픈 API 서비스 인증키 발급
## 3. 우리말샘 오픈 API 서비스 이용

In [1]:
from urllib.request import urlopen
from urllib.parse import quote, unquote

### url 한글 처리
- URL에 사용할 수 있는 문자 : 영문자, 숫자, 몇몇 기호 뿐
- URL에서 Ascii 코드가 아닌 문자들을 전송하기 위해서는 퍼센트 인코딩(percent encoding)이라는 형식으로 바꾸어야 함
- urllib.parse.quote() / urllib.parse.unquote()

In [2]:
kor = quote('한글')
print(kor, unquote(kor))

%ED%95%9C%EA%B8%80 한글


In [3]:
def makeUrl(apiKey, word):
    url = 'https://opendict.korean.go.kr/api/search?'
    url += 'certkey_no=1036&key='
    url += apiKey         # 우리말 샘 개발 API Key
    url += '&target_type=search&part=word&q='
    url += quote(word)    # for percent encoding (한글 처리)
    url += '&sort=dict&start=1&num=10'
    return url

In [4]:
key = '********'
word = '정보'
urlStr = makeUrl(key, word)
xml = urlopen(urlStr).read()

In [5]:
xml

b'<?xml version="1.0" encoding="UTF-8"?>\n        \n            \n            \t\n            \t\t\n            \t <channel>\n\t\t\t        <title>\xec\x9a\xb0\xeb\xa6\xac\xeb\xa7\x90\xec\x83\x98 \xea\xb0\x9c\xeb\xb0\x9c \xec\xa7\x80\xec\x9b\x90(Open API) - \xec\x82\xac\xec\xa0\x84 \xec\x96\xb4\xed\x9c\x98 \xea\xb2\x80\xec\x83\x89</title>\n\t\t\t        <link>http://opendict.korean.go.kr</link>\n\t\t\t        <description>\xec\x9a\xb0\xeb\xa6\xac\xeb\xa7\x90\xec\x83\x98 \xea\xb0\x9c\xeb\xb0\x9c \xec\xa7\x80\xec\x9b\x90(Open API) - \xec\x82\xac\xec\xa0\x84 \xec\x96\xb4\xed\x9c\x98 \xea\xb2\x80\xec\x83\x89 \xea\xb2\xb0\xea\xb3\xbc</description>\n\t\t\t        <lastBuildDate>20191103125351</lastBuildDate> \n\t\t\t        <total>1409</total>\n\t\t\t        <start>1</start>\n\t\t\t        <num>10</num>    \n                \n                    <item>\n                        <word>\xec\xa0\x95\xeb\xb3\xb4</word>                        \n                       \t\n\t                       \

### XML Parsing
- 데이터가 문자열로 존재하는 경우 elemTree.fromstring('XML 문자열')
- 태그 검색 : find(tag), findall(tag)
- 태그 데이터 : text

In [6]:
import xml.etree.ElementTree as elemTree
tree = elemTree.fromstring(xml)

In [7]:
title = tree.find('title')
title.text

'우리말샘 개발 지원(Open API) - 사전 어휘 검색'

In [14]:
item = tree.find('item')
item.find('word').text

'정보'

In [15]:
item.find('sense').find('definition').text

'보통 행군의 걸음걸이. 보통 걸음보다 힘 있고 절도 있게 팔과 다리를 움직이며 걷는 걸음이다.'

In [16]:
for item in tree.findall('item'):
    print(item.find('word').text, ':', item.find('sense').find('definition').text)

정보 : 보통 행군의 걸음걸이. 보통 걸음보다 힘 있고 절도 있게 팔과 다리를 움직이며 걷는 걸음이다.
정보 : 정확한 소식.
정보 : 땅 넓이의 단위. 정(町)으로 끝나고 우수리가 없을 때 쓴다. 1정보는 3,000평으로 약 9,917.4㎡에 해당한다.
정보 : 관찰이나 측정을 통하여 수집한 자료를 실제 문제에 도움이 될 수 있도록 정리한 지식. 또는 그 자료.
정보 : 과거의 업인(業因)에 따라 내생(來生)에 어떠한 몸으로 나타나느냐로 받는 과보. 부처나 중생의 몸이다.
정보 : 고려 초기에, 태봉의 관제를 본떠서 정한 16위계 가운데 아홉 번째 등급. 종사품에 해당한다.
정보 : 영의정, 좌의정, 우의정을 통틀어 이르던 말.
정보 검색대 : 인터넷이나 자료 검색을 할 수 있도록 컴퓨터 따위를 설치하여 만든 이용물.
정보 더미 : 많은 정보를 비유적으로 이르는 말.
정보 맨 : 정보에 관한 일을 맡아 처리하는 사람.
