## requests 모듈을 이용한 트위터 POS 웹 요청

In [None]:
!pip install requests
# 해당 모듈 사용을 위한 설치, 직접 커맨드에서 pip install requests 하셔도 됩니다.

In [1]:
import re
import requests
from urllib import parse  # 한글을 올바르게 전달하기 위해 인코딩

In [2]:
pt = re.compile(r'(?P<text>.+?)\((?P<pos>.+):.+\)')
# 주로(Noun: 4, 2) 같은 패턴을 text와 pos로 분리해서 사용하기 위한 정규식

In [14]:
def request_pos(sentence):
    sentence = parse.quote(sentence)  # 한글 인코딩
    # print(sentence) 어떻게 변경되는지 확인해보세요
    
    url = 'https://open-korean-text-api.herokuapp.com/normalize?text='
    
    sentence = requests.get(url=url+sentence, timeout=5).json()
    sentence = parse.quote(sentence['strings'])  # 한글 인코딩
    
    url = 'https://open-korean-text-api.herokuapp.com/tokenize?text='
    response = requests.get(url=url+sentence, timeout=5).json()  # 웹 요청한 결과를 json(dict)으로

    tokens = []
    for i in response['tokens']:
        m = pt.match(i)
        if m:
            tokens.append((m.group('text'), m.group('pos')))
        
    return tokens

In [15]:
result = request_pos('지금 당장 집에 가서 쉬고 싶엉. 나는 너무 지쳤엌ㅋㅋ. 오늘 너무 힘들었는데, 아무도 내게 말 한마디 없어.')
result

{'strings': '지금 당장 집에 가서 쉬고 싶엉. 나는 너무 지쳤어ㅋㅋ. 오늘 너무 힘들었는데, 아무도 내게 말 한마디 없어.'}


[('지금', 'Noun'),
 ('당장', 'Noun'),
 ('집', 'Noun'),
 ('에', 'Josa'),
 ('가서', 'Verb(가다)'),
 ('쉬', 'Noun'),
 ('고', 'Josa'),
 ('싶', 'Verb(싶다)'),
 ('엉', 'Exclamation'),
 ('.', 'Punctuation'),
 ('나', 'Noun'),
 ('는', 'Josa'),
 ('너무', 'Adverb'),
 ('지쳤어', 'Verb(지치다)'),
 ('ㅋㅋ', 'KoreanParticle'),
 ('.', 'Punctuation'),
 ('오늘', 'Noun'),
 ('너무', 'Adverb'),
 ('힘들었는데', 'Adjective(힘들다)'),
 (',', 'Punctuation'),
 ('아무', 'Noun'),
 ('도', 'Josa'),
 ('내게', 'Verb(내다)'),
 ('말', 'Noun'),
 ('한마디', 'Noun'),
 ('없어', 'Adjective(없다)'),
 ('.', 'Punctuation')]