In [1]:
# 웹 API
# Application Programming Interface
# HTML 소스 분석 과정 없이 웹 서버에서 바로 원하는 데이터를 요청 및 전달 받을 수 있다.
# 응용 프로그램에서 사용 가능한 인터페이스
# 파일 제어, 창 제어, 화성 처리 및 문자 제어 등을 위한 인터페이스 제공.

# API : 컴퓨터 안에서 프로그램 만들 때 운영체제 또는 프로그래밍 언어가 제공하는 기능을 제어하게끔 하는 역할
# 웹 API : 웹으로 연결된 다른 기기들과 데이터를 공유하기 위해 제공하는 역할

# 클라의 요청 > 서버의 응답 방식으로 데이터를 주고 받는 기능을 한다.
# 1) REST API(Representational State Transfer)
#    : 이미 존재하는 데이터를 공유하는 데 사용. 데이터 요청>응답 후에는 연결이 끊어진다.
# 2) Streaming API
#    : 앞으로 발생할 이벤트에 대해 등록한 뒤, 이벤트 발생 시 데이터 갱신 > 응답
#    : 응답 후에도 강제로 연결을 끊기 전까지 연결을 계속 유지.
# 3) REAT API & Streaming API 모두 지원 -> Tweepy library

# OAuth : 외부에서 해당 서비스에 접속하는 응용 프로그램의 보안인증을 허용하는 개방형 인증 규약.
# -> API Key, Access Token, password 로 권한을 얻는다.
# (기존에는 id & password 방식으로 권한을 얻었다.)
# + API Key, Access Token, password >>> 절대 공개하면 X

# XML
# JSON
# : 데이터를 주고 받는 구조화된 텍스트 형식.
# XML >>> 단점 극복 >>> JSON : 구조가 단순하고 속도가 좀 더 빠르다.
# JSON 은 이름:값 으로 이뤄진 쌍의 집합

In [2]:
import json

In [3]:
python_dict = {
    "이름":"김민경",
    "나이":"28",
    "거주지":"서울",
    "정보":{"혈액형":"AB",
         "생일":"1월"},
    "취미":["음악감상",
         "러닝",
         "자전거타기"]
}
print(type(python_dict))

<class 'dict'>


In [4]:
# dict >>> json 형변환 하기
json_data = json.dumps(python_dict)
print(type(json_data))

<class 'str'>


In [5]:
print(json_data)

{"\uc774\ub984": "\uae40\ubbfc\uacbd", "\ub098\uc774": "28", "\uac70\uc8fc\uc9c0": "\uc11c\uc6b8", "\uc815\ubcf4": {"\ud608\uc561\ud615": "AB", "\uc0dd\uc77c": "1\uc6d4"}, "\ucde8\ubbf8": ["\uc74c\uc545\uac10\uc0c1", "\ub7ec\ub2dd", "\uc790\uc804\uac70\ud0c0\uae30"]}


In [6]:
# 가독성을 위해 옵션을 추가하자
json_data = json.dumps(python_dict, indent=3, sort_keys=True, ensure_ascii=False)
print(json_data)

{
   "거주지": "서울",
   "나이": "28",
   "이름": "김민경",
   "정보": {
      "생일": "1월",
      "혈액형": "AB"
   },
   "취미": [
      "음악감상",
      "러닝",
      "자전거타기"
   ]
}


In [7]:
# json >>> dic 형변환
json_dict = json.loads(json_data)
print(type(json_dict))

<class 'dict'>


In [8]:
# 일부 추출
json_dict['정보']['생일']

'1월'

In [9]:
json_dict['취미']

['음악감상', '러닝', '자전거타기']

In [10]:
# 인덱스
json_dict['취미'][0]

'음악감상'

In [11]:
# XML 
# eXtensible Markup Language
# 마크업 언어 : 태그를 이용해 데이터를 구조화.
# 대표적인 마크업 언어로는 HTML
# <태그> </태그>
# 문서에는 반드시 최상위(root) 요소가 있어야 한다.
# 루트는 시작과 끝 태그로 다른 모든 요소를 감싸야 한다.
# 태그에는 속성을 사용할 수 있고, <문자열 name="속성">으로 표현한다.
# 주석 : <!-- -->
# xml 데이터를 파이썬의 딕셔너리 타입으로 바로 변환하는 xmltodict library
# 아나콘다 설치 시 함께 설치되는 것이 아니라, 따로 설치해야한다.
# Anaconda Prompt > pip install xmltodict

In [12]:
import xmltodict

In [13]:
xml_data = """<?xml version="1.0" encoding="UTF-8" ?>
<사용자 정보>
    <이름>김민경</이름>
    <나이>28</나이>
    <거주지>서울</거주지>
    <정보>
        <키 unit="cm">163</키>
        <몸무게 unit="kg">9999</몸무게>
    </정보>
    <취미>러닝</취미>
    <취미>자전거타기</취미>
    <취미>음악감상></취미>
</사용자 정보>
"""
print(xml_data)

<?xml version="1.0" encoding="UTF-8" ?>
<사용자 정보>
    <이름>김민경</이름>
    <나이>28</나이>
    <거주지>서울</거주지>
    <정보>
        <키 unit="cm">163</키>
        <몸무게 unit="kg">9999</몸무게>
    </정보>
    <취미>러닝</취미>
    <취미>자전거타기</취미>
    <취미>음악감상></취미>
</사용자 정보>



In [19]:
# xml >>> dic 형변환
# parse() 이용
import xmltodict

#file = forms.FieldField(widget=forms.FileInput(attrs={'class': 'rounded_list'}))

#class ImportExcelForm(Form):
#    file  = forms.FileField()
#    file.widget.attrs.update({'class': 'rounded_list'})

dict_data = xmltodict.parse(xml_data, attribs=True)
dict_data
# >>> attribs?? 왜 오류죠?!

TypeError: __init__() got an unexpected keyword argument 'attribs'

In [21]:
# str 연결로 url을 연결 사용
# >>> 하위 경로만 변경할 때 편하다.
base_url = "https://api.github.com/"
sub_dir = "events"
url = base_url + sub_dir
print(url)

https://api.github.com/events


In [24]:
import requests
base_url = "https://api.github.com/"
sub_dirs = ["events","user","emails"]

for sub_dir in sub_dirs:
    url_dir = base_url + sub_dir
    r = requests.get(url_dir)
    print(r.url)

https://api.github.com/events
https://api.github.com/user
https://api.github.com/emails


In [26]:
import requests
LAT = '37.57'# 위도
LON = '126.98'# 경도
API_KEY = 'b235c57pc357fb68acr1e81' # API 임의의 키
UNIT = 'metric' # 단위

site_url = "http://api.openweathermap.org/data/2.5/weather"
parameter = "?lat=%s&lon=%s&appid=%s&units=%s"%(LAT,LON,API_KEY,UNIT)
url_para = site_url + parameter
r = requests.get(url_para)

print(r.url)

http://api.openweathermap.org/data/2.5/weather?lat=37.57&lon=126.98&appid=b235c57pc357fb68acr1e81&units=metric


In [29]:
# twitter
import tweepy

api_key = ''
api_secret = ''
access_token = ''
access_secret = ''

In [30]:
# OAuth 인증
auth = tweepy.OAuthHandler(api_key, api_secret)
auth.set_access_token(access_token, access_secret)

In [31]:
api = tweepy.API(auth)

In [32]:
# 사용자 이름 추출
print("name:",api.me().name)

TweepError: [{'code': 215, 'message': 'Bad Authentication data.'}]

In [None]:
for status in tweepy.Cursor(api.home_timeline).items(2):
    print("*", status.text)

In [None]:
import tweepy

class MyStreamListener(tweepy.StreamListener):
    def on_status(self, status):
        print(status.text)

In [33]:
myStreamListener = MyStreamListener()
# 객체 생성

In [34]:
myStream = tweepy.Stream(auth, myStreamListener)

In [35]:
#myStreaeam.filter(track = ['파이썬','python'])

In [36]:
class MyStreamListener(tweepy.StreamListener):
    def __init__(self):
        super().__init__()
        self.tweet_num = 0
        
    def on_status(self, status):
        self.tweet_num = self.tweet_num + 1
        if(self.tweet_num <= 5):
            print("***", status.text)
            return True
        else:
            return False

In [37]:
myStreamListener = MyStreamListener()
myStream = tweepy.Stream(auth, myStreamListener)
myStream = filter(track = ['머신 러닝', 'Machine Learning'])

TypeError: filter() takes no keyword arguments