### JSON 데이터 예제

In [1]:
import json

python_dict = {
    "이름": "홍길동",
    "나이": 25,
    "거주지": "서울",
    "신체정보": {
        "키": 175.4,
        "몸무게": 71.2
    },
    "취미": [
        "등산",
        "자전거타기",
        "독서"
    ]
}

type(python_dict)

dict

In [2]:
# json 형태의 데이터로 변환
json_data = json.dumps(python_dict)
type(json_data)

str

In [3]:
# json 데이터 출력 확인
# 한글도 출력이 안되고 들여쓰기도 안되는 것을 확인할 수 있음
print(json_data)

{"\uc774\ub984": "\ud64d\uae38\ub3d9", "\ub098\uc774": 25, "\uac70\uc8fc\uc9c0": "\uc11c\uc6b8", "\uc2e0\uccb4\uc815\ubcf4": {"\ud0a4": 175.4, "\ubab8\ubb34\uac8c": 71.2}, "\ucde8\ubbf8": ["\ub4f1\uc0b0", "\uc790\uc804\uac70\ud0c0\uae30", "\ub3c5\uc11c"]}


In [4]:
# json.dumps()에 옵션 추가 후 다시 출력
json_data = json.dumps(python_dict, indent = 3, sort_keys = True, ensure_ascii = False)
print(json_data)

{
   "거주지": "서울",
   "나이": 25,
   "신체정보": {
      "몸무게": 71.2,
      "키": 175.4
   },
   "이름": "홍길동",
   "취미": [
      "등산",
      "자전거타기",
      "독서"
   ]
}


In [5]:
# json 형식의 데이터를 파이썬의 dictionary형태로 변경하기
json_dict = json.loads(json_data)
type(json_dict)

dict

In [6]:
# 실제 dictionary처럼 출력이 이뤄 지는지 확인해봅니다.
json_dict['신체정보']['몸무게']

71.2

In [7]:
json_dict['취미']

['등산', '자전거타기', '독서']

In [8]:
json_dict['취미'][0]

'등산'

### XML to Python dictionary 예제

In [9]:
xml_data = """<?xml version="1.0" encoding="UTF-8" ?>
<사용자정보>
    <이름>홍길동</이름>
    <나이>25</나이>
    <거주지>서울</거주지>
<신체정보>
    <키 unit="cm">175.4</키>
    <몸무게 unit="kg">71.2</몸무게>
</신체정보>
<취미>등산</취미>
<취미>자전거타기</취미>
<취미>독서</취미>
</사용자정보>
"""

print(xml_data)

<?xml version="1.0" encoding="UTF-8" ?>
<사용자정보>
    <이름>홍길동</이름>
    <나이>25</나이>
    <거주지>서울</거주지>
<신체정보>
    <키 unit="cm">175.4</키>
    <몸무게 unit="kg">71.2</몸무게>
</신체정보>
<취미>등산</취미>
<취미>자전거타기</취미>
<취미>독서</취미>
</사용자정보>



In [10]:
# xml 데이터 형식을 dictionary 타입으로 변경하는 예제
import xmltodict

dict_data = xmltodict.parse(xml_data, xml_attribs = True)
dict_data

OrderedDict([('사용자정보',
              OrderedDict([('이름', '홍길동'),
                           ('나이', '25'),
                           ('거주지', '서울'),
                           ('신체정보',
                            OrderedDict([('키',
                                          OrderedDict([('@unit', 'cm'),
                                                       ('#text', '175.4')])),
                                         ('몸무게',
                                          OrderedDict([('@unit', 'kg'),
                                                       ('#text', '71.2')]))])),
                           ('취미', ['등산', '자전거타기', '독서'])]))])

In [11]:
dict_data['사용자정보']['이름']

'홍길동'

In [12]:
# 사용자정보 중 신체정보 출력
dict_data['사용자정보']['신체정보']

OrderedDict([('키', OrderedDict([('@unit', 'cm'), ('#text', '175.4')])),
             ('몸무게', OrderedDict([('@unit', 'kg'), ('#text', '71.2')]))])

In [13]:
print("키의 단위: ", dict_data['사용자정보']['신체정보']['키']['@unit'], "키의 텍스트 값: ", \
      dict_data['사용자정보']['신체정보']['키']['#text'])

키의 단위:  cm 키의 텍스트 값:  175.4


In [14]:
# XML 데이터에서 원하는 데이터를 추출 및 활용하는 예제(종합)
import xmltodict

dict_data = xmltodict.parse(xml_data)

user_name = dict_data['사용자정보']['이름']
body_data = dict_data['사용자정보']['신체정보']

height = body_data['키']['#text']
height_unit = body_data['키']['@unit']

weight = body_data['몸무게']['#text']
weight_unit = body_data['몸무게']['@unit']

print("[사용자 {0}의 신체정보]".format(user_name))
print("*키: {0}{1}".format(height, height_unit))
print("*몸무게: {0}{1}".format(weight, weight_unit))

[사용자 홍길동의 신체정보]
*키: 175.4cm
*몸무게: 71.2kg


In [15]:
# XML에서 지정한 속성 무시하고 python dictionary로 파싱하기
dict_data2 = xmltodict.parse(xml_data, xml_attribs = False)
dict_data2

OrderedDict([('사용자정보',
              OrderedDict([('이름', '홍길동'),
                           ('나이', '25'),
                           ('거주지', '서울'),
                           ('신체정보',
                            OrderedDict([('키', '175.4'), ('몸무게', '71.2')])),
                           ('취미', ['등산', '자전거타기', '독서'])]))])

### 웹 사이트 주소에 부가 정보 추가하기 예제

In [16]:
base_url = "https://api.github.com/"
sub_dir = "events"
url = base_url + sub_dir
print(url)

https://api.github.com/events


#### 웹 사이트 주소에 경로 추가

In [17]:
# 기본 웹 사이트 주소에 하위 경로만 변경하여 URL 생성 후 requests.get()을 이용해 데이터를 요청하고 응답받는 예제
import requests

base_url = "https://api.github.com/"
sub_dirs = ["events", "user", "emails"]

for sub_dir in sub_dirs:
    url_dir = base_url + sub_dir
    r = requests.get(url_dir)
    print(r.url)

https://api.github.com/events
https://api.github.com/user
https://api.github.com/emails


#### 웹 사이트 주소에 매개변수 추가

In [18]:
# '?'를 이용하면 해당 웹 사이트에 매개변수를 보낼 수 있다.
# 전달하려는 매개변수가 2개 이상이면 : '&'로 연결지어 보내주면 된다.
import requests

LAT = '37.57' # 위도
LON = '126.98' # 경도
# API_KEY = 'YOUR-API-KEY' # API 키(임의의 API 키)
UNIT = 'metric' # 단위

site_url = "http://api.openweathermap.org/data/2.5/weather"
parameter = "?lat=%s&lon=%s&appid=%s&units=%s"%(LAT, LON, API_KEY, UNIT)
url_para = site_url + parameter
r = requests.get(url_para)

print(r.url)

http://api.openweathermap.org/data/2.5/weather?lat=37.57&lon=126.98&appid=b235c57pc357fb68acr1e81&units=metric


In [19]:
# 직접 생성한 URL을 요청 주소(url)과 요청 매개변수(params)로 분리 후 'requests.get(url, params = req_parameter)'
# 를 이용해 URL 생성하는 예제
import requests

LAT = '37.57' # 위도
LON = '126.98' # 경도
# API_KEY = 'YOUR-API-KEY' # API 키(임의의 API 키)
UNIT = 'metric' # 단위

req_url = "http://api.openweathermap.org/data/2.5/weather"
req_parameter = {"lat": LAT, "lon": LON, "appid": API_KEY, "units": UNIT}
r = requests.get(req_url, params = req_parameter)
print(r.url)

http://api.openweathermap.org/data/2.5/weather?lat=37.57&lon=126.98&appid=b235c57pc357fb68acr1e81&units=metric


#### 웹사이트 주소의 인코딩과 디코딩

In [20]:
# 인코딩된 API 키 문자열을 원래의 API 키 문자열, 다시 말해 디코딩된 API 키 문자열로 변환하는 방법 예제
import requests

# API_KEY = 'YOUR-API-KEY'

# API_KEY decoding
API_KEY_decode = requests.utils.unquote(API_KEY)

print("Encoded url: ", API_KEY)
print("Decoded url: ", API_KEY_decode)

Encoded url:  et5piq3pfpqLEWPpCbvtSQ%2Bertertg%2Bx3evdvbaRBvhWEerg3efac2r3f3RfhDTERTw%2B9rkvoewRV%2Fovmrk3dq%3D%3D
Decoded url:  et5piq3pfpqLEWPpCbvtSQ+ertertg+x3evdvbaRBvhWEerg3efac2r3f3RfhDTERTw+9rkvoewRV/ovmrk3dq==


In [21]:
# 디코딩된 API 키를 이용해 데이터를 요청하는 예제
# 그런데 연결 거부가 떠서 확인이 안되유 ㅠㅠ
req_url = "http://openapi.airkorea.or.kr/openapi/services/rest/MsrstcInfoInquireSvc/getNearbyMsrstnList"

tm_x = 244148.546388
tm_y = 412423.75772

req_parameter = {"ServiceKey": API_KEY_decode, "tmX": tm_x, "tmY": tm_y}

r = requests.get(req_url, params = req_parameter)
print(r.url)

http://openapi.airkorea.or.kr/openapi/services/rest/MsrstcInfoInquireSvc/getNearbyMsrstnList?ServiceKey=et5piq3pfpqLEWPpCbvtSQ%2Bertertg%2Bx3evdvbaRBvhWEerg3efac2r3f3RfhDTERTw%2B9rkvoewRV%2Fovmrk3dq%3D%3D&tmX=244148.546388&tmY=412423.75772


### API 키 없이 데이터 가져오기

In [22]:
# 국제 우주정거장(ISS)의 정보 가져오기
# API DOCS 참조 : http://open-notify.org
import requests
import json

# 이건 현재 ISS가 어디 있는지 보여주는 json입니다
url = "http://api.open-notify.org/iss-now.json"
r = requests.get(url)

# 이건 현재 ISS가 특정 위,경도에 언제 올건지 보여줄 json입니다.
# 본가가 김포시 사우동이라 해당 위,경도 기준으로 합니다
LAT = '37.40' # 위도 
LON = '126.37' # 경도
url2 = "http://api.open-notify.org/iss-pass.json"
req_param = {"lat": LAT, "lon": LON}
r2 = requests.get(url2, params = req_param)

# 이 API는 얼마나 많은 사람들이 지금 우주(space)에 있는지를 보여주는 API
# 사실상 ISS에 누가 있나 신상확인하는 부분
url3 = "http://api.open-notify.org/astros.json"
r3 = requests.get(url3)

# 현재 ISS의 위치
print(r.text)
print("="*120)

# 내 위치에 ISS가 올 시각
print(r2.text)
print("="*120)

# 얼마나 많은 사람들이 space 상에 있는지를 보여줌
# 예 > 어떤 craft(우주선)에 name(이름)은 뭐시기다 이렇게 보여줌
print(r3.text)

{"message": "success", "iss_position": {"longitude": "108.5958", "latitude": "-9.7247"}, "timestamp": 1558345216}
{
  "message": "success", 
  "request": {
    "altitude": 100, 
    "datetime": 1558343831, 
    "latitude": 37.4, 
    "longitude": 126.37, 
    "passes": 5
  }, 
  "response": [
    {
      "duration": 476, 
      "risetime": 1558345754
    }, 
    {
      "duration": 644, 
      "risetime": 1558351434
    }, 
    {
      "duration": 564, 
      "risetime": 1558357294
    }, 
    {
      "duration": 465, 
      "risetime": 1558363211
    }, 
    {
      "duration": 535, 
      "risetime": 1558369049
    }
  ]
}

{"message": "success", "number": 6, "people": [{"craft": "ISS", "name": "Oleg Kononenko"}, {"craft": "ISS", "name": "David Saint-Jacques"}, {"craft": "ISS", "name": "Anne McClain"}, {"craft": "ISS", "name": "Alexey Ovchinin"}, {"craft": "ISS", "name": "Nick Hague"}, {"craft": "ISS", "name": "Christina Koch"}]}


In [23]:
# 앞에서 살펴본 json 라이브러리의 'json.loads()'를 활용 JSON 형태의 data를 Python dictionary로 변경한다
json_to_dict = json.loads(r.text)
json_to_dict2 = json.loads(r2.text)
json_to_dict3 = json.loads(r3.text)

print(type(json_to_dict), type(json_to_dict2), type(json_to_dict3)) 

<class 'dict'> <class 'dict'> <class 'dict'>


In [24]:
# 앞에서 웹 API 응답(r)에서 'r.text'를 이용, JSON 형태의 데이터를 가져온 후 'json.loads()'로
# JSON 형태의 데이터를 dictionary 형태의 데이터로 변환 -> r.json() 으로 단순화가 가능하다
import requests

url = "http://api.open-notify.org/iss-now.json"

LAT = '37.40' # 위도 
LON = '126.37' # 경도
url2 = "http://api.open-notify.org/iss-pass.json"
req_param = {"lat": LAT, "lon": LON}

url3 = "http://api.open-notify.org/astros.json"

r = requests.get(url)
r2 = requests.get(url2, params = req_param)
r3 = requests.get(url3)

json_to_dict = r.json() # 간결화
json_to_dict2 = r2.json() # 간결화
json_to_dict3 = r3.json() # 간결화

In [25]:
# 위 코드를 좀 더 단순화
import requests

url = "http://api.open-notify.org/iss-now.json"

LAT = '37.40' # 위도 
LON = '126.37' # 경도
url2 = "http://api.open-notify.org/iss-pass.json"
req_param = {"lat": LAT, "lon": LON}

url3 = "http://api.open-notify.org/astros.json"

json_to_dict = requests.get(url).json()
json_to_dict2 = requests.get(url2, params = req_param).json()
json_to_dict3 = requests.get(url3).json()

In [26]:
# 위의 결과 출력
print(json_to_dict)
print("="*139)
print(json_to_dict2)
print("="*139)
print(json_to_dict3)

{'message': 'success', 'iss_position': {'longitude': '108.6703', 'latitude': '-9.6239'}, 'timestamp': 1558345218}
{'message': 'success', 'request': {'altitude': 100, 'datetime': 1558343831, 'latitude': 37.4, 'longitude': 126.37, 'passes': 5}, 'response': [{'duration': 476, 'risetime': 1558345754}, {'duration': 644, 'risetime': 1558351434}, {'duration': 564, 'risetime': 1558357294}, {'duration': 465, 'risetime': 1558363211}, {'duration': 535, 'risetime': 1558369049}]}
{'message': 'success', 'number': 6, 'people': [{'craft': 'ISS', 'name': 'Oleg Kononenko'}, {'craft': 'ISS', 'name': 'David Saint-Jacques'}, {'craft': 'ISS', 'name': 'Anne McClain'}, {'craft': 'ISS', 'name': 'Alexey Ovchinin'}, {'craft': 'ISS', 'name': 'Nick Hague'}, {'craft': 'ISS', 'name': 'Christina Koch'}]}


In [27]:
# 딕셔너리 타입 변환 후 원하는 데이터만 가져올 수 있습니다.
print(json_to_dict["message"])
print(json_to_dict["iss_position"])
print(json_to_dict["iss_position"]["latitude"])
print(json_to_dict["iss_position"]["longitude"])
print(json_to_dict["timestamp"])
print("="*139)
print(json_to_dict2["message"])
print(json_to_dict2["request"]["altitude"])
print(json_to_dict2["request"]["datetime"])
print(json_to_dict2["request"]["latitude"])
print(json_to_dict2["request"]["longitude"])
print(json_to_dict2["response"])
print(json_to_dict2["response"][0]["duration"])
print(json_to_dict2["response"][0]["risetime"])
print("="*139)
print(json_to_dict3["message"])
print(json_to_dict3["people"])
print(json_to_dict3["people"][0])
print(json_to_dict3["people"][1])
print(json_to_dict3["people"][2])

success
{'longitude': '108.6703', 'latitude': '-9.6239'}
-9.6239
108.6703
1558345218
success
100
1558343831
37.4
126.37
[{'duration': 476, 'risetime': 1558345754}, {'duration': 644, 'risetime': 1558351434}, {'duration': 564, 'risetime': 1558357294}, {'duration': 465, 'risetime': 1558363211}, {'duration': 535, 'risetime': 1558369049}]
476
1558345754
success
[{'craft': 'ISS', 'name': 'Oleg Kononenko'}, {'craft': 'ISS', 'name': 'David Saint-Jacques'}, {'craft': 'ISS', 'name': 'Anne McClain'}, {'craft': 'ISS', 'name': 'Alexey Ovchinin'}, {'craft': 'ISS', 'name': 'Nick Hague'}, {'craft': 'ISS', 'name': 'Christina Koch'}]
{'craft': 'ISS', 'name': 'Oleg Kononenko'}
{'craft': 'ISS', 'name': 'David Saint-Jacques'}
{'craft': 'ISS', 'name': 'Anne McClain'}


In [28]:
# 국제우주정거장 API를 이용하여 국제우주정거장의 위치 정보를 일정 시간(여기서는 10초)마다 갱신하는 코드를 작성합니다
import requests
import time

url = "http://api.open-notify.org/iss-now.json"

LAT = '37.40' # 위도 
LON = '126.37' # 경도
url2 = "http://api.open-notify.org/iss-pass.json"
req_param = {"lat": LAT, "lon": LON}

url3 = "http://api.open-notify.org/astros.json"

def ISS_Position(iss_position_api_url):
    json_to_dict = requests.get(iss_position_api_url).json()
    return json_to_dict["iss_position"]

def ISS_passed_on_Gimpo(iss_passed_api_url, req_param):
    json_to_dict2 = requests.get(iss_passed_api_url, params = req_param)
    return json_to_dict2["response"]

def ISS_Crew_in_space(iss_astros_api_url):
    json_to_dict3 = requests.get(iss_astros_api_url)
    return json_to_dict3["people"]

for i in range(10):
    print(ISS_Position(url))
    # 안되는 부분 수정해서 같이 출력될 수 있도록 조치필요
#     print(ISS_passed_on_Gimpo(url2, req_param))
#     print(ISS_Crew_in_space(url3))
    time.sleep(10)

{'longitude': '108.6889', 'latitude': '-9.5987'}
{'longitude': '109.0789', 'latitude': '-9.0691'}
{'longitude': '109.4491', 'latitude': '-8.5641'}
{'longitude': '109.8367', 'latitude': '-8.0335'}
{'longitude': '110.2232', 'latitude': '-7.5024'}
{'longitude': '110.5903', 'latitude': '-6.9962'}
{'longitude': '110.9748', 'latitude': '-6.4643'}
{'longitude': '111.3402', 'latitude': '-5.9574'}
{'longitude': '111.7230', 'latitude': '-5.4247'}
{'longitude': '112.0869', 'latitude': '-4.9172'}


In [29]:
# 국가 관련 정보를 웹 API로 제공함(https://restcountries.eu/)
import requests

# 책하고 url 다른거 확인하고 작성할것!
url_temp = "https://restcountries.eu/rest/v1/name/"
country = "South Korea"
url = url_temp + country

r = requests.get(url)

print(r.text)

[{"name":"South Korea","topLevelDomain":[".kr"],"alpha2Code":"KR","alpha3Code":"KOR","callingCodes":["82"],"capital":"Seoul","altSpellings":["KR","Republic of Korea"],"region":"Asia","subregion":"Eastern Asia","population":51448183,"latlng":[37.0,127.5],"demonym":"South Korean","area":100210.0,"gini":31.3,"timezones":["UTC+09:00"],"borders":["PRK"],"nativeName":"대한민국","numericCode":"410","currencies":["KRW"],"languages":["ko"],"translations":{"de":"Südkorea","es":"Corea del Sur","fr":"Corée du Sud","ja":"大韓民国","it":"Corea del Sud"},"relevance":"1.5"}]


In [30]:
# JSON 형식의 파일을 파이썬 데이터 형태로 변환
json_to_list = requests.get(url).json()
json_to_list

[{'name': 'South Korea',
  'topLevelDomain': ['.kr'],
  'alpha2Code': 'KR',
  'alpha3Code': 'KOR',
  'callingCodes': ['82'],
  'capital': 'Seoul',
  'altSpellings': ['KR', 'Republic of Korea'],
  'region': 'Asia',
  'subregion': 'Eastern Asia',
  'population': 51448183,
  'latlng': [37.0, 127.5],
  'demonym': 'South Korean',
  'area': 100210.0,
  'gini': 31.3,
  'timezones': ['UTC+09:00'],
  'borders': ['PRK'],
  'nativeName': '대한민국',
  'numericCode': '410',
  'currencies': ['KRW'],
  'languages': ['ko'],
  'translations': {'de': 'Südkorea',
   'es': 'Corea del Sur',
   'fr': 'Corée du Sud',
   'ja': '大韓民国',
   'it': 'Corea del Sud'},
  'relevance': '1.5'}]

In [31]:
# 변수 json_to_list에서 나라의 수도(Capital) 추출
json_to_list[0]["capital"]

'Seoul'

In [32]:
# 위의 내용을 활용하여 여러개의 나라 정보를 웹 API를 통해 가져오는 예제 작성
import requests
import json

countries = ["South Korea", "United States of America", "United Kingdom", "France", "Germany", "Japan", "China"]

def country_to_capital(country):
    url_temp = "https://restcountries.eu/rest/v1/name/"
    url = url_temp + country
    json_to_list = requests.get(url).json()
    return json_to_list[0]["capital"]

for country in countries:
    capital = country_to_capital(country)
    print("*{0}: {1}".format(country, capital))

*South Korea: Seoul
*United States of America: Washington, D.C.
*United Kingdom: London
*France: Paris
*Germany: Berlin
*Japan: Tokyo
*China: Beijing


### Twitter api 사용 예제

In [33]:
## Twitter api using examples
import tweepy

# 트위터 key 및 token
# consumer_key = 'your-twitter-consumer-key'
# consumer_secret = 'your-consumer-secret-key'

# access_token = 'your-access-token'
# access_secret = 'your-access-secet'

In [34]:
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)

In [35]:
api = tweepy.API(auth)

In [36]:
print("name:", api.me().name)

name: ybear90_twit_test


In [37]:
# twit 작성 예제
# tweet_update_status = api.update_status('파이썬에서 Tweepy 라이브러리를 이용한 첫 번째 트윗')

In [38]:
# 트위터에 이미지 파일 올리는 api예제
tweet_media_update_status = api.update_with_media("./image_test.png")

In [39]:
# Timeline에서 메세지 가져오기
# Cursor(api.home_timeline).items([n])
for status in tweepy.Cursor(api.home_timeline).items(2):
    print("*", status.text)

* https://t.co/q8OGDVpQBB
* 애니메이션 버전 다크 소울 '코드 베인'의 네트워크 테스트 일정이 공개됐습니다. 북미와 유럽 지역은 5월 31일 부터 4일 간 테스트에 참여할 수 있다고 하는데, 아시아 지역은 아직 미정이랍니다. 얼른 아시… https://t.co/FIyTHeTBNx


In [40]:
# status._json을 이용하여 딕셔너리 형태로 가져오기
# 메세지 생성시간 기준은 미국시간 기준인 듯 하다
for status in tweepy.Cursor(api.home_timeline).items(2):
    print("*", status._json['text'])
    print(" => Created at", status._json['created_at'])

* https://t.co/q8OGDVpQBB
 => Created at Mon May 20 09:42:08 +0000 2019
* 애니메이션 버전 다크 소울 '코드 베인'의 네트워크 테스트 일정이 공개됐습니다. 북미와 유럽 지역은 5월 31일 부터 4일 간 테스트에 참여할 수 있다고 하는데, 아시아 지역은 아직 미정이랍니다. 얼른 아시… https://t.co/FIyTHeTBNx
 => Created at Mon May 20 09:29:47 +0000 2019


#### Twitter Streaming API 사용하여 실시간으로 특정 키워드에 대한 게시물 트윗

In [41]:
# Tweepy의 StreamingListener를 상속받아 클래스 정의
import tweepy
class MyStreamListener(tweepy.StreamListener):
    def on_status(self, status):
        print(status.text) # 140자까지 출력

In [42]:
# 정의한 클래스를 이용해 객체 생성
myStreamListener = MyStreamListener()

In [43]:
# 생성한 객체를 Tweepy의 Stream을 이용해 트위터 Stream API와 연결
myStream = tweepy.Stream(auth, myStreamListener)

In [44]:
# Stream의 Filter를 이용해 단어를 지정하고 Stream을 시작
# 갯수 지정을 안하면 무한정 트윗 하므로 일단 클래스 수정 후에 실행 권장
# myStream.filter(track = ['파이썬', 'python'])

In [45]:
# Tweepy의 StreamingListener를 상속받아 클래스 정의(재정의)
class MyStreamListener(tweepy.StreamListener):
    def __init__(self):
        super().__init__()
        self.tweet_num = 0
    
    def on_status(self, status):
        self.tweet_num = self.tweet_num + 1
        if self.tweet_num <= 5:
            print("***", status.text) # 140자까지 출력
            return True
        else:
            return False

In [46]:
# 키워드를 지정해 트위터에서 메세지를 가져오기
myStreamListener = MyStreamListener()
myStream = tweepy.Stream(auth, myStreamListener)
myStream.filter(track = ['머신 러닝', 'Machine Learning'])

*** Machine learning speeds modeling of experiments aimed at capturing fusion energy on Earth https://t.co/dlI6k2J3aG https://t.co/bjUa9XAbpA
*** RT @Laboegalite: Le prochain correcteur de Word sera...féministe ! Exploitant le machine learning de l'IA, ce nouvel outil constitue une av…
*** Cette image résume 99% des cas où les gens parlent AI et Machine learning ^^
*** The importance of machine learning in your digital marketing strategy #DigitalMarketing #MachineLearning  https://t.co/LwYnEynRor
*** How AI and Machine Learning Can Supercharge Your Social Media Marketing #SocialMedia #AI #MachineLearning  https://t.co/mpTtfoq5zF


In [47]:
# 위의 코드를 종합한 예제
import tweepy

# 키, 토큰, 비밀번호 지정
# consumer_key = 'your-twitter-consumer-key'
# consumer_secret = 'your-consumer-secret-key'

# access_token = 'your-access-token'
# access_secret = 'your-access-secet'

# OAuth 인증 진행
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_secret)

# 인증된 auth 변수를 이용하여 twitte API 클래스 정의
class MyStreamListener2(tweepy.StreamListener):
    def __init__(self, max_num):
        super().__init__()
        self.tweet_num = 0
        self.max_num = max_num
    
    def on_status(self, status):
        self.tweet_num = self.tweet_num + 1
        file_name = './twitter_stream_test.txt'
        if self.tweet_num <= self.max_num:
            with open(file_name, 'a', encoding = 'utf-8') as f:
                write_text = "*** " + status.text + "\n"
                f.write(write_text)
            return True
        else:
            return False
    
    def on_error(self, status):
        print(status) # 오류 메세지 출력
        return False
    
if __name__ == '__main__':
    myStreamListener = MyStreamListener2(5)
    myStream = tweepy.Stream(auth, myStreamListener)
    myStream.filter(track = ['머신 러닝', 'Machine Learning'])
    print("End of streaming!")

End of streaming!


### 정부의 공공 데이터 가져오기

In [48]:
# 도로명 주소 조회 서비스를 이용한 새 우편번호 호출 예제
import requests

# API_KEY = 'YOUR-API-KEY' # 자신의 인증키를 복사해서 입력합니다.
# API_KEY는 URL 인코딩 된 상태로 제공되므로 'requests.get()' 의 파라미터로 입력하기 전에 'requests.utils.unquote()'
# 로 디코딩 해야 합니다. 이를 구현한 코드는 다음과 같습니다.
API_KEY_decode = requests.utils.unquote(API_KEY)
API_KEY_decode

'iH83FPn541jSnsh9ltgyYxIAOBpM0rJbAWxZ7yprBW5dKNElaUKLQwiGzZdh1zJgoXk/G/RGSEOywu5GmPlV9g=='

In [49]:
# 도로명 주소를 지정해 데이터를 가져오는 예제 코드입니다.
req_url = "http://openapi.epost.go.kr/postal/retrieveNewAdressAreaCdService/retrieveNewAdressAreaCdService/getNewAddressListAreaCd"

search_Se = "road"
srch_wrd = "사우로 51" # 우리집 주소다

req_parameter = {"ServiceKey": API_KEY_decode, "searchSe": search_Se, "srchwrd": srch_wrd}

r = requests.get(req_url, params = req_parameter)
xml_data = r.text
print(xml_data)

<?xml version="1.0" encoding="UTF-8" standalone="yes"?><NewAddressListResponse><cmmMsgHeader><requestMsgId></requestMsgId><responseMsgId></responseMsgId><responseTime>20190520:184527135</responseTime><successYN>Y</successYN><returnCode>00</returnCode><errMsg></errMsg><totalCount>1</totalCount><countPerPage>10</countPerPage><totalPage>1</totalPage><currentPage></currentPage></cmmMsgHeader><newAddressListAreaCd><zipNo>10111</zipNo><lnmAdres>경기도 김포시 사우로 51 (사우동, 김포사우아이파크)</lnmAdres><rnAdres>경기도 김포시 사우동 1481 김포사우아이파크</rnAdres></newAddressListAreaCd></NewAddressListResponse>


In [50]:
import xmltodict

# 출력형식이 xml 인것을 python dictionary 형태로 변경 해 줍니다.
dict_data = xmltodict.parse(xml_data)
dict_data

OrderedDict([('NewAddressListResponse',
              OrderedDict([('cmmMsgHeader',
                            OrderedDict([('requestMsgId', None),
                                         ('responseMsgId', None),
                                         ('responseTime',
                                          '20190520:184527135'),
                                         ('successYN', 'Y'),
                                         ('returnCode', '00'),
                                         ('errMsg', None),
                                         ('totalCount', '1'),
                                         ('countPerPage', '10'),
                                         ('totalPage', '1'),
                                         ('currentPage', None)])),
                           ('newAddressListAreaCd',
                            OrderedDict([('zipNo', '10111'),
                                         ('lnmAdres',
                                          '경기도 김포시 사우로 51

In [51]:
# Python dictionary 타입으로 변환된 변수의 결과를 분석(dict_data), 우편번호, 도로명 주소, 지번 주소를 추출합니다
address_list = dict_data['NewAddressListResponse']['newAddressListAreaCd']

print("[입력한 도로명 주소]", srch_wrd)
print("[응답 데이터에서 추출한 결과]")
print("- 우편번호:", address_list['zipNo'])
print("- 도로명 주소:", address_list['lnmAdres'])
print("- 지번 주소:", address_list['rnAdres'])

[입력한 도로명 주소] 사우로 51
[응답 데이터에서 추출한 결과]
- 우편번호: 10111
- 도로명 주소: 경기도 김포시 사우로 51 (사우동, 김포사우아이파크)
- 지번 주소: 경기도 김포시 사우동 1481 김포사우아이파크


In [100]:
# 동네예보정보조회서비스 API를 이용하여 지금 우리집 날씨를 알아봅니다(김포시 사우동 살아요)
import requests

# API_KEY = 'YOUR-API-KEY'
API_KEY_decode = requests.utils.unquote(API_KEY)
API_KEY_decode

'iH83FPn541jSnsh9ltgyYxIAOBpM0rJbAWxZ7yprBW5dKNElaUKLQwiGzZdh1zJgoXk/G/RGSEOywu5GmPlV9g=='

In [101]:
import json
import datetime

# [날짜 및 시간 설정]
now = datetime.datetime.now() # 현재 날짜 및 시간 반환
print(now)

# baseDate에 날짜를 입력하기 위해 날짜를 출력 형식을 지정해 변수에 할당
date = "{:%Y%m%d}".format(now)

# baseTime에 시간(정시)를 입력하기 위해 출력 형식을 지정해 시간만 변수에 할당
time = "{:%H00}".format(now)

# 현재 분이 30분 이전이면 이전 시간(정시)을 설정\
# 날씨 발표 갱신 시각이 매시 30분 마다 이므로 아래와 같이 시간에 대한 조건 설정을 해둔다
if now.minute >= 30:
    time = "{0}00".format(now.hour)
else:
    time = "{0}00".format(now.hour - 1)

# [요청 주소 및 요청 변수 지정]
req_url = "http://newsky2.kma.go.kr/service/SecndSrtpdFrcstInfoService2/ForecastSpaceData"

baseDate = date # 발표 일자 지정
baseTime = time

nx_val = 55 # 예보지점 x 좌표(경기 김포시 사우동의 x 좌표)
ny_val = 128 # 예보지점 y 좌표(경기 김포시 사우동의 y 좌표)

num_of_rows = 30 # 한 페이지에 포함된 결과 수
page_no = 1 # 페이지 번호

output_type = "json" # 응답 데이터 형식 지정

req_parameter = {"ServiceKey": API_KEY_decode,
                 "nx": nx_val, "ny": ny_val,
                 "base_date": baseDate, "base_time": baseTime,
                 "pageNo": page_no, "numOfRows": num_of_rows,
                 "_type": output_type}

# [데이터 요청]
r = requests.get(req_url, params = req_parameter)

# [JSON 형태로 응답받은 데이터를 딕셔너리 데이터로 변환]
dict_data = r.json()
dict_data

2019-05-20 18:58:28.827844


{'response': {'header': {'resultCode': '0000', 'resultMsg': 'OK'},
  'body': {'items': {'item': [{'baseDate': 20190520,
      'baseTime': 1800,
      'category': 'REH',
      'fcstDate': 20190520,
      'fcstTime': 2200,
      'fcstValue': '-',
      'nx': 55,
      'ny': 128},
     {'baseDate': 20190520,
      'baseTime': 1800,
      'category': 'REH',
      'fcstDate': 20190521,
      'fcstTime': '0100',
      'fcstValue': '-',
      'nx': 55,
      'ny': 128},
     {'baseDate': 20190520,
      'baseTime': 1800,
      'category': 'REH',
      'fcstDate': 20190521,
      'fcstTime': '0400',
      'fcstValue': '-',
      'nx': 55,
      'ny': 128},
     {'baseDate': 20190520,
      'baseTime': 1800,
      'category': 'REH',
      'fcstDate': 20190521,
      'fcstTime': '0700',
      'fcstValue': '-',
      'nx': 55,
      'ny': 128},
     {'baseDate': 20190520,
      'baseTime': 1800,
      'category': 'REH',
      'fcstDate': 20190521,
      'fcstTime': 1000,
      'fcstValue': '-',
 

In [102]:
# [딕셔너리 데이터를 분석해서 원하는 값 추출]

weather_items = dict_data['response']['body']['items']['item']

sky_cond = ["맑음", "구름 조금", "구름 많음", "흐림"]
rain_type = ["없음", "비", "진눈깨비", "눈", "소나기"]

print("[ 발표 날짜: {} ]".format(weather_items[0]['baseDate']))
print("[ 발표 시간: {} ]".format(weather_items[0]['baseTime']))

for k in range(len(weather_items)):
    weather_item = weather_items[k]
    fcstValue = weather_item['fcstValue']
    if (weather_item['category'] == 'T3H'):
        print("* 3시간 뒤 기온: {} 도".format(fcstValue))
    elif (weather_item['category'] == 'T1H'):
        print("* 기온: {} 도".format(fcstValue))
    elif (weather_item['category'] == 'REH'):
        print("* 습도: {} 퍼센트".format(fcstValue))
    elif (weather_item['category'] == 'SKY'):
        print("* 하늘: {}".format(sky_cond[fcstValue - 1]))
    elif (weather_item['category'] == 'PTY'):
        print("* 강수: {}".format(rain_type[fcstValue]))

[ 발표 날짜: 20190520 ]
[ 발표 시간: 1800 ]
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트
* 습도: - 퍼센트


In [107]:
# 초단기예보조회, 동네예보조회 오퍼레이션 작동 예제
import json
import datetime

# [날짜 및 시간 설정]
now = datetime.datetime.now() # 현재 날짜 및 시간 변환

# baseDate에 날짜를 입력하기 위해 날짜에 출력 형식을 지정해 변수에 할당
date = "{:%Y%m%d}".format(now)

# baseTime에 시간(정시)을 입력하기 위해 출력 형식을 지정해 시간만 변수에 할당
time = "{:%H00}".format(now)

# 현재 분이 30분 이전이면 이전 시간(정시)을 설정
if (now.minute >= 30):
    time = "{0}00".format(now.hour)
else:
    time = "{0}00".format(now.hour - 1)

# [요청 주소 및 요청 변수 지정]
req_url = "http://newsky2.kma.go.kr/service/SecndSrtpdFrcstInfoService2/ForecastTimeData"

baseDate = date # 발표 일자 지정
baseTime = time # time -> 발표 시간 지정(정시로 지정)

nx_val = 55 # 예보지점 X 좌표(경기도 김포시 사우동)
ny_val = 128 # 예보지점 Y 좌표(경기도 김포시 사우동)

num_of_rows = 30 # 한 페이지에 포함된 결과 수
page_no = 1 # page 번호

output_type = 'json' # 응답 데이터 형식 지정

req_parameter = {"ServiceKey": API_KEY_decode,
                 "nx": nx_val, "ny": ny_val,
                 "base_date": baseDate, "base_time": baseTime,
                 "pageNo": page_no, "numOfRows": num_of_rows,
                 "_type": output_type}

# [데이터 요청]
r = requests.get(req_url, params = req_parameter)

# [JSON 형태로 응답받은 데이터를 딕셔너리 데이터로 변환]
dict_data = r.json()

# [딕셔너리 데이터를 분석해서 원하는 값 추출]
weather_items = dict_data['response']['body']['items']['item']

sky_cond = ["맑음", "구름 조금", "구름 많음", "흐림"]
rain_type = ["없음", "비", "진눈깨비", "눈", "소나기"]

print("[ 발표 날짜: {} ]".format(weather_items[0]['baseDate']))
print("[ 발표 시간: {} ]".format(weather_items[0]['baseTime']))

print("[ 초단기 일기 예보 ]")

for k in range(len(weather_items)):
    weather_item = weather_items[k]
    
    fcstTime = weather_item['fcstTime']
    fcstValue = weather_item['fcstValue']
    
    if (weather_item['category'] == 'T3H'):
        print("* 시간: {0}, 3시간 뒤 기온: {1} 도".format(fcstTime, fcstValue))
    elif (weather_item['category'] == 'T1H'):
        print("* 시간: {0}, 기온: {1} 도".format(fcstTime, fcstValue))
    elif (weather_item['category'] == 'REH'):
        print("* 시간: {0}, 습도: {1} 퍼센트".format(fcstTime, fcstValue))
    elif (weather_item['category'] == 'SKY'):
        print("* 시간: {0}, 하늘: {1}".format(fcstTime, sky_cond[fcstValue - 1]))
    elif (weather_item['category'] == 'PTY'):
        print("* 시간: {0}, 강수: {1}".format(fcstTime, rain_type[fcstValue]))

[ 발표 날짜: 20190520 ]
[ 발표 시간: 1830 ]
[ 초단기 일기 예보 ]
* 시간: 1900, 강수: 없음
* 시간: 2000, 강수: 없음
* 시간: 2100, 강수: 없음
* 시간: 1900, 하늘: 맑음
* 시간: 2000, 하늘: 맑음
* 시간: 2100, 하늘: 맑음
* 시간: 1900, 기온: 15 도
* 시간: 2000, 기온: 14 도
* 시간: 2100, 기온: 14 도
* 시간: 1900, 습도: 60 퍼센트
* 시간: 2000, 습도: 60 퍼센트
* 시간: 2100, 습도: 65 퍼센트


#### 대기 오염 정보 가져오기

In [108]:
# 근접측정소 목록 조회 오퍼레이션 사용해보기 실습
# API_KEY 디코딩
import requests

# API_KEY = 'YOUR-API-KEY'
API_KEY_decode = requests.utils.unquote(API_KEY)
API_KEY_decode

'iH83FPn541jSnsh9ltgyYxIAOBpM0rJbAWxZ7yprBW5dKNElaUKLQwiGzZdh1zJgoXk/G/RGSEOywu5GmPlV9g=='

In [110]:
# 읍면동 이름으로 TM 기준 좌표 데이터를 가져오는 코드 작성
req_url = "http://openapi.airkorea.or.kr/openapi/services/rest/MsrstnInfoInqireSvc/getTMStdrCrdnt"

umd_name = "사우동" # 읍, 면, 동 지정
num_of_rows = 10 # 한 페이지에 포함된 결과 수
page_no = 1 # 페이지 번호

output_type = "json"

req_parameter = {"ServiceKey": API_KEY_decode, "umdName": umd_name,
                 "pageNO": page_no, "numOfRows": num_of_rows,
                 "_returnType": output_type}

dict_data = requests.get(req_url, params = req_parameter).json()
dict_data['totalCount']

1

In [113]:
print("[입력한 읍/면/동명]", umd_name)
print("[TM 기준 좌표 조회 결과]\n")

for k in range(dict_data['totalCount']):
    sido = dict_data['list'][k]['sidoName']
    sgg = dict_data['list'][k]['sggName']
    umd = dict_data['list'][k]['umdName']
    
    tmX = dict_data['list'][k]['tmX']
    tmY = dict_data['list'][k]['tmY']

    print("- 위치: {0} {1} {2}".format(sido, sgg, umd))
    print("- k = {0}, TM 좌표(X, Y): {1}, {2}\n".format(k, tmX, tmY))

[입력한 읍/면/동명] 사우동
[TM 기준 좌표 조회 결과]

- 위치: 경기도 김포시 사우동
- k = 0, TM 좌표(X, Y): 175749.543357, 457451.232697



In [116]:
k = 0 # 원하는 위치 선택 (김포시 사우동의 index 위치)
TM_X = dict_data['list'][k]['tmX']
TM_Y = dict_data['list'][k]['tmY']
print("TM 좌표(X, Y): {0}, {1}".format(TM_X, TM_Y))

TM 좌표(X, Y): 175749.543357, 457451.232697


In [118]:
# 구해서 저장한 TM 좌표 값으로 근접측정서 목록을 조회합니다
req_url = "http://openapi.airkorea.or.kr/openapi/services/rest/MsrstnInfoInqireSvc/getNearbyMsrstnList"

x_value = TM_X # TM 측정방식 X 좌표
y_value = TM_Y # TM 측정방식 Y 좌표

num_of_rows = 10 # 한 페이지에 포함된 결과 수
page_no = 1 # 페이지 번호

output_type = "json"
req_parameter = {"ServiceKey": API_KEY_decode,
                 "tmX": x_value, "tmY": y_value,
                 "pageNo": page_no, "numOfRows": num_of_rows,
                 "_returnType": output_type}

dict_data = requests.get(req_url, params = req_parameter).json()

print("해당 지역 근처에 있는 측정소의 개수:", dict_data['totalCount'])

해당 지역 근처에 있는 측정소의 개수: 3


In [119]:
# 실제 측정소 정보들을 가져옵니다
print("[측정소 정보]")

for k in range(dict_data['totalCount']):
    stationName = dict_data['list'][k]['stationName']
    distance = dict_data['list'][k]['tm']
    addr = dict_data['list'][k]['addr']
    
    print("- 측정소 이름:{0}, 거리:{1}[km]".format(stationName, distance))
    print("- 측정소 주소:{0} \n".format(addr))

[측정소 정보]
- 측정소 이름:사우동, 거리:0.8[km]
- 측정소 주소:경기 김포시 돌문로 51사우동주민센터 

- 측정소 이름:고촌읍, 거리:3.5[km]
- 측정소 주소:경기 김포시 고촌읍 신곡로 152김포상하수도사업소 

- 측정소 이름:원당, 거리:3.7[km]
- 측정소 주소:인천 서구 고산후로121번길 7(원당동)검단선사박물관 옥상 



In [120]:
# 근접측정소 중 가장 가까운 측정소에서 측정한 대기오염 정보를 가져옵니다
req_url = "http://openapi.airkorea.or.kr/openapi/services/rest/ArpltnInforInqireSvc/getMsrstnAcctoRltmMesureDnsty"

station_name = "사우동"
data_term = "DAILY" # 일일 단위로...
num_of_rows = 10
page_no = 1
version = 1.3
output_type = "json"

req_parameter = {"ServiceKey": API_KEY_decode,
                 "stationName": station_name,
                 "dataTerm": data_term, "ver": version,
                 "pageNo": page_no, "numOfRows": num_of_rows,
                 "_returnType": output_type}

dict_data = requests.get(req_url, params = req_parameter).json()
dict_data['list'][0]

{'_returnType': 'json',
 'coGrade': '1',
 'coValue': '0.3',
 'dataTerm': '',
 'dataTime': '2019-05-20 21:00',
 'khaiGrade': '2',
 'khaiValue': '73',
 'mangName': '도시대기',
 'no2Grade': '1',
 'no2Value': '0.006',
 'numOfRows': '10',
 'o3Grade': '2',
 'o3Value': '0.057',
 'pageNo': '1',
 'pm10Grade': '2',
 'pm10Grade1h': '2',
 'pm10Value': '38',
 'pm10Value24': '33',
 'pm25Grade': '1',
 'pm25Grade1h': '1',
 'pm25Value': '8',
 'pm25Value24': '7',
 'resultCode': '',
 'resultMsg': '',
 'rnum': 0,
 'serviceKey': '',
 'sidoName': '',
 'so2Grade': '1',
 'so2Value': '0.002',
 'stationCode': '',
 'stationName': '',
 'totalCount': '',
 'ver': ''}

In [121]:
# 해당 지역의 대기 오염 정보 중 아황산가스, 일산화탄소, 오존, 이산화질소의 지수, 미세먼지
# 와 통합 대기 환경의 등급 확인
dataTime = dict_data['list'][0]['dataTime']

so2Grade = dict_data['list'][0]['so2Grade']
coGrade = dict_data['list'][0]['coGrade']
o3Grade = dict_data['list'][0]['o3Grade']
no2Grade = dict_data['list'][0]['no2Grade']

pm10Grade1h = dict_data['list'][0]['pm10Grade1h'] # 마세먼지 PM_10 1시간 등급
pm25Grade1h = dict_data['list'][0]['pm25Grade1h'] # 마세먼지 PM_25 1시간 등급
khaiGrade = dict_data['list'][0]['khaiGrade'] # 통합대기환경 수치

print("[측정소({0})에서 측정된 대기 오염 상태]".format(station_name))
print("- 측정 시간:{0}".format(dataTime))

print("- [지수] ", end = '')
print("아황산가스:{0}, 일산화탄소:{1}, 오존:{2}, 이산화질소:{3}".
     format(so2Grade, coGrade, o3Grade, no2Grade))

print("- [등급] ", end = '')
print("미세먼지:{0}, 초미세먼지:{1}, 통합대기환경:{2}".
     format(pm10Grade1h, pm25Grade1h, khaiGrade))

[측정소(사우동)에서 측정된 대기 오염 상태]
- 측정 시간:2019-05-20 21:00
- [지수] 아황산가스:1, 일산화탄소:1, 오존:2, 이산화질소:1
- [등급] 미세먼지:2, 초미세먼지:1, 통합대기환경:2


In [122]:
gradeNum2Str = {"1":"좋음", "2":"보통", "3":"나쁨", "4":"매우나쁨"}

print("[측정소({0})에서 측정된 대기 오염 상태]".format(station_name))
print("- 측정 시간:{0}".format(dataTime))

print("아황산가스:{0}, 일산화탄소:{1}, 오존:{2}, 이산화질소:{3}".
     format(gradeNum2Str[so2Grade], gradeNum2Str[coGrade],
            gradeNum2Str[o3Grade], gradeNum2Str[no2Grade]))

print("미세먼지:{0}, 초미세먼지:{1}, 통합대기환경:{2}".
     format(gradeNum2Str[pm10Grade1h], gradeNum2Str[pm25Grade1h],
            gradeNum2Str[khaiGrade]))

[측정소(사우동)에서 측정된 대기 오염 상태]
- 측정 시간:2019-05-20 21:00
아황산가스:좋음, 일산화탄소:좋음, 오존:보통, 이산화질소:좋음
미세먼지:보통, 초미세먼지:좋음, 통합대기환경:보통
