In [9]:
import warnings
warnings.filterwarnings(action='ignore')
import requests
from bs4 import BeautifulSoup
from datetime import datetime as dt

In [10]:
# 실시간 검색어가 웹 페이지의 전부 혹은 일부가 포함되어있지 않고 ajax를 이용해서 실시간으로 받아오는 방식을 사용한다
# Request Mathod가 GET이므로 request 모듈의 get() 메소드를 사용해서 실시간 검색어를 얻어온다
targetsite = 'https://www.nate.com/js/data/jsonLiveKeywordDataV1.js?v=202108102050'
request = requests.get(targetsite)
print(request)

<Response [200]>


In [11]:
issues = request.text
print(type(issues)) # <class 'str'>, ajax로 처리되는 데이터는 무조건 문자열 형태로 얻어온다
print(issues)

<class 'str'>
[["1",  "백신 접종 예약",  "+",  "2",  "백신 접종 예약"], ["2",  "경찰수업",  "-",  "1",  "경찰수업"], ["3",  "송종호",  "-",  "1",  "송종호"], ["4",  "명세빈",  "n",  "0",  "명세빈"], ["5",  "하데스타운 개막 연기",  "+",  "1",  "하데스타운 개막 연기"], ["6",  "너는 나의 봄",  "+",  "1",  "너는 나의 봄"], ["7",  "확진 사태후 568일만",  "+",  "2",  "코로나 신규 확진"], ["8",  "배수진",  "-",  "3",  "배수진"], ["9",  "SK 바이오 사이언스",  "-",  "1",  "SK 바이오 사이언스"], ["10",  "희소병 앓던 30대",  "s",  "0",  "희소병 앓던 30대"]]


In [13]:
# requests 모듈의 json() 매소드로 서버에 요청해서 전달받은 데이터를 파이썬에 처리하기에 적합하도록 리스트나 딕셔너리 타입으로
# 변환한다 => 데이터가 []로 묶여있으면 리스트로 {}로 묶여있으면 딕셔너리로 자동 변환한다
ranks = request.json()
print(type(ranks)) # <class 'list'>
print(ranks)

<class 'list'>
[['1', '백신 접종 예약', '+', '2', '백신 접종 예약'], ['2', '경찰수업', '-', '1', '경찰수업'], ['3', '송종호', '-', '1', '송종호'], ['4', '명세빈', 'n', '0', '명세빈'], ['5', '하데스타운 개막 연기', '+', '1', '하데스타운 개막 연기'], ['6', '너는 나의 봄', '+', '1', '너는 나의 봄'], ['7', '확진 사태후 568일만', '+', '2', '코로나 신규 확진'], ['8', '배수진', '-', '3', '배수진'], ['9', 'SK 바이오 사이언스', '-', '1', 'SK 바이오 사이언스'], ['10', '희소병 앓던 30대', 's', '0', '희소병 앓던 30대']]


In [17]:
# json 모듈의 import 하고 loads() 메소드를 사용해서 json 형태의 문자열 데이터를 파이썬에서 처리할 수 있는 리스트나 딕셔너리 
# 타입으로 변환한다. => 데이터가 []로 묶여있으면 리스트로 {}로 묶여있으면 딕셔너리로 자동 변환한다.
import json
ranks = json.loads(request.text)
print(type(ranks)) # <class 'list'>
for rank in ranks:
    print(rank)

<class 'list'>
['1', '백신 접종 예약', '+', '2', '백신 접종 예약']
['2', '경찰수업', '-', '1', '경찰수업']
['3', '송종호', '-', '1', '송종호']
['4', '명세빈', 'n', '0', '명세빈']
['5', '하데스타운 개막 연기', '+', '1', '하데스타운 개막 연기']
['6', '너는 나의 봄', '+', '1', '너는 나의 봄']
['7', '확진 사태후 568일만', '+', '2', '코로나 신규 확진']
['8', '배수진', '-', '3', '배수진']
['9', 'SK 바이오 사이언스', '-', '1', 'SK 바이오 사이언스']
['10', '희소병 앓던 30대', 's', '0', '희소병 앓던 30대']


In [18]:
for i in range(len(ranks)):
    print('{0:>2s}위 {1}'.format(ranks[i][0], ranks[i][1]), end=' ')
    if ranks[i][2] == '+':
        print('↑{}'.format(ranks[3]))
    elif ranks[i][2] == '-':
        print('↓{}'.format(ranks[3]))
    elif ranks[i][2] == 's':
        print('-'.format(ranks[3]))
    else:
        print(ranks[i][2])

 1위 백신 접종 예약 ↑['4', '명세빈', 'n', '0', '명세빈']
 2위 경찰수업 ↓['4', '명세빈', 'n', '0', '명세빈']
 3위 송종호 ↓['4', '명세빈', 'n', '0', '명세빈']
 4위 명세빈 n
 5위 하데스타운 개막 연기 ↑['4', '명세빈', 'n', '0', '명세빈']
 6위 너는 나의 봄 ↑['4', '명세빈', 'n', '0', '명세빈']
 7위 확진 사태후 568일만 ↑['4', '명세빈', 'n', '0', '명세빈']
 8위 배수진 ↓['4', '명세빈', 'n', '0', '명세빈']
 9위 SK 바이오 사이언스 ↓['4', '명세빈', 'n', '0', '명세빈']
10위 희소병 앓던 30대 -
