# API (Application Programming Interface)

API란 웹 상에서 데이터를 주고받을 수 있도록 미리 정해진 규칙과 프로토콜을 제공하는 인터페이스입니다. 인공지능 개발자는 이러한 API를 통해 데이터를 쉽게 수집하고 활용할 수 있습니다.

날씨 정보, 지리 정보, 주가 정보, 소셜 미디어 데이터 등 다양한 데이터를 API를 통해 수집할 수 있습니다. 이렇게 수집한 데이터를 기반으로 인공지능 모델을 학습시키고 예측 모델을 구축할 수 있습니다.

API를 사용하면 데이터를 실시간으로 수집하는 것도 가능합니다. 데이터 분석가나 인공지능 개발자는 API를 통해 빠르게 변화하는 데이터를 수집하고, 이를 바탕으로 인공지능 모델을 최신화하고 새로운 트렌드에 대응할 수 있습니다.

또한, 데이터를 가공하거나 필요한 부분만 추출할 수도 있습니다. 이를 통해 인공지능 개발자는 필요한 데이터만 추출하고 이를 활용하여 모델을 더욱 효과적으로 구성할 수 있습니다.

이러한 API를 활용한 데이터 수집은 파이썬에서도 쉽게 구현할 수 있습니다. 
requests 라이브러리를 이용하여 API를 호출하고, JSON 또는 XML과 같은 형식으로 데이터를 수집하고 가공할 수 있습니다.

## Naver API

https://developers.naver.com/main/



네이버 API는 네이버에서 제공하는 다양한 서비스들을 이용할 수 있도록 제공하는 API입니다. 네이버 블로그 검색, 지식인 검색, 뉴스 검색 등의 기능을 API를 통해 사용할 수 있습니다. 이를 이용하여 웹 애플리케이션, 모바일 애플리케이션 등 다양한 서비스를 개발할 수 있습니다.

[사용방법]

1.	네이버 개발자 센터에서 애플리케이션을 등록하고 클라이언트 아이디와 클라이언트 시크릿을 발급
2.	애플리케이션에 사용할 네이버 오픈API를 사용 API에서 선택해 추가
3.	로그인 오픈 API 서비스 환경별 상세 정보는 로그인 오픈 API 서비스 환경에서 입력

네이버 오픈API는 인증 여부에 따라 로그인 방식 오픈 API와 비로그인 방식 오픈 API로 구분됩니다. 로그인 방식 오픈 API는 '네이버 로그인’의 인증을 받아 접근 토큰(access token)을 획득해야 사용할 수 있는 오픈 API입니다. API를 호출할 때 네이버 로그인 API를 통해 받은 접근 토큰의 값을 전송해야 합니다


https://seo.tbwakorea.com/blog/naver-seo-api-searching-data/

### 예시 1 - 네이버 블로그 겁색 API

In [None]:
# 네이버 검색 Open API 예제 - 블로그 검색
# 네이버 검색 API예제는 블로그를 비롯 전문자료까지 호출방법이 동일하므로 blog검색만 대표로 예제를 올렸습니다.
# json 모듈 - JSON 데이터를 파싱하고 생성하는 데에 사용되는 다양한 함수와 메서드를 제공
# json.loads() - 파일 핸들러(file handle)를 사용하여 JSON 형식 파일 데이터를 파싱하여 파이썬 객체로 변환

import os
import sys
import urllib.request
import pandas as pd
import json
import re

# client_id와 client_secret 변수에는 네이버에서 제공하는 클라이언트 ID와 클라이언트 시크릿 값이 저장
client_id = 'VNx3Aev0BoTmQVfE8a94'
client_secret = 'eNDLCmXP2A'

# urllib.parse.quote() 함수를 사용하여 검색어에 대한 URL 인코딩을 수행
encText = urllib.parse.quote(input('검색 질의 : '))

# url 변수에는 검색어를 포함한 검색 API의 URL이 저장되어 있습니다. 이때 검색 결과 형식을 JSON or XML로 설정
url = 'https://openapi.naver.com/v1/search/blog?query=' + encText
# url = 'https://openapi.naver.com/v1/search/blog.xml?query=' + encText

# urllib.request.Request() 함수를 사용하여 API에 대한 요청(Request) 객체를 생성
request = urllib.request.Request(url)

# add_header() 함수를 사용하여 클라이언트 ID와 클라이언트 시크릿 값을 요청 헤더에 포함
request.add_header('X-Naver-Client-Id', client_id)
request.add_header('X-Naver-Client-Secret', client_secret)

# urllib.request.urlopen() 함수를 사용하여 요청 객체를 전송하고, API에서 반환한 응답(Response) 객체를 받아옴
response = urllib.request.urlopen(request)

# response.getcode() 함수를 사용하여 HTTP 응답 코드를 확인
rescode = response.getcode()

web_df = pd.DataFrame(columns=('title', 'link', 'description'))    # 밑에서 iloc쓰려면 index=range(10) 설정해야 함

if (rescode==200):
    response_body = response.read()    # urllib으로 가져오면 bytes 타입임
#     response_dict = json.loads(response_body.decode('utf-8'))    #str -> dic 타입으로 (디코딩은 필요 없는듯)
    response_dict = json.loads(response_body)
    
    items = response_dict['items']
    
    for item_index in range(0,len(items)):
        remove_tag = re.compile('<.*?>')
        title = re.sub(remove_tag, '', items[item_index]['title'])
        link = items[item_index]['link']
        description = re.sub(remove_tag, '', items[item_index]['description'])
        web_df.loc[item_index] = [title, link, description]    # 판다스에는 정수 인덱싱을 라벨로 변환해주는 내부적인 처리가 있음
        # web_df.iloc~ 를 사용하려면, DataFrame을 만들 때 미리 index 범위를 지정해 주어야 함
else:
    print('Error Code:' + rescode)

web_df

검색 질의 : 인공지능


Unnamed: 0,title,link,description
0,인공지능 AI학원 자격증부터 실무까지,https://blog.naver.com/kumh/223084650618,미래에는 일자리도 더욱 늘어날 것이며 인공지능이 관여하는 분야는 점점 넓어질 것이기...
1,그림 인공지능 사용해보기,https://www.internetmap.kr/entry/Why-Generativ...,"Stable Diffusion은 생성형 AI(인공지능), 그중에서도 단어를 입력하면..."
2,"언론사, &apos;인공지능 R&amp;D&apos; 나설 때다",https://www.onlinejournalism.co.kr/1196231257,고안되던 인공지능은 이제 전혀 다른 국면을 맞고 있다. 미국 NBC 방송의 유명 시...
3,2023 월드IT쇼 SK텔레콤의 다양한 AI 인공지능 기술과 UAM,https://blog.naver.com/todshrck/223088135648,인공지능 스피커로도 괜찮을 것 같네요. A.(에이닷)은 대화형 인공지능 서비스를 지...
4,AI 인공지능 관련주 챗GPT 바드 - 춤을 추되 문 근처에서 춤을...,https://blog.naver.com/resumet/223016372983,개인적으로 인터넷이 불러온 3차 산업혁명 이후 4차의 주인공이 인공지능이 되지 않을...
5,성동4차산업혁명체험센터 인공지능Ai 로봇코딩 드론 서울...,https://ndolson.com/5812,성동4차산업혁명체험센터 인공지능Ai 로봇코딩 드론 서울 아이들 가볼만한 곳 강력 추...
6,"AI 그림 그리기, Bing Image Creator로 인공지능 이미지...",https://blog.naver.com/winsweet/223068891384,Bing 이미지 생성기는 검색 사이트와 유사한 인터페이스로 누구나 쉽게 인공지능 이...
7,"인공지능을 사랑하는 한 남자의 영화, &apos;그녀(her)&apos; 감상평",https://blog.naver.com/soh4472/223091394568,"영화는 포스터에 등장하는 테오도르(호아킨 피닉스)를 중심으로 흘러가지만, 또 다른 ..."
8,"AI 인공지능 ETF SRVR, CLOU, IROB (ft. 챗gpt 관련주...",https://blog.naver.com/couplesoap/222999333420,인공지능(AI)가 답변을 해주는 채팅 플랫폼이다. 지금까지 우리는 검색을 하면 키워...
9,후지의료기 인공 지능이 탑재된 JP-2000 안마의자,https://blog.naver.com/wbstore/223079260672,#후지의료기 #인공지능안마의자 #안마의자 안녕하세요 웰빙스토어 막내입니다:) 비 소...


b'{\n\t"lastBuildDate":"Thu, 04 May 2023 21:49:16 +0900",\n\t"total":1667533,\n\t"start":1,\n\t"display":10,\n\t"items":[\n\t\t{\n\t\t\t"title":"<b>\xec\x9d\xb8\xea\xb3\xb5\xec\xa7\x80\xeb\x8a\xa5<\\/b> AI\xed\x95\x99\xec\x9b\x90 \xec\x9e\x90\xea\xb2\xa9\xec\xa6\x9d\xeb\xb6\x80\xed\x84\xb0 \xec\x8b\xa4\xeb\xac\xb4\xea\xb9\x8c\xec\xa7\x80",\n\t\t\t"link":"https:\\/\\/blog.naver.com\\/kumh\\/223084650618",\n\t\t\t"description":"\xeb\xaf\xb8\xeb\x9e\x98\xec\x97\x90\xeb\x8a\x94 \xec\x9d\xbc\xec\x9e\x90\xeb\xa6\xac\xeb\x8f\x84 \xeb\x8d\x94\xec\x9a\xb1 \xeb\x8a\x98\xec\x96\xb4\xeb\x82\xa0 \xea\xb2\x83\xec\x9d\xb4\xeb\xa9\xb0 <b>\xec\x9d\xb8\xea\xb3\xb5\xec\xa7\x80\xeb\x8a\xa5<\\/b>\xec\x9d\xb4 \xea\xb4\x80\xec\x97\xac\xed\x95\x98\xeb\x8a\x94 \xeb\xb6\x84\xec\x95\xbc\xeb\x8a\x94 \xec\xa0\x90\xec\xa0\x90 \xeb\x84\x93\xec\x96\xb4\xec\xa7\x88 \xea\xb2\x83\xec\x9d\xb4\xea\xb8\xb0\xec\x97\x90 \xec\x95\x88\xec\xa0\x95\xec\xa0\x81\xec\x9d\xb8... \xec\xbb\xa4\xeb\xa6\xac\xed\x81\x98\xeb\x9f\xbc\xec\x

In [None]:
import os
import sys
import urllib.request
import pandas as pd
import json
import re

client_id = 'VNx3Aev0BoTmQVfE8a94'
client_secret = 'eNDLCmXP2A'

query = urllib.parse.quote(input('검색 질의: '))

display = 100
start = 1
end = 1000
sort = 'sim'    # 유사도?

news_df = pd.DataFrame(columns=('Title', 'Original Link', 'Link', 'Description', 'Publication Date'))

for start_index in range(start, end, display):
    
    url = 'https://openapi.naver.com/v1/search/news?query=' + query \
    + '&display=' + str(display) \
    + '&start=' + str(start_index) \
    + '&sort=' + sort
    
    request = urllib.request.Request(url)
    request.add_header('X-Naver-Client-Id', client_id)
    request.add_header('X-Naver-Client-Secret', client_secret)
    response = urllib.request.urlopen(request)
    rescode = response.getcode()

    if (rescode==200):
        response_body = response.read()    # urllib으로 가져오면 bytes 타입임
        response_dict = json.loads(response_body.decode('utf-8'))    #str -> dic 타입으로
        items = response_dict['items']
        for item_index in range(0,len(items)):
            remove_tag = re.compile('<.*?>')
            title = re.sub(remove_tag, '', items[item_index]['title'])
            original_link = items[item_index]['originallink']
            link = items[item_index]['link']
            description = re.sub(remove_tag, '', items[item_index]['description'])
            pub_date = items[item_index]['pubDate']
            news_df.loc[item_index] = [title, original_link, link, description, pub_date]            
    else:
        print('Error Code:' + rescode)

news_df

#  'items': [{'title': '&apos;투자 온도계&apos; 더한 <b>인공지능</b> 자산관리',
#    'originallink': 'https://www.bloter.net/news/articleView.html?idxno=600662',
#    'link': 'https://n.news.naver.com/mnews/article/293/0000043417?sid=101',
#    'description': 'AI(<b>인공지능</b>) 자동투자 콴텍이 하나은행의 AI자산관리 플랫폼 &apos;아이웰스&apos;를 통해 &apos;금융시장 투자 온도계(SMART Index)&apos; 서비스를 제공한다. 14일 콴텍에 따르면 하나은행과 제휴해 선보이는 금융시장 투자 온도계는 그간... ',
#    'pubDate': 'Fri, 14 Apr 2023 18:06:00 +0900'},

검색 질의: 인공지능


Unnamed: 0,Title,Original Link,Link,Description,Publication Date
0,"컴투버스, 셀바스AI와 메타버스내 인공지능 기술·사업 맞손",http://www.newsdream.kr/news/articleView.html?...,http://www.newsdream.kr/news/articleView.html?...,컴투버스는 이번 협약을 바탕으로 셀바스AI와 함께 메타버스 인프라스트럭처로 설계되는...,"Tue, 18 Apr 2023 10:54:00 +0900"
1,&apos;투자 온도계&apos; 더한 인공지능 자산관리,https://www.bloter.net/news/articleView.html?i...,https://n.news.naver.com/mnews/article/293/000...,AI(인공지능) 자동투자 콴텍이 하나은행의 AI자산관리 플랫폼 &apos;아이웰스&...,"Fri, 14 Apr 2023 18:06:00 +0900"
2,"컴투버스, 셀바스AI와 메타버스 내 인공지능 기술·사업 협력",https://www.tokenpost.kr/article-129720,https://www.tokenpost.kr/article-129720,"셀바스AI는 음성인식, 음성합성, 필기인식, 광학문자인식, 자연어 처리 등 최고 수...","Tue, 18 Apr 2023 09:30:00 +0900"
3,인공지능 기술로 리튬이온배터리 수명 진단,https://www.dongascience.com/news/view/59294,https://n.news.naver.com/mnews/article/584/000...,인공지능(AI)을 구현하는 딥러닝 기술을 활용해 배터리의 수명과 관련한 일부 데이터...,"Thu, 06 Apr 2023 13:53:00 +0900"
4,김외철 (사)한국인공지능협회 상근부회장 임명,https://news.imaeil.com/page/view/202304191709...,https://n.news.naver.com/mnews/article/088/000...,김외철 전 경상북도 서울본부장이 지난 18일 (사)한국인공지능협회 상근부회장에 임명...,"Wed, 19 Apr 2023 17:14:00 +0900"
...,...,...,...,...,...
95,"인간과 대화할 수 있게 된 인공지능, 다음 순서는 ‘자아’일까",https://www.hani.co.kr/arti/science/science_ge...,https://n.news.naver.com/mnews/article/028/000...,하지만 이는 잠시 미뤄두고 이번 칼럼부터는 두뇌와 인공지능 관점을 다룰 것이다. 뜬...,"Wed, 12 Apr 2023 10:03:00 +0900"
96,"아이메디신, 2023 월드IT쇼서 인공지능 기반 디지털 멘탈 헬스케어 플랫폼 소...",https://kr.aving.net/news/articleView.html?idx...,https://kr.aving.net/news/articleView.html?idx...,아이메디신은 2012년 설립한 인공지능 기반 &apos;디지털 멘탈 헬스케어 플랫폼...,"Fri, 28 Apr 2023 14:04:00 +0900"
97,“인공지능 길들이기”…‘챗GPT’ 광주시민 무료 실습 교육 눈길,http://www.kwangju.co.kr/article.php?aid=16819...,http://www.kwangju.co.kr/article.php?aid=16819...,인공지능산업융합사업단이 광주시민을 대상으로 인공지능(AI) 기반 챗봇인 ‘챗 GPT...,"Thu, 20 Apr 2023 17:38:00 +0900"
98,"건국대, 반도체·인공지능 등 2학기 17개 분야 교수 초빙",https://dhnews.co.kr/news/view/1065596975223198,https://dhnews.co.kr/news/view/1065596975223198,21일 건국대에 따르면 초빙분야는 공과대학에서 ▲건설재료(사회환경공학부) ▲반도체 ...,"Fri, 21 Apr 2023 16:34:00 +0900"


파이썬에서 클래스는 일종의 데이터 타입이며, 모든 변수나 객체는 어떤 클래스의 인스턴스(instance)입니다. 이때 클래스 이름은 해당 객체의 데이터 타입을 나타냅니다.

그래서 파이썬에서는 클래스 이름을 보기 쉽게 나타내기 위해 "<class '클래스 이름'>" 형태로 보여줍니다. 하지만 이는 사용자가 클래스 이름을 보기 편하게 하기 위한 것으로, 클래스 이름이 없는 데이터 타입(str, int 등)도 있습니다.

따라서 "<class 'str'>"처럼 클래스 이름이 나오는 것과 "str"처럼 클래스 이름이 생략되어 나오는 것이 모두 가능합니다.

In [None]:
# dict 객체임
print(type(response_dict))
response_dict

<class 'dict'>


{'lastBuildDate': 'Thu, 04 May 2023 12:35:56 +0900',
 'total': 1739155,
 'start': 901,
 'display': 100,
 'items': [{'title': '컴투버스, 셀바스AI와 메타버스내 <b>인공지능</b> 기술·사업 맞손',
   'originallink': 'http://www.newsdream.kr/news/articleView.html?idxno=41840',
   'link': 'http://www.newsdream.kr/news/articleView.html?idxno=41840',
   'description': '컴투버스는 이번 협약을 바탕으로 셀바스AI와 함께 메타버스 인프라스트럭처로 설계되는 컴투버스를 위해, <b>인공지능</b> 기술 및 서비스 개발에 대한 전략적 협력을 추진할 계획이다. 또한 셀바스AI와 2분기 첫 선을 보이는... ',
   'pubDate': 'Tue, 18 Apr 2023 10:54:00 +0900'},
  {'title': '&apos;투자 온도계&apos; 더한 <b>인공지능</b> 자산관리',
   'originallink': 'https://www.bloter.net/news/articleView.html?idxno=600662',
   'link': 'https://n.news.naver.com/mnews/article/293/0000043417?sid=101',
   'description': 'AI(<b>인공지능</b>) 자동투자 콴텍이 하나은행의 AI자산관리 플랫폼 &apos;아이웰스&apos;를 통해 &apos;금융시장 투자 온도계(SMART Index)&apos; 서비스를 제공한다. 14일 콴텍에 따르면 하나은행과 제휴해 선보이는 금융시장 투자 온도계는 그간... ',
   'pubDate': 'Fri, 14 Apr 2023 18:06:00 +0900'},
  {'title': '컴투버스, 셀바스AI와 메타버스 내 <b>인공지능

In [None]:
# str임
print(type(response_body.decode('utf-8')))
print(response_body.decode('utf-8'))

<class 'str'>
{
	"lastBuildDate":"Thu, 04 May 2023 12:35:56 +0900",
	"total":1739155,
	"start":901,
	"display":100,
	"items":[
		{
			"title":"컴투버스, 셀바스AI와 메타버스내 <b>인공지능<\/b> 기술·사업 맞손",
			"originallink":"http:\/\/www.newsdream.kr\/news\/articleView.html?idxno=41840",
			"link":"http:\/\/www.newsdream.kr\/news\/articleView.html?idxno=41840",
			"description":"컴투버스는 이번 협약을 바탕으로 셀바스AI와 함께 메타버스 인프라스트럭처로 설계되는 컴투버스를 위해, <b>인공지능<\/b> 기술 및 서비스 개발에 대한 전략적 협력을 추진할 계획이다. 또한 셀바스AI와 2분기 첫 선을 보이는... ",
			"pubDate":"Tue, 18 Apr 2023 10:54:00 +0900"
		},
		{
			"title":"&apos;투자 온도계&apos; 더한 <b>인공지능<\/b> 자산관리",
			"originallink":"https:\/\/www.bloter.net\/news\/articleView.html?idxno=600662",
			"link":"https:\/\/n.news.naver.com\/mnews\/article\/293\/0000043417?sid=101",
			"description":"AI(<b>인공지능<\/b>) 자동투자 콴텍이 하나은행의 AI자산관리 플랫폼 &apos;아이웰스&apos;를 통해 &apos;금융시장 투자 온도계(SMART Index)&apos; 서비스를 제공한다. 14일 콴텍에 따르면 하나은행과 제휴해 선보이는 금융시장 투자 온도계는 그간... ",
			"pubDate":"Fri, 14 Apr 2023 18:06:00 +0900"
		},


In [None]:
import os
import sys
import urllib.request
import pandas as pd
import json
import re

client_id = "xUCzXK76sez26412vcLf"
client_secret = "oCZNcdIe3A"

query = urllib.parse.quote(input("검색 질의: "))

idx = 0
display = 100
start = 1
end = 1000
sort = "sim"

news_df = pd.DataFrame(columns=('Title','Original Link','Link','Description','Publication Date'))

for start_index in range(start, end, display):

    url = "https://openapi.naver.com/v1/search/news?query=" + query \
    + "&display=" + str(display) \
    + "&start=" + str(start_index) \
    + "&sort=" + sort
    
    # url = "https://openapi.naver.com/v1/search/blog.xml?query=" + encText # xml 결과

    request = urllib.request.Request(url)
    request.add_header("X-Naver-Client-Id",client_id)
    request.add_header("X-Naver-Client-Secret",client_secret)
    response = urllib.request.urlopen(request)
    rescode = response.getcode()
    if(rescode==200):
        response_body = response.read()
        response_dict = json.loads(response_body.decode('utf-8'))
        items = response_dict['items']
        for item_index in range(0,len(items)):
            remove_tag = re.compile('<.*?>')
            title = re.sub(remove_tag, "", items[item_index]['title'])
            original_link = items[item_index]['originallink']
            link = items[item_index]['link']
            description = re.sub(remove_tag, '', items[item_index]['description'])
            pub_date = items[item_index]['pubDate']
            news_df.loc[idx] = [title, original_link, link, description, pub_date]
            idx += 1        
    else:
        print("Error Code:" + rescode)
news_df

검색 질의: 인공 지능


Unnamed: 0,Title,Original Link,Link,Description,Publication Date
0,美 FTC 칸 위원장 &quot;인공지능 남용 예의주시하고 있다&quot;,https://www.yna.co.kr/view/AKR2023050400250009...,https://n.news.naver.com/mnews/article/001/001...,뉴욕타임스 기고…&quot;새로운 시장에서도 강력하게 법 집행&quot; 김태종 특...,"Thu, 04 May 2023 02:09:00 +0900"
1,경기도 인공지능(AI) 산학연관 협의체 6월 출범,http://www.newsis.com/view/?id=NISX20230504_00...,https://n.news.naver.com/mnews/article/003/001...,"기사내용 요약 정책 제안, 의견 수렴 창구 역할 경기도 인공지능(AI) 산업 발전을...","Thu, 04 May 2023 09:11:00 +0900"
2,인공지능의 대부가 챗GPT 위협을 인류에 경고하다 [핫이슈],https://www.mk.co.kr/article/10728202,https://n.news.naver.com/mnews/article/009/000...,인간보다 똑똑한 측면 보여 코드를 짜고 스스로 실행하는 지능 갖춘 자율적 존재 우려...,"Thu, 04 May 2023 09:31:00 +0900"
3,경기도 인공지능 산학연관 협의체 6월 출범,https://daily.hankooki.com/news/articleView.ht...,https://daily.hankooki.com/news/articleView.ht...,"사진=경기도 제공 경기도와 도내 기업, 대학, 연구소가 함께 경기도 인공지능(AI)...","Thu, 04 May 2023 10:18:00 +0900"
4,"엠로, 자체 개발한 인공지능 기술 일본서 특허등록",https://www.hankyung.com/economy/article/20230...,https://n.news.naver.com/mnews/article/015/000...,공급망관리 소프트웨어 기업 엠로가 일본에서 인공지능 기술 관련 특허를 등록했다고 3...,"Wed, 03 May 2023 17:27:00 +0900"
...,...,...,...,...,...
995,"광주시, 인공지능·문화예술 양 날개로 도시 외교 확대",https://www.yna.co.kr/view/AKR2023041008500005...,https://n.news.naver.com/mnews/article/001/001...,광주시가 인공지능(AI)과 문화예술을 매개로 도시 외교 보폭을 넓혀가고 있다. 10...,"Mon, 10 Apr 2023 14:06:00 +0900"
996,인공지능 챗 GPT에 대한 창의성…미래 사회는 어떤 모습,https://www.sedaily.com/NewsView/29O9VQU7R8,https://n.news.naver.com/mnews/article/011/000...,국립광주과학관은 한국과총 광주전남지역연합회와 공동으로 오는 15일 국립광주과학관 상...,"Wed, 12 Apr 2023 08:49:00 +0900"
997,"경기도, 인공지능 기술 활용 게임 콘텐츠 제작 기업에 1억원 지원",https://www.newscj.com/news/articleView.html?i...,https://www.newscj.com/news/articleView.html?i...,"도는 미래기술 분야(블록체인, 인공지능, 빅데이터, 클라우드, 메타버스, 가상·증강...","Mon, 17 Apr 2023 14:08:00 +0900"
998,"KT그룹사, 인공지능 등 기술 결집과 DX업무혁신 위한 &apos;2023 그룹DX...",https://www.aitimes.kr/news/articleView.html?i...,https://www.aitimes.kr/news/articleView.html?i...,올해로 3년째를 맞는 &apos;그룹 DX 원팀&apos;은 KT그룹사들의 디지털전...,"Fri, 21 Apr 2023 09:50:00 +0900"


In [None]:
news_df['Original Link']

0      https://www.yna.co.kr/view/AKR2023050400250009...
1      http://www.newsis.com/view/?id=NISX20230504_00...
2                  https://www.mk.co.kr/article/10728202
3      https://daily.hankooki.com/news/articleView.ht...
4      https://www.hankyung.com/economy/article/20230...
                             ...                        
995    https://www.yna.co.kr/view/AKR2023041008500005...
996          https://www.sedaily.com/NewsView/29O9VQU7R8
997    https://www.newscj.com/news/articleView.html?i...
998    https://www.aitimes.kr/news/articleView.html?i...
999    https://www.hankyung.com/society/article/20230...
Name: Original Link, Length: 1000, dtype: object

#### 과제1_0504.
네이버 지식인에서 1000개의 데이터를 가져와서 'Title', 'Link', 'Description'을 컬럼으로 하는 데이터프레임을 작성해서 출력하세요.
- news
- blog
- webkr : 웹문서
- kin : 지식인

In [None]:
import os
import sys
import urllib.request
import pandas as pd
import json
import re

client_id = 'VNx3Aev0BoTmQVfE8a94'
client_secret = 'eNDLCmXP2A'

query = urllib.parse.quote(input('검색 질의: '))

display = 100
start = 1
end = 1000
sort = 'point'    # 평점순으로 내림차순 정렬

news_df = pd.DataFrame(columns=('Title', 'Link', 'Description'))

for start_index in range(start, end, display):
    
    url = 'https://openapi.naver.com/v1/search/kin?query=' + query \
    + '&display=' + str(display) \
    + '&start=' + str(start_index) \
    + '&sort=' + sort
    
    request = urllib.request.Request(url)
    request.add_header('X-Naver-Client-Id', client_id)
    request.add_header('X-Naver-Client-Secret', client_secret)
    response = urllib.request.urlopen(request)
    rescode = response.getcode()

    if (rescode==200):
        response_body = response.read()    # urllib으로 가져오면 bytes 타입임
        response_dict = json.loads(response_body.decode('utf-8'))    #str -> dic 타입으로
        items = response_dict['items']
        for item_index in range(0,len(items)):
            remove_tag = re.compile('<.*?>')
            title = re.sub(remove_tag, '', items[item_index]['title'])
            link = items[item_index]['link']
            description = re.sub(remove_tag, '', items[item_index]['description'])
            news_df.loc[item_index] = [title, link, description]            
    else:
        print('Error Code:' + rescode)

news_df

검색 질의: 영등포 맛집


Unnamed: 0,Title,Link,Description
0,영등포구주변에데이트장소좀추천해주세요!,https://kin.naver.com/qna/detail.naver?d1id=12...,... 수있구요 영등포역쪽엔 롯데백화점도 있답니다! 그리고 먹자골목에 술집이며 맛집...
1,크리스마스에 갈 곳 추천,https://kin.naver.com/qna/detail.naver?d1id=12...,... 01) 영등포 타임스퀘어 - 트리장식 더현대서울 - 트리장식 시청광장 - 트...
2,수도권 혼자 구경할곳,https://kin.naver.com/qna/detail.naver?d1id=9&...,... 1호선 영등포역 타임스퀘어 영등포 지하상가와 연결되어 있음 노량진 역 컵밥 ...
3,서울대 주변에 놀거리 추천해주세요 수학여행 하루치...,https://kin.naver.com/qna/detail.naver?d1id=9&...,... 고척돔 영등포역 6번출구 타임스퀘어 영등포 지하상가 노량진 역 2번출구 컵밥...
4,서울 가볼곳 추천,https://kin.naver.com/qna/detail.naver?d1id=12...,... 가기 쉽게 지하철로 정리해 봄 (최대한 합리적이면서 저렴하게 광고질 없이 서...
...,...,...,...
95,서울 데이트 영화관 코스,https://kin.naver.com/qna/detail.naver?d1id=3&...,"... 그리고 심심하시면 타임스퀘어나 신세계백화점, 롯데백화점, 지하상가 가셔서 아..."
96,서울에서 펜팔친구랑 만나기로했는데요 조언좀해주세요^^,https://kin.naver.com/qna/detail.naver?d1id=20...,... ㅎㅎ 서로 추억도 만들고 관심있으면계속만날수도있고 겸사겸사해서 좋은감정 만드...
97,블로그체험단 모집을 오픈과 동시에 하려는데요.,https://kin.naver.com/qna/detail.naver?d1id=4&...,이번에 영등포에서 50평 규모의 이자카야를 오픈합니다. 신규오픈이라 손님이 빌까봐 ...
98,영등포역 부근에 맛집좀 알려주세요,https://kin.naver.com/qna/detail.naver?d1id=8&...,... 여친이 맵고 짜고 자극적인 음식을 못먹구요 병원 조제약을 복용중이라 되도록이...


## OpenWeatherMap 날씨정보


https://home.openweathermap.org/users/sign_up

[사용방법]

1. https://openweathermap.org/api 사이트에서 Current Weather data에 대한 API doc 내용을 파악
2.	OpenWeatherMap 홈페이지에서 회원가입
3.	회원가입 후 API Key를 발급. New Account 등록 후 API Keys라는 탭에서 API Key 확인 가능
4.	발급받은 API Key를 사용하여 API를 호출


* 기본적으로 유료 사이트이지만 현재 날씨, 5일까지의 날씨는 무료로 사용할 수 있음(단 1분에 60번만 호출 가능)

#### 과제2_0504.
서울, 도쿄, 뉴욕의 날씨 조회를 아래와 같은 형식으로 출력하세요. 

* text로 가져와서 json으로 변환하여 일차 출력
  - cities = ["Seoul,KR", "Tokyo,JP", "New York,US"]
  - 가져올 정보 : 도시별 날씨(description), 최저 기온(temp_min), 최고 기온(temp_max), 습도(humidity), 기압(pressure), 풍속(speed)
  - 기온 데이터는 켈빈 온도로 되어 있으며 섭씨 온도로 변환해서 출력
* json 포멧으로 출력 데이터를 아래와 같이 가독력 있게 출력(소수점 2번째에서 반올림 처리)


[출력형식]

    도시 = Seoul
    | 날씨 = broken clouds
    | 최저 기온 = -1.0 2
    | 최고 기온 = 2.0 2
    | 습도 = 74
    | 기압 = 1023
    | 풍속 = 0.5

In [1]:
import os
import sys
import pandas as pd
import re
import urllib
import json

# API call
city_list = ['Seoul,KR', 'Tokyo,JP', 'New.York,US']
city_lat = []
city_lon = []

for city in city_list:
    url = f'http://api.openweathermap.org/geo/1.0/direct?q={city}&appid=556a2e345d0fdd0fa90db44a994b009d'
    city_coordinates = json.loads(urllib.request.urlopen(url).read())
    city_lat.append(city_coordinates[0]['lat'])
    city_lon.append(city_coordinates[0]['lon'])

df = pd.DataFrame({'city': city_list, 'latitude': city_lat, 'longitude': city_lon})
df.iloc[2,0] = 'New York'
print(df,'\n')
# print('위도 = ', city_lat)
# print('경도 = ', city_lon,'\n')

# API call
for lat, lon in zip(city_lat, city_lon):
    url = f'https://api.openweathermap.org/data/2.5/weather?lat={lat}&lon={lon}&appid=556a2e345d0fdd0fa90db44a994b009d'
    response_dict = json.loads(urllib.request.urlopen(url).read())
    print(f"도시 = {response_dict['name']}")
    print(f"| 날씨 = {response_dict['weather'][0]['description']}")
    print(f"| 최저 기온 = {round(response_dict['main']['temp_min']-273.15, 2)}℃")
    print(f"| 최고 기온 = {round(response_dict['main']['temp_max']-273.15, 2)}℃")
    print(f"| 습도 = {response_dict['main']['humidity']}%")
    print(f"| 기압 = {response_dict['main']['pressure']}hPa")
    print(f"| 풍속 = {response_dict['wind']['speed']}m/s", '\n')

       city   latitude   longitude
0  Seoul,KR  37.566679  126.978291
1  Tokyo,JP  35.682839  139.759455
2  New York  40.712728  -74.006015 

도시 = Seoul
| 날씨 = light rain
| 최저 기온 = 12.72℃
| 최고 기온 = 12.75℃
| 습도 = 84%
| 기압 = 1009hPa
| 풍속 = 4.31m/s 

도시 = Japan
| 날씨 = broken clouds
| 최저 기온 = 23.22℃
| 최고 기온 = 30.7℃
| 습도 = 46%
| 기압 = 1004hPa
| 풍속 = 15.43m/s 

도시 = New York
| 날씨 = few clouds
| 최저 기온 = 5.9℃
| 최고 기온 = 11.65℃
| 습도 = 85%
| 기압 = 1024hPa
| 풍속 = 1.79m/s 



In [14]:
# API call로 가져온 부분 중 Tokyo의 위도와 경도가 맞지 않아, name이 Japan이나 Marunouchi로 출력되는 문제 발생
# Openweathermap의 Tokyo 위도, 경도 관련 정보를 직접 입렵함

import os
import sys
import pandas as pd
import re
import urllib
import json

# API call
city_list = ['Seoul,KR', 'Tokyo,JP', 'New.York,US']
city_lat = [37.5666791, 35.6895, 40.7127281]
city_lon = [126.9782914, 139.6917, -74.0060152]

# for city in city_list:
#     url = f'http://api.openweathermap.org/geo/1.0/direct?q={city}&appid=556a2e345d0fdd0fa90db44a994b009d'
#     city_coordinates = json.loads(urllib.request.urlopen(url).read())
#     city_lat.append(city_coordinates[0]['lat'])
#     city_lon.append(city_coordinates[0]['lon'])

df = pd.DataFrame({'city': city_list, 'latitude': city_lat, 'longitude': city_lon})
df.iloc[2,0] = 'New York'
print(df,'\n')
# print('위도 = ', city_lat)
# print('경도 = ', city_lon,'\n')

# API call
for lat, lon in zip(city_lat, city_lon):
    url = f'https://api.openweathermap.org/data/2.5/weather?lat={lat}&lon={lon}&appid=556a2e345d0fdd0fa90db44a994b009d'
    response_dict = json.loads(urllib.request.urlopen(url).read())
    print(f"도시 = {response_dict['name']}")
    print(f"| 날씨 = {response_dict['weather'][0]['description']}")
    print(f"| 최저 기온 = {round(response_dict['main']['temp_min']-273.15, 2)}℃")
    print(f"| 최고 기온 = {round(response_dict['main']['temp_max']-273.15, 2)}℃")
    print(f"| 습도 = {response_dict['main']['humidity']}%")
    print(f"| 기압 = {response_dict['main']['pressure']}hPa")
    print(f"| 풍속 = {response_dict['wind']['speed']}m/s", '\n')

       city   latitude   longitude
0  Seoul,KR  37.566679  126.978291
1  Tokyo,JP  35.689500  139.691700
2  New York  40.712728  -74.006015 

도시 = Seoul
| 날씨 = moderate rain
| 최저 기온 = 12.72℃
| 최고 기온 = 12.82℃
| 습도 = 88%
| 기압 = 1009hPa
| 풍속 = 4.12m/s 

도시 = Tokyo
| 날씨 = broken clouds
| 최저 기온 = 24.75℃
| 최고 기온 = 29.58℃
| 습도 = 50%
| 기압 = 1004hPa
| 풍속 = 15.43m/s 

도시 = New York
| 날씨 = few clouds
| 최저 기온 = 5.29℃
| 최고 기온 = 11.64℃
| 습도 = 86%
| 기압 = 1024hPa
| 풍속 = 2.24m/s 



In [1]:
# 최종본

import pandas as pd
import urllib
import json

city_list = ['Seoul,KR', 'Tokyo,JP', 'New%20York,US']

# API call
for city in city_list:
    url = f'http://api.openweathermap.org/data/2.5/weather?q={city}&appid=556a2e345d0fdd0fa90db44a994b009d'
    response_dict = json.loads(urllib.request.urlopen(url).read())
    print(f"도시 = {response_dict['name']}")
    print(f"| 날씨 = {response_dict['weather'][0]['description']}")
    print(f"| 최저 기온 = {round(response_dict['main']['temp_min']-273.15, 2)}℃")
    print(f"| 최고 기온 = {round(response_dict['main']['temp_max']-273.15, 2)}℃")
    print(f"| 습도 = {response_dict['main']['humidity']}%")
    print(f"| 기압 = {response_dict['main']['pressure']}hPa")
    print(f"| 풍속 = {response_dict['wind']['speed']}m/s", '\n')

도시 = Seoul
| 날씨 = moderate rain
| 최저 기온 = 12.66℃
| 최고 기온 = 12.78℃
| 습도 = 82%
| 기압 = 1009hPa
| 풍속 = 5.14m/s 

도시 = Tokyo
| 날씨 = broken clouds
| 최저 기온 = 24.75℃
| 최고 기온 = 29.58℃
| 습도 = 50%
| 기압 = 1004hPa
| 풍속 = 15.43m/s 

도시 = New York
| 날씨 = few clouds
| 최저 기온 = 5.08℃
| 최고 기온 = 11.64℃
| 습도 = 86%
| 기압 = 1024hPa
| 풍속 = 2.06m/s 



In [8]:
# 최종본

import pandas as pd
import urllib
import json

city_list = ['Seoul,KR', 'Tokyo,JP', 'New%20York,US']

df = pd.DataFrame(columns=['날씨', '최저 기온', '최고 기온', '습도', '기압', '풍속'])

# API call
for city in city_list:
    url = f'http://api.openweathermap.org/data/2.5/weather?q={city}&appid=556a2e345d0fdd0fa90db44a994b009d'
    response_dict = json.loads(urllib.request.urlopen(url).read())
    print(f"도시 = {response_dict['name']}")
    print(f"| 날씨 = {response_dict['weather'][0]['description']}")
    print(f"| 최저 기온 = {round(response_dict['main']['temp_min']-273.15, 2)}℃")
    print(f"| 최고 기온 = {round(response_dict['main']['temp_max']-273.15, 2)}℃")
    print(f"| 습도 = {response_dict['main']['humidity']}%")
    print(f"| 기압 = {response_dict['main']['pressure']}hPa")
    print(f"| 풍속 = {response_dict['wind']['speed']}m/s", '\n')
    
    # 인덱스를 '도시'로 설정
    df.loc[response_dict['name']] = [response_dict['weather'][0]['description'], round(response_dict['main']['temp_min']-273.15, 2), round(response_dict['main']['temp_max']-273.15, 2), response_dict['main']['humidity'], response_dict['main']['pressure'], response_dict['wind']['speed']]  
    print(df)

# 인덱스를 번호로 설정
df.reset_index().rename(columns={'index':'도시'})

도시 = Seoul
| 날씨 = moderate rain
| 최저 기온 = 12.66℃
| 최고 기온 = 13.76℃
| 습도 = 79%
| 기압 = 1009hPa
| 풍속 = 5.66m/s 

                  날씨  최저 기온  최고 기온  습도    기압    풍속
Seoul  moderate rain  12.66  13.76  79  1009  5.66
도시 = Tokyo
| 날씨 = broken clouds
| 최저 기온 = 24.3℃
| 최고 기온 = 26.95℃
| 습도 = 53%
| 기압 = 1003hPa
| 풍속 = 16.98m/s 

                  날씨  최저 기온  최고 기온  습도    기압     풍속
Seoul  moderate rain  12.66  13.76  79  1009   5.66
Tokyo  broken clouds  24.30  26.95  53  1003  16.98
도시 = New York
| 날씨 = clear sky
| 최저 기온 = 5.19℃
| 최고 기온 = 10.97℃
| 습도 = 88%
| 기압 = 1025hPa
| 풍속 = 2.57m/s 

                     날씨  최저 기온  최고 기온  습도    기압     풍속
Seoul     moderate rain  12.66  13.76  79  1009   5.66
Tokyo     broken clouds  24.30  26.95  53  1003  16.98
New York      clear sky   5.19  10.97  88  1025   2.57


Unnamed: 0,도시,날씨,최저 기온,최고 기온,습도,기압,풍속
0,Seoul,moderate rain,12.66,13.76,79,1009,5.66
1,Tokyo,broken clouds,24.3,26.95,53,1003,16.98
2,New York,clear sky,5.19,10.97,88,1025,2.57


TypeError: reset_index() got an unexpected keyword argument 'name'

In [1]:
!pip install --upgrade pandas



