# API (Application Programming Interface)

API란 웹 상에서 데이터를 주고받을 수 있도록 미리 정해진 규칙과 프로토콜을 제공하는 인터페이스입니다. 인공지능 개발자는 이러한 API를 통해 데이터를 쉽게 수집하고 활용할 수 있습니다.

날씨 정보, 지리 정보, 주가 정보, 소셜 미디어 데이터 등 다양한 데이터를 API를 통해 수집할 수 있습니다. 이렇게 수집한 데이터를 기반으로 인공지능 모델을 학습시키고 예측 모델을 구축할 수 있습니다.

API를 사용하면 데이터를 실시간으로 수집하는 것도 가능합니다. 데이터 분석가나 인공지능 개발자는 API를 통해 빠르게 변화하는 데이터를 수집하고, 이를 바탕으로 인공지능 모델을 최신화하고 새로운 트렌드에 대응할 수 있습니다.

또한, 데이터를 가공하거나 필요한 부분만 추출할 수도 있습니다. 이를 통해 인공지능 개발자는 필요한 데이터만 추출하고 이를 활용하여 모델을 더욱 효과적으로 구성할 수 있습니다.

이러한 API를 활용한 데이터 수집은 파이썬에서도 쉽게 구현할 수 있습니다. 
requests 라이브러리를 이용하여 API를 호출하고, JSON 또는 XML과 같은 형식으로 데이터를 수집하고 가공할 수 있습니다.

## Naver API

https://developers.naver.com/main/



네이버 API는 네이버에서 제공하는 다양한 서비스들을 이용할 수 있도록 제공하는 API입니다. 네이버 블로그 검색, 지식인 검색, 뉴스 검색 등의 기능을 API를 통해 사용할 수 있습니다. 이를 이용하여 웹 애플리케이션, 모바일 애플리케이션 등 다양한 서비스를 개발할 수 있습니다.

[사용방법]

1.	네이버 개발자 센터에서 애플리케이션을 등록하고 클라이언트 아이디와 클라이언트 시크릿을 발급
2.	애플리케이션에 사용할 네이버 오픈API를 사용 API에서 선택해 추가
3.	로그인 오픈 API 서비스 환경별 상세 정보는 로그인 오픈 API 서비스 환경에서 입력

네이버 오픈API는 인증 여부에 따라 로그인 방식 오픈 API와 비로그인 방식 오픈 API로 구분됩니다. 로그인 방식 오픈 API는 '네이버 로그인’의 인증을 받아 접근 토큰(access token)을 획득해야 사용할 수 있는 오픈 API입니다. API를 호출할 때 네이버 로그인 API를 통해 받은 접근 토큰의 값을 전송해야 합니다


https://seo.tbwakorea.com/blog/naver-seo-api-searching-data/

In [20]:
# 네이버 검색 API 예제 - 블로그 검색

import os
import sys
import urllib.request
import json
import pandas as pd
import re

client_id ="fY5WGtxU_xYEugPkd__R"
client_secret = "MpfLJ3x0zp"

encText = urllib.parse.quote(input("검색 질의 : "))

url = "https://openapi.naver.com/v1/search/blog?query=" + encText #json 결과
# url = "https://openapi.naver.com/v1/search/blog.xml?query=" + encText #xml 결과 
request = urllib.request.Request(url)

request.add_header("X-Naver-Client-id",client_id)
request.add_header("X-Naver-Client-Secret",client_secret)

response = urllib.request.urlopen(request)
rescode = response.getcode()

idx = 0
web_df=pd.DataFrame(columns=('title','link','description'))

#2 데이터를 보고 어떤걸 추가할지 본 후 작업
if(rescode==200):
    response_body = response.read()
    response_dict = json.loads(response_body.decode('utf-8'))
    
    items =  response_dict['items']
    
    for item_index in range(0,len(items)):
        remove_tag = re.compile('<.*?>')
        title = re.sub(remove_tag,'',items[item_index]['title'])
        link = items[item_index]['link']
        description = re.sub(remove_tag,'',items[item_index]['description'])
        web_df.loc[idx] = [title, link,description]
        idx += 1
else:
    print("Error Code: "+ rescode)
    
web_df

검색 질의 : 인공지능


Unnamed: 0,title,link,description
0,인공지능 AI학원 자격증부터 실무까지,https://blog.naver.com/kumh/223084650618,미래에는 일자리도 더욱 늘어날 것이며 인공지능이 관여하는 분야는 점점 넓어질 것이기...
1,그림 인공지능 사용해보기,https://www.internetmap.kr/entry/Why-Generativ...,"Stable Diffusion은 생성형 AI(인공지능), 그중에서도 단어를 입력하면..."
2,"언론사, &apos;인공지능 R&amp;D&apos; 나설 때다",https://www.onlinejournalism.co.kr/1196231257,고안되던 인공지능은 이제 전혀 다른 국면을 맞고 있다. 미국 NBC 방송의 유명 시...
3,2023 월드IT쇼 SK텔레콤의 다양한 AI 인공지능 기술과 UAM,https://blog.naver.com/todshrck/223088135648,인공지능 스피커로도 괜찮을 것 같네요. A.(에이닷)은 대화형 인공지능 서비스를 지...
4,AI 인공지능 관련주 챗GPT 바드 - 춤을 추되 문 근처에서 춤을...,https://blog.naver.com/resumet/223016372983,개인적으로 인터넷이 불러온 3차 산업혁명 이후 4차의 주인공이 인공지능이 되지 않을...
5,성동4차산업혁명체험센터 인공지능Ai 로봇코딩 드론 서울...,https://ndolson.com/5812,성동4차산업혁명체험센터 인공지능Ai 로봇코딩 드론 서울 아이들 가볼만한 곳 강력 추...
6,"AI 그림 그리기, Bing Image Creator로 인공지능 이미지...",https://blog.naver.com/winsweet/223068891384,Bing 이미지 생성기는 검색 사이트와 유사한 인터페이스로 누구나 쉽게 인공지능 이...
7,"인공지능을 사랑하는 한 남자의 영화, &apos;그녀(her)&apos; 감상평",https://blog.naver.com/soh4472/223091394568,"영화는 포스터에 등장하는 테오도르(호아킨 피닉스)를 중심으로 흘러가지만, 또 다른 ..."
8,"AI 인공지능 ETF SRVR, CLOU, IROB (ft. 챗gpt 관련주...",https://blog.naver.com/couplesoap/222999333420,인공지능(AI)가 답변을 해주는 채팅 플랫폼이다. 지금까지 우리는 검색을 하면 키워...
9,후지의료기 인공 지능이 탑재된 JP-2000 안마의자,https://blog.naver.com/wbstore/223079260672,#후지의료기 #인공지능안마의자 #안마의자 안녕하세요 웰빙스토어 막내입니다:) 비 소...


In [None]:
# 태그만 지우는 방법 1
import re
p = re.compile("<.+?>") #최소화 해서 뽑아줌. ("<.*?>") 이렇게 하면 <>까지 제거됨. 
for i in text:
    print(p.sub("",i))
    
# 방법 2
re.sub("<.+>","",text>)


In [None]:
# 한글만 남기고 추리기 
x = response_body.decode('utf-8')
bs = BeautifulSoup(x,'html.parser')
for i in bs:
    print( '')

In [5]:
#### 네이버 검색 API 제: 블로그 검색 ####

# 클라이언트 id와 시크릿 (네이버 디벨로퍼에서 제공)
c_id = 'fY5WGtxU_xYEugPkd__R'
c_secret = 'MpfLJ3x0zp'

# 검색어에 대한 url인코딩 수행
search = urllib.parse.quote('인공지능')

# url변수 = 검색어를 포함한 검색 API의 url이 저장되어 있음
url='https://openapi.naver.com/v1/search/blog?query=' + search   # JSON 결과
url='https://openapi.naver.com/v1/search/blog.xml?query=' + search   # XML 결과

# API에 대한 요청 객체(request)를 생성
request = urllib.request.Request(url)

# 클라이언트 id와 시크릿 값을 요청 헤더에 포함
request.add_header('X-Naver-Client-Id', c_id)
request.add_header('X-Naver-Client-Secret', c_secret)

# 요청 객체 전송 / API에서 반환한 응답(request) 객체 받아옴
res = urllib.request.urlopen(request)

# HTTP응답 코드 확인
rescode = res.getcode()

if(rescode==200):
    res_body = res.read()
    print(res_body.decode('utf-8'))   #문자열 형태로 디코딩
else:
    print('Error Code: ' + str(rescode))

<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"><channel><title>Naver Open API - blog ::&apos;인공지능&apos;</title><link>https://search.naver.com</link><description>Naver Search Result</description><lastBuildDate>Thu, 04 May 2023 10:30:31 +0900</lastBuildDate><total>1666434</total><start>1</start><display>10</display><item><title>&lt;b&gt;인공지능&lt;/b&gt; AI학원 자격증부터 실무까지</title><link>https://blog.naver.com/kumh/223084650618</link><description>미래에는 일자리도 더욱 늘어날 것이며 &lt;b&gt;인공지능&lt;/b&gt;이 관여하는 분야는 점점 넓어질 것이기에 안정적인... 커리큘럼의 최종 목표는 파이썬을 활용해서 데이터를 분석하고 &lt;b&gt;인공지능&lt;/b&gt; 지식을 기반으로 하는... </description><bloggername>까비까비의 지식창고</bloggername><bloggerlink>blog.naver.com/kumh</bloggerlink><postdate>20230425</postdate></item><item><title>그림 &lt;b&gt;인공지능&lt;/b&gt; 사용해보기</title><link>https://www.internetmap.kr/entry/Why-Generative-AI?category=1083809</link><description>Stable Diffusion은 생성형 AI(&lt;b&gt;인공지능&lt;/b&gt;), 그중에서도 단어를 입력하면 그림을 생성해주는(text-to-image) 생성형 AI로서, 2022년 8월에 오픈소스로 공개된 &l

In [None]:
import os
import sys
import urllib.request

client_id = "qrx_FJ2xCzVHsYcnb12T"
client_secret = "SEjnzgEiHG"
query = urllib.parse.quote(input('검색 질의 : '))

url = "https://openapi.naver.com/v1/search/webkr?query=" + query # json 결과

request = urllib.request.Request(url)
request.add_header("X-Naver-Client-Id",client_id)
request.add_header("X-Naver-Client-Secret", client_secret)
response = urllib.request.urlopen(request)
rescode = response.getcode()

web_df = pd.DataFrame(columns = ('title','link','description'))

if (rescode==200):
    response_body = response.read()
    response_dict = json.loads(response_body.decode('utf-8'))
    
    items = response_dict['items']
    
else:
    print("Error Code:" + rescode)

## 네이버 뉴스 검색

In [37]:
import os
import sys
import urllib.request
import json
import pandas as pd
import re

client_id ="fY5WGtxU_xYEugPkd__R"
client_secret = "MpfLJ3x0zp"
query = urllib.parse.quote(input('검색 질의 : '))   #검색어 입력받음

idx = 0
display = 100    # 한 번에 보여줄 검색결과 개수
start = 1   # 검색 시작 인덱스
end = 1000   # 검색 끝 인덱스
sort = 'sim'    # 정확도순 내림차순 정렬 (date: 날짜순 내림차순 정렬)


news_df = pd.DataFrame(columns = ('Title','Original Link','Link','Description','Publication Date'))

for start_index in range(start, end, display):
    
    url='https://openapi.naver.com/v1/search/news.json?query=' + query + "&display=" + str(display) + "&start="+ str(start_index) + "&sort=" +sort
    
    request = urllib.request.Request(url)
    request.add_header("X-Naver-Client-id",client_id)
    request.add_header("X-Naver-Client-Secret",client_secret)
    
    response  = urllib.request.urlopen(request)
    rescode = response.getcode()
    if(rescode ==200):
        response_body = response.read()
        response_dict = json.loads(response_body.decode('utf-8'))
        items = response_dict['items']
        for item_index in range(0,len(items)):
            remove_tag = re.compile('<.*?>')
            title = re.sub(remove_tag,'',items[item_index]['title'])
            original_link = items[item_index]['originallink']
            link = items[item_index]['link']
            description = re.sub(remove_tag,'',items[item_index]['description'])
            pub_date = items[item_index]['pubDate']
            news_df.loc[idx] = [title,original_link, link, description, pub_date]
            idx +=1
    else:
        print("Error Code: "+ rescode)
    
news_df

검색 질의 : 인공지능


Unnamed: 0,Title,Original Link,Link,Description,Publication Date
0,美 FTC 칸 위원장 &quot;인공지능 남용 예의주시하고 있다&quot;,https://www.yna.co.kr/view/AKR2023050400250009...,https://n.news.naver.com/mnews/article/001/001...,뉴욕타임스 기고…&quot;새로운 시장에서도 강력하게 법 집행&quot; 김태종 특...,"Thu, 04 May 2023 02:09:00 +0900"
1,경기도 인공지능(AI) 산학연관 협의체 6월 출범,http://www.newsis.com/view/?id=NISX20230504_00...,https://n.news.naver.com/mnews/article/003/001...,"기사내용 요약 정책 제안, 의견 수렴 창구 역할 경기도 인공지능(AI) 산업 발전을...","Thu, 04 May 2023 09:11:00 +0900"
2,인공지능의 대부가 챗GPT 위협을 인류에 경고하다 [핫이슈],https://www.mk.co.kr/article/10728202,https://n.news.naver.com/mnews/article/009/000...,인간보다 똑똑한 측면 보여 코드를 짜고 스스로 실행하는 지능 갖춘 자율적 존재 우려...,"Thu, 04 May 2023 09:31:00 +0900"
3,경기도 인공지능 산학연관 협의체 6월 출범,https://daily.hankooki.com/news/articleView.ht...,https://daily.hankooki.com/news/articleView.ht...,"사진=경기도 제공 경기도와 도내 기업, 대학, 연구소가 함께 경기도 인공지능(AI)...","Thu, 04 May 2023 10:18:00 +0900"
4,"엠로, 자체 개발한 인공지능 기술 일본서 특허등록",https://www.hankyung.com/economy/article/20230...,https://n.news.naver.com/mnews/article/015/000...,공급망관리 소프트웨어 기업 엠로가 일본에서 인공지능 기술 관련 특허를 등록했다고 3...,"Wed, 03 May 2023 17:27:00 +0900"
...,...,...,...,...,...
995,"인간과 대화할 수 있게 된 인공지능, 다음 순서는 ‘자아’일까",https://www.hani.co.kr/arti/science/science_ge...,https://n.news.naver.com/mnews/article/028/000...,하지만 이는 잠시 미뤄두고 이번 칼럼부터는 두뇌와 인공지능 관점을 다룰 것이다. 뜬...,"Wed, 12 Apr 2023 10:03:00 +0900"
996,“인공지능 길들이기”…‘챗GPT’ 광주시민 무료 실습 교육 눈길,http://www.kwangju.co.kr/article.php?aid=16819...,http://www.kwangju.co.kr/article.php?aid=16819...,인공지능산업융합사업단이 광주시민을 대상으로 인공지능(AI) 기반 챗봇인 ‘챗 GPT...,"Thu, 20 Apr 2023 17:38:00 +0900"
997,"건국대, 반도체·인공지능 등 2학기 17개 분야 교수 초빙",https://dhnews.co.kr/news/view/1065596975223198,https://dhnews.co.kr/news/view/1065596975223198,21일 건국대에 따르면 초빙분야는 공과대학에서 ▲건설재료(사회환경공학부) ▲반도체 ...,"Fri, 21 Apr 2023 16:34:00 +0900"
998,"아이메디신, 2023 월드IT쇼서 인공지능 기반 디지털 멘탈 헬스케어 플랫폼 소...",https://kr.aving.net/news/articleView.html?idx...,https://kr.aving.net/news/articleView.html?idx...,아이메디신은 2012년 설립한 인공지능 기반 &apos;디지털 멘탈 헬스케어 플랫폼...,"Fri, 28 Apr 2023 14:04:00 +0900"


In [None]:
# 

query = urllib.parse.quote(input('검색 질의 : '))   #검색어 입력받음

idx = 0
display = 100    # 한 번에 보여줄 검색결과 개수
start = 1   # 검색 시작 인덱스
end = 1000   # 검색 끝 인덱스
sort = 'sim'    # 정확도순 내림차순 정렬 (date: 날짜순 내림차순 정렬)

news_df = pd.DataFrame(columns=['Title','Original Link', 'Link','Description', 'Publication Date'])

for i in range(start, end, display):
    url = 'https://openapi.naver.com/v1/search/news.json?'
    url += ('query=' + query)
    url += ('&display=' + str(display))
    url += ('&start=' + str(start))
    url += ('&sort=' + sort)

    request = urllib.request.Request(url)
    request.add_header("X-Naver-Client-Id",client_id)
    request.add_header("X-Naver-Client-Secret", client_secret)
    response = urllib.request.urlopen(request)
    rescode = response.getcode()

    if (rescode==200):
        response_body = response.read()
        t = json.loads(response_body.decode('utf-8'))
        items = t['items']

        for i in range(0,len(items)):   # 각 기사의 정보가 리스트로 들어가 있음
            remove_tag = re.compile('<.*?>')   # 태그 제거

            title = re.sub(remove_tag, '', items[i]['title'])   # 리스트 안에는 딕셔너리 형태
            ori_link = re.sub(remove_tag, '', items[i]['originallink'])
            link = re.sub(remove_tag, '', items[i]['link'])
            des = re.sub(remove_tag, '', items[i]['description'])
            date = re.sub(remove_tag, '', items[i]['pubDate'])

            news_df.loc[i] = [title, ori_link, link, des, date]   # 데이터프레임에 삽입

    else:
        print("Error Code: " + rescode)
#     print(news_df)     #매 for문 반복마다 100개씩 기사를 보여줌

news_df    #여기서 보는 건 마지막 901~1000번 구간의 100개 기사

## 지식인

### 과제 1_0504
네이버 지식인에서 1000개의 데이터를 가져와서 title, link, description을 칼럼으로 하는 데이터 프레임을 작성하세요. 

## OpenWeatherMap 날씨정보


https://home.openweathermap.org/users/sign_up

[사용방법]

1. https://openweathermap.org/api 사이트에서 Current Weather data에 대한 API doc 내용을 파악
2. OpenWeatherMap 홈페이지에서 회원가입
3. 회원가입 후 API Key를 발급. New Account 등록 후 API Keys라는 탭에서 API Key 확인 가능
4. 발급받은 API Key를 사용하여 API를 호출


* 기본적으로 유료 사이트이지만 현재 날씨, 5일까지의 날씨는 무료로 사용할 수 있음(단 1분에 60번만 호출 가능)

### 과제2_0504.
서울, 도쿄, 뉴욕의 날씨 조회를 아래와 같은 형식으로 출력하세요. 

* text로 가져와서 json으로 변환하여 일차 출력
  - cities = ["Seoul,KR", "Tokyo,JP", "New York,US"]
  - 가져올 정보 : 도시별 날씨(description), 최저 기온(temp_min), 최고 기온(temp_max), 습도(humidity), 기압(pressure), 풍속(speed)
  - 기온 데이터는 켈빈 온도로 되어 있으며 섭씨 온도로 변환해서 출력
* json 포멧으로 출력 데이터를 아래와 같이 가독력 있게 출력(소수점 2번째에서 반올림 처리)


[출력형식]

    도시 = Seoul
    | 날씨 = broken clouds
    | 최저 기온 = -1.0 2
    | 최고 기온 = 2.0 2
    | 습도 = 74
    | 기압 = 1023
    | 풍속 = 0.5