In [2]:
import urllib.request
import config


def makeURL(sNode, search_text ):
    base = "https://openapi.naver.com/v1/search"
    node = "/%s.json" % sNode
    parameters = "?query=%s" % urllib.parse.quote(search_text)
    url = base + node + parameters
    return url


def requestURL(url):  # 매개인자로 url(http://www.naver.com.... ) 이 오면   open api 키를 header에 추가한 후, 크롤링
    req = urllib.request.Request(url)
    req.add_header("X-Naver-Client-Id", config.client_id)  # open api 키를 header에 추가
    req.add_header("X-Naver-Client-Secret", config.client_secret)  # open api 키를 header에 추가
    try:
        response = urllib.request.urlopen(req)  # 크롤링
        if response.status == 200:  # 200이면 정상 응답
            print("Url Request Success")
            data = response.read().decode('utf-8')
            return data  # 크롤링 결과 반환
    except Exception as e:  # url로 요청 중 오류가 발생시 실행
        print(e)
        print("Error for URL : %s" %url)
        return None



import json

def main():
    print("네이버 검색 프로그램입니다.")
    search_text = input(">검색할 키워드를 입력하세요.")
    sNode="news"  
    targetURL = makeURL(sNode, search_text )    #1. URL 만들기
    result = requestURL(targetURL)              #2. URL로 크롤링
    #print(result)                              #3. 크롤링 결과 출력


    #4. 크롤링 전체 결과를 파일에 저장
    filename = '%s_naver_%s_all.json' % (search_text, sNode) 

    with open(filename, 'w', encoding='utf8') as outfile:
        outfile.write(result)
    print(filename +' 저장 완료' )


    #5. 크롤링 결과 중 일부만 파싱할 때
    jsonResult = []
    if result != None:
        jsonSearch = json.loads (result)    # JSON 문자열을  파이썬 딕셔너리로 load

        for post in jsonSearch["items"]  :  # items에 있는 데이터만
            title = post["title"]
            description = post["description"]  
            org_link = post['originallink']
            link = post['link'] 
           
            jsonResult.append({'title': title,
                               'description': description,
                               'org_link': org_link,
                                'link': link
                              })

    retJson = json.dumps(jsonResult,   #파이썬 딕셔너리를 json 문자열로
                         indent=4,     #들여쓰기 함
                         ensure_ascii=False) #한글 인코딩
    print(retJson)
 
main()

네이버 검색 프로그램입니다.


>검색할 키워드를 입력하세요. 파이썬


Url Request Success
파이썬_naver_news_all.json 저장 완료
[
    {
        "title": "'청소년 코딩실력자 누구?'…넥슨, NYPC 2019 개최",
        "description": "예선 기간 중 총 20개의 문제가 다섯 단계에 걸쳐 공개되며, 참가자들은 ‘<b>파이썬</b>’, ‘자바’, ‘C#’, ‘C++’, ‘C’ 등 프로그래밍 언어를 활용해 답안을 제출하면 된다. 특히 올해는 ‘트라하’... ",
        "org_link": "http://www.shinailbo.co.kr/news/articleView.html?idxno=1192928",
        "link": "http://www.shinailbo.co.kr/news/articleView.html?idxno=1192928"
    },
    {
        "title": "넥슨 청소년 코딩 대회, NYPC 온라인 예선 16일까지 진행",
        "description": "예선 기간 중 문제 20개가 다섯 단계에 걸쳐 공개되며, <b>파이썬</b>, 자바, C#, C++, C 등 프로그래밍 언어를 활용해 답안을 제출하면 된다. 올해는 '트라하', '메이플스토리', '카트라이더', '마비노기' 등 넥슨 게임을 활용한... ",
        "org_link": "http://www.gamemeca.com/mv.php?inflow=naver_s&gid=1572750",
        "link": "http://sports.news.naver.com/esports/news/read.nhn?oid=356&aid=0000034965"
    },
    {
        "title": "[뉴스투데이 E] 넥슨, ‘청소년 프로그래밍 챌린지’ 온라인 예선 시작",
        "description": "예선 기간 중 총 20개의 문제가 다섯 단계에 걸쳐 공개되며, 참가자들은 ‘<b>파이썬</b>’, ‘자바’, ‘C#’,