In [None]:

# -*- coding: utf-8 -*-

#  api 설명 : https://developers.google.com/youtube/v3/docs/commentThreads/list?apix_params=%7B%22part%22%3A%5B%22id.snippet%22%5D%7D
#  api 코드 설명 : https://youtu.be/XTjtPc0uiG8


###  모듈1 종속모듈1. json 확장자로 파일 저장하는 기능 (더이상 안씀!!)
def get_comment_as_json(response) :

    comments = []  # 리턴할 최종 결과물을 넣을 곳

    # 덧글작성시간(time), 덧글좋아요수(like), 덧글내용(comment) 추출 후 저장
    for item in response["items"] :
        comment_info = {}
        comment_info["time"] = item["snippet"]["topLevelComment"]["snippet"]["updatedAt"]
        comment_info["like"] = item["snippet"]["topLevelComment"]["snippet"]["likeCount"]
        text = item["snippet"]["topLevelComment"]["snippet"]["textOriginal"]
        comment_info["comment"] = text
        comments.append(comment_info)

    # 최종 결과물 리턴
    return comments

In [None]:
###  모듈1 종속모듈2. csv 확장자로 파일 저장하는 기능
def get_comment_as_csv(response) :

    import pandas as pd
    import numpy as np

    columns = ["time", "like", "comment"]
    data = np.zeros((len(response["items"]),3))
    comments = pd.DataFrame(data, columns=columns)

    for idx, item in enumerate(response["items"]) :
        comments.iat[idx, 0] = item["snippet"]["topLevelComment"]["snippet"]["updatedAt"]
        comments.iat[idx, 1] = item["snippet"]["topLevelComment"]["snippet"]["likeCount"]
        text = item["snippet"]["topLevelComment"]["snippet"]["textOriginal"]
        text = text.replace("\n", " ")
        comments.iat[idx, 2] = text

    return comments

In [None]:
###  모듈1. 유튜브 api로 크롤링하는 모듈
def crawling(apikey, videoId, exe, savefile=True, filename="result"):
    import os
    from googleapiclient.discovery import build
    import json
    import pandas as pd
    os.environ["OAUTHLIB_INSECURE_TRANSPORT"] = "1"
    youtube = build("youtube", "v3", developerKey = apikey)

    # 리턴할 최종 결과물을 넣을 곳 생성
    if exe == "csv" :
        result = pd.DataFrame() 
    elif exe == "json" :
        result = {}
        result.fromkeys(["items"])
        comments_list = []
    else :
        print("csv 또는 json 확장자만 가능합니다.")
        return None

    # 첫번째 페이지 요청 후,
    # 응답받은 json에서 필요한 정보만 추출하고, 변수에 저장
    request = youtube.commentThreads().list(
        part = "snippet",  
        maxResults = 100,   
        order = "time", 
        videoId = videoId
    )
    response = request.execute()
    if exe == "csv" :
        result = get_comment_as_csv(response)
    elif exe == "json" :
        comments_list.extend(get_comment_as_json(response))

    # 다음 페이지 요청, 필요 정보 추출, 변수에 저장
    while response.get("nextPageToken", None) :
        request = youtube.commentThreads().list(
            part="snippet",  # snippet으로 해야 코멘트 텍스트를 불러올 수 있음.
            pageToken = response["nextPageToken"], # 다음 페이지 정보를 가져옴
            maxResults = 100, 
            order="time",
            videoId=videoId
        )
        response = request.execute()
        if exe == "csv" :
            result = pd.concat([result, get_comment_as_csv(response)])
            result.reset_index(inplace=True)
            result.drop("index", axis="columns", inplace=True)
        elif exe == "json" :
            comments_list.extend(get_comment_as_json(response))

    # 최종 결과물 리턴 및 파일로 저장
    if exe == "csv" :
        if savefile :
            result.to_csv("{}.csv".format(filename), index=False, sep=",", encoding="utf-8")
            print("{}.csv 저장 완료".format(filename))
        print("크롤링 종료")
        return result

    elif exe == "json" :
        result["items"] = comments_list
        if savefile :
            with open("{}.json".format(filename), "w") as j :
                json.dump(result, j)
            print("{}.json 저장 완료".format(filename))    
        print("크롤링 종료")    
        return result

In [None]:
if __name__ == "__main__":

    apikey = "AIzaSyBhRfECwAl-6NbZlWQziCr0kSifdSp3V7c"
    videoIds = {
        # 흥행 영화
        "범죄도시2_예고편":"aw9j_23nORs",  
        "범죄도시2_리뷰":"J9h2jwn36zs",  
        "공조2_예고편":"fzUKUfHeIYA", 
        "공조2_리뷰":"UfnZuM215d4", 
        "한산_예고편":"GduEtmvwcI0", 
        "한산_리뷰":"qX88HyEPdTk", 

        # 망한 영화
        "늑대사냥_예고편":"OL9BqniEMDo", 
        "늑대사냥_리뷰":"uAxdSV_uayw",
        "외계인_예고편":"l9288UVTHkA",
        "외계인_리뷰":"pIGrwNvz1Yc",
        "뜨거운피_예고편":"C4iJUJ5ffPg",
        "뜨거운피_리뷰":"eHX82A3JC88"
    }
    
    for filename, videoId in videoIds.items() :
        result_csv = crawling(apikey, videoId, "csv", filename=f"유튜브댓글크롤링_{filename}")
    