In [1]:
# Google Console API key
# AIzaSyD0ulk8CX2kjEC8xwkblAWqoh1sCwPn8HA

In [2]:
import requests
import json
import re
from urllib.parse import urlparse, parse_qs

---

### YouTube API
https://www.getphyllo.com/post/is-the-youtube-api-free-costs-limits-iv
- 영상(link)의 댓글, 작성자, 좋아요, 작성일 가져오기
- 채널 댓글 수집
    - commentThreads.list 메서드 사용
        - allThreadsRelatedToChannelId 파라미터 : 채널의 모든 비디오 댓글 + 채널 자체 댓글
        - channelId 파라미터 : 채널 자체에 달린 댓글만 (비디오 댓글 제외)
    - order=time 파라미터 : 시간순으로 정렬된 댓글을 받을 수 있음
    - 채널 설정 및 댓글 권한 관련 문제 주의
- 채널 영상 조회수 수집
    - Retrieve video details such as titles, tags, descriptions, and views.
    - 1단계 : 채널의 모든 영상 목록 가져오기 (search.list 메서드 사용 | playListItems.list 사용)
    - 2단계 : 각 영상의 상세 정보 (조회수 포함) 가져오기 (videos.list 메서드 사용)
        - 응답에서 얻을 수 있는 데이터
            - viewCount : 조회 수
            - likeCount : 좋아요 수
            - commentCount : 댓글 수
            - favoriteCount : 즐겨찾기 수

- What you actually get for Free?
    - 10,000 quota units per day by default
    - Structured Data with noi scraping required
    - Every API request consumes units. The more complex the request, the higher the cost
        - Retrieve video details (Pulling data on one video) -> Quota Cost : 1 unit
        - Retrieve channel info (Getting channel subscriber count) -> Quota Cost : 1 unit
        - Search for videos (Searching video by keyword) -> Quota Cost : 100 units
        - Upload video (Uploading via API instead of manually) -> Quota Cost : 1,600 units


---

In [3]:

class YouTubeCommentsFetcher:
    def __init__(self, api_key):
        self.api_key = api_key
        self.base_url = "https://www.googleapis.com/youtube/v3/commentThreads"
    
    def extract_video_id(self, url):
        """
        YouTube URL에서 video ID 추출
        다양한 YouTube URL 형식을 지원합니다:
        - https://www.youtube.com/watch?v=VIDEO_ID
        - https://youtu.be/VIDEO_ID
        - https://www.youtube.com/embed/VIDEO_ID
        """
        patterns = [
            r'(?:v=|\/)([0-9A-Za-z_-]{11}).*',
            r'(?:embed\/)([0-9A-Za-z_-]{11})',
            r'(?:youtu\.be\/)([0-9A-Za-z_-]{11})'
        ]
        
        for pattern in patterns:
            match = re.search(pattern, url)
            if match:
                return match.group(1)
        
        return None
    
    def get_comments(self, video_url, max_results=100, order='time'):
        """
        특정 YouTube 동영상의 댓글을 가져옵니다.
        
        Args:
            video_url (str): YouTube 동영상 URL
            max_results (int): 가져올 최대 댓글 수 (기본값: 100, 최대: 100)
            order (str): 정렬 순서 ('time', 'relevance')
        
        Returns:
            dict: 댓글 데이터
        """
        # URL에서 video ID 추출
        video_id = self.extract_video_id(video_url)
        if not video_id:
            return {"error": "유효하지 않은 YouTube URL입니다."}
        
        # API 매개변수 설정
        params = {
            'part': 'snippet,replies',
            'videoId': video_id,
            'key': self.api_key,
            'maxResults': min(max_results, 100),  # API 제한: 최대 100개
            'order': order,
            'textFormat': 'plainText'
        }
        
        try:
            response = requests.get(self.base_url, params=params)
            response.raise_for_status()
            
            data = response.json()
            
            # 댓글 데이터 파싱
            comments = self.parse_comments(data)
            
            return {
                "video_id": video_id,
                "total_comments": len(comments),
                "comments": comments,
                "next_page_token": data.get('nextPageToken')
            }
            
        except requests.exceptions.RequestException as e:
            return {"error": f"API 요청 오류: {str(e)}"}
        except json.JSONDecodeError:
            return {"error": "응답 데이터를 파싱할 수 없습니다."}
    
    def parse_comments(self, data):
        """댓글 데이터를 파싱하여 필요한 정보만 추출"""
        comments = []
        
        for item in data.get('items', []):
            snippet = item['snippet']['topLevelComment']['snippet']
            
            comment_data = {
                'author': snippet['authorDisplayName'],
                'author_channel_url': snippet.get('authorChannelUrl', ''),
                'text': snippet['textDisplay'],
                'like_count': snippet['likeCount'],
                'published_at': snippet['publishedAt'],
                'updated_at': snippet['updatedAt'],
                'reply_count': item['snippet']['totalReplyCount']
            }
            
            # 답글이 있는 경우 답글도 포함
            replies = []
            if 'replies' in item:
                for reply in item['replies']['comments']:
                    reply_snippet = reply['snippet']
                    replies.append({
                        'author': reply_snippet['authorDisplayName'],
                        'text': reply_snippet['textDisplay'],
                        'like_count': reply_snippet['likeCount'],
                        'published_at': reply_snippet['publishedAt']
                    })
            
            comment_data['replies'] = replies
            comments.append(comment_data)
        
        return comments
    
    def get_all_comments(self, video_url, order='time'):
        """
        모든 댓글을 페이지네이션으로 가져옵니다.
        주의: 댓글이 많은 동영상의 경우 시간이 오래 걸릴 수 있습니다.
        """
        video_id = self.extract_video_id(video_url)
        if not video_id:
            return {"error": "유효하지 않은 YouTube URL입니다."}
        
        all_comments = []
        next_page_token = None
        
        while True:
            params = {
                'part': 'snippet,replies',
                'videoId': video_id,
                'key': self.api_key,
                'maxResults': 100,
                'order': order,
                'textFormat': 'plainText'
            }
            
            if next_page_token:
                params['pageToken'] = next_page_token
            
            try:
                response = requests.get(self.base_url, params=params)
                response.raise_for_status()
                data = response.json()
                
                comments = self.parse_comments(data)
                all_comments.extend(comments)
                
                next_page_token = data.get('nextPageToken')
                if not next_page_token:
                    break
                    
            except requests.exceptions.RequestException as e:
                return {"error": f"API 요청 오류: {str(e)}"}
        
        return {
            "video_id": video_id,
            "total_comments": len(all_comments),
            "comments": all_comments
        }

In [None]:
# # 사용 예제
# if __name__ == "__main__":
#     # API 키 설정 (실제 키로 교체해주세요)
#     API_KEY = "YOUR_YOUTUBE_API_KEY"
    
#     # YouTube 댓글 가져오기 객체 생성
#     fetcher = YouTubeCommentsFetcher(API_KEY)
    
#     # 예제 YouTube URL
#     video_url = "https://www.youtube.com/watch?v=dQw4w9WgXcQ"
    
#     # 댓글 가져오기 (최대 50개)
#     result = fetcher.get_comments(video_url, max_results=50, order='time')
    
#     if "error" in result:
#         print(f"오류: {result['error']}")
#     else:
#         print(f"비디오 ID: {result['video_id']}")
#         print(f"총 댓글 수: {result['total_comments']}")
#         print("\n=== 댓글 목록 ===")
        
#         for i, comment in enumerate(result['comments'][:10], 1):  # 처음 10개만 출력
#             print(f"\n{i}. 작성자: {comment['author']}")
#             print(f"   내용: {comment['text'][:100]}...")  # 처음 100자만
#             print(f"   좋아요: {comment['like_count']}")
#             print(f"   작성일: {comment['published_at']}")
#             if comment['replies']:
#                 print(f"   답글 수: {len(comment['replies'])}")

#     # CSV 파일로 저장하는 함수
#     def save_comments_to_csv(comments_data, filename="youtube_comments.csv"):
#         import csv
        
#         if "error" in comments_data:
#             print(f"오류로 인해 저장할 수 없습니다: {comments_data['error']}")
#             return
        
#         with open(filename, 'w', newline='', encoding='utf-8') as csvfile:
#             fieldnames = ['author', 'text', 'like_count', 'published_at', 'reply_count']
#             writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
            
#             writer.writeheader()
#             for comment in comments_data['comments']:
#                 writer.writerow({
#                     'author': comment['author'],
#                     'text': comment['text'],
#                     'like_count': comment['like_count'],
#                     'published_at': comment['published_at'],
#                     'reply_count': comment['reply_count']
#                 })
        
#         print(f"댓글이 {filename}에 저장되었습니다.")
    
#     # CSV 파일로 저장
#     # save_comments_to_csv(result)

In [4]:
# 사용 예제
if __name__ == "__main__":
    # API 키 설정 (실제 키로 교체해주세요)
    API_KEY = "AIzaSyD0ulk8CX2kjEC8xwkblAWqoh1sCwPn8HA"
    
    # YouTube 댓글 가져오기 객체 생성
    fetcher = YouTubeCommentsFetcher(API_KEY)
    
    # 예제 YouTube URL
    # CrazAngel의 official M/V
    video_url = "https://www.youtube.com/watch?v=nJdlElIDWYE"
    
    # 댓글 가져오기 (최대 50개)
    result = fetcher.get_comments(video_url, max_results=50, order='time')
    
    if "error" in result:
        print(f"오류: {result['error']}")
    else:
        print(f"비디오 ID: {result['video_id']}")
        print(f"총 댓글 수: {result['total_comments']}")
        print("\n=== 댓글 목록 ===")
        
        for i, comment in enumerate(result['comments'][:10], 1):  # 처음 10개만 출력
            print(f"\n{i}. 작성자: {comment['author']}")
            print(f"   내용: {comment['text'][:100]}...")  # 처음 100자만
            print(f"   좋아요: {comment['like_count']}")
            print(f"   작성일: {comment['published_at']}")
            if comment['replies']:
                print(f"   답글 수: {len(comment['replies'])}")

    # CSV 파일로 저장하는 함수
    def save_comments_to_csv(comments_data, filename="youtube_comments.csv"):
        import csv
        
        if "error" in comments_data:
            print(f"오류로 인해 저장할 수 없습니다: {comments_data['error']}")
            return
        
        with open(filename, 'w', newline='', encoding='utf-8') as csvfile:
            fieldnames = ['author', 'text', 'like_count', 'published_at', 'reply_count']
            writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
            
            writer.writeheader()
            for comment in comments_data['comments']:
                writer.writerow({
                    'author': comment['author'],
                    'text': comment['text'],
                    'like_count': comment['like_count'],
                    'published_at': comment['published_at'],
                    'reply_count': comment['reply_count']
                })
        
        print(f"댓글이 {filename}에 저장되었습니다.")
    
    # CSV 파일로 저장
    # save_comments_to_csv(result)

비디오 ID: nJdlElIDWYE
총 댓글 수: 50

=== 댓글 목록 ===

1. 작성자: @zoyave3801
   내용: Неожиданная находка.
Лирика интересная, клип снят прикольно, девочки милашки, песня очень необычно з...
   좋아요: 0
   작성일: 2025-09-23T14:17:19Z

2. 작성자: @imondfan-forever
   내용: ATE...
   좋아요: 0
   작성일: 2025-09-21T20:53:24Z

3. 작성자: @whatsafart3
   내용: 0:25 “Someday i’ll become a butterfly” Gowon is that YOU 🩵😳...
   좋아요: 0
   작성일: 2025-09-14T07:46:30Z

4. 작성자: @elskabee
   내용: I feel like I'm the only one who knows this is a remix/sampling of  내 이름은 빨강머리 앤 My Name is Red-Hair...
   좋아요: 0
   작성일: 2025-09-13T11:43:00Z

5. 작성자: @Blink-m8d
   내용: ❤❤❤❤❤...
   좋아요: 0
   작성일: 2025-09-09T20:38:58Z

6. 작성자: @WooniwWoonini
   내용: ❤❤❤❤...
   좋아요: 0
   작성일: 2025-09-09T15:58:20Z

7. 작성자: @clara-xr5yz
   내용: Essa música é inteligente e mostra o poder do kpop de se reinventar!! Crazangel é o futuro!...
   좋아요: 0
   작성일: 2025-09-05T20:50:39Z

8. 작성자: @NguyenNgocThuanAn
   내용: Happy birthday to Ahon...
   좋아요: 1
   작성일: 2025-09-