### 유튜브 테스트용 모듈

In [1]:
## 영상용 api 키, 하고 바로 삭제하기
import requests
import re
from dotenv import load_dotenv
import os
import xml.etree.ElementTree as ET
from datetime import datetime
from pprint import pprint
from youtube_transcript_api import YouTubeTranscriptApi

In [2]:
load_dotenv()

True

In [5]:
YOUTUBE_API_KEY = os.getenv('YOUTUBE_API_KEY')
YOUTUBE_API_URL = 'https://www.googleapis.com/youtube/v3'

#### 유튜브 자막 가져오기 함수

In [6]:
def get_youtube_transcript(url: str) -> str:
    """ 유튜브 영상 URL에 대한 자막을 가져옵니다."""
    
    # 1. 유튜브 URL에서 비디오 ID를 추출합니다.
    video_id_match = re.search(r"(?:v=|\/)([0-9A-Za-z_-]{11}).*", url)
    if not video_id_match:
        raise ValueError("유효하지 않은 YouTube URL이 제공되었습니다")
    video_id = video_id_match.group(1)
    
    languages = ["ko", "en"]
    # 2. youtube_transcript_api를 사용하여 자막을 가져옵니다.
    try:
        transcript_list = YouTubeTranscriptApi.get_transcript(video_id, languages=languages)
        
        # 3. 자막 목록의 'text' 부분을 하나의 문자열로 결합합니다.
        transcript_text = " ".join([entry["text"] for entry in transcript_list])
        return transcript_text

    except Exception as e:
        raise RuntimeError(f"비디오 ID '{video_id}'에 대한 자막을 찾을 수 없거나 사용할 수 없습니다.{e}")

In [13]:
transcript = get_youtube_transcript('https://youtu.be/aLXwRnBTsWI?si=OUSon5PdIUHE6BFH') # ChatGPT로 60억번 23살 청년
pprint(transcript) # "notebook.output.wordWrap": true in settings.json

('made about million in revenue. GPTobile app이 [음악] 친구 나이가 23. 그런데 이미 수십억 원의 '
 '매출을 만드는 앱 창업가입니다. 그런데이 친구 알아보니까 처음부터 잘 나간 건 아니에요. 가난 속에서 살았고 아버지의 병을 지켜봤고 '
 '그리고 이런 책임감들이 그를 더욱더 강력하게 움지게 만들었죠. 그래서 그는 결심합니다. 내가 돈을 벌어야겠다. 그리고 중요한 건이 친구가 '
 '개발자도 디자이너도 아니었다는 거예요. 그냥 그저 채 GPT한테 이렇게 물었죠. 모바일 앱은 어떻게 만들죠? 하고 그냥 친 거죠. 진짜이 '
 '한 문장에서 시작된 그의 여정입니다. 그의 첫 단 한 달 만에 출시됐고 SNS 영상 딱 두 개로 바로 그 두 개로 월출 8만 달러. '
 '그래서 블레이크가 말했습니다. 중요한 건 기술이 아니라 문제를 해결하려는 그 너의 태도다. 어, 블레이크가 대학교를 다닐 때 뭐 졸업에는 '
 '애초에 관심도 없었고 직상에 취업하는 것도 관심이 없었다고 합니다. 이제 대학교 때 룸메이트가 있었는데 이제 룸메이트가 블레이크한테 종종 '
 '물었대요. 야, 내가이 데이트 앱을 쓰고 있는데 채팅이 왔어.이 여자한테 뭐라고 답장하면 좋을까? 그때 블레이크가 아마 생각이 난 거 '
 '같아요. 딱 떠올랐어요. 이거 그냥 AI가 해 주면 되지 않나? 그렇게 만들어진 앱이 바로 리지 GPT. 방식은 엄청 간단합니다. '
 '스크린샷 올리면 AI가 센스 있게 답장을 만들어 주는 거예요. 복잡한 기술도 없어요. GPT 그리고 OCR 끝. 근데 이게 SNNS랑 '
 '아주 찰떡처럼 잘 맞으면서 일주일 만에 20만 다운로드를 기록했고 월매출 2억 원 달성했습니다. 대단하죠? 그리고 여기서 우리 모두가 '
 '주목해야 될 포인트는 블레이크가 뭐를 해서 얼마를 벌었다? 며칠 만에 얼마를 벌었다? 얼만큼 성공했다? 얼만큼 다운로드 받았다. 이게 '
 '되게 도파민의 도파민을 자극하는 그런 수치긴 하지만 중요한게 아닙니다. 정확한 문제

In [9]:
def search_youtube_videos(query: str) :
    """유튜브에서 특정 키워드로 동영상을 검색하고 세부 정보를 가져옵니다"""
    try:
        # 1. 동영상 검색
        max_results: int = 20
        search_url = f"{YOUTUBE_API_URL}/search?part=snippet&q={requests.utils.quote(query)}&type=video&maxResults={max_results}&key={YOUTUBE_API_KEY}"
        print(f"Searching YouTube with URL: {search_url}")

        search_response = requests.get(search_url)
        search_data = search_response.json()
        video_ids = [item['id']['videoId'] for item in search_data.get('items', [])]

        if not video_ids:
            print("No videos found for the query.")
            return []

        video_details_url = f"{YOUTUBE_API_URL}/videos?part=snippet,statistics&id={','.join(video_ids)}&key={YOUTUBE_API_KEY}"
        print(f"영상 정보 가져오는 중: {video_details_url}")
        details_response = requests.get(video_details_url)
        details_response.raise_for_status()
        details_data = details_response.json()

        videos = []
        for item in details_data.get('items', []):
            snippet = item.get('snippet', {})
            statistics = item.get('statistics', {})
            thumbnails = snippet.get('thumbnails', {})
            high_thumbnail = thumbnails.get('high', {}) 
            view_count = statistics.get('viewCount')
            like_count = statistics.get('likeCount')

            video_card = {
                "title": snippet.get('title', 'N/A'),
                "publishedDate": snippet.get('publishedAt', ''),
                "channelName": snippet.get('channelTitle', 'N/A'),
                "channelId": snippet.get('channelId', ''),
                "thumbnailUrl": high_thumbnail.get('url', ''),
                "viewCount": int(view_count) if view_count is not None else None,
                "likeCount": int(like_count) if like_count is not None else None,
                "url": f"https://www.youtube.com/watch?v={item.get('id', '')}",
            }
            videos.append(video_card)

        if not videos:
            print("No video details could be fetched.")
            return []

        return videos

    except Exception as e:
        print(f"Error: {e}")
        return []

In [10]:
videos = search_youtube_videos('ChatGPT 활용')
for video in videos:
    pprint(video)


Searching YouTube with URL: https://www.googleapis.com/youtube/v3/search?part=snippet&q=ChatGPT%20%ED%99%9C%EC%9A%A9&type=video&maxResults=20&key=AIzaSyBl_T8QPr4GB2QeWgmk3BRd7ZC7Ob5vMX8
영상 정보 가져오는 중: https://www.googleapis.com/youtube/v3/videos?part=snippet,statistics&id=aGMS6j8kFrA,yux_9YJ9YcM,IzzXx5g7Jdw,k-5M06S1GIs,ovv3UOfUMys,xOfax3H3O00,YPa1B7AJ_zI,vLgZWduVzWo,mQuo8Rw3mv0,xAUuLECuyd0,6UH74jsEk5A,fS0JnWnocos,i1VqqX4iAZ0,oardd0VJLZg,TIr6_Bo8zfg,0KtfbY5m_bU,dLzjQUFMme4,WBdtG97V-T8,CmkyAo6PN2k,jwvnctA0qBw&key=AIzaSyBl_T8QPr4GB2QeWgmk3BRd7ZC7Ob5vMX8
{'channelId': 'UCZ6UHYBQFBe14WUgxlgmYfg',
 'channelName': '오빠두엑셀 l 엑셀 강의 대표채널',
 'likeCount': 40443,
 'publishedDate': '2024-10-02T13:35:00Z',
 'thumbnailUrl': 'https://i.ytimg.com/vi/aGMS6j8kFrA/hqdefault.jpg',
 'title': '엑셀 데이터 입력, 10초 안에 끝내세요! ChatGPT 꿀팁 대공개⚡#shorts',
 'url': 'https://www.youtube.com/watch?v=aGMS6j8kFrA',
 'viewCount': 2093447}
{'channelId': 'UChu25pJgVZB3p0dVEgmU0PQ',
 'channelName': '메타코드M',
 'likeCount': 2283,
 'publi

In [11]:
def get_channel_info(video_url: str) -> dict:
    """YouTube 동영상 URL로부터 채널 정보와 최근 5개의 동영상을 가져옵니다"""
    def extract_video_id(url):
        match = re.search(r"(?:v=|\/)([0-9A-Za-z_-]{11})", url)
        return match.group(1) if match else None
    def fetch_recent_videos(channel_id):
        rss_url = f"https://www.youtube.com/feeds/videos.xml?channel_id={channel_id}"
        try:
            response = requests.get(rss_url)
            if response.status_code != 200:
                return []

            root = ET.fromstring(response.text)
            ns = {'atom': 'http://www.w3.org/2005/Atom'}
            videos = []

            for entry in root.findall('.//atom:entry', ns)[:5]:  
                title = entry.find('./atom:title', ns).text
                link = entry.find('./atom:link', ns).attrib['href']
                published = entry.find('./atom:published', ns).text
                videos.append({
                    'title': title,
                    'link': link,
                    'published': published,
                    'updatedDate': datetime.now().strftime("%Y-%m-%d %H:%M:%S")
                })

            return videos
        except:
            return []

    video_id = extract_video_id(video_url)
    if not video_id:
        raise ValueError("Invalid YouTube URL")

    video_api = f"{YOUTUBE_API_URL}/videos?part=snippet,statistics&id={video_id}&key={YOUTUBE_API_KEY}"
    video_data = requests.get(video_api).json()
    if not video_data.get('items'):
        raise ValueError("No video found")

    video_info = video_data['items'][0]
    channel_id = video_info['snippet']['channelId']

    channel_api = f"{YOUTUBE_API_URL}/channels?part=snippet,statistics&id={channel_id}&key={YOUTUBE_API_KEY}"
    channel_data = requests.get(channel_api).json()['items'][0]

    return {
        'channelTitle': channel_data['snippet']['title'],
        'channelUrl': f"https://www.youtube.com/channel/{channel_id}",
        'subscriberCount': channel_data['statistics'].get('subscriberCount', '0'),
        'viewCount': channel_data['statistics'].get('viewCount', '0'),
        'videoCount': channel_data['statistics'].get('videoCount', '0'),
        'videos': fetch_recent_videos(channel_id)
    }


In [12]:
pprint(get_channel_info("https://www.youtube.com/watch?v=gYqs-wUKZsM")) ## openai 영상

{'channelTitle': 'OpenAI',
 'channelUrl': 'https://www.youtube.com/channel/UCXZCJLdBC09xxGZ6gcdrc6A',
 'subscriberCount': '1510000',
 'videoCount': '279',
 'videos': [{'link': 'https://www.youtube.com/watch?v=nN65VbhKCxU',
             'published': '2025-05-02T20:01:22+00:00',
             'title': 'ChatGPT Has Multiple Voices?!',
             'updatedDate': '2025-05-06 15:24:45'},
            {'link': 'https://www.youtube.com/watch?v=0dhX84UkwFs',
             'published': '2025-04-23T15:29:02+00:00',
             'title': 'How to make Sora music videos with David Sheldrick',
             'updatedDate': '2025-05-06 15:24:45'},
            {'link': 'https://www.youtube.com/watch?v=FUq9qRwrDrI',
             'published': '2025-04-16T18:18:29+00:00',
             'title': 'OpenAI Codex CLI',
             'updatedDate': '2025-05-06 15:24:45'},
            {'link': 'https://www.youtube.com/watch?v=sq8GBPUb3rk',
             'published': '2025-04-16T17:33:32+00:00',
             'title': 'O