In [1]:
## 영상용 api 키, 하고 바로 삭제하기
import requests
import re
from dotenv import load_dotenv
import os
import xml.etree.ElementTree as ET
from datetime import datetime
from pprint import pprint
from youtube_transcript_api import YouTubeTranscriptApi

load_dotenv()
YOUTUBE_API_KEY = os.getenv("YOUTUBE_API_KEY")
YOUTUBE_API_URL = 'https://www.googleapis.com/youtube/v3'



In [4]:
def get_youtube_transcript(url: str) -> str:
    """ 유튜브 영상 URL에 대한 자막을 가져옵니다."""
    
    # 1. 유튜브 URL에서 비디오 ID를 추출합니다.
    video_id_match = re.search(r"(?:v=|\/)([0-9A-Za-z_-]{11}).*", url)
    if not video_id_match:
        raise ValueError("유효하지 않은 YouTube URL이 제공되었습니다")
    video_id = video_id_match.group(1)
    
    languages = ["ko", "en"]
    # 2. youtube_transcript_api를 사용하여 자막을 가져옵니다.
    try:
        transcript_list = YouTubeTranscriptApi.get_transcript(video_id, languages=languages)
        
        # 3. 자막 목록의 'text' 부분을 하나의 문자열로 결합합니다.
        transcript_text = " ".join([entry["text"] for entry in transcript_list])
        return transcript_text

    except Exception as e:
        raise RuntimeError(f"비디오 ID '{video_id}'에 대한 자막을 찾을 수 없거나 사용할 수 없습니다.{e}")




In [7]:
transcript = get_youtube_transcript("https://www.youtube.com/watch?v=Rn5HMaWunx4&list=LL&index=1&t=14s") # operator 관련 영상  OpenAI
print(transcript) # "notebook.output.wordWrap": true in settings.json

안녕하세요 요즘 MCP 단어가 굉장히 많이 들립니다 그래서 한번 만들어 보았습니다 이번 영상에서는 유튜브 영상 검색 영상 요약 그리고 채널 분석까지 해주는 에이전트를 파이썬과 MCP 이용해서 만들어 보겠습니다 먼저 데모 보겠습니다 AI 에이전트에 대해서 영상을 검색을 해 달라고 요청을 하면은 도구를 불러주고 유튜브 데이터 api 이용해서 영상들을 검색을 해 줍니다이 중에 괜찮은 영상이 있으면은 상 요약해 줘라 하면은 자막을 불러주는 도구를 이용해서 요약을 해 줍니다 영상이 마음에 들어서 채널 분석을 해 달라고 하면은 채널까지 분석을 해줍니다네 이렇게 다양한 기능을 할 수 있는 유튜브 에이전트를 MCP 이용해서 만들어 보겠습니다 먼저 MCP 하는 개념을 간단히 소개를 드리고 저희가이 MCP 서버와 MCP 클라이언트를 만들려고 하는데 사전 초기 세팅을 해보고 MCP 서버부터 만들겠습니다 그다음에 방금 데모에서 보여드 였던 MCP 클라이언트를 직접 만들어 보고 이때는 오픈에서 최근에 에전 stk 하는 패키지를 출시를 했고 MCP 지원을 해 주기 때문에 그걸 이용해서 한번 MCP 클라이언트를 만들어 보겠습니다 MCP 하는 개념을 설명하기 전에 잠깐에 채치 PT 오늘 날씨에 어때라고 하는 질문에 대해서 정확하게 답변을 요즘 해 주는데 어떻게 하는지를 한번 보겠습니다 제츠 PT 테 이런 질문을 하면은 원래는 피티는 이런 오늘 아니면은 최근 데이터에 대한 맥락이나 지식이 없기 때문에 잘 답변을 못해 주다가 최근에는 다양한 도구들을 활용을 하고 있습니다 그래서 우리가 질문을 하면은 그 질문과 관련된 도구를 이용해서 그 도구로 터 주요 정보를 받아서 최종적으로 응답을 완성해 주는 방식을 많이 이용을 해 주고 있습니다 그래서 MCP 요즘 그런 도구를 어떻게 좀 더 잘 효과적으로 그리고 효율적으로 활용할 수 있을까를 고민 하면서 나오게 된 표준화된 방식이라고 볼 수도 있습니다 예전에는 우리가 우리만의 맞춤형 에이전트를 만들기 위해서 다양한 도구가 필요한데 그 도구를 활용할 어플리

In [6]:
def search_youtube_videos(query: str) :
    """유튜브에서 특정 키워드로 동영상을 검색하고 세부 정보를 가져옵니다"""
    try:
        # 1. 동영상 검색
        max_results: int = 20
        search_url = f"{YOUTUBE_API_URL}/search?part=snippet&q={requests.utils.quote(query)}&type=video&maxResults={max_results}&key={YOUTUBE_API_KEY}"
        print(f"Searching YouTube with URL: {search_url}")

        search_response = requests.get(search_url)
        search_data = search_response.json()
        video_ids = [item['id']['videoId'] for item in search_data.get('items', [])]

        if not video_ids:
            print("No videos found for the query.")
            return []

        video_details_url = f"{YOUTUBE_API_URL}/videos?part=snippet,statistics&id={','.join(video_ids)}&key={YOUTUBE_API_KEY}"
        print(f"영상 정보 가져오는 중: {video_details_url}")
        details_response = requests.get(video_details_url)
        details_response.raise_for_status()
        details_data = details_response.json()

        videos = []
        for item in details_data.get('items', []):
            snippet = item.get('snippet', {})
            statistics = item.get('statistics', {})
            thumbnails = snippet.get('thumbnails', {})
            high_thumbnail = thumbnails.get('high', {}) 
            view_count = statistics.get('viewCount')
            like_count = statistics.get('likeCount')

            video_card = {
                "title": snippet.get('title', 'N/A'),
                "publishedDate": snippet.get('publishedAt', ''),
                "channelName": snippet.get('channelTitle', 'N/A'),
                "channelId": snippet.get('channelId', ''),
                "thumbnailUrl": high_thumbnail.get('url', ''),
                "viewCount": int(view_count) if view_count is not None else None,
                "likeCount": int(like_count) if like_count is not None else None,
                "url": f"https://www.youtube.com/watch?v={item.get('id', '')}",
            }
            videos.append(video_card)

        if not videos:
            print("No video details could be fetched.")
            return []

        return videos

    except Exception as e:
        print(f"Error: {e}")
        return []



In [10]:
def search_youtube_videos(query: str) :
    """유튜브에서 특정 키워드로 동영상을 검색하고 세부 정보를 가져옵니다"""
    try:
        # 1. 동영상 검색
        max_results: int = 20
        search_url = f"{YOUTUBE_API_URL}/search?part=snippet&q={requests.utils.quote(query)}&type=video&maxResults={max_results}&key={YOUTUBE_API_KEY}"
        print(f"Searching YouTube with URL: {search_url}")

        search_response = requests.get(search_url)
        search_data = search_response.json()
        video_ids = [item['id']['videoId'] for item in search_data.get('items', [])]

        if not video_ids:
            print("No videos found for the query.")
            return []

        video_details_url = f"{YOUTUBE_API_URL}/videos?part=snippet,statistics&id={','.join(video_ids)}&key={YOUTUBE_API_KEY}"
        print(f"영상 정보 가져오는 중: {video_details_url}")
        details_response = requests.get(video_details_url)
        details_response.raise_for_status()
        details_data = details_response.json()

        videos = []
        for item in details_data.get('items', []):
            snippet = item.get('snippet', {})
            statistics = item.get('statistics', {})
            thumbnails = snippet.get('thumbnails', {})
            high_thumbnail = thumbnails.get('high', {}) 
            view_count = statistics.get('viewCount')
            like_count = statistics.get('likeCount')

            video_card = {
                "title": snippet.get('title', 'N/A'),
                "publishedDate": snippet.get('publishedAt', ''),
                "channelName": snippet.get('channelTitle', 'N/A'),
                "channelId": snippet.get('channelId', ''),
                "thumbnailUrl": high_thumbnail.get('url', ''),
                "viewCount": int(view_count) if view_count is not None else None,
                "likeCount": int(like_count) if like_count is not None else None,
                "url": f"https://www.youtube.com/watch?v={item.get('id', '')}",
            }
            videos.append(video_card)

        if not videos:
            print("No video details could be fetched.")
            return []

        return videos

    except Exception as e:
        print(f"Error: {e}")
        return []



In [11]:
videos = search_youtube_videos("AI Agents")
for video in videos:
    pprint(video)


Searching YouTube with URL: https://www.googleapis.com/youtube/v3/search?part=snippet&q=AI%20Agents&type=video&maxResults=20&key=AIzaSyAOz5efF0LiQ3txpyOO1qd8LLW49v_5gC8
영상 정보 가져오는 중: https://www.googleapis.com/youtube/v3/videos?part=snippet,statistics&id=O2gerCxEXvc,geR9PeCuHK4,F8NKVhkZZWI,FwOTs4UxQS4,hLJTcVHW8_I,eHEHE2fpnWQ,ShhVdkgzqUI,BF2k_fKuCVM,qU3fmidNbJE,HISRUrJsD08,fXizBc03D7E,gGy-JDcOwlI,77NpesUmr5Q,wazHMMaiDEA,LP5OCa20Zpg,2aC2ly7vKtM,_4jVeVkUOzs,Ctpo_gsGQJs,wkuwMqrOXFE,WfIJhS_1xIk&key=AIzaSyAOz5efF0LiQ3txpyOO1qd8LLW49v_5gC8
{'channelId': 'UCh9nVJoWXmFb7sLApWGcLPQ',
 'channelName': 'codebasics',
 'likeCount': 542,
 'publishedDate': '2025-06-30T16:10:56Z',
 'thumbnailUrl': 'https://i.ytimg.com/vi/O2gerCxEXvc/hqdefault.jpg',
 'title': 'Generative ai vs AI agents vs Agentic AI',
 'url': 'https://www.youtube.com/watch?v=O2gerCxEXvc',
 'viewCount': 16387}
{'channelId': 'UCWZwfV3ICOt3uEPpW6hYK4g',
 'channelName': 'AI Foundations',
 'likeCount': 977,
 'publishedDate': '2025-06-30T14:4

In [13]:

def get_channel_info(video_url: str) -> dict:
    """YouTube 동영상 URL로부터 채널 정보와 최근 5개의 동영상을 가져옵니다"""
    def extract_video_id(url):
        match = re.search(r"(?:v=|\/)([0-9A-Za-z_-]{11})", url)
        return match.group(1) if match else None
    def fetch_recent_videos(channel_id):
        rss_url = f"https://www.youtube.com/feeds/videos.xml?channel_id={channel_id}"
        try:
            response = requests.get(rss_url)
            if response.status_code != 200:
                return []

            root = ET.fromstring(response.text)
            ns = {'atom': 'http://www.w3.org/2005/Atom'}
            videos = []

            for entry in root.findall('.//atom:entry', ns)[:5]:  
                title = entry.find('./atom:title', ns).text
                link = entry.find('./atom:link', ns).attrib['href']
                published = entry.find('./atom:published', ns).text
                videos.append({
                    'title': title,
                    'link': link,
                    'published': published,
                    'updatedDate': datetime.now().strftime("%Y-%m-%d %H:%M:%S")
                })

            return videos
        except:
            return []

    video_id = extract_video_id(video_url)
    if not video_id:
        raise ValueError("Invalid YouTube URL")

    video_api = f"{YOUTUBE_API_URL}/videos?part=snippet,statistics&id={video_id}&key={YOUTUBE_API_KEY}"
    video_data = requests.get(video_api).json()
    if not video_data.get('items'):
        raise ValueError("No video found")

    video_info = video_data['items'][0]
    channel_id = video_info['snippet']['channelId']

    channel_api = f"{YOUTUBE_API_URL}/channels?part=snippet,statistics&id={channel_id}&key={YOUTUBE_API_KEY}"
    channel_data = requests.get(channel_api).json()['items'][0]

    return {
        'channelTitle': channel_data['snippet']['title'],
        'channelUrl': f"https://www.youtube.com/channel/{channel_id}",
        'subscriberCount': channel_data['statistics'].get('subscriberCount', '0'),
        'viewCount': channel_data['statistics'].get('viewCount', '0'),
        'videoCount': channel_data['statistics'].get('videoCount', '0'),
        'videos': fetch_recent_videos(channel_id)
    }

In [14]:
pprint(get_channel_info("https://www.youtube.com/watch?v=gYqs-wUKZsM")) ## openai 영상

{'channelTitle': 'OpenAI',
 'channelUrl': 'https://www.youtube.com/channel/UCXZCJLdBC09xxGZ6gcdrc6A',
 'subscriberCount': '1580000',
 'videoCount': '302',
 'videos': [{'link': 'https://www.youtube.com/watch?v=atXyXP3yYZ4',
             'published': '2025-07-01T14:50:39+00:00',
             'title': 'Inside ChatGPT, AI assistants, and building at OpenAI — '
                      'the OpenAI Podcast Ep. 2',
             'updatedDate': '2025-07-02 11:24:24'},
            {'link': 'https://www.youtube.com/shorts/XGswiRpn6js',
             'published': '2025-06-27T19:51:05+00:00',
             'title': 'A quick guide | How to search in ChatGPT',
             'updatedDate': '2025-07-02 11:24:24'},
            {'link': 'https://www.youtube.com/shorts/rswUgIfj1YU',
             'published': '2025-06-25T18:32:15+00:00',
             'title': 'UCLA student shares how he was using ChatGPT',
             'updatedDate': '2025-07-02 11:24:24'},
            {'link': 'https://www.youtube.com/shorts/E0