In [2]:
## 영상용 api 키, 하고 바로 삭제하기
import requests
import re
from dotenv import load_dotenv
import os
import xml.etree.ElementTree as ET
from datetime import datetime
from pprint import pprint
from youtube_transcript_api import YouTubeTranscriptApi

load_dotenv()
YOUTUBE_API_KEY = os.getenv("YOUTUBE_API_KEY")
YOUTUBE_API_URL = 'https://www.googleapis.com/youtube/v3'



In [4]:
def get_youtube_transcript(url: str) -> str:
    """ 유튜브 영상 URL에 대한 자막을 가져옵니다."""
    
    # 1. 유튜브 URL에서 비디오 ID를 추출합니다.
    video_id_match = re.search(r"(?:v=|\/)([0-9A-Za-z_-]{11}).*", url)
    if not video_id_match:
        raise ValueError("유효하지 않은 YouTube URL이 제공되었습니다")
    video_id = video_id_match.group(1)
    
    languages = ["ko", "en"]
    # 2. youtube_transcript_api를 사용하여 자막을 가져옵니다.
    try:
        transcript_list = YouTubeTranscriptApi.get_transcript(video_id, languages=languages)
        
        # 3. 자막 목록의 'text' 부분을 하나의 문자열로 결합합니다.
        transcript_text = " ".join([entry["text"] for entry in transcript_list])
        return transcript_text

    except Exception as e:
        raise RuntimeError(f"비디오 ID '{video_id}'에 대한 자막을 찾을 수 없거나 사용할 수 없습니다.{e}")




In [6]:
transcript = get_youtube_transcript("https://www.youtube.com/watch?v=ISrYHGg2C2c") # operator 관련 영상  OpenAI
print(transcript) # "notebook.output.wordWrap": true in settings.json

네 안녕하세요 오늘은 MCP에 대해서이어서 진행해 볼 예정인데요 지난 영상에서 왜 MCP가 대세가 될 수밖에 없는지에 대해서 알아봤고요 지난 영상에서는 통신하는 방법이나 구조에 대해서 다루지 않아서 이번에는 구조에 대해서 어 자세히 다뤄보도록 하겠습니다 MCP에 동작하는 방식을 더 잘 이해하기 위해서 간단한 앱을 하나 만들어 봤어요 이번에 만들어 놓은 앱은 이제 MCP2를 저희가 보통 커서 AI이나 클로드 데스에 물려서 쓰시거든요 커사 AI나 클로드 데스타 같은 거를 호스트라고 부르는데 제가 이번에는 호스트를 한번 구현을 해 본 거예요.이 호스트를 구현을 해 봐야 호스트와 클라이언트와 서버와의 어떤 통신 방식이나 이런 것들에 대해서 더 잘 이해할 수 있을 거라고 생각이 들었거든요 MCP 도구들을 동적으로 추가해 보고 그다음에 적용해 본 다음에이 동적으로 에이전트들이 MCP와 통신하는 그런 앱을 통해서 설명을 드리도록 하겠습니다 아주 간략한 개요부터 보시면은 MCP는 크게 서버와 클라이언트 클라이언트를 포함하는 호스트로 이루어져 있습니다 이렇게 구조도가 엔트로픽에 나와 있는데이 서버가 우리가 알고 있는이 다양한 소스들이라고 보시면 돼요.이 서버들이 이제 로컬 데이터 소스로부터 가져올 수 있는 레그 시스템이 될 수가 있고요 또이 서버가 웹서치 기능을 하는 그런 서버가 될 수도 있고요 그밖에 다양한 서버들이 있을 수 있습니다.이 서버들이 모여 있는 공간이 대표적으로 뭐 스미더리가 있고 MCPSO 요런 사이트들이 있는데요 여기에 있는 등록되어 있는 것들이 전부 다 MCP 서버라고 보시면 돼요 그래서 우리는 굉장히 쉽게이 서버들이 구축이 되어 있으니까 가져다가 쓸 수가 있습니다 여기서 보시는 서버가 바로 여기에 나와 있는이 서버의 개념이라고 보시면 되는데 우리가 실제 개발을 할 때는 MCP 호스트 즉 호스트는 여기에서는 클로드나 그다음에 커서 AI 요런 아이디가 될 텐데이 호스트가 가지고 있는 클라이언트를 통해서 서버랑 소통을 하게 되는 거죠 근데 커뮤니티에서도 많이 

In [7]:
def search_youtube_videos(query: str) :
    """유튜브에서 특정 키워드로 동영상을 검색하고 세부 정보를 가져옵니다"""
    try:
        # 1. 동영상 검색
        max_results: int = 20
        search_url = f"{YOUTUBE_API_URL}/search?part=snippet&q={requests.utils.quote(query)}&type=video&maxResults={max_results}&key={YOUTUBE_API_KEY}"
        print(f"Searching YouTube with URL: {search_url}")

        search_response = requests.get(search_url)
        search_data = search_response.json()
        video_ids = [item['id']['videoId'] for item in search_data.get('items', [])]

        if not video_ids:
            print("No videos found for the query.")
            return []

        video_details_url = f"{YOUTUBE_API_URL}/videos?part=snippet,statistics&id={','.join(video_ids)}&key={YOUTUBE_API_KEY}"
        print(f"영상 정보 가져오는 중: {video_details_url}")
        details_response = requests.get(video_details_url)
        details_response.raise_for_status()
        details_data = details_response.json()

        videos = []
        for item in details_data.get('items', []):
            snippet = item.get('snippet', {})
            statistics = item.get('statistics', {})
            thumbnails = snippet.get('thumbnails', {})
            high_thumbnail = thumbnails.get('high', {}) 
            view_count = statistics.get('viewCount')
            like_count = statistics.get('likeCount')

            video_card = {
                "title": snippet.get('title', 'N/A'),
                "publishedDate": snippet.get('publishedAt', ''),
                "channelName": snippet.get('channelTitle', 'N/A'),
                "channelId": snippet.get('channelId', ''),
                "thumbnailUrl": high_thumbnail.get('url', ''),
                "viewCount": int(view_count) if view_count is not None else None,
                "likeCount": int(like_count) if like_count is not None else None,
                "url": f"https://www.youtube.com/watch?v={item.get('id', '')}",
            }
            videos.append(video_card)

        if not videos:
            print("No video details could be fetched.")
            return []

        return videos

    except Exception as e:
        print(f"Error: {e}")
        return []



In [8]:
videos = search_youtube_videos("AI Agents")
for video in videos:
    pprint(video)


Searching YouTube with URL: https://www.googleapis.com/youtube/v3/search?part=snippet&q=AI%20Agents&type=video&maxResults=20&key=AIzaSyA-xSiUsSsWa8_5fu9x5jv6yfFcVHUdOpw
영상 정보 가져오는 중: https://www.googleapis.com/youtube/v3/videos?part=snippet,statistics&id=F8NKVhkZZWI,eHEHE2fpnWQ,hLJTcVHW8_I,sIugzOQz7Vk,HISRUrJsD08,Z-nZNUiUOBs,qU3fmidNbJE,w0H1-b044KY,Tup1yI6iPig,wazHMMaiDEA,LP5OCa20Zpg,IuiBo-sNfy4,pcWKJ_yvf1M,ZZ2QUCePgYw,djrMoZk_5uM,ASABxNenD_U,kHPXbo2OkzA,muG-wverDzU,KrRD7r7y7NY,XVO3zsHdvio&key=AIzaSyA-xSiUsSsWa8_5fu9x5jv6yfFcVHUdOpw
{'channelId': 'UCKWaEZ-_VweaEx1j62do_vQ',
 'channelName': 'IBM Technology',
 'likeCount': 26640,
 'publishedDate': '2024-07-15T10:00:13Z',
 'thumbnailUrl': 'https://i.ytimg.com/vi/F8NKVhkZZWI/hqdefault.jpg',
 'title': 'What are AI Agents?',
 'url': 'https://www.youtube.com/watch?v=F8NKVhkZZWI',
 'viewCount': 1400883}
{'channelId': 'UCZgt6AzoyjslHTC9dz0UoTw',
 'channelName': 'ByteByteGo',
 'likeCount': 2623,
 'publishedDate': '2025-03-19T15:30:14Z',
 'thumbn

In [9]:

def get_channel_info(video_url: str) -> dict:
    """YouTube 동영상 URL로부터 채널 정보와 최근 5개의 동영상을 가져옵니다"""
    def extract_video_id(url):
        match = re.search(r"(?:v=|\/)([0-9A-Za-z_-]{11})", url)
        return match.group(1) if match else None
    def fetch_recent_videos(channel_id):
        rss_url = f"https://www.youtube.com/feeds/videos.xml?channel_id={channel_id}"
        try:
            response = requests.get(rss_url)
            if response.status_code != 200:
                return []

            root = ET.fromstring(response.text)
            ns = {'atom': 'http://www.w3.org/2005/Atom'}
            videos = []

            for entry in root.findall('.//atom:entry', ns)[:5]:  
                title = entry.find('./atom:title', ns).text
                link = entry.find('./atom:link', ns).attrib['href']
                published = entry.find('./atom:published', ns).text
                videos.append({
                    'title': title,
                    'link': link,
                    'published': published,
                    'updatedDate': datetime.now().strftime("%Y-%m-%d %H:%M:%S")
                })

            return videos
        except:
            return []

    video_id = extract_video_id(video_url)
    if not video_id:
        raise ValueError("Invalid YouTube URL")

    video_api = f"{YOUTUBE_API_URL}/videos?part=snippet,statistics&id={video_id}&key={YOUTUBE_API_KEY}"
    video_data = requests.get(video_api).json()
    if not video_data.get('items'):
        raise ValueError("No video found")

    video_info = video_data['items'][0]
    channel_id = video_info['snippet']['channelId']

    channel_api = f"{YOUTUBE_API_URL}/channels?part=snippet,statistics&id={channel_id}&key={YOUTUBE_API_KEY}"
    channel_data = requests.get(channel_api).json()['items'][0]

    return {
        'channelTitle': channel_data['snippet']['title'],
        'channelUrl': f"https://www.youtube.com/channel/{channel_id}",
        'subscriberCount': channel_data['statistics'].get('subscriberCount', '0'),
        'viewCount': channel_data['statistics'].get('viewCount', '0'),
        'videoCount': channel_data['statistics'].get('videoCount', '0'),
        'videos': fetch_recent_videos(channel_id)
    }

In [11]:
pprint(get_channel_info("https://www.youtube.com/watch?v=gYqs-wUKZsM")) ## openai 영상

{'channelTitle': 'OpenAI',
 'channelUrl': 'https://www.youtube.com/channel/UCXZCJLdBC09xxGZ6gcdrc6A',
 'subscriberCount': '1470000',
 'videoCount': '264',
 'videos': [{'link': 'https://www.youtube.com/watch?v=PFsOUNfBhzI',
             'published': '2025-03-25T18:21:15+00:00',
             'title': 'Character Consistency with 4o Image Generation',
             'updatedDate': '2025-03-30 16:19:44'},
            {'link': 'https://www.youtube.com/watch?v=ELwb_emN1p0',
             'published': '2025-03-25T18:20:56+00:00',
             'title': 'Detailed Directions with 4o Image Generation',
             'updatedDate': '2025-03-30 16:19:44'},
            {'link': 'https://www.youtube.com/watch?v=E9RN8jX--uc',
             'published': '2025-03-25T18:20:30+00:00',
             'title': 'OpenAI 4o Image Generation',
             'updatedDate': '2025-03-30 16:19:44'},
            {'link': 'https://www.youtube.com/watch?v=NO7Uo2ii1Sw',
             'published': '2025-03-25T18:20:16+00:00',
   