In [3]:
from googleapiclient.discovery import build
from googleapiclient.errors import HttpError
from oauth2client.tools import argparser
from itertools import chain
from urllib import request
import pandas as pd
import numpy as np

In [1]:
## youtube api 사용할 수 있게 해주는 함수
def use_api():
    ## 개인 youtube api키 받고 사용하기 
    API_KEY          = '#######################'
    API_SERVICE_NAME = 'youtube'
    API_VERSION      = 'v3'
    
    return build(API_SERVICE_NAME, API_VERSION, developerKey = API_KEY)

In [44]:
from pprint import pprint

## 채널부터 시작해 영상 목록까지 가져오는 함수
def search_datas(query, max_result = 30):
    youtube = use_api()
    
    ## query에 해당하는 채널 이름 찾기
    ## max_result의 갯수 만큼 채널을 찾아 가져옴.
    result  = youtube.search().list(
                q          = query,
                part       = 'snippet',
                maxResults = max_result
            ).execute()
    
    ## youtube api에서 가져온 데이터가 json 데이터에 좀 복잡한 구조로 되어있는데,
    ## 채널 id는 channel_id 변수처럼 가져올 수 있다.
    channel_id = result['items'][0]['id']['channelId']
    
    ## 채널 내 플레이리스트 id 목록 가져옴.
    playlists  = search_playlists(youtube, channel_id)
    
    ## 영상 업로드 날짜, 제목, id, 썸네일 링크를 저장
    dates, titles, ids, thumbnails = [], [], [], []
    for playlist in playlists: 
        (d, t, i, th) = search_videos(youtube, playlist)
        dates      = list(chain(dates    , d))
        titles     = list(chain(titles   , t))
        ids        = list(chain(ids      , i))
        thumbnails = list(chain(thumbnails, th))
    
    ## 저장한 영상정보 데이터를 DataFrame으로 변환
    df         = pd.DataFrame([dates, titles, ids, thumbnails]).T
    df.columns = ['dates', 'titles', 'ids', 'thumbnails']
    return df
    
##채널 내 플레이리스트의 id 가져오는 함수
def search_playlists(youtube, id, max_result = 100):
    ## channelId에 해당하는 플레이리스트 찾기
    ## max_result의 갯수 만큼의 플레이리스트를 찾아 가져옴.
    result = youtube.playlists().list(
                channelId  = id,
                part       = 'snippet',
                maxResults = max_result
            ).execute()
    
    ## 플레이리스트 id 저장 
    ids = []
    for playlist in result['items']: ids.append(playlist['id'])
    return ids

## 채널의 플레이리스트에 있는 영상 정보 가져오는 함수
def search_videos(youtube, id, max_result = 200):
    ## playlistId에 해당하는 영상 찾기
    ## max_result의 갯수 만큼 영상을 찾아 가져옴.
    result = youtube.playlistItems().list(
                playlistId = id,
                part       = 'snippet',
                maxResults = max_result
            ).execute()
    titles, ids, thumbnails, dates = [], [], [],[]
    
    for video in result['items']:
        snippet = video['snippet']
        
        ## 비공개 동영상인 경우에 그냥 넘기기 
        if 'private' in snippet['title'].lower(): continue
        
        titles.append(snippet['title'])
        ids.append(snippet['resourceId']['videoId'])
        dates.append(snippet['publishedAt'])
        
        ## 썸네일에 medium 이미지가 없는 경우 default 이미지로 가져오기
        try: thumbnails.append(snippet['thumbnails']['medium']['url'])
        except: thumbnails.append(snippet['thumbnails']['default']['url'])
        
    return (dates, titles, ids, thumbnails)

In [45]:
df = search_datas('침착맨', max_result = 1)

In [46]:
df.sort_values('dates', ascending = False)

Unnamed: 0,dates,titles,ids,thumbnails
240,2022-06-20T09:22:18Z,과학으로 본 주호민의 재즈,QsuhIGOXxfs,https://i.ytimg.com/vi/QsuhIGOXxfs/mqdefault.jpg
0,2022-06-18T10:33:18Z,침펄인물사전 | 4장 이사배 편,-CWjPKeinpE,https://i.ytimg.com/vi/-CWjPKeinpE/mqdefault.jpg
203,2022-06-16T09:28:49Z,안 해요 안 해,clk9rMS9GJ4,https://i.ytimg.com/vi/clk9rMS9GJ4/mqdefault.jpg
239,2022-06-16T09:28:49Z,안 해요 안 해,clk9rMS9GJ4,https://i.ytimg.com/vi/clk9rMS9GJ4/mqdefault.jpg
1,2022-06-11T10:38:39Z,[ENG] 침펄인물사전 | 3장 우지 of 세븐틴 편,V1ryDPaC6mo,https://i.ytimg.com/vi/V1ryDPaC6mo/mqdefault.jpg
...,...,...,...,...
697,2019-07-29T11:04:20Z,【메이플스토리】 '멀쎄대쓰벤츠'의 인내의 숲 탐험,LsdH5Vxz_u0,https://i.ytimg.com/vi/LsdH5Vxz_u0/mqdefault.jpg
698,2019-07-29T11:04:20Z,【메이플스토리】 다시 오른다! 인내의 숲 (feat. 옥&철),hfkzpAAhroY,https://i.ytimg.com/vi/hfkzpAAhroY/mqdefault.jpg
699,2019-07-29T11:04:20Z,【메이플스토리】 드디어 정복? '멀쎄대쓰벤츠'의 인내의 숲,_f6vZdSTqoA,https://i.ytimg.com/vi/_f6vZdSTqoA/mqdefault.jpg
702,2019-07-28T10:00:25Z,【침&펄 디아블로2 하드코어 대작전】 Act 2: 두리엘 (完),dwmzy2fk9WA,https://i.ytimg.com/vi/dwmzy2fk9WA/mqdefault.jpg


In [25]:
df.to_csv('chim_videos.csv', index = False)

In [53]:
## 채널부터 시작해 영상 목록까지 가져오는 함수
def search_datas(query, max_result = 30):
    youtube = use_api()
    
    ## query에 해당하는 채널 이름 찾기
    ## max_result의 갯수 만큼 채널을 찾아 가져옴.
    result  = youtube.search().list(
                q          = query,
                part       = 'snippet',
                maxResults = max_result
            ).execute()
    
    ## youtube api에서 가져온 데이터가 json 데이터에 좀 복잡한 구조로 되어있는데,
    ## 채널 id는 channel_id 변수처럼 가져올 수 있다.
    channel_id = result['items'][0]['id']['channelId']
    playlists  = search_playlists(youtube, channel_id)
    
##채널 내 플레이리스트의 id 가져오는 함수
def search_playlists(youtube, id, max_result = 100):
    ## channelId에 해당하는 플레이리스트 찾기
    ## max_result의 갯수 만큼의 플레이리스트를 찾아 가져옴.
    result = youtube.playlists().list(
                channelId  = id,
                part       = 'snippet',
                maxResults = max_result
            ).execute()
    
    ## 플레이리스트 id 저장 
    ids = []
    
    for playlist in result['items']: 
        pprint(playlist['snippet']['localized']['title'])
        ids.append(playlist['id'])
    return ids

df = search_datas('침착맨', max_result = 1)

'침펄인물사전'
'2020년 침착맨 정주행'
'2021년 침착맨 정주행'
'2022년 침착맨 정주행'
'침착맨과 특강'
'침착맨의 뱉은 말은 지킨다'
'침착맨 몰아보기 합본판(合本版)'
'(2022 설특선) 침투부 같이보기'
'고수를 찾아서'
'침터뷰 시즌 3: 비대면 인터뷰'
'불만 피우면 쿡방'
'침착맨 오마카세 모음집'
'이번주 침착맨 오마카세'
'안될과학 궤도 X 침착맨 과학특강'
'(2021 추석특선) 침투부 클래식'
'침착맨의 뿌리를 찾아서'
'침착맨 삼국지 인물전'
'(2021 설특선) 침착맨 월드컵 베스트'
'쇼핑맨'
'2020 AMD 자낳대 시즌2 참가 영상'
'(2020 추석특선) 침착맨 클래식'
'설명맨'
'포켓몬스터 소드'
'2020 배도라지 25시간 MT'
'2020 AMD 자낳대 시즌1 참가 영상'
'GALAX배 배도라지 전장 으깨기 리그 시즌1'
'침착맨 삼국지'
"포켓몬스터 레츠고! 피카츄 (Pokémon Let's Go, Pikachu!)"
'배도라지 전장 으깨기 시범리그'
'침펄놈의 대모험 WOW Classic (풀버전)'
'침착맨 풀버전 영상 (정주행용)'
'화가 이말년: 증명그림 그려드립니다'
'月刊 침착맨'
'모여봐요 동물의 숲 (풀버전)'
'모여봐요 동물의 숲'
'펄풍戰'
'TRPG D&D: 호미니아 탐험대'
'윷놀이'
'삼국지14: 공손찬전'
'삼국지 영걸전 리메이크 (전투생략 버전)'
'침착맨의 전장'
'【침착맨】 블리즈컨 2019'
'침투부 노래방'
'대항해시대 2: 조안 페레로 (Uncharted Waters : New Horizons)'
'침펄놈의 대모험 (WOW Classic)'
'【침착맨】 쿵야 캐치마인드'
'침투부 라디오: 왕십리로 날아온 편지'
'【침&펄】 디아블로3 하드코어 대작전 (Diablo III)'
'【침착맨】 메이플스토리 (MapleStory)'
'【침&펄】 디아블로2 하드코어 대작전 (Diablo II)'


## 전체 영상 가져오기
[[여기 확인해보기]](https://velog.io/@keemsw/%EC%9C%A0%ED%8A%9C%EB%B8%8C-API%EB%A5%BC-%ED%99%9C%EC%9A%A9%ED%95%98%EC%97%AC-%EB%8F%99%EC%98%81%EC%83%81-%EB%A6%AC%EC%8A%A4%ED%8A%B8%EC%97%85-%ED%95%98%EA%B8%B0)

In [21]:
from collections import namedtuple
import pandas as pd

csv = pd.read_csv('chim_videos.csv')
vid = namedtuple('videos', ['dates', 'titles', 'ids', 'thumbnails'])

datas = zip(*[csv[c] for c in csv.columns])
datas = [vid._make(data) for data in datas]

for data in datas:
    print(data.dates)

2022-06-18T10:33:18Z
2022-06-11T10:38:39Z
2022-06-04T09:03:11Z
2022-05-27T11:07:34Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13:40:43Z
2022-05-22T13