### 유튜브 조회수 수집해 엑셀로 저장하기 (13.2)

In [13]:
import time
from selenium import webdriver
from selenium.webdriver import ActionChains, Keys
from selenium.webdriver.common.by import By

In [21]:
import os
import openpyxl
import datetime

In [26]:
from openpyxl.chart import LineChart, Reference

In [29]:
from openpyxl.styles import Font, Alignment, PatternFill, Border, Side

In [15]:
def string_to_integer(view):
    if "만회" in view:
        view = view.replace("만회", "")
        view = int(float(view) * 10000)
    elif "천회" in view:
        view = view.replace("천회", "")
        view = int(float(view) * 1000)
    elif "회" in view:
        view = view.replace("회", "")
        view = int(view)
    return view

In [30]:
# 유튜브 조회수 수집하기 (13.2.1)
def crawling(reverse = False):
    # 유튜브 접속
    opt = webdriver.ChromeOptions()
    opt.add_experimental_option('detach', True)
    browser = webdriver.Chrome(options=opt)
    browser.get('https://www.youtube.com/@nadocoding/videos')
    time.sleep(3)
    
    # 스크롤 끝까지 내리기
    same_num_cnt = 0
    prev_height = 0
    
    while True:
        ActionChains(browser).key_down(Keys.PAGE_DOWN).perform()
        cur_height = browser.execute_script("return document.documentElement.scrollTop")
    
        if prev_height == cur_height:
            same_num_cnt += 1
        else:
            same_num_cnt = 0
    
        if same_num_cnt == 200:
            break
    
        prev_height = cur_height
        
    # 크롤링
    if reverse:
        title_elements = reversed(browser.find_elements(By.CSS_SELECTOR, "#contents #video-title"))
        views_elements = reversed(browser.find_elements(By.CSS_SELECTOR, "span.inline-metadata-item.style-scope.ytd-video-meta-block:nth-child(3)"))
        date_elements = reversed(browser.find_elements(By.CSS_SELECTOR, "span.inline-metadata-item.style-scope.ytd-video-meta-block:nth-child(4)"))
        link_elements = reversed(browser.find_elements(By.CSS_SELECTOR, "a#video-title-link"))
    else:
        title_elements = browser.find_elements(By.CSS_SELECTOR, "#contents #video-title")
        views_elements = browser.find_elements(By.CSS_SELECTOR, "span.inline-metadata-item.style-scope.ytd-video-meta-block:nth-child(3)")
        date_elements = browser.find_elements(By.CSS_SELECTOR, "span.inline-metadata-item.style-scope.ytd-video-meta-block:nth-child(4)")
        link_elements = browser.find_elements(By.CSS_SELECTOR, "a#video-title-link")

    # 유튜브 조회수 엑셀로 저장하기 (13.2.2)
    ## 엑셀 파일 생성
    if not os.path.exists("./유튜브채널조회수"):
        os.mkdir("./유튜브채널조회수")

    book = openpyxl.Workbook()
    sheet = book.active

    sheet.cell(row=1, column=1).value = "영상 제목"
    sheet.cell(row=1, column=2).value = "조회수"
    sheet.cell(row=1, column=3).value = "업로드 날짜"
    sheet.cell(row=1, column=4).value = "영상 링크"

    sheet.column_dimensions["A"].width = 85
    sheet.column_dimensions["B"].width = 10
    sheet.column_dimensions["C"].width = 13
    sheet.column_dimensions["D"].width = 50

    row_num = 2
    
    # 결과 출력
    for view, date, title, link in zip(views_elements, date_elements, title_elements, link_elements):
        view_integer = string_to_integer(view.text.replace("조회수 ", ""))
        video_link = link.get_attribute("href")
        print(f"|| --- 영상 제목 : {title.text}")
        print(f"|| --- 조회수 : {view_integer}")
        print(f"|| --- 업로드 날짜 : {date.text}")
        print(f"|| --- 링크 : {video_link}")
        print(f"||")

        sheet.cell(row=row_num, column=1).value = title.text
        sheet.cell(row=row_num, column=2).value = view_integer
        sheet.cell(row=row_num, column=3).value = date.text
        sheet.cell(row=row_num, column=4).value = video_link

        row_num += 1

    # 조회수 추이를 꺾은선 차트로 그리기 (13.2.3)
    ## 차트 생성
    chart = LineChart()

    chart.title = "조회수 추이"
    chart.style = 13
    chart.y_axis.title = "조회수"
    chart.x_axis.title = "영상 번호"
    
    data = Reference(sheet, range_string=f"Sheet!B1:B{sheet.max_row}")
    
    chart.add_data(data, titles_from_data=True)
    chart.width = 45
    chart.height = 25
    
    sheet.add_chart(chart, "E1")

    # 셀 서식 적용하기 (13.2.4)
    ## 서식 지정
    header_font = Font(bold=True, size=12)
    center_alignment = Alignment(horizontal="center")
    header_fill = PatternFill(start_color="D9EAF1", end_color="D9EAF1", patternType="solid")
    thin_border = Border(left=Side(style="thin"), right=Side(style="thin"), top=Side(style="thin"), bottom=Side(style="thin"))

    ## 제목 행 서식 적용
    for row in sheet["A1:D1"]:
        for cell in row:
            cell.font = header_font
            cell.alignment = center_alignment
            cell.fill = header_fill

    ## 데이터 부분 서식 적용
    for row in sheet["B2":f"D{sheet.max_row}"]:
        for cell in row:
            cell.alignment = center_alignment

    ## 영상 링크
    for row in sheet[f"D2:D{sheet.max_row}"]:
        for cell in row:
            cell.hyperlink = cell.value

    ## 모든 셀에 서식 적용
    for row in sheet.iter_rows():
        for cell in row:
            cell.border = thin_border

    today = datetime.datetime.today().strftime("%y%m%d_%H시%M분%S초")
    book.save(f"./유튜브채널조회수/{today}.xlsx")
    
    browser.close()

In [None]:
crawling()

```
|| --- 영상 제목 : 챗GPT4o with Canvas 소개 - 글쓰기 및 코딩하시는 분들 꼭 보세요
|| --- 조회수 : 30000
|| --- 업로드 날짜 : 1개월 전
|| --- 링크 : https://www.youtube.com/watch?v=_QPdytD9yXY
||
|| --- 영상 제목 : 자바 무료 강의 2시간 완성 (1분 자바)
|| --- 조회수 : 50000
|| --- 업로드 날짜 : 6개월 전
|| --- 링크 : https://www.youtube.com/watch?v=DNCBaeCoMug
||
|| --- 영상 제목 : 새로운 시작, 코딩 공부와 함께 #유데미
|| --- 조회수 : 8600
|| --- 업로드 날짜 : 10개월 전
|| --- 링크 : https://www.youtube.com/watch?v=JhsrCJ_Hb84
||

(중략)
```

In [None]:
crawling(True)

```
|| --- 영상 제목 : (나도코딩 C) 소개
|| --- 조회수 : 110000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=dEykoFZkf5Y
||
|| --- 영상 제목 : (나도코딩 C) 1-1. 환경설정
|| --- 조회수 : 77000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=_jjZysGQS_w
||
|| --- 영상 제목 : (나도코딩 C) 1-2. Hello World
|| --- 조회수 : 61000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=xNMGGQIU8FU
||

(중략)
```

In [32]:
crawling(True)

|| --- 영상 제목 : (나도코딩 C) 소개
|| --- 조회수 : 110000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=dEykoFZkf5Y
||
|| --- 영상 제목 : (나도코딩 C) 1-1. 환경설정
|| --- 조회수 : 77000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=_jjZysGQS_w
||
|| --- 영상 제목 : (나도코딩 C) 1-2. Hello World
|| --- 조회수 : 61000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=xNMGGQIU8FU
||
|| --- 영상 제목 : (나도코딩 C) 2-8 프로젝트
|| --- 조회수 : 21000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=Ca_UCG40JX0
||
|| --- 영상 제목 : (나도코딩 C) 2-5 상수
|| --- 조회수 : 18000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=D4rZ7ZxxgAo
||
|| --- 영상 제목 : (나도코딩 C) 2-1 경찰서 조서 쓰기
|| --- 조회수 : 41000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=LF46oSNFP_U
||
|| --- 영상 제목 : (나도코딩 C) 2-4 실수형 변수
|| --- 조회수 : 21000
|| --- 업로드 날짜 : 6년 전
|| --- 링크 : https://www.youtube.com/watch?v=PtUCr7a1dPo
||
|| --- 영상 제목 : (나도코딩 C) 2-7 scanf
|| --- 조회수 : 22000
|| --- 업로드 날짜 