### 음원 및 영상 다운로드

In [2]:
import yt_dlp

#### 영상 다운로드

In [7]:
def download_video_with_ytdlp(youtube_url, filename):
    """yt-dlp를 사용하여 YouTube에서 MP4 비디오를 다운로드하고 파일 이름을 반환합니다."""
    ydl_opts = {
        'format': 'bestvideo+bestaudio/best',  # 최고 품질의 비디오와 오디오 형식을 지정
        'outtmpl': f'{filename}.mp4',  # 파일 이름을 지정하고 확장자를 mp4로 설정
        'merge_output_format': 'mp4',  # 비디오와 오디오를 mp4 형식으로 병합
        'ffmpeg_location': r'C:\Users\USER\ffmpeg-7.1',  # 필요한 경우 FFmpeg 경로 지정
    }

    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info_dict = ydl.extract_info(youtube_url, download=True)  # YouTube 정보 추출 및 다운로드
        file_name = ydl.prepare_filename(info_dict).replace('.webm', '.mp4')  # 파일 이름을 mp4로 변경
    return file_name  # 파일 이름 반환

In [None]:
https://youtu.be/MR2ela9evnk?si=oFkAnmn0NZZTF_KY

#### 음원 다운로드

In [4]:
def download_audio_with_ytdlp(youtube_url, filename):
    """yt-dlp를 사용하여 YouTube에서 오디오를 다운로드하고 파일 이름을 반환합니다."""
    ydl_opts = {
        'format': 'bestaudio/best',  # 최고 품질의 오디오 형식 지정
        'extractaudio': True,  # 오디오만 추출
        'audioformat': 'wav',  # 오디오 형식을 wav로 지정
        'outtmpl': rf'.\data\{filename}.%(ext)s',  # 파일 이름 지정 및 확장자 설정
        'postprocessors': [{
            'key': 'FFmpegExtractAudio',  # FFmpeg을 사용하여 오디오 추출
            'preferredcodec': 'wav',  # 선호하는 코덱을 wav로 설정
            'preferredquality': '192',  # 오디오 품질을 192kbps로 설정
        }],
        'ffmpeg_location': './ffmpeg/bin',  # 필요한 경우 FFmpeg 경로 지정
    }

    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info_dict = ydl.extract_info(youtube_url, download=True)  # YouTube 정보 추출 및 다운로드
        file_name = ydl.prepare_filename(info_dict).replace('.webm', '.wav')  # 파일 이름을 wav로 변경
    return file_name  # 파일 이름 반환

In [None]:
youtube_url = ''
file_name = ""
# download_audio_with_ytdlp(youtube_url, file_name)  # 오디오 다운로드

In [5]:
# extract data from excel
import pandas as pd
import os

def excel_to_df(file_path, sheet_name=None, header=0):
    """
    Excel 파일을 pandas DataFrame으로 변환하는 함수
    
    Parameters:
        file_path (str): Excel 파일 경로
        sheet_name (str or int, optional): 읽을 시트 이름 또는 인덱스. None일 경우 첫 번째 시트
        header (int, optional): 헤더로 사용할 행 번호. 기본값 0
        
    Returns:
        pd.DataFrame: 변환된 DataFrame
        
    Raises:
        FileNotFoundError: 파일이 존재하지 않을 경우
        Exception: 파일 읽기 실패 시
    """
    try:
        # 파일 존재 여부 확인
        if not os.path.exists(file_path):
            raise FileNotFoundError(f"파일을 찾을 수 없습니다: {file_path}")
            
        # 파일 확장자 확인
        if not file_path.endswith('.xlsx') and not file_path.endswith('.xls'):
            raise ValueError("엑셀 파일(.xlsx 또는 .xls)만 지원됩니다.")
            
        # Excel 파일 읽기
        df = pd.read_excel(
            file_path,
            sheet_name=sheet_name,
            header=header
        )
        
        # 데이터 기본 정보 출력
        print(f"데이터 크기: {df.shape}")
        print("\n처음 5행:")
        print(df.head())
        print("\n데이터 정보:")
        print(df.info())
        
        return df
        
    except Exception as e:
        print(f"오류 발생: {str(e)}")
        raise

In [None]:
file_path = "./youtube_playlist 1.xlsx"
df = excel_to_df(file_path, sheet_name="Sheet1")
df

In [None]:
song_list_df = df.copy()
song_list_df = song_list_df.rename(columns={'Unnamed: 1':'keyword'})
song_list_df.head(3)

In [None]:
df_url_list = []
for i in range(len(song_list_df)):
    df_url_list.append((song_list_df['keyword'][i], song_list_df['url'][i]))

print(df_url_list[:10])

In [None]:
df_url_list[31][0]

In [None]:
df_url_list[0]

In [None]:
tmp_list = df_url_list[:32]
for url_data in tmp_list:
    file_name = url_data[0]
    youtube_url = url_data[1]
    # print(file_name, youtube_url)
    download_audio_with_ytdlp(youtube_url, file_name)  # 오디오 다운로드

##### url_list의 곡 다운로드

In [5]:
url_list = [
    # ('', ''),
]

In [None]:
for url_data in url_list:
    file_name = url_data[0]
    youtube_url = url_data[1]
    download_audio_with_ytdlp(youtube_url, file_name)  # 오디오 다운로드