#### 언어 감지
- 한국어(ko), 영어(en) 구분을 위한 기능

In [None]:
!pip install langdetect

In [None]:
from langdetect import detect, DetectorFactory

# 언어 감지기의 동작을 일관되게 하기 위해 시드 값 설정
DetectorFactory.seed = 0

def get_language_code(text):
    try:
        # 입력된 텍스트의 언어 감지
        language_code = detect(text)
        return language_code
    except Exception as e:
        return str(e)

# 예제 사용법
print(get_language_code('이 문장은 한국어로 작성되었습니다.'))  # 출력: ko
print(get_language_code('This sentence is written in English.'))  # 출력: en
print(get_language_code('Cette phrase est écrite en français.'))  # 출력: fr
print(get_language_code('내이름은 Tom이야.'))  # 출력: fr

print(get_language_code(''))  # 출력: No features in text.

#### Youtube 2 Numpy 2 mp4
- 영상을 심하게 가공하거나 분석할 필요가 있을 때 활용

In [None]:
import yt_dlp
import cv2
import numpy as np
from pprint import pprint

def youtube_to_numpy(youtube_url, start_time, duration):
    ydl_opts = {'format': 'best[ext=mp4]', 'nocheckcertificate': True}
    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info = ydl.extract_info(youtube_url, download=False)
        video_url = info['url']
        fps = info['fps']
        pprint(info)

    cap = cv2.VideoCapture(video_url)
    
    # 시작 위치로 이동
    cap.set(cv2.CAP_PROP_POS_MSEC, start_time * 1000)
    
    # 첫 프레임을 읽어 배열의 shape을 결정합니다
    ret, first_frame = cap.read()
    if not ret:
        raise ValueError("비디오를 읽을 수 없습니다.")
    
    first_frame_rgb = cv2.cvtColor(first_frame, cv2.COLOR_BGR2RGB)
    frame_shape = first_frame_rgb.shape
    
    # 필요한 프레임 수 계산
    total_frames = int(duration * fps)
    
    # 미리 할당된 NumPy 배열 생성
    numpy_array = np.empty((total_frames, *frame_shape), dtype=np.uint8)
    numpy_array[0] = first_frame_rgb
    
    frame_count = 1
    
    for i in range(1, total_frames):
        ret, frame = cap.read()
        if not ret:
            break
        frame_rgb = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        numpy_array[i] = frame_rgb
        frame_count += 1
    
    cap.release()

    # 실제로 읽은 프레임 수만큼 배열 크기 조정
    numpy_array = numpy_array[:frame_count]

    return numpy_array

In [None]:
# 사용 예시
url = "https://www.youtube.com/watch?v=dQw4w9WgXcQ"
start_time = 30  # 시작 시간 (초)
duration = 10    # 지속 시간 (초)
video_data = youtube_to_numpy(url, start_time, duration)
print(f"Video shape: {video_data.shape}")

In [None]:
def save_numpy_to_mp4(numpy_array, output_filename, fps=30):
    if len(numpy_array.shape) != 4:
        raise ValueError("NumPy 배열은 (프레임, 높이, 너비, 채널) 형태여야 합니다.")
    
    height, width = numpy_array.shape[1:3]
    
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    out = cv2.VideoWriter(output_filename, fourcc, fps, (width, height))
    
    for frame in numpy_array:
        frame_bgr = cv2.cvtColor(frame, cv2.COLOR_RGB2BGR)
        out.write(frame_bgr)
    
    out.release()
    
    print(f"비디오가 {output_filename}로 저장되었습니다.")

In [None]:
save_numpy_to_mp4(video_data, 'video1.mp4')

#### Youtube content의 특정 구간을 mp4로 저장

In [None]:
import yt_dlp
import ffmpeg

"""
segments : start time, duration, mp4 file name
"""
def download_youtube_segment_simple(youtube_url, segments):
    ydl_opts = {
#        'format': 'bestvideo[ext=mp4]+bestaudio[ext=m4a]/best[ext=mp4]/best',
        'format' : 'best[ext=mp4]',
        'outtmpl': 'temp_video.%(ext)s',
        'nocheckcertificate': True,
    }

    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info = ydl.extract_info(youtube_url, download=True)
        temp_filename = ydl.prepare_filename(info)

    try:
        for start_time, duration, output_filename in segments:
            try:
                (
                    ffmpeg
                    .input(temp_filename, ss=start_time, t=duration)
                    .output(output_filename, c='copy')
                    .overwrite_output()
                    .run(capture_stdout=True, capture_stderr=True)
                )
                print(f"Video segment saved as {output_filename}")
            except ffmpeg.Error as e:
                print(f'Error processing segment {output_filename}:')
                print('stdout:', e.stdout.decode('utf8'))
                print('stderr:', e.stderr.decode('utf8'))
    except Exception as e:
        print(f"An error occurred: {str(e)}")
    finally:
        # 임시 파일 삭제
        if os.path.exists(temp_filename):
            os.remove(temp_filename)

In [None]:
import yt_dlp
import cv2
import os
import numpy as np
from PIL import Image, ImageDraw, ImageFont

from enum import Enum

class Position(Enum):
    CENTER = 'center'
    BOTTOM = 'bottom'
    TOP = 'top'

def is_tuple_int_int(var):
    return isinstance(var, tuple) and len(var) == 2 and all(isinstance(i, int) for i in var)

def time_to_seconds(time_str):
    """시간 문자열을 초로 변환"""
    if isinstance(time_str, (int, float)):
        return float(time_str)
    h, m, s = time_str.split(':')
    return int(h) * 3600 + int(m) * 60 + float(s)

def download_youtube_segment(youtube_url, segments, text_configs=None):
    ydl_opts = {
        'format': 'best[ext=mp4]',
        'outtmpl': 'temp_video.%(ext)s',
        'nocheckcertificate': True,
    }

    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info = ydl.extract_info(youtube_url, download=True)
        temp_filename = ydl.prepare_filename(info)

    try:
        for i, (start_time, duration, output_filename) in enumerate(segments):
            try:
                start_seconds = time_to_seconds(start_time)
                duration_seconds = time_to_seconds(duration)
                
                cap = cv2.VideoCapture(temp_filename)
                cap.set(cv2.CAP_PROP_POS_MSEC, start_seconds * 1000)
                
                fourcc = cv2.VideoWriter_fourcc(*'mp4v')
                fps = cap.get(cv2.CAP_PROP_FPS)
                width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
                height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
                out = cv2.VideoWriter(output_filename, fourcc, fps, (width, height))
                
                if text_configs and i < len(text_configs):
                    text_config = text_configs[i]
                    text = text_config.get('text', 'COPIED')
                    font_path = text_config.get('font_path', 'C:\\Windows\\Fonts\\gulim.ttc') # 한글 폰트 파일 경로
                    font_size = text_config.get('font_size', 48)
                    font = ImageFont.truetype(font_path, font_size)
                    color = text_config.get('color', (0, 0, 255))
                    
                    position = text_config.get('position', 'center')

                    if not is_tuple_int_int(position):

                        # PIL Image로 텍스트 크기 계산
                        pil_img = Image.new('RGB', (width, height))
                        draw = ImageDraw.Draw(pil_img)

                        bbox = draw.textbbox((0, 0), text, font=font)
                        text_width = bbox[2] - bbox[0]
                        text_height = bbox[3] - bbox[1]
                        text_x = (width - text_width) // 2

                        match position:
                            case Position.CENTER:
                                text_y = (height - text_height) // 2
                            case Position.BOTTOM:
                                text_y = (height - text_height) - 10
                            case Position.TOP:
                                text_y = 10

                        position = (text_x, text_y)

                frame_count = 0
                while cap.isOpened():
                    ret, frame = cap.read()
                    if not ret or frame_count >= duration_seconds * fps:
                        break
                    
                    if text_configs:
                        # OpenCV 프레임을 PIL Image로 변환
                        pil_frame = Image.fromarray(cv2.cvtColor(frame, cv2.COLOR_BGR2RGB))
                        draw = ImageDraw.Draw(pil_frame)
                        
                        # 텍스트 그리기
                        draw.text(position, text, font=font, fill=color[::-1])  # RGB to BGR
                        
                        # PIL Image를 다시 OpenCV 프레임으로 변환
                        frame = cv2.cvtColor(np.array(pil_frame), cv2.COLOR_RGB2BGR)
                    
                    out.write(frame)
                    frame_count += 1
                
                print('type(frame) : ', type(frame))
                cap.release()
                out.release()
                print(f"Video segment saved as {output_filename}")
                
            except Exception as e:
                print(f"Error processing segment {output_filename}: {str(e)}")
    
    except Exception as e:
        print(f"An error occurred: {str(e)}")
    
    finally:
        if os.path.exists(temp_filename):
            os.remove(temp_filename)

In [1]:
from functions import download_youtube

# 사용 예시
youtube_url = "https://www.youtube.com/watch?v=71uyHKyQrEo"

download_youtube(youtube_url)

[youtube] Extracting URL: https://www.youtube.com/watch?v=71uyHKyQrEo
[youtube] 71uyHKyQrEo: Downloading webpage
[youtube] 71uyHKyQrEo: Downloading ios player API JSON
[youtube] 71uyHKyQrEo: Downloading m3u8 information
[info] Testing format 609
[info] 71uyHKyQrEo: Downloading 1 format(s): 609+140
[hlsnative] Downloading m3u8 manifest
[hlsnative] Total fragments: 112
[download] Destination: 71uyHKyQrEo.f609.mp4
[download] 100% of   15.91MiB in 00:00:02 at 5.59MiB/s                    
[download] Destination: 71uyHKyQrEo.f140.m4a
[download] 100% of    9.11MiB in 00:00:00 at 46.41MiB/s  
[Merger] Merging formats into "71uyHKyQrEo.mp4"
Deleting original file 71uyHKyQrEo.f140.m4a (pass -k to keep)
Deleting original file 71uyHKyQrEo.f609.mp4 (pass -k to keep)


In [None]:
from functions import Position, download_youtube_segment as dys

# 사용 예시
youtube_url = "https://www.youtube.com/watch?v=71uyHKyQrEo"
segments = [
    (10, 5, "output1.mp4"),
    (20, 5, "output2.mp4"),
    (30, 5, "output3.mp4")
]
text_configs = [
    {
        'text': '첫 번째 구간 메시지',
        'font_size': 48,
        'color': (0, 255, 255),  # 노란색 (BGR 형식)
        'position': Position.CENTER
    },
    {
        'text': '두 번째 구간 메시지',
        'font_size': 60,
        'color': (0, 0, 255),  # 빨간색
        'position': Position.BOTTOM
    },
    {
        'text': '세 번째 구간 메시지',
        'font_size': 24,
        'color': (0, 255, 0),  # 초록색
        'position': Position.TOP
    }
]

dys(youtube_url, segments, text_configs)

In [None]:
# 한글 필요없는 경우
import yt_dlp
import cv2
import os
import numpy as np

def download_youtube_segment_en(youtube_url, segments, text_configs=None):
    ydl_opts = {
        'format': 'best[ext=mp4]',
        'outtmpl': 'temp_video.%(ext)s',
        'nocheckcertificate': True,
    }

    with yt_dlp.YoutubeDL(ydl_opts) as ydl:
        info = ydl.extract_info(youtube_url, download=True)
        temp_filename = ydl.prepare_filename(info)

    try:
        for i, (start_time, duration, output_filename) in enumerate(segments):
            try:
                start_seconds = time_to_seconds(start_time)
                duration_seconds = time_to_seconds(duration)
                
                cap = cv2.VideoCapture(temp_filename)
                cap.set(cv2.CAP_PROP_POS_MSEC, start_seconds * 1000)
                
                fourcc = cv2.VideoWriter_fourcc(*'mp4v')
                fps = cap.get(cv2.CAP_PROP_FPS)
                width = int(cap.get(cv2.CAP_PROP_FRAME_WIDTH))
                height = int(cap.get(cv2.CAP_PROP_FRAME_HEIGHT))
                out = cv2.VideoWriter(output_filename, fourcc, fps, (width, height))
                
                if text_configs and i < len(text_configs):
                    text_config = text_configs[i]
                    text = text_config.get('text', 'COPIED')
                    font = cv2.FONT_HERSHEY_SIMPLEX
                    font_scale = text_config.get('font_scale', 2)
                    font_thickness = text_config.get('font_thickness', 5)
                    color = text_config.get('color', (0, 0, 255))
                    
                    text_size = cv2.getTextSize(text, font, font_scale, font_thickness)[0]
                    text_x = (width - text_size[0]) // 2
                    text_y = (height + text_size[1]) // 2
                
                frame_count = 0
                while cap.isOpened():
                    ret, frame = cap.read()
                    if not ret or frame_count >= duration_seconds * fps:
                        break
                    
                    if text_configs:
                        cv2.putText(frame, text, (text_x, text_y), font, font_scale, color, font_thickness, cv2.LINE_AA)
                    
                    out.write(frame)
                    frame_count += 1
                
                print('type(frame) : ', type(frame))
                cap.release()
                out.release()
                print(f"Video segment saved as {output_filename}")
                
            except Exception as e:
                print(f"Error processing segment {output_filename}: {str(e)}")
    
    except Exception as e:
        print(f"An error occurred: {str(e)}")
    
    finally:
        if os.path.exists(temp_filename):
            os.remove(temp_filename)

In [None]:
# 사용 예시
youtube_url = "https://www.youtube.com/watch?v=tPBWrHyu67s"
segments = [
    (30, 10, "video1.mp4"),  # (시작 시간, 지속 시간, 출력 파일명)
    (60, 10, "video2.mp4"),
    (90, 10, "video3.mp4")
]
download_youtube_segment(youtube_url, segments)

In [None]:
# youtube 검색을 위한 google-api-python-client 설치
!pip install google-api-python-client

# youtube 자막 API library 설치
!pip install youtube-transcript-api

In [4]:
import httplib2

# SSL 인증을 비활성화한 HTTP 객체 생성
http = httplib2.Http(disable_ssl_certificate_validation=True)

In [5]:

from googleapiclient.discovery import build
from googleapiclient.errors import HttpError

# YouTube API 클라이언트 생성
# - YouTube Data API v3 서비스를 사용해야 함(가입 및 API Key 생성 필요)
# - 사내망에서 사용할 시 위에서 정의한 ssl certificate validation 안하는 함수 사용
YOUTUBE_DEVELOPER_KEY = "AIzaSyBuA-0N7DJ-lP_TQtiX_Wc6_76CoddWsSc"
youtube = build("youtube", "v3", developerKey=YOUTUBE_DEVELOPER_KEY, http=http)

In [6]:
from youtube_transcript_api import YouTubeTranscriptApi, NoTranscriptFound

def get_youtube_captions(id,language='ko'):
    
    try:
        scripts = YouTubeTranscriptApi.get_transcript(id, languages=[language])
    except NoTranscriptFound:
        scripts = []
    return scripts

In [None]:
c = get_youtube_captions('M3RIwupUmdY',language='ko')
c

In [7]:
def search_youtube(query):
    try:
        # YouTube 검색 실행
        search_response = youtube.search().list(
            q=query,
            type="video",
            part="id,snippet",
            maxResults=5
        ).execute()

        # 검색 결과 처리
        videos = []
        for search_result in search_response.get("items", []):
            video_id = search_result["id"]["videoId"]
            
            video = {
                "title": search_result["snippet"]["title"],
                "video_id": video_id,
                "channel": search_result["snippet"]["channelTitle"],
                "url": f"https://www.youtube.com/watch?v={video_id}"
            }
            videos.append(video)

        return videos

    except HttpError as e:
        print(f"An HTTP error {e.resp.status} occurred:\n{e.content}")
        return []

In [8]:
keyword = "Mr blue sky"
# YouTube 검색 실행
results = search_youtube(keyword)

In [9]:
results

[{'title': 'Mr. Blue Sky',
  'video_id': 'wuJIqmha2Hk',
  'channel': 'Electric Light Orchestra - Topic',
  'url': 'https://www.youtube.com/watch?v=wuJIqmha2Hk'},
 {'title': 'Electric Light Orchestra - Mr. Blue Sky (Official Video)',
  'video_id': 'aQUlA8Hcv4s',
  'channel': 'ELOVEVO',
  'url': 'https://www.youtube.com/watch?v=aQUlA8Hcv4s'},
 {'title': 'Electric Light Orchestra - Mr. Blue Sky (Animated Video)',
  'video_id': 'G8dsvclf3Tk',
  'channel': 'ELOVEVO',
  'url': 'https://www.youtube.com/watch?v=G8dsvclf3Tk'},
 {'title': 'Electric Light Orchestra - Mr  Blue Sky (Lyrics)',
  'video_id': '9axQVJF_FYs',
  'channel': 'Young Pilgrim Music',
  'url': 'https://www.youtube.com/watch?v=9axQVJF_FYs'},
 {'title': 'Smiling Critters • Mr. Blue Sky [AMV]',
  'video_id': 'FtDEfiePtOc',
  'channel': 'Eggritos',
  'url': 'https://www.youtube.com/watch?v=FtDEfiePtOc'}]

In [11]:
c = get_youtube_captions('aQUlA8Hcv4s', language='en')
c

[{'text': '(upbeat music)', 'start': 2.101, 'duration': 2.583},
 {'text': '(stars whirring)', 'start': 9.468, 'duration': 2.75},
 {'text': '(upbeat music)', 'start': 18.234, 'duration': 1.12},
 {'text': '- [Announcer] Good morning,', 'start': 19.354, 'duration': 0.833},
 {'text': "today's forecast calls for blue skies.",
  'start': 20.187,
  'duration': 5.0},
 {'text': '♪ Sun is shining in the sky ♪', 'start': 32.876, 'duration': 3.495},
 {'text': "♪ There ain't a cloud in sight ♪",
  'start': 36.371,
  'duration': 3.1},
 {'text': "♪ It's stopped raining,\neverybody's in the play ♪",
  'start': 39.471,
  'duration': 3.919},
 {'text': "♪ And don't you know,\nit's a beautiful new day ♪",
  'start': 43.39,
  'duration': 4.644},
 {'text': '♪ Hey, hey ♪', 'start': 48.034, 'duration': 1.915},
 {'text': '♪ Running down the avenue ♪', 'start': 49.949, 'duration': 2.917},
 {'text': '♪ See how the sun shines\nbrightly in the city ♪',
  'start': 52.866,
  'duration': 4.638},
 {'text': '♪ On the s

In [None]:
# 결과 출력 및 자막 내용 조회
if results:
    print("\n검색 결과 상위 5개:")
    for i, video in enumerate(results, 1):
        print(f"{i}. 제목: {video['title']}")
        print(f"   채널: {video['channel']}")
        print(f"   URL: {video['url']}")
        print()

    # 사용자가 자막 내용을 조회할 비디오 선택
    while True:
        try:
            selection = int(input("자막 내용을 조회할 비디오 번호를 입력하세요 (1-5, 또는 0으로 종료): "))
            if selection == 0:
                break
            if 1 <= selection <= 5:
                selected_video = results[selection - 1]
                captions = get_caption_content(selected_video['video_id'])
                print(f"\n'{selected_video['title']}' 의 자막 내용:")
                if captions:
                    for caption in captions[:10]:  # 처음 10개의 자막만 출력
                        print(f"{caption['time']}")
                        print(f"{caption['text']}")
                        print()
                    print("... (이하 생략)")
                else:
                    print("  자막 내용을 가져올 수 없습니다.")
                print()
            else:
                print("올바른 번호를 입력해주세요.")
        except ValueError:
            print("숫자를 입력해주세요.")
else:
    print("검색 결과가 없습니다.")

In [None]:
!pip install gTTS playsound

In [None]:
from gtts import gTTS
import os
from playsound import playsound

def text_to_speech(text, language='en', filename='output.mp3'):
    # 텍스트를 음성으로 변환
    tts = gTTS(text=text, lang=language, slow=False)
    
    # 음성 파일 저장
    tts.save(filename)
    
    print(f"음성 파일이 {filename}로 저장되었습니다.")
    
    # 음성 파일 재생
    playsound(filename)
    
    # 재생 후 파일 삭제 (선택사항)
    # os.remove(filename)

In [None]:
# 사용자로부터 텍스트 입력 받기
input_text = "저는 김형기라는 사람 올시다. 반갑습니다."

# 언어 선택 (기본값은 영어)
#language = input("언어를 선택하세요 (en: 영어, ko: 한국어, ja: 일본어 등): ") or 'en'
language = "ko"

# 텍스트를 음성으로 변환
text_to_speech(input_text, language)

In [None]:
from gtts import gTTS
import requests
from requests.packages.urllib3.exceptions import InsecureRequestWarning

# 경고 메시지 비활성화
requests.packages.urllib3.disable_warnings(InsecureRequestWarning)

# SSL 인증서 검증을 건너뛰는 함수 정의
def get_with_ssl_skip(*args, **kwargs):
    kwargs['verify'] = False
    return original_get(*args, **kwargs)

# 원래의 requests.get을 저장하고 SSL 인증서 검증을 건너뛰도록 패치
original_get = requests.get
requests.get = get_with_ssl_skip

# 텍스트 입력
text = "안녕하세요. 이것은 텍스트를 오디오로 변환하는 샘플입니다."

# gTTS 객체 생성 (언어는 한국어로 설정)
tts = gTTS(text=text, lang='ko')

# 오디오 파일로 저장
tts.save("sample_audio.mp3")

print("오디오 파일이 생성되었습니다: sample_audio.mp3")


In [None]:
!pip install pyttsx3 numpy sounddevice

In [None]:
import pyttsx3
import numpy as np
import sounddevice as sd

def text_to_speech_array(text, rate=16000):
    # pyttsx3 엔진 초기화
    engine = pyttsx3.init()
    
    # 음성 속성 설정
    engine.setProperty('rate', 150)  # 말하기 속도
    
    # 오디오 데이터를 저장할 리스트
    audio_data = []
    
    def onData(data):
        audio_data.append(data)
    print("init")   
    # 콜백 함수 설정
    engine.connect('data', onData)
    print("connect")
    # 텍스트를 음성으로 변환
    engine.say(text)
    print("say")
    engine.runAndWait()
    print("runAndWait")
    
    # 바이트 데이터를 NumPy 배열로 변환
    audio_array = np.frombuffer(b''.join(audio_data), dtype=np.int16)
    
    return audio_array

def play_audio(audio_array, rate=16000):
    sd.play(audio_array, rate)
    sd.wait()

In [None]:
# 사용자로부터 텍스트 입력 받기
input_text = "저는 김형기라는 사람 올시다. 반갑습니다."

# 텍스트를 NumPy 배열로 변환
audio_array = text_to_speech_array(input_text)

print(f"생성된 오디오 배열 크기: {audio_array.shape}")

# 선택적: 생성된 오디오 재생
play_option = input("생성된 오디오를 재생하시겠습니까? (y/n): ")
if play_option.lower() == 'y':
    play_audio(audio_array)

In [None]:
import pyttsx3

engine = pyttsx3.init(driverName='sapi5')

engine.setProperty('rate', 150)

engine.say('무궁화 꽃이 피었습니다')

engine.runAndWait()

In [None]:
import pyttsx3
import uuid

# UUID 생성
file_name = f"{uuid.uuid4()}.wav"

# pyttsx3를 사용해 음성 파일 생성
engine = pyttsx3.init(driverName='sapi5')
engine.setProperty('rate', 150)
engine.save_to_file('무궁화 꽃이 피었습니다', file_name)
engine.runAndWait()


In [None]:
!pip install moviepy

In [None]:
!ffmpeg

In [None]:
import ffmpeg

def get_video_properties(file):
    probe = ffmpeg.probe(file)
    video_stream = next((stream for stream in probe['streams'] if stream['codec_type'] == 'video'), None)
    
    if video_stream is None:
        raise Exception(f"No video stream found in {file}")

    return {
        'width': int(video_stream['width']),
        'height': int(video_stream['height']),
        'r': eval(video_stream['r_frame_rate']),
        'pix_fmt': video_stream.get('pix_fmt', 'yuv420p'),
        'vcodec': video_stream['codec_name']
    }

def concatenate_videos(input_files, output_file):
    if not input_files:
        raise Exception("No input files provided")

    # 첫 번째 비디오의 속성 가져오기
    first_video_props = get_video_properties(input_files[0])
    
    input_streams = []
    
    for file in input_files:
        # 비디오 스트림 추가 (첫 번째 비디오의 속성으로 변환)
        video = ffmpeg.input(file)['v']
        video = ffmpeg.filter(video, 'scale', width=first_video_props['width'], height=first_video_props['height'])
        video = ffmpeg.filter(video, 'fps', fps=first_video_props['r'])
        video = ffmpeg.filter(video, 'setsar', sar='1')
        input_streams.append(video)
        
        # 오디오 스트림이 있는 경우에만 추가
        probe = ffmpeg.probe(file)
        audio_streams = [stream for stream in probe['streams'] if stream['codec_type'] == 'audio']
        if audio_streams:
            input_streams.append(ffmpeg.input(file)['a'])
        else:
            # 오디오가 없는 경우 무음 추가
            video_duration = float(probe['format']['duration'])
            input_streams.append(ffmpeg.input(f'anullsrc=duration={video_duration}', f='lavfi')['a'])

    # 모든 스트림 연결
    joined = ffmpeg.concat(*input_streams, v=1, a=1)

    # 출력 파일 생성 (첫 번째 비디오의 속성 사용)
    output = ffmpeg.output(joined, output_file,
                           vcodec=first_video_props['vcodec'],
                           pix_fmt=first_video_props['pix_fmt'])

    # FFmpeg 명령 실행 및 오류 디버깅
    try:
        ffmpeg.run(output, capture_stdout=True, capture_stderr=True)
    except ffmpeg.Error as e:
        print('stdout:', e.stdout.decode('utf8'))
        print('stderr:', e.stderr.decode('utf8'))
        raise e

In [None]:
# 사용 예시
input_files = ['video1.mp4', 'video2.mp4', 'video3.mp4']  # 연결할 비디오 파일들
output_file = 'output.mp4'  # 출력 파일 이름

concatenate_videos(input_files, output_file)

In [None]:
def create_video_from_image(image_path, duration, width, height, output_path):
    # 참조 비디오의 속성을 추출합니다
    # 이미지를 비디오로 변환합니다
    stream = ffmpeg.input(image_path, loop=1, t=duration)
    stream = ffmpeg.filter(stream, 'scale', width, height)
    stream = ffmpeg.output(stream, output_path, 
                           vcodec='libx264', 
                           pix_fmt='yuv420p', 
                           r=24)
    
    ffmpeg.run(stream)

In [None]:
image_path = 'bg_image.png'

# 참조 비디오의 정보를 가져옵니다
probe = ffmpeg.probe('video1.mp4')
video_stream = next((stream for stream in probe['streams'] if stream['codec_type'] == 'video'), None)
# 참조 비디오의 속성을 추출합니다
width = int(video_stream['width'])
height = int(video_stream['height'])
duration = 10
framerate = eval(video_stream['r_frame_rate'])

output_file = 'image_added.mp4'
create_video_from_image(image_path, duration, width, height, framerate, output_file)

In [None]:
# 사용 예시
input_files = ['video1.mp4', 'image_added.mp4', 'video2.mp4']  # 연결할 비디오 파일들
output_file = 'bg_output.mp4'  # 출력 파일 이름

concatenate_videos(input_files, output_file)

In [None]:
import pyttsx3
import uuid
import os
import ffmpeg

def generate_wav(text, file_name):
    engine = pyttsx3.init(driverName='sapi5')
    engine.setProperty('rate', 150)
    engine.save_to_file(text, file_name)
    engine.runAndWait()

# 여러 개의 음성 파일 생성
texts = [
    '집에서 뵙겠습니다. 야 이자식아', 
    '어쩌면 내가 더 잘생겼을 지 몰라', 
    '경찰청 철 철창살은 내가 먹었지',
    ]
wav_files = [f"{uuid.uuid4()}.wav" for _ in texts]

for text, file_name in zip(texts, wav_files):
    generate_wav(text, file_name)

# 비디오 파일 경로 설정
input_video = 'sample2.mp4'
output_video = 'sample3.mp4'

# 각 wav 파일을 삽입할 시간 설정 (초)
insert_times = [5, 15, 25]

# ffmpeg 명령어 작성
input_stream = ffmpeg.input(input_video)
audio_streams = [input_stream.audio]
for wav_file, insert_time in zip(wav_files, insert_times):
    audio_streams.append(
        ffmpeg.input(wav_file)
            .filter_('adelay', f'{insert_time*1000}|{insert_time*1000}')
    )

mixed_audio = ffmpeg.filter_(audio_streams, 'amix', inputs=len(audio_streams))
output_stream = ffmpeg.output(input_stream.video, mixed_audio, output_video, vcodec='copy', acodec='aac')

# ffmpeg 실행
ffmpeg.run(output_stream)

# 생성된 wav 파일 삭제
for file_name in wav_files:
    os.remove(file_name)


In [None]:
import ffmpeg
import pyttsx3
import os
import tempfile

def create_audio_from_text(text, output_path):
    engine = pyttsx3.init(driverName='sapi5')
    engine.setProperty('rate', 150)
    engine.save_to_file(text, output_path)
    engine.runAndWait()

def create_video_from_image(image_path, text, width, height, output_path):
    # 음성 파일 생성
    with tempfile.NamedTemporaryFile(suffix='.wav', delete=False) as temp_audio:
        temp_audio_path = temp_audio.name
    
    create_audio_from_text(text, temp_audio_path)
    
    # 음성 파일의 길이 확인
    probe = ffmpeg.probe(temp_audio_path)
    audio_duration = float(probe['streams'][0]['duration'])
    
    # 이미지를 비디오로 변환
    video_stream = ffmpeg.input(image_path, loop=1, t=audio_duration)
    video_stream = ffmpeg.filter(video_stream, 'scale', width, height)
    
    # 오디오 스트림 생성
    audio_stream = ffmpeg.input(temp_audio_path)
    
    # 비디오와 오디오 결합
    output = ffmpeg.output(video_stream, audio_stream, output_path,
                           vcodec='libx264',
                           acodec='aac',
                           pix_fmt='yuv420p',
                           r=24)
    
    #ffmpeg.run(output)
    # FFmpeg 명령 실행 및 오류 디버깅
    try:
        ffmpeg.run(output, capture_stdout=True, capture_stderr=True)
    except ffmpeg.Error as e:
        print('stdout:', e.stdout.decode('utf8'))
        print('stderr:', e.stderr.decode('utf8'))
        raise e
    
    # 임시 오디오 파일 삭제
    os.remove(temp_audio_path)

In [None]:
create_video_from_image('bg_image.png', '무궁화 꽃이 피었습니다. 언능 따다 주세요.', 640, 480, 'image_speech.mp4')

In [None]:
# 사용 예시
input_files = ['video1.mp4', 'image_speech.mp4', 'video2.mp4']  # 연결할 비디오 파일들
output_file = 'bg_speech.mp4'  # 출력 파일 이름

concatenate_videos(input_files, output_file)