In [1]:
from moviepy.editor import VideoFileClip

def extract_audio(video_path, audio_path):
    print("extract_audio processing...")
    video = VideoFileClip(video_path)
    audio = video.audio
    audio.write_audiofile(audio_path)


In [2]:
import whisper

def transcribe_audio(audio_path):
    print("transcribe_audio processing...")
    model = whisper.load_model("base")
    result = model.transcribe(audio_path)
    return result


In [8]:
# 현재는 대본이 없기 때문에 전적으로 음성 인식결과에서 매칭.
# 만약 대본을 구할 수 있다면, 음성인식 부분에서 parse한 결과를 실제 대본으로 업데이트.

import re

def search_text(transcript, query):
    print("search_text processing...")
    matches = re.finditer(query, transcript, re.IGNORECASE)
    return [match.span() for match in matches]


In [9]:
def search_text(result, query):
    print("search_text processing...")
    for item in result["segments"]:
        if query in item["text"]:
            return item["start"], item["end"], query
    return None, None, query
    


In [4]:
def map_time(result, matches):
    print("mapping time processing...")
    segments = result["segments"]
    time_matches = []
    for match in matches:
        start_time = next(seg["start"] for seg in segments if seg["start"] <= match[0] < seg["end"])
        end_time = next(seg["end"] for seg in reversed(segments) if seg["start"] < match[1] <= seg["end"])
        time_matches.append((start_time, end_time))
    return time_matches


In [5]:
def print_results(time_matches):
    for start, end in time_matches:
        print(f"대사 발견: {start:.2f}초 - {end:.2f}초")


In [6]:
video_path = "./assets/Goblin_test.mp4"
audio_path = "./assets/Goblin_test.wav"

target_text = "아프고 그럴 때지"

extract_audio(video_path, audio_path)


extract_audio processing...
MoviePy - Writing audio in ./assets/Goblin_test.wav


                                                                        

MoviePy - Done.




In [11]:
result = transcribe_audio(audio_path)
result

transcribe_audio processing...


{'text': ' 300살이면 한창 아프고 그럴 때지. 괜찮아. 왜? 다시 사실 하나. 답을 어떻게 위해선 답과 가까운 자에게 다가가야 한다. 뭔 소리야? 야 무슨 짓이야 이게 너 하나야. 역시 너에게 나무것도 보이지 않는군. 그저 따뜻할 때. 아 깜짝짝 아파 아파. 야 대소 어떻게 할 거야? 너 꼭 잘 먹었어. 대소. 이소 어떻게 할 거야? 이소. 아 더워. 더워 더워. 잘라버려야 돼. 소독. 이런면 됐죠? 됐네. 다 됐네 소독이. 이제 괜찮아. 걱정 마. 왜 여기로 와 슈퍼 가주면서. 아 궁금하잖아. 내가 진짜 궁금하잖아 처음 먹어봐. 진짜 진짜 처음이야. 궁금하를 처음 먹는 게 아니라 궁금한 처음 먹는 길을 처음 한 것 같은데. 세상에 역시 일을 생활권 지구천 한부 당시 내. 어떻게 이런 우연이 있을 수 있죠? 뭐해 이런 우연 앞에서. 두 분 인사 안 하세요? 우연이 마주쳐도 인사 안 하기로 해서. 인사 안 하기로 했어? 하하. 두 사람 오늘 전체적으로 노른자와 흰자가 안 내 계란으로 해. 아 공 Brain. 아 공 나물이네. 쫄기. 대가리. 공нако 좋아하잖아. 우리 학교 되게 좋죠. 좋네. 되게 싫은 것들 몇 가지 있었는데요? 또 자장하기 되게 좋은 것도 있었어요. 좋은 건 원래 늦게 찾아오나봐요. 아저씨처럼. 일찍 왔는데 몇 반인지 몰랐어. 말고요. 덕방 삼촌. 어 왔어. 왜 일이야? 회사에서 이상한 사람 만나가지고 마음이 등승하고 해서 급방 삼촌 잘 계시나 해서 한번 왔죠. 근데 급방 삼촌. 어? 삼촌이면 삼촌이지. 삼촌은 왜 급방 삼촌이에요? 그러고 보니 급방 삼촌 언제부터 우리 집에 살았죠? 부동산 계약서 보면 알잖아. 아 근데 왜 술 병원 두 병인가요? 누구 왔어요? 내가 양손에 한 벽씩 주고 맛있는 걸 선호해서. 그럼 소파 뒤에 있는 저 발 뒤꿈치는 뭐예요? 야 이게 소파가 참 예쁘다. 참 주인이 안보기 높아. 마무리가 좋아가지고. 어? 아까 그 이상한 그 시안한 머리 하셨네요? 머리가 잘 됐다 그래. 나는 저자의 친구 이 집에 놀러와.

In [30]:
transcript = result['text']
transcript

' 300살이면 한창 아프고 그럴 때지. 괜찮아. 왜? 다시 사실 하나. 답을 어떻게 위해선 답과 가까운 자에게 다가가야 한다. 뭔 소리야? 야 무슨 짓이야 이게 너 하나야. 역시 너에게 나무것도 보이지 않는군. 그저 따뜻할 때. 아 깜짝짝 아파 아파. 야 대소 어떻게 할 거야? 너 꼭 잘 먹었어. 대소. 이소 어떻게 할 거야? 이소. 아 더워. 더워 더워. 잘라버려야 돼. 소독. 이런면 됐죠? 됐네. 다 됐네 소독이. 이제 괜찮아. 걱정 마. 왜 여기로 와 슈퍼 가주면서. 아 궁금하잖아. 내가 진짜 궁금하잖아 처음 먹어봐. 진짜 진짜 처음이야. 궁금하를 처음 먹는 게 아니라 궁금한 처음 먹는 길을 처음 한 것 같은데. 세상에 역시 일을 생활권 지구천 한부 당시 내. 어떻게 이런 우연이 있을 수 있죠? 뭐해 이런 우연 앞에서. 두 분 인사 안 하세요? 우연이 마주쳐도 인사 안 하기로 해서. 인사 안 하기로 했어? 하하. 두 사람 오늘 전체적으로 노른자와 흰자가 안 내 계란으로 해. – icy 홈‑ licence 당림owned? 콩나물이네죽이pa Class finely. 우리 학교 되게 좋죠? 좋네. 되게 싫은 것들 몇 가지 있었는데요? 저에게 좋은 것도 있었어요. 좋은 건 원래 늦게 찾아오나봐요. 아저씨처럼. 일찍 왔는데 몇 반인지 몰랐어. 말고요. 덕박 덕박 덕박 덕박 덕박. 잠시만, 걱정해요. 금방 삼촌. 어 왔어, 무슨 일이야? 회사에서 이상한 사람 만나가지고 마음이 다 정승하고 해서. 끝방 삼촌 잘 계시나 해서 한번 와 봤죠. 근데 끝방 삼촌. 어? 삼촌이면 삼촌이지. 삼촌은 왜 끝방 삼촌이에요? 그러고 보니 끝방 삼촌 언제부터 우리 집에 살았죠? 부동산 계약서 보면 알잖아. 아. 근데 왜 술 병원 두 병인가요? 누구 왔어요? 내가 양손에 한 벽씩 주고 맛있는 걸 선호해서. 그럼 소파 뒤에 있는 저 발 뒤꿈치는 뭐예요? 야 이게 소파가 참 예쁘다. 그럼 주인이 안보기 높아. 마무리가 좋아가지고. 어? 아까 그 이상한 그 시안한. 머리 하셨네요? 머리가 

In [31]:
matches = search_text(transcript, target_text)
matches


extract_audio processing...


[(11, 20)]

In [12]:
start_time, end_time, query = search_text(result, target_text)

search_text processing...


(0.0, 3.18, '아프고 그럴 때지')

In [32]:
time_matches = map_time(result, matches)
time_matches

mapping time processing...


[(10.06, 20.98)]

In [33]:
print_results(time_matches)

대사 발견: 10.06초 - 20.98초


In [14]:
from IPython.display import Video, HTML
import base64
from pathlib import Path

def play_video_basic(video_path):
    """기본 비디오 플레이어"""
    return Video(video_path)

def play_video_with_controls(video_path, width=640):
    """HTML5 비디오 플레이어 (컨트롤 포함)"""
    video_path = Path(video_path)
    video_type = f'video/{video_path.suffix[1:]}'  # .mp4 -> video/mp4
    
    html = f'''
    <video width="{width}" controls>
        <source src="{video_path}" type="{video_type}">
        Your browser does not support the video tag.
    </video>
    '''
    return HTML(html)

def play_video_segment(video_path, start_time=0, end_time=None, width=640):
    """특정 구간 재생"""
    video_path = Path(video_path)
    video_type = f'video/{video_path.suffix[1:]}'
    
    # t=시작시간#t=끝시간 형식으로 구간 지정
    time_params = f"#t={start_time}"
    if end_time:
        time_params += f",{end_time}"
    
    html = f'''
    <video width="{width}" controls>
        <source src="{video_path}{time_params}" type="{video_type}">
        Your browser does not support the video tag.
    </video>
    '''
    return HTML(html)

# 사용 예시:
video_path = "./assets/Goblin_test.mp4"

# 1. 기본 재생
basic_player = play_video_basic(video_path)
#display(basic_player)

# 2. 컨트롤러가 있는 플레이어
controller_player = play_video_with_controls(video_path, width=800)
#display(controller_player)

# 3. 특정 구간 재생 (예: 10초부터 20초까지)
segment_player = play_video_segment(video_path, start_time=10, end_time=20, width=800)
display(segment_player)