In [None]:
!pip install openai-whisper ffmpeg torch

In [None]:
from google.colab import drive

def mount_google_drive():
    """Google Driveをマウントします"""
    drive.mount('/content/drive')
    print("Google Drive mounted successfully.")

mount_google_drive()

In [None]:
import os

def list_audio_files(folder_path):
    """指定したフォルダ内の音声/動画ファイルをリストアップします"""
    return [
        os.path.join(folder_path, f)
        for f in os.listdir(folder_path)
        if f.endswith(('.mp3', '.mp4', '.wav'))
    ]

# Google Drive内のフォルダパスを指定してください
target_folder = "/content/drive/My Drive/TranscriptionFolder"
audio_files = list_audio_files(target_folder)

if not audio_files:
    print("対象の音声/動画ファイルが見つかりませんでした。")
else:
    print(f"対象のファイル: {audio_files}")

In [None]:
import whisper

def transcribe_files(files, model):
    """ファイルごとにテキスト化を実行し、結果を保存します"""
    for file_path in files:
        print(f"Processing: {file_path}")
        result = model.transcribe(file_path)
        
        # 結果をテキストファイルとして保存
        output_file = file_path.replace('.mp3', '.txt').replace('.mp4', '.txt').replace('.wav', '.txt')
        with open(output_file, "w") as f:
            f.write(result["text"])
        print(f"Saved transcription to: {output_file}")

# Whisperモデルをロード
model = whisper.load_model("medium")  # 必要に応じてモデルサイズを変更

# テキスト化を実行
if audio_files:
    transcribe_files(audio_files, model)

In [None]:
print("すべてのファイルをテキスト化しました！")