# MP4をMP3に変換・文字起こしを行い、ChatGPT APIで英語から日本語に翻訳し、Slackに翻訳したファイルをアップロードする

動画(MP4)を音声(MP3)に変換

In [None]:
# ライブラリをインポート
import os
import subprocess

In [None]:
# 動画(MP4)を音声(MP3)に変換する関数
def convert_file(input_file, output_file):
    ffmpeg_cmd = [
        "ffmpeg", 
        "-y", 
        "-i", input_file, 
        output_file
    ]
    
    try:
        subprocess.run(ffmpeg_cmd, check=True)
        print("Successfully converted!")
    except subprocess.CalledProcessError as e:
        print("Conversion failed.")  

In [None]:
# 入力ファイル (MP4)
input_file = "english_movie.mp4"

# 出力ファイル (MP3)
output_file = "english_audio.mp3"

In [None]:
# ファイルを変換
convert_file(input_file, output_file)

音声(MP3)からテキストを文字起こし

In [None]:
# ライブラリをインポート
from faster_whisper import WhisperModel
import pandas as pd
from pprint import pprint
from datetime import datetime, timedelta

In [None]:
# モデルを指定
model_size = "large-v3"

In [None]:
# GPU・FP16で実行する場合
model = WhisperModel(model_size, device="cuda", compute_type="float16")

# GPU・INT8で実行する場合
# model = WhisperModel(model_size, device="cuda", compute_type="int8_float16")

# CPU・INT8で実行する場合
# model = WhisperModel(model_size, device="cpu", compute_type="int8")

In [None]:
# 音声を文字起こし
segments, info = model.transcribe(output_file, beam_size=5)

In [None]:
# 検出された言語と言語の確率を確認
print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

In [None]:
# 開始時間、終了時間、テキストの情報を追加するリスト
start_time = []
end_time = []
text = []

In [None]:
# 秒のリストを時間分秒のリストに変換する関数
def sec_to_hms(seconds_list):
    hms_list = []
    for seconds in seconds_list:
        # datetime.minからseconds秒後のdatetimeオブジェクトを作成
        dt = datetime.min + timedelta(seconds=seconds)
        # 時間分秒の文字列に変換
        hms_str = dt.strftime("%H:%M:%S")
        hms_list.append(hms_str)
    return hms_list

# 開始時間を時間分秒に変換
hms_list_of_start_time = sec_to_hms(start_time)

# 終了時間を時間分秒に変換
hms_list_of_end_time = sec_to_hms(end_time)

# 結果を表示
print("Start Time:\n", hms_list_of_start_time)
print("End Time:\n", hms_list_of_end_time)

In [None]:
# データフレームを作成
df = pd.DataFrame(
    {
        "start_time": hms_list_of_start_time,
        "end_time": hms_list_of_end_time,
        "text": text
    }
)

In [None]:
# データフレームを確認
display(df)

In [None]:
# データフレームをExcelにエクスポート
df.to_excel("transcribed_data.xlsx", index=False)

In [None]:
# textのカラムをリストに変換
text_list = df["text"].to_list()

pprint(text_list)

In [None]:
# 文字を結合
combined_text = "".join(text_list).strip()

pprint(combined_text)

ChatGPT APIで英語から日本語に翻訳

In [None]:
# ライブラリをインポート
from openai import OpenAI

In [None]:
# APIキーを環境変数から取得
api_key = os.getenv("OPEN_AI_API_KEY")

In [None]:
# APIキーを設定
client = OpenAI(api_key=api_key)

In [None]:
# 質問
message = f"以下を日本語にを翻訳して下さい。\n{combined_text}"

In [None]:
# チャットコンプリーションを作成
chat_completion = client.chat.completions.create(
    model="gpt-4o-mini", 
    messages=[
        {"role": "system", "content": "あなたは優秀なアシスタントです。"}, 
        {"role": "user", "content": message}
    ], 
    temperature=0.4
)

# 回答を変数に格納
response = chat_completion.choices[0].message.content

# 回答を表示
print(response)

In [None]:
# テキストファイル名
translation_file = "translation.txt"

In [None]:
# 回答をテキストファイルに保存
with open(translation_file, mode="w") as f:
    f.write(response)

Slackに翻訳したファイルをアップロード

In [None]:
# ライブラリをインポート
from slack_sdk import WebClient

In [None]:
# アクセストークンを環境変数から取得
access_token = os.getenv("SLACK_ACCESS_TOEKN")

In [None]:
# WebClientを作成
slack_client = WebClient(token=access_token)

In [None]:
# ファイルをアップロード (メッセージと一緒に)
result = slack_client.files_upload_v2(
    file=translation_file, # ファイル
    channel="Slack Channel ID", # チャンネルID
    initial_comment="ファイルをアップロードします。" # メッセージ
)

In [None]:
# アップロードしたファイルのメタデータを確認
pprint(result.get("file"))