In [None]:
!pip install srt
!pip install -U langchain langchain-openai

In [5]:
import os
import srt
import asyncio
from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from langchain.chains import LLMChain
from langchain.memory import ConversationBufferWindowMemory
from srt import compose
import nest_asyncio 
import subprocess

nest_asyncio.apply() 

# 環境変数の設定
os.environ["OPENAI_API_KEY"] = os.getenv('OPEN_AI_KEY')

# LLMの初期化
llm = ChatOpenAI(model_name="gpt-4o-mini", temperature=0.2)

# 翻訳用のプロンプトテンプレート
template = """あなたは翻訳者です。翻訳した文章のみを返してください下記の文章を日本語に翻訳してください:\n{text}"""
prompt = ChatPromptTemplate.from_template(template)

# ConversationBufferWindowMemoryの初期化
memory = ConversationBufferWindowMemory(k=5)  # 最後の5つの対話を記憶

# 翻訳チェインの定義
chain = LLMChain(llm=llm, prompt=prompt, memory=memory)

def get_srt_files():
    """現在のディレクトリ内のsrtファイルのリストを取得する。

    Returns:
        list: srtファイルのリスト
    """
    return [f for f in os.listdir('.') if f.endswith('.srt')]

def select_srt_file():
    """ユーザーにsrtファイルを選択させる。

    Returns:
        str: 選択されたsrtファイル名
    """
    srt_files = get_srt_files()
    if not srt_files:
        print("No .srt files found in the current directory.")
        return None

    print("Available .srt files:")
    for i, file in enumerate(srt_files, 1):
        print(f"{i}. {file}")

    while True:
        try:
            choice = int(input("Enter the number of the file you want to use: "))
            if 1 <= choice <= len(srt_files):
                return srt_files[choice - 1]
            else:
                print("Invalid choice. Please try again.")
        except ValueError:
            print("Invalid input. Please enter a number.")

def read_srt(input_srt_file):
    """SRTファイルを読み込み、字幕データのリストを返す。

    Args:
        input_srt_file (str): 入力SRTファイルのパス

    Returns:
        list: 字幕データのリスト
    """
    try:
        with open(input_srt_file, 'r', encoding='utf-8', errors='ignore') as file:
            srt_data = file.read()
        return list(srt.parse(srt_data))
    except Exception as e:
        print(f"Error reading SRT file: {e}")
        return []

async def translate_subtitles(subtitles, batch_size=10):
    """字幕データをバッチ処理で翻訳する。

    Args:
        subtitles (list): 字幕データのリスト
        batch_size (int): バッチサイズ

    Returns:
        list: 翻訳された字幕データのリスト
    """
    translated_subtitles = []
    for i in range(0, len(subtitles), batch_size):
        batch = subtitles[i:i + batch_size]
        tasks = [chain.ainvoke({"text": subtitle.content}) for subtitle in batch]
        results = await asyncio.gather(*tasks)
        for j, result in enumerate(results):
            subtitles[i + j].content = result['text']
            progress = (i + j + 1) / len(subtitles) * 100
            print(f"Translation progress: {progress:.2f}%")
    return subtitles

def write_srt(output_srt_file, subtitles):
    """翻訳された字幕データをSRTファイルに書き込む。

    Args:
        output_srt_file (str): 出力SRTファイルのパス
        subtitles (list): 翻訳された字幕データのリスト
    """
    try:
        translated_srt_content = compose(subtitles)
        with open(output_srt_file, "w", encoding="utf-8") as f:
            f.write(translated_srt_content)
    except Exception as e:
        print(f"Error writing SRT file: {e}")

async def translate_srt(input_srt_file, output_srt_file, batch_size=30):
    """SRTファイルを読み込み、翻訳して、新しいSRTファイルに書き込む。

    Args:
        input_srt_file (str): 入力SRTファイルのパス
        output_srt_file (str): 出力SRTファイルのパス
        batch_size (int): バッチサイズ
    """
    subtitles = read_srt(input_srt_file)
    if not subtitles:
        print("No subtitles to translate.")
        return
    translated_subtitles = await translate_subtitles(subtitles, batch_size)
    write_srt(output_srt_file, translated_subtitles)

def add_line_breaks(text, max_length=20, max_lines=2):
    """テキストに改行を追加する。

    Args:
        text (str): 改行を追加するテキスト
        max_length (int): 1行の最大長
        max_lines (int): 最大行数

    Returns:
        str: 改行を追加したテキスト
    """
    result = ""
    current_line = ""
    lines = []

    for char in text:
        if char == "、" or char == "。":
            current_line += char
            if len(current_line) > max_length or char == "。":
                lines.append(current_line)
                current_line = ""
        else:
            current_line += char

    if current_line:
        lines.append(current_line)

    while len(lines) > max_lines:
        line1 = lines.pop(0)
        line2 = lines.pop(0)
        combined_line = line1 + line2
        lines.insert(0, combined_line)

    return "\n".join(lines)

def add_line_breaks_srt(srt_text):
    """SRT形式を保持して改行を追加する。

    Args:
        srt_text (str): SRT形式のテキスト

    Returns:
        str: 改行を追加したSRTテキスト
    """
    lines = srt_text.split("\n")
    result = ""

    for i, line in enumerate(lines):
        if line.strip().isdigit():
            result += line
        elif "-->" in line:
            result += line
        else:
            result += add_line_breaks(line) + "\n"

        if i < len(lines) - 1 and lines[i + 1] != "" and line != "":
            result += "\n"

    return result.strip()

# 実行
input_srt = select_srt_file()
if input_srt:
    output_srt = 'translated_' + input_srt
    video = input_srt.replace(".srt", ".mp4")

    # SRT翻訳の実行
    asyncio.run(translate_srt(input_srt, output_srt, batch_size=30))

    # 改行されたテキストを取得
    with open(output_srt, 'r', encoding='utf-8') as file:
        srt_text = file.read()

    # 改行されたテキストを取得
    result = add_line_breaks_srt(srt_text)

    # ファイルへの書き込み (エンコーディング指定)
    with open("translated_file_result.srt", "w", encoding='utf-8') as file:
        file.write(result)

    subprocess.run([
        'ffmpeg',
        '-hwaccel', 'auto', 
        '-i', f"{video}",
        '-vf', "subtitles=translated_file_result.srt:force_style='FontName=Helvetica,FontSize=11'",
        '-c:v', 'h264_amf', 
        '-c:a', 'copy', 
        f'{video.replace(".mp4", "_jp.mp4")}' 
    ])
else:
    print("No file selected. Exiting.")

Available .srt files:
1. sample.srt
2. y2mate.com - Airbnb Clone with React Native Expo Router Authentication Reanimated Clerk_v720P.srt
Translation progress: 0.03%
Translation progress: 0.05%
Translation progress: 0.08%
Translation progress: 0.10%
Translation progress: 0.13%
Translation progress: 0.15%
Translation progress: 0.18%
Translation progress: 0.20%
Translation progress: 0.23%
Translation progress: 0.25%
Translation progress: 0.28%
Translation progress: 0.30%
Translation progress: 0.33%
Translation progress: 0.36%
Translation progress: 0.38%
Translation progress: 0.41%
Translation progress: 0.43%
Translation progress: 0.46%
Translation progress: 0.48%
Translation progress: 0.51%
Translation progress: 0.53%
Translation progress: 0.56%
Translation progress: 0.58%
Translation progress: 0.61%
Translation progress: 0.63%
Translation progress: 0.66%
Translation progress: 0.69%
Translation progress: 0.71%
Translation progress: 0.74%
Translation progress: 0.76%
Translation progress: 0