# N46Whisper

N46Whisper is a Google Colab notebook application for streamlined video subtitle file generation.The original purpose of the project was to improve the productivity of Nogizaka46 (and Sakamichi groups) subbers. However, it can also be used to create subtitles in general.The application could significantly reduce the labour and time costs of sub-groups or individual subbers. However, despite its impressive performance, the Whisper model, AI translation and the application itself are not without limitations.


N46Whisper 是基于 Google Colab 的应用。开发初衷旨在提高乃木坂46（以及坂道系）字幕组日语视频的制作效率,但亦适于所有外语视频的字幕制作。本应用的目标并非生产完美的字幕文件， 而旨在于搭建并提供一个简单且自动化的使用平台以节省生产成品字幕的时间和精力。Whisper模型有其本身的应用场景限制，AI 翻译的质量亦还不能尽如人意。

<font size='4'>**对于中文用户，推荐在使用前阅读[常见问题说明](https://github.com/Ayanaminn/N46Whisper/blob/main/FAQ.md)。如果你觉得本应用对你有所帮助，欢迎帮助扩散给更多的人。**


<font size='4'>**联系作者/Contact me：[E-mail](admin@ikedateresa.cc)**


## 更新/What's Latest：
历史更新日志

<font size = '3'>**本项目将不再进行维护和更新，感谢大家的帮助与支持。**
</br></br>

2024.4.17:
* 添加使用Google Gemini API翻译的选项。

2024.1.31:
* 鉴于集成的参数选项（还会）越来越多有使流程变得繁琐的趋势，这有违开发初衷。因此测试分离了一个[轻量版](https://colab.research.google.com/github/Ayanaminn/N46Whisper/blob/dev/N46WhisperLite.ipynb)，只保留最少的必要操作。

2023.12.4:
* 支持基于faster-whisper的WhisperV3模型/Support faster-whisper based WhisperV3 model

2023.11.7:
* 现在可以加载最新的WhisperV3模型/Enable users to load lastest Whisper V3 model.
* 允许用户自行设置beam size/ Enable customerize beam size parameter.

2023.4.30:
* 优化提示词/Refine the translation prompt.
* 允许用户使用个人提示词并调节Temperature参数/Allow user to custom prompt and temperature for translation.
* 显示翻译任务消费统计/Display the token used and total cost for the translation task.

2023.4.15:
* 使用faster-whisper模型重新部署以提高效率，节省资源。Reimplement Whsiper based on faster-whsiper to improve efficiency.
* 提供faster-whisper集成的vad filter选项以提高转录精度。Enable vad filter that integrated in faster-whisper to improve transcribe accuracy

**<font size='5'>以下选择文件方式按需执行其中一种即可，不需要全部运行</font>**

In [4]:
#@title **从谷歌网盘选择文件/Select File From Google Drive**

# @markdown <font size="2">Navigate to the file you want to transcribe, left-click to highlight the file, then click 'Select' button to confirm.
# @markdown <br/>从网盘目录中选择要转换的文件(视频/音频），单击选中文件，点击'Select'按钮以确认。</font><br/>
# @markdown <br/><font size="2">If use local file, ignore this cell and move to the next.
# @markdown <br/>若希望从本地上传文件，则跳过此步执行下一单元格。</font><br/>
# @markdown <br/><font size="2">If file uploaded to drive after execution, execute this cell again to refresh.
# @markdown <br/>若到这一步才上传文件到谷歌盘，则重复执行本单元格以刷新文件列表。</font>
! pip install geemap
from google.colab import drive
from google.colab import files
import os
import logging
from IPython.display import clear_output
import geemap

clear_output()
drive.mount('/drive')

print('Google Drive is mounted，please select file')
print('谷歌云盘挂载完毕，请选择要转换的文件')

from ipytree import Tree, Node
import ipywidgets as widgets
from ipywidgets import interactive
# import os
from google.colab import output
output.enable_custom_widget_manager()
use_drive = True
global drive_dir
drive_dir = []

def file_tree():
    # create widgets as a simple file browser
    full_widget = widgets.HBox()
    left_widget = widgets.VBox()
    right_widget = widgets.VBox()

    path_widget = widgets.Text()
    path_widget.layout.min_width = '300px'
    select_widget = widgets.Button(
      description='Select', button_style='primary', tooltip='Select current media file.'
      )
    drive_url = widgets.Output()

    right_widget.children = [select_widget]
    full_widget.children = [left_widget]

    tree_widget = widgets.Output()
    tree_widget.layout.max_width = '300px'
    tree_widget.overflow = 'auto'

    left_widget.children = [path_widget,tree_widget]

    # init file tree
    my_tree = Tree(multiple_selection=False)
    my_tree_dict = {}
    media_names = []

    def select_file(b):
        drive_dir.append(path_widget.value)
        # full_widget.disabled = True
        # clear_output()
        print('File selected，please continue to select more or execute next cell')
        print('已选择文件，可以继续选择或执行下个单元格')
    #     if (out_file not in my_tree_dict.keys()) and (out_dir in my_tree_dict.keys()):
    #         node = Node(os.path.basename(out_file))
    #         my_tree_dict[out_file] = node
    #         parent_node = my_tree_dict[out_dir]
    #         parent_node.add_node(node)

    select_widget.on_click(select_file)

    def handle_file_click(event):
        if event['new']:
            cur_node = event['owner']
            for key in my_tree_dict.keys():
                if (cur_node is my_tree_dict[key]) and (os.path.isfile(key)):
                    try:
                        with open(key) as f:
                            path_widget.value = key
                            path_widget.disabled = False
                            select_widget.disabled = False
                            full_widget.children = [left_widget, right_widget]
                    except Exception as e:
                        path_widget.value = key
                        path_widget.disabled = True
                        select_widget.disabled = True

                        return

    def handle_folder_click(event):
        if event['new']:
            full_widget.children = [left_widget]

    # redirect cwd to default drive root path and add nodes
    my_dir = '/drive/MyDrive'
    my_root_name = my_dir.split('/')[-1]
    my_root_node = Node(my_root_name)
    my_tree_dict[my_dir] = my_root_node
    my_tree.add_node(my_root_node)
    my_root_node.observe(handle_folder_click, 'selected')

    for root, d_names, f_names in os.walk(my_dir):
        folders = root.split('/')
        for folder in folders:
            if folder.startswith('.'):
                continue
        for d_name in d_names:
            if d_name.startswith('.'):
                d_names.remove(d_name)
        for f_name in f_names:
            # if f_name.startswith('.'):
            #     f_names.remove(f_name)
            # only add media files
            if f_name.lower().endswith(('mp3','m4a','flac','aac','wav','mp4','mkv','ts','flv')):
                media_names.append(f_name)

        d_names.sort()
        f_names.sort()
        media_names.sort()
        keys = my_tree_dict.keys()

        if root not in my_tree_dict.keys():
          # print(f'root name is {root}') # folder path
          name = root.split('/')[-1] # folder name
          # print(f'folder name is {name}')
          dir_name = os.path.dirname(root) # parent path of folder
          # print(f'dir name is {dir_name}')
          parent_node = my_tree_dict[dir_name]
          node = Node(name)
          my_tree_dict[root] = node
          parent_node.add_node(node)
          node.observe(handle_folder_click, 'selected')

        if len(media_names) > 0:
              parent_node = my_tree_dict[root] # parent folders
              # print(parent_node)
              parent_node.opened = False
              for f_name in media_names:
                  node = Node(f_name)
                  node.icon = 'file'
                  full_path = os.path.join(root, f_name)
                  # print(full_path)
                  my_tree_dict[full_path] = node
                  parent_node.add_node(node)
                  node.observe(handle_file_click, 'selected')
        media_names.clear()

    with tree_widget:
      tree_widget.clear_output()
      display(my_tree)

    return full_widget


tree= file_tree()
tree


Drive already mounted at /drive; to attempt to forcibly remount, call drive.mount("/drive", force_remount=True).
Google Drive is mounted，please select file
谷歌云盘挂载完毕，请选择要转换的文件


HBox(children=(VBox(children=(Text(value='', layout=Layout(min_width='300px')), Output(layout=Layout(max_width…

In [5]:
#@title **从本地上传文件(可多选）/Upload Local File（Can select multiple)**
# @markdown <font size="2">If use file in google drive, ignore this cell and move to the next.
# @markdown <br/>若已选择谷歌盘中的文件，则跳过此步执行下一单元格。</font>

from google.colab import files
use_drive = False
uploaded = files.upload()
file_names = []
file_names.append(list(uploaded.keys())[0])
print('File uploaded，please continue to upload more or execute next cell')
print('已上传文件，可以执行下个单元格')

Saving output.aac to output.aac
File uploaded，please continue to upload more or execute next cell
已上传文件，可以执行下个单元格


**<font size='5'>以下顺次点击下方每个单元格左侧的“运行”图标，不可跳过步骤</font>**
**</br>【重要】:** 务必在"修改"->"笔记本设置"->"硬件加速器"中选择GPU！否则处理速度会非常慢。
 **</br>【IMPORTANT】:** Make sure you select GPU as hardware accelerator in notebook settings, otherwise the processing speed will be very slow.

In [7]:
#@title **通用参数/Required settings:**


# @markdown **【IMPORTANT】:**<font size="2">Select uploaded file type.
# @markdown **</br>【重要】:** 选择上传的文件类型(视频-video/音频-audio）</font>

# encoding:utf-8
file_type = "audio"  # @param ["audio","video"]

# @markdown <font size="2">Model size will affect the processing time and transcribe quality.
# @markdown <br/>The default source language is Japanese.Please input your own source language if applicable.Use two letter language code， e.g.  'en', 'ja'...
# @markdown <br/>模型大小将影响转录时间和质量, **默认使用稳定的large-v2模型以节省时间**
# @markdown <br/>默认识别语言为日语，若使用其它语言的视频请自行输入即可。请注意：使用两字母语言代码如'en'，'ja'
# @markdown <br/>【请注意】：large-v3在某些情况下可能未必优于large-v2或更早的模型，请用户自行选择

model_size = "large-v2"  # @param ["base","small","medium", "large-v1","large-v2","large-v3"]
language = "ja"  # @param {type:"string"}

# @markdown <font size="2">默认只导出ass，若需要srt则选择Yes</font>
# @markdown <br/><font size="2">导出时浏览器会弹出允许同时下载多个文件的请求，需要同意
export_srt = "No"  # @param ["No","Yes"]


In [8]:
#@title **其他选项/Advanced settings**

# @markdown <font size="2">Option for split line text by spaces. The splited lines all use the same time stamp, with 'adjust_required' label as remark for manual adjustment.
# @markdown <br/>将存在空格的单行文本分割为多行（多句）。分割后的若干行均临时采用相同时间戳，且添加了adjust_required标记提示调整时间戳避免叠轴
# @markdown <br/>普通分割（Modest): 当空格后的文本长度超过5个字符，则另起一行
# @markdown <br/>全部分割（Aggressive): 只要遇到空格即另起一行
# @markdown <br/>标点分割（Punctuation): 只要遇到句号即另起一行，在未来可能添加更加智能的标点分割方法
is_split = "No"  # @param ["No","Yes"]
split_method = "Modest"  # @param ["Modest","Aggressive", "Punctuation"]
# @markdown <font size="2">Please contact us if you want to have your sub style integrated.
# @markdown <br/>当前支持生成字幕格式：
# @markdown <br/><li>ikedaCN - 特蕾纱熊猫观察会字幕组
# @markdown <br/><li>sugawaraCN - 坂上之月字幕组
# @markdown <br/><li>kaedeCN - 三番目の枫字幕组
# @markdown <br/><li>taniguchiCN - 泪痣愛季応援団
# @markdown <br/><li>asukaCN - 暗鳥其实很甜字幕组
sub_style = "default"  # @param ["default", "ikedaCN", "kaedeCN","sugawaraCN","taniguchiCN","asukaCN"]

# @markdown **使用VAD过滤/Use VAD filter**

# @markdown <font size="2">使用[Silero VAD model](https://github.com/snakers4/silero-vad)以检测并过滤音频中的无声段落（推荐小语种使用）
# @markdown <br/>[WARNING] Use VAD filter have pros and cons, please carefully select this option accroding to your own audio content.
# @markdown <br/>【注意】使用VAD filter有优点亦有缺点，请用户自行根据音频内容决定是否启用. [关于VAD filter](https://github.com/Ayanaminn/N46Whisper/blob/main/FAQ.md)


is_vad_filter = "False" # @param ["True", "False"]
# @markdown  <font size="2"> *  The default <font size="3">  ```min_silence_duration``` <font size="2"> is set at 1000 ms in N46Whisper

# @markdown **设置Beam Size**

# @markdown <font size="2">Beam Size数值越高，在识别时探索的路径越多，这在一定范围内可以帮助提高识别准确性，但是相对的VRAM使用也会更高. 同时，Beam Size在超过5-10后有可能降低精确性，详情请见https://arxiv.org/pdf/2204.05424.pdf
# @markdown <br/> 默认设置为 5
set_beam_size = 5 #@param

# @markdown <font size="2">在不设置Beam Size时，Whisper将会使用贪心解码，这在一定程度上可能与英语等其他语言的换行功能有联系，详情请见https://github.com/Ayanaminn/N46Whisper/issues/46
# @markdown <br/> 默认设置为 false
beam_size_off = False # @param {type:"boolean"}

# # @markdown <font size="2">设置此参数为True将在代码执行完毕后自动断开Colab的连接。这有助于在长时间运行的任务完成后释放资源。请注意，断开连接后，所有未保存的数据将丢失。</font>
# # @markdown <br/> 默认设置为 False
# auto_disconnect = True #@param {type:"boolean"}

# # 以下代码用于断开连接
# from IPython.display import Javascript

# def disconnect_runtime():
#     if auto_disconnect:
#         display(Javascript('google.colab.kernel.disconnect();'))
#         print("已经自动断开连接。")
#     else:
#         print("自动断开连接功能已关闭。")

In [9]:
#@title **运行Whisper/Run Whisper**
# Hugging Face Hub
# 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

#@markdown 完成后ass文件将自动下载到本地/ass file will be auto downloaded after finish.
! pip install ffmpeg
! wget https://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@raw.githubusercontent.com/Ayanaminn/N46Whisper/main/srt2ass.py
! pip install pysubs2
! pip install faster-whisper
! pip install ctranslate2==4.4.0
! apt remove --purge -y libcudnn9 libcudnn9-dev
! apt autoremove -y
! apt update
! apt install -y libcudnn8 libcudnn8-dev
# ! pip install nest_asyncio
import torch
# import nest_asyncio
from faster_whisper import WhisperModel
import ipywidgets as widgets
from IPython.display import display, clear_output
clear_output()
print('语音识别库配置完毕，将开始转换')
import os
import ffmpeg
import subprocess
from tqdm import tqdm
import time
import pandas as pd
import requests
from urllib.parse import quote_plus
from pathlib import Path
import sys
import pysubs2
import gc
import zipfile
import asyncio

# Enable nested asyncio in Jupyter Notebook
# nest_asyncio.apply()

# assert file_name != ""
# assert language != ""
import warnings
warnings.filterwarnings("ignore")

file_basenames = []

if use_drive:
    output_dir = os.path.dirname(drive_dir[0])
    try:
        file_names = drive_dir
        for i in range(len(file_names)):
          file_basenames.append(file_names[i].split('.')[0])
        # print(file_name)
        output_dir = os.path.dirname(drive_dir[0])
    except Exception as e:
            print(f'error: {e}')
else:
    sys.path.append('/drive/content')
    if not os.path.exists(file_names[0]):
      raise ValueError(f"No {file_names[0]} found in current path.")
    else:
        try:
            for i in range(len(file_names)):
              file_basenames.append(Path(file_names[i]).stem)
            output_dir = Path(file_names[0]).parent.resolve()
            # print(file_basename)
            # print(output_dir)
        except Exception as e:
            print(f'error: {e}')


clear_output()
print('加载模型 Loading model...')

model = WhisperModel(model_size)
torch.cuda.empty_cache()

for i in range(len(file_names)):
  file_name = file_names[i]
  #Transcribe
  file_basename = file_basenames[i]
  if file_type == "video":
    print('提取音频中 Extracting audio from video file...')
    os.system(f'ffmpeg -i {file_name} -f mp3 -ab 192000 -vn {file_basename}.mp3')
    print('提取完毕 Done.')
  # print(file_basename)
  tic = time.time()
  clear_output()
  print('识别中 Transcribe in progress...')

  if beam_size_off:
    segments, info = model.transcribe(audio = f'{file_name}',
                                          language=language,
                                          vad_filter=is_vad_filter,
                                          vad_parameters=dict(min_silence_duration_ms=1000))
  else:
    segments, info = model.transcribe(audio = f'{file_name}',
                                          beam_size=set_beam_size,
                                          language=language,
                                          vad_filter=is_vad_filter,
                                          vad_parameters=dict(min_silence_duration_ms=1000))

  # segments is a generator so the transcription only starts when you iterate over it
  # to use pysubs2, the argument must be a segment list-of-dicts
  total_duration = round(info.duration, 2)  # Same precision as the Whisper timestamps.
  results= []
  with tqdm(total=total_duration, unit=" seconds") as pbar:
      for s in segments:
          segment_dict = {'start':s.start,'end':s.end,'text':s.text}
          results.append(segment_dict)
          segment_duration = s.end - s.start
          pbar.update(segment_duration)


  #Time comsumed
  toc = time.time()
  print('识别完毕 Done')
  print(f'Time consumpution {toc-tic}s')

  subs = pysubs2.load_from_whisper(results)
  srt_filename = file_basename + '.srt'
  subs.save(srt_filename)

  from srt2ass import srt2ass
  ass_filename  = srt2ass(srt_filename, sub_style, is_split,split_method)
  print('ASS subtitle saved as: ' + ass_filename )

  if i+1 ==1:
    #一个文件则直接下载
    files.download(ass_filename )
  else:
    # 用压缩包来处理所有下载，避免多个下载触发浏览器限制，必须要跟用户交互才能继续
    zip_filename = file_basename+".zip"
    with zipfile.ZipFile(zip_filename, 'w') as zipf:
      if export_srt == 'Yes':
          zipf.write(srt_filename)
      zipf.write(ass_filename)

    # Trigger the download asynchronously
    files.download(zip_filename)

  print('第',i+1,'个文件字幕生成完毕/',i+1, 'file(s) was completed!')
  torch.cuda.empty_cache()

print('所有字幕生成完毕 All done!')

# 如果设定了自动关闭连接，这里将释放Colab资源
# disconnect_runtime()


识别中 Transcribe in progress...


 99%|█████████▉| 1816.28/1834.97 [02:09<00:01, 14.01 seconds/s]           

识别完毕 Done
Time consumpution 143.53182077407837s
ASS subtitle saved as: output.ass





<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

第 1 个文件字幕生成完毕/ 1 file(s) was completed!
所有字幕生成完毕 All done!


In [None]:
#@title **【实验功能】Experimental Features:**

# @markdown **AI文本翻译/AI Translation:**
# @markdown **</br>**<font size="2"> 此功能允许用户使用AI翻译服务对识别的字幕文件做逐行翻译，并以相同的格式生成双语对照字幕。
# @markdown **</br>**阅读项目文档以了解更多。</font>
# @markdown **</br>**<font size="2"> This feature allow users to translate previously transcribed subtitle text line by line using AI translation.
# @markdown **</br>**Then generate bilingual subtitle files in same sub style.Read documentaion to learn more.</font>

# @markdown **</br>**希望在本地使用字幕翻译功能的用户，推荐尝试 [subtitle-translator-electron](https://github.com/gnehs/subtitle-translator-electron)

# @markdown **</br><font size="3">Select subtitle file source</br>
# @markdown <font size="3">选择字幕文件(使用上一步的转录-use_transcribed/新上传-upload_new）</br>**
# @markdown <font size="2">支持SRT与ASS文件
sub_source = "upload_new"  # @param ["use_transcribed","upload_new"]

# @markdown **chatGPT:**
# @markdown **</br>**<font size="2"> 要使用chatGPT翻译，请填入你自己的OpenAI API Key，目标语言，输出类型，然后执行单元格。</font>
# @markdown **</br>**<font size="2"> Please input your own OpenAI API Key, then execute this cell.</font>
# @markdown **</br>**<font size="2">【注意】 免费的API对速度有所限制，需要较长时间，用户可以自行考虑付费方案。</font>
# @markdown **</br>**<font size="2">【Note】There are limitaions on usage for free API, consider paid plan to speed up.</font>
openai_key = '' # @param {type:"string"}
target_language = 'zh-hans'# @param ["zh-hans","english"]
prompt = "You are a language expert.Your task is to translate the input subtitle text, sentence by sentence, into the user specified target language.However, please utilize the context to improve the accuracy and quality of translation.Please be aware that the input text could contain typos and grammar mistakes, utilize the context to correct the translation.Please return only translated content and do not include the origin text.Please do not use any punctuation around the returned text.Please do not translate people's name and leave it as original language.\"" # @param {type:"string"}
temperature = 0.6 #@param {type:"slider", min:0, max:1.0, step:0.1}
# @markdown <font size="4">Default prompt: </br>
# @markdown ```You are a language expert.```</br>
# @markdown ```Your task is to translate the input subtitle text, sentence by sentence, into the user specified target language.```</br>
# @markdown ```Please utilize the context to improve the accuracy and quality of translation.```</br>
# @markdown ```Please be aware that the input text could contain typos and grammar mistakes, utilize the context to correct the translation.```</br>
# @markdown ```Please return only translated content and do not include the origin text.```</br>
# @markdown ```Please do not use any punctuation around the returned text.```</br>
# @markdown ```Please do not translate people's name and leave it as original language.```</br>
output_format = "ass"  # @param ["ass","srt"]

import sys
import os
import re
import time
import codecs
import regex as re
from pathlib import Path
from tqdm import tqdm
from google.colab import files
from IPython.display import clear_output

clear_output()

if sub_source == 'upload_new':
  uploaded = files.upload()
  sub_name = list(uploaded.keys())[0]
  sub_basename = Path(sub_name).stem
elif sub_source == 'use_transcribed':
  sub_name = file_basenames[0] +'.ass'
  sub_basename = file_basenames[0]

!pip install openai
!pip install pysubs2
from openai import OpenAI
import pysubs2

clear_output()

class ChatGPTAPI():
    def __init__(self, key, language, prompt, temperature):
        self.key = key
        # self.keys = itertools.cycle(key.split(","))
        self.language = language
        self.key_len = len(key.split(","))
        self. prompt = prompt
        self.temperature = temperature


    # def rotate_key(self):
    #     openai.api_key = next(self.keys)

    def translate(self, text):
        # print(text)
        # self.rotate_key()
        client = OpenAI(
            api_key=self.key,
            )

        try:
            completion = client.chat.completions.create(
                model="gpt-3.5-turbo",
                messages=[
                    {
                        "role": "system",
                        # english prompt here to save tokens
                        "content": f'{self.prompt}'
                    },
                    {
                        "role":"user",
                        "content": f"Original text:`{text}`. Target language: {self.language}"
                    }
                ],
                temperature=self.temperature
            )
            t_text = (
                completion.choices[0].message.content.encode("utf8").decode()
            )
            total_tokens = completion.usage.total_tokens # include prompt_tokens and completion_tokens
        except Exception as e:
            # TIME LIMIT for open api , pay to reduce the waiting time
            sleep_time = int(60 / self.key_len)
            time.sleep(sleep_time)
            print(e, f"will sleep  {sleep_time} seconds")
            # self.rotate_key()
            client = OpenAI(
            api_key=self.key,
            )
            completion = client.chat.completions.create(
                model="gpt-3.5-turbo",
                messages=[
                    {
                        "role": "system",
                        "content": f'{self.prompt}'
                    },
                    {
                        "role": "user",
                        "content": f"Original text:`{text}`. Target language: {self.language}"
                    }
                ],
                temperature=self.temperature
            )
            t_text = (
                completion.choices[0].message.content.encode("utf8").decode()
            )
        total_tokens = completion.usage.total_tokens
        return t_text, total_tokens


class SubtitleTranslator():
    def __init__(self, sub_src, model, key, language, prompt,temperature):
        self.sub_src = sub_src
        self.translate_model = model(key, language,prompt,temperature)
        self.translations = []
        self.total_tokens = 0

    def calculate_price(self,num_tokens):
        price_per_token = 0.000002 #gpt-3.5-turbo	$0.002 / 1K tokens
        return num_tokens * price_per_token

    def translate_by_line(self):
        sub_trans = pysubs2.load(self.sub_src)
        total_lines = len(sub_trans)
        for line in tqdm(sub_trans,total = total_lines):
            line_trans, tokens_per_task = self.translate_model.translate(line.text)
            line.text += (r'\N'+ line_trans)
            print(line_trans)
            self.translations.append(line_trans)
            self.total_tokens += tokens_per_task

        return sub_trans, self.translations, self.total_tokens


clear_output()

translate_model = ChatGPTAPI

assert translate_model is not None, "unsupported model"
OPENAI_API_KEY = openai_key

if not OPENAI_API_KEY:
    raise Exception(
        "OpenAI API key not provided, please google how to obtain it"
    )
# else:
#     OPENAI_API_KEY = openai_key

t = SubtitleTranslator(
    sub_src=sub_name,
    model= translate_model,
    key = OPENAI_API_KEY,
    language=target_language,
    prompt=prompt,
    temperature=temperature)

translation, _, total_token = t.translate_by_line()
total_price = t.calculate_price(total_token)
#Download ass file

if output_format == 'ass':
  translation.save(sub_basename + '_translation.ass')
  files.download(sub_basename + '_translation.ass')
elif output_format == 'srt':
  translation.save(sub_basename + '_translation.srt')
  files.download(sub_basename + '_translation.srt')



print('双语字幕生成完毕 All done!')
print(f"Total number of tokens used: {total_token}")
print(f"Total price (USD): ${total_price:.4f}")

# @markdown **</br>**<font size='3'>**实验功能的开发亦是为了尝试帮助大家更有效率的制作字幕。但是只有在用户实际使用体验反馈的基础上，此应用才能不断完善，如果您有任何想法，都欢迎以任何方式联系我，提出[issue](https://github.com/Ayanaminn/N46Whisper/issues)或者分享在[讨论区](https://github.com/Ayanaminn/N46Whisper/discussions)。**
# @markdown **</br>**<font size='3'>**The efficacy of this application cannot get improved without the feedbacks from everyday users.Please feel free to share your thoughts with me or post it [here](https://github.com/Ayanaminn/N46Whisper/discussions)**

In [33]:
#@title **【实验功能】Experimental Features:**

# @markdown **Google Gemini AI文本翻译/Google Gemini AI Translation:**
# @markdown **</br>**<font size="2"> 由于谷歌Gemini提供免费的API，想要免费使用AI翻译的用户可以执行该单元格。
# @markdown **</br>**阅读项目文档以了解更多。</font>
# @markdown **</br>**<font size="2"> Since Google Gemini provides a free tier API, the users that want to use free AI translations can execute this block of code.
# @markdown **</br>**Then generate bilingual subtitle files in same sub style.Read documentaion to learn more.</font>

# @markdown **注意：同时执行Whisper翻译和Gemini API翻译有可能遇到runtime问题，建议在disconnect runtime之后重新执行该单元格**

# @markdown **Attention: Executing Whisper and Gemini translation at the same time might run into runtime errors, we recommend that the users disconnect their runtimes before executing this block**
output_format = "ass"  # @param ["ass","srt"]

# @markdown **Google Gemini:**
# @markdown **</br>**<font size="2"> 要使用Gemini翻译，请填入你自己的Gemini API Key，目标语言，输出类型，然后执行单元格。</font>
# @markdown **</br>**<font size="2"> Please input your own Gemini API Key, then execute this cell.</font>

google_api_key = 'AIzaSyCfbb3h7eXhtWu_cpwiyhtYKZSNhyMgbFY' # @param {type:"string"}
target_language = 'zh-hans'# @param ["zh-hans","english"]
prompt = "You are a language expert.Your task is to translate the input subtitle text, sentence by sentence, into {target_language}.However, please utilize the context to improve the accuracy and quality of translation.Please be aware that the input text could contain typos and grammar mistakes, utilize the context to correct the translation.Please return only translated content and do not include the origin text. Do not return your thinking process and only return the translated text. Please do not use any punctuation around the returned text.Please do not translate people's name and leave it as original language. Here is the text to translate: {text}\"" # @param {type:"string"}
prompt_long = "You are a language expert and a nogizaka46's fan.The text you will translate is a cut from a stream for fans.Your task is to translate the input subtitle text, each line must be translated into a dependent line and the user specified target language.However, please utilize the context to improve the accuracy and quality of translation.If there are two same lines, you shouldn't ignore them and must translate it into the two same lines.Please be aware that the input text could contain typos and grammar mistakes, utilize the context to correct the translation.Please return only translated content and do not include the origin text.Please must not combine two lines into one line, the number of lines you output must be equal to the orginal number of lines.Please do not use any punctuation around the returned text.Please must not translate people's name and leave it as original language.\"" # @param {type:"string"}
temperature = 0.6 #@param {type:"slider", min:0, max:1.0, step:0.1}
# @markdown <font size="4">Default prompt: </br>
# @markdown ```You are a language expert.```</br>
# @markdown ```Your task is to translate the input subtitle text, sentence by sentence, into the user specified target language.```</br>
# @markdown ```Please utilize the context to improve the accuracy and quality of translation.```</br>
# @markdown ```Please be aware that the input text could contain typos and grammar mistakes, utilize the context to correct the translation.```</br>
# @markdown ```Please return only translated content and do not include the origin text.```</br>
# @markdown ```Please do not use any punctuation around the returned text.```</br>
# @markdown ```Please do not translate people's name and leave it as original language.```</br>

import sys
import os
import re
import time
import codecs
import regex as re
from pathlib import Path
from tqdm import tqdm
from google.colab import files
from IPython.display import clear_output

uploaded = files.upload()
sub_name = list(uploaded.keys())[0]
sub_basename = Path(sub_name).stem

clear_output()

!pip install -q -U google-generativeai
!pip install pysubs2

from google import genai
from google.genai import types
import pysubs2

client = genai.Client(api_key=google_api_key)

def translate(prompt, language, text, retry_times=0):
        try:
            safety_settings = [
                types.SafetySetting(category="HARM_CATEGORY_HATE_SPEECH", threshold="BLOCK_NONE"),
                types.SafetySetting(category="HARM_CATEGORY_HARASSMENT", threshold="BLOCK_NONE"),
                types.SafetySetting(category="HARM_CATEGORY_SEXUALLY_EXPLICIT", threshold="BLOCK_NONE"),
                types.SafetySetting(category="HARM_CATEGORY_DANGEROUS_CONTENT", threshold="BLOCK_NONE"),
            ]
            response = client.models.generate_content_stream(
                model="gemini-2.5-flash-preview-04-17",
                config=types.GenerateContentConfig(
                    system_instruction=prompt,safety_settings = safety_settings,temperature = 0.6),
                contents="target language :" + language + "text: " + text,
            )
            text =""
            for chunk in response:
                text += chunk.text
                print(chunk.text, end="")
            return text
        except Exception as e:
            if re.search(r"^429 POST|Remote end closed connection|Connection reset by peer", str(e), flags=re.I) and retry_times < 6:
                print("翻译接口请求过于频繁或被断开，将再次重试，重试次数: %d" % (retry_times + 1))
                print("The translation interface request is too frequent or disconnected. Will try again. Number of retries: %d" % (retry_times + 1))
                time.sleep(min(retry_times + 1, 3))
                return translate(prompt, language, text, retry_times + 1)
            else:
                # Since Google API should not run into runtime error, this would be an unknown error
                print(str(e))
                print("未知错误，用户可以尝试查看报错信息并在Repository里提交issue")
                print("Unknown Error, please check the error log and open an issue in the repository")
                return ">>>>> UnknownError"
class SubtitleTranslator():
    def __init__(self, sub_src):
        self.sub_src = sub_src
        self.translations = []
        self.multiline = 50

    def translate_by_multilines(self):
        sub_trans = pysubs2.load(self.sub_src)
        lines_grouped = [sub_trans[i:i + self.multiline] for i in range(0, len(sub_trans), self.multiline)]
        total_lines = len(lines_grouped)
        for line in tqdm(lines_grouped,total = total_lines):
            line_trans = translate(prompt, target_language, '\n'.join(map(lambda sline:sline.text,line)))
            line_trans = line_trans.split('\n')
            print(len(line),len(line_trans))
            for i in range(len(line)):
                line[i].text += (r'\N'+ line_trans[i])
                print(line_trans[i])
                self.translations.append(line_trans)
        return sub_trans, self.translations

    def translate_by_line(self):
        sub_trans = pysubs2.load(self.sub_src)
        total_lines = len(sub_trans)
        for line in tqdm(sub_trans,total = total_lines):
            line_trans = translate(prompt, target_language, line.text)
            line.text += (r'\N'+ line_trans)
            print(line_trans)
            self.translations.append(line_trans)
        return sub_trans, self.translations

    def translate_once(self):
        sub_trans = pysubs2.load(self.sub_src)
        line_trans = translate(prompt, target_language, '\n'.join(map(lambda line:line.text,sub_trans)))
        line_trans = line_trans.split('\n')
        print(len(sub_trans),len(line_trans))
        for i in range(len(sub_trans)):
            sub_trans[i].text += (r'\N'+ line_trans[i])
            self.translations.append(line_trans)
        return sub_trans, self.translations


clear_output()

if not google_api_key:
    raise Exception(
        "Google Gemini API key not provided, please google how to obtain it"
    )

t = SubtitleTranslator(sub_src=sub_name)

translation, _, = t.translate_by_multilines()

if output_format == 'ass':
  translation.save(sub_basename + '_translation.ass')
  files.download(sub_basename + '_translation.ass')
elif output_format == 'srt':
  translation.save(sub_basename + '_translation.srt')
  files.download(sub_basename + '_translation.srt')

print('双语字幕生成完毕 All done!')

  0%|          | 0/9 [00:00<?, ?it/s]

各位晚安
好的 晚安
是nogiobi
這是久違的nogiobi 今天是
晚安
今天是5月14日呢
是星期三
是星期三
應該是久違了吧
蠻
晚安
今天好好地自己化了妝
這個臥蠶
晚安
啊 有章魚在飛
是章魚對吧 好厲害
玫瑰和星星也在落下
今天也總算
總算
今天也輕鬆地
覺得能像我一樣說話就好了
啊 貓舌
這樣啊
mao和nagi一起做的對吧
謝謝
欸 怎麼辦
因為是久違了
要說什麼好呢
各位 巴士拉快到了呢
各位
糟了
欸 3天後
是3天後之類的
3天後之類的糟了
巴士拉我會加油的
因為快到了
欸 總覺得天氣
總覺得怎麼樣來著
我會稍微努力的
晚安
要注意雨喔
好的 那麼就稍微立刻
想來做上次成員給的作業
上次的成員呢
是這個
nao的畫
可愛地

 11%|█         | 1/9 [00:38<05:07, 38.40s/it]

對nao生氣
mao醬
是mao醬的繪畫作業
總覺得稍微看了mao的直播50 50
各位晚安
好的 晚安
是nogiobi
這是久違的nogiobi 今天是
晚安
今天是5月14日呢
是星期三
是星期三
應該是久違了吧
蠻
晚安
今天好好地自己化了妝
這個臥蠶
晚安
啊 有章魚在飛
是章魚對吧 好厲害
玫瑰和星星也在落下
今天也總算
總算
今天也輕鬆地
覺得能像我一樣說話就好了
啊 貓舌
這樣啊
mao和nagi一起做的對吧
謝謝
欸 怎麼辦
因為是久違了
要說什麼好呢
各位 巴士拉快到了呢
各位
糟了
欸 3天後
是3天後之類的
3天後之類的糟了
巴士拉我會加油的
因為快到了
欸 總覺得天氣
總覺得怎麼樣來著
我會稍微努力的
晚安
要注意雨喔
好的 那麼就稍微立刻
想來做上次成員給的作業
上次的成員呢
是這個
nao的畫
可愛地對nao生氣
mao醬
是mao醬的繪畫作業
總覺得稍微看了mao的直播
まお用關西腔
說著像帥哥一樣的台詞對吧
我用可愛的なおなお在生氣
前陣子在TikTok上
和まお一起
做了像是生氣的影片
那個有點想和まお一起做
就約了まお
生氣了
很開心
我那天是線下見面會的日子
嗯其實其實というか
讓化妝師幫我弄了非常非常可愛的髮型
雖然是先做作業這樣的話題
嗯怎麼說呢
不像是半紮髮那種微捲
而是普通的直髮半紮髮
然後被告知要用那個髮型拍TikTok
應該說是反正被告知要拍TikTok
啊既然這樣就用這個髮型拍吧想著
就在想著要這樣拍的瞬間
嗯因為和松尾さん聊了一下
聊得非常起勁
結果就忘了要拍TikTok這件事
然後跟松尾さん說著話
結果化妝師就說
なおちゃん頭髮要拍囉
被告知已經沒有要拍了
啊好我拍說著
然後我真的完全忘了要拍TikTok
就拍了
非常可愛的
明明做了半紮髮之類的
所以有點是直髮
像這樣普通地放下來
因為這裡

 22%|██▏       | 2/9 [00:48<02:30, 21.50s/it]

之類的地方做了半紮髮
直到剛才都還是鼓起來的
那個生氣的影片
哎呀我為什麼會忘了呢
這樣想著
最近為了和那位松尾さん變親近
聊了很多
好的啊這個這個必須做
用可愛的なおなお在生氣
是什麼用可愛的なおなお在生氣
怎麼辦好煩躁
欸不知道好煩躁
好奇怪怎麼辦是什麼呢
生氣
好的剛才那個50 50
まお用關西腔
說著像帥哥一樣的台詞對吧
我用可愛的なおなお在生氣
前陣子在TikTok上
和まお一起
做了像是生氣的影片
那個有點想和まお一起做
就約了まお
生氣了
很開心
我那天是線下見面會的日子
嗯其實其實というか
讓化妝師幫我弄了非常非常可愛的髮型
雖然是先做作業這樣的話題
嗯怎麼說呢
不像是半紮髮那種微捲
而是普通的直髮半紮髮
然後被告知要用那個髮型拍TikTok
應該說是反正被告知要拍TikTok
啊既然這樣就用這個髮型拍吧想著
就在想著要這樣拍的瞬間
嗯因為和松尾さん聊了一下
聊得非常起勁
結果就忘了要拍TikTok這件事
然後跟松尾さん說著話
結果化妝師就說
なおちゃん頭髮要拍囉
被告知已經沒有要拍了
啊好我拍說著
然後我真的完全忘了要拍TikTok
就拍了
非常可愛的
明明做了半紮髮之類的
所以有點是直髮
像這樣普通地放下來
因為這裡之類的地方做了半紮髮
直到剛才都還是鼓起來的
那個生氣的影片
哎呀我為什麼會忘了呢
這樣想著
最近為了和那位松尾さん變親近
聊了很多
好的啊這個這個必須做
用可愛的なおなお在生氣
是什麼用可愛的なおなお在生氣
怎麼辦好煩躁
欸不知道好煩躁
好奇怪怎麼辦是什麼呢
生氣
好的剛才那個
嘟嘴生氣是什麼呢
希望真央能示範一下
真央醬示範一下嘟嘴生氣
結束了
大概過了7分鐘
欸怎麼辦乃木坂obi選手權要開始了嗎
吐舌頭
是說吐舌頭嗎
嘟嘴生氣大概不是所以下一個
好的乃木坂obi選手權就是這樣
這週的比賽是繼上上週
配合黃金週的連續假期抽籤
箱子裡有前端是紅色的國定假日免洗筷10根和
前端是黑色的平日免洗筷5根總共15根
一根一根抽免洗筷
聽說是比賽連續能抽到幾次國定假日
因為抽到平日就結束了
能抽到越長連續假期的人就贏
這樣就能獲得很棒的禮物
所以我想稍微努力看看
那麼我想開始抽了
來來來欸是誰抽到最多的啊
えりか桑上上週有2個
えむき桑連續抽到了3次
我真的太不走運了
因為沒運氣大概是第一次吧
說什麼第一次啊不知道會怎樣
那麼我想攪拌一下再抽

 33%|███▎      | 3/9 [01:04<01:53, 18.98s/it]

次對吧
因為ゆみき桑是3次
再來加油吧我拜託了50 50
嘟嘴生氣是什麼呢
希望真央能示範一下
真央醬示範一下嘟嘴生氣
結束了
大概過了7分鐘
欸怎麼辦乃木坂obi選手權要開始了嗎
吐舌頭
是說吐舌頭嗎
嘟嘴生氣大概不是所以下一個
好的乃木坂obi選手權就是這樣
這週的比賽是繼上上週
配合黃金週的連續假期抽籤
箱子裡有前端是紅色的國定假日免洗筷10根和
前端是黑色的平日免洗筷5根總共15根
一根一根抽免洗筷
聽說是比賽連續能抽到幾次國定假日
因為抽到平日就結束了
能抽到越長連續假期的人就贏
這樣就能獲得很棒的禮物
所以我想稍微努力看看
那麼我想開始抽了
來來來欸是誰抽到最多的啊
えりか桑上上週有2個
えむき桑連續抽到了3次
我真的太不走運了
因為沒運氣大概是第一次吧
說什麼第一次啊不知道會怎樣
那麼我想攪拌一下再抽
抽到紅色就好了對吧
抽到紅色就好了所以
我今年能抽到啊
真開心呢獲得了一天休假
目標是希望能有大概一個禮拜對吧
那麼我要去了
拜託了下次如果抽到紅色抽到
我就買蛋糕之類的給自己一個獎勵
我來了
果然很帶運氣呢
你看這樣不給你看也知道吧
是紅色的喔
欸好開心
蛋糕來了呢
下次要選什麼呢
下次要選什麼呢
下次嘛嘛嘛
下次嘛是啊
冰淇淋冰淇淋吧
現在是2次對吧
因為ゆみき桑是3次
再來加油吧我拜託了
守護靈守護靈的請多指教
出來了呢 果然是黑色的呢
是兩天嗎
休息日明明有10個行程
有人說只是普通的六日
請不要這樣說啊
我寫了喔
兩天啊 稍微再多一點就好了
明明想要一個禮拜的
嗯嗯嗯 很高興
耳朵
我啊
有各種各樣的綽號喔
Tommy桑
Tommy醬 Otomi桑
Nao Nao Nao Nao Mochimochi之類的呢
所以今天稍微寫了Tommy
是零呢
Yumiya桑也
啊原來如此 不過啊 說的也是呢
Nogiobi選手權的禮物
因為真的很棒
我其實很想要呢
真可惜
也就是說
自由談話的時間到了
今天我進行得蠻順利的吧
到這裡呢
來決定作業吧
咦 還早吧
那自由談話稍微說一下吧
要說什麼呢
我去了那個Nagi的家喔
Nagi這樣邀請了我
我去Nagi家打擾了
雖然是晚上
就想說想做點什麼呢
就決定來做那個漢堡排了喔
然後一起去買東西之類的
雖然沒說什麼
被拜託說「幫我帶這個來喔」
我說OK
結果帶過去卻是「那個不是喔」這樣
啊啊之類的感覺
也有被退回的

 44%|████▍     | 4/9 [01:15<01:20, 16.12s/it]

「你可以坐著沒關係喔」
但我想說既然難得 我也想一起做
我好好地揉了50 50
守護靈守護靈的請多指教
出來了呢 果然是黑色的呢
是兩天嗎
休息日明明有10個行程
有人說只是普通的六日
請不要這樣說啊
我寫了喔
兩天啊 稍微再多一點就好了
明明想要一個禮拜的
嗯嗯嗯 很高興
耳朵
我啊
有各種各樣的綽號喔
Tommy桑
Tommy醬 Otomi桑
Nao Nao Nao Nao Mochimochi之類的呢
所以今天稍微寫了Tommy
是零呢
Yumiya桑也
啊原來如此 不過啊 說的也是呢
Nogiobi選手權的禮物
因為真的很棒
我其實很想要呢
真可惜
也就是說
自由談話的時間到了
今天我進行得蠻順利的吧
到這裡呢
來決定作業吧
咦 還早吧
那自由談話稍微說一下吧
要說什麼呢
我去了那個Nagi的家喔
Nagi這樣邀請了我
我去Nagi家打擾了
雖然是晚上
就想說想做點什麼呢
就決定來做那個漢堡排了喔
然後一起去買東西之類的
雖然沒說什麼
被拜託說「幫我帶這個來喔」
我說OK
結果帶過去卻是「那個不是喔」這樣
啊啊之類的感覺
也有被退回的情況
我們一起做了那個漢堡排
啊 我也做了
她說「你可以坐著沒關係喔」
但我想說既然難得 我也想一起做
我好好地揉了
欸真的啊Nagisa她很厲害喔
她是料理的天才
我以前聖誕派對的時候五期生聚在一起時
那個Nagisa做了炸雞給我吃
我吃了那個時候真的非常感動喔
想說真好吃
我想說總有一天絕對要再吃Nagisa做的飯
然後她做了漢堡排
嗯不過她在很多我沒看到的地方
都有幫忙弄一些小東西
我呢就是負責揉麵團
還有在旁邊加油
我有好好揉喔
然後想說要做起司起司漢堡排
還有把起司放上去之類的也有做
真的非常好吃
真的超級好吃
超級感動然後跟她說絕對會再去喔
而且Nagisa她真的好厲害喔
除了漢堡排以外還做了其他東西給我吃
像是豬肉料理之類的
還有餃子也有端出來給我
還有麵包也有端出來
而且超級好吃
總覺得我那時候真的沒有什麼精神
該怎麼說呢
就是非常沒有那種精神
但是Nagisa邀請了我
吃了好多東西精神就恢復了好多
玩得非常開心
總覺得從那之後大概一個月
都非常開心地努力著
我覺得是因為Nagisa我才能努力著
那時候Aruno之類的也有
邀請我說要不要來家裡
不過那時候有點沒辦法去
有點想去Aruno家之類的
還有想一起出去玩

 56%|█████▌    | 5/9 [01:24<00:53, 13.49s/it]

耶50 50
欸真的啊Nagisa她很厲害喔
她是料理的天才
我以前聖誕派對的時候五期生聚在一起時
那個Nagisa做了炸雞給我吃
我吃了那個時候真的非常感動喔
想說真好吃
我想說總有一天絕對要再吃Nagisa做的飯
然後她做了漢堡排
嗯不過她在很多我沒看到的地方
都有幫忙弄一些小東西
我呢就是負責揉麵團
還有在旁邊加油
我有好好揉喔
然後想說要做起司起司漢堡排
還有把起司放上去之類的也有做
真的非常好吃
真的超級好吃
超級感動然後跟她說絕對會再去喔
而且Nagisa她真的好厲害喔
除了漢堡排以外還做了其他東西給我吃
像是豬肉料理之類的
還有餃子也有端出來給我
還有麵包也有端出來
而且超級好吃
總覺得我那時候真的沒有什麼精神
該怎麼說呢
就是非常沒有那種精神
但是Nagisa邀請了我
吃了好多東西精神就恢復了好多
玩得非常開心
總覺得從那之後大概一個月
都非常開心地努力著
我覺得是因為Nagisa我才能努力著
那時候Aruno之類的也有
邀請我說要不要來家裡
不過那時候有點沒辦法去
有點想去Aruno家之類的
還有想一起出去玩之類的
如果說有時間的話呢
我想再一起做
對了Nagisa問我說下次想吃什麼
你們覺得什麼比較好呢?
什麼比較好呢?
不不過我也會幫忙啦
餃子?馬鈴薯燉肉?
蛋包飯?
Nagisa我想吃萩餅
Nagisa我想吃萩餅啊
馬鈴薯燉肉
啊不錯耶不錯耶高麗菜捲也不錯耶
我肚子要餓了
對然後呢
也玩了Overcooked
Overcooked
然後なぎ沒玩過
所以她把廚房燒起來了
然後我用滅火器幫她滅了
對非常開心
還有就是楓さん畢業了
雖然很寂寞
在線見面會結束幾天後
她約我去吃飯了
那時候我有拍攝工作
工作結束時她打電話給我
問我說Naonao現在要去哪
我說「好」 她就說「去吃飯吧」
我們就興高采烈地說「去吧！」
就去吃了
我有點事想在這裡向大家報告
楓さん打翻了麥茶
雖然吃了飯
但她打翻了麥茶
我之前跟
楓さん辦章魚燒派對時
她也把章魚燒粉灑到褲子上
當時她就「啊」了一下
麥茶也打翻了
畢業後也打翻了
我們兩個手忙腳亂的
但是非常開心的時光
飯也很好吃
是啊總覺得
快樂的回憶越來越多了呢
然後呢相機
相機最近真的都沒碰
所以有點
擔心拍照技術是不是退步了
雖然這麼想
但今天稍微拍了一下
拍得還不錯
想做成員的寫真集
說是想做不如說
像あや的寫真集

 67%|██████▋   | 6/9 [01:38<00:40, 13.50s/it]

兩年左右過去了呢
沒過那麼久嗎50 50
我肚子要餓了
對然後呢
也玩了Overcooked
Overcooked
然後なぎ沒玩過
所以她把廚房燒起來了
然後我用滅火器幫她滅了
對非常開心
還有就是楓さん畢業了
雖然很寂寞
在線見面會結束幾天後
她約我去吃飯了
那時候我有拍攝工作
工作結束時她打電話給我
問我說Naonao現在要去哪
我說「好」 她就說「去吃飯吧」
我們就興高采烈地說「去吧！」
就去吃了
我有點事想在這裡向大家報告
楓さん打翻了麥茶
雖然吃了飯
但她打翻了麥茶
我之前跟
楓さん辦章魚燒派對時
她也把章魚燒粉灑到褲子上
當時她就「啊」了一下
麥茶也打翻了
畢業後也打翻了
我們兩個手忙腳亂的
但是非常開心的時光
飯也很好吃
是啊總覺得
快樂的回憶越來越多了呢
然後呢相機
相機最近真的都沒碰
所以有點
擔心拍照技術是不是退步了
雖然這麼想
但今天稍微拍了一下
拍得還不錯
想做成員的寫真集
說是想做不如說
像あや的寫真集那樣
像手工寫真集那樣
我因為喜歡相機所以會做這些
一直想著要幫あや做寫真集
一直這麼想著
從那時候起已經一年左右
還是兩年左右過去了呢
沒過那麼久嗎
已經過了相當久的時間了
完全沒有進展
還為了那個買了衣服什麼的
還買了Ayano的衣服
想說把那個當作生日禮物送給她
然後穿著那個來拍照
但那時候好像也很忙
一直沒辦法兩個人一起去外面拍照
那件衣服也一直沒能送出去
現在還睡著呢
希望能在某個時間點
送給她
對了 我想在花田裡拍Ayano
希望Ayano能在花田裡
拿著花
想拍她輕飄飄的樣子
今年能去嗎
7月 7月
是鏡球
總之希望能在某個地方去
是這樣啊
啊 寢movera很好呢
對對對對
啊 向日葵田絕對很適合Ayano呢
對了 和Roki-chan 6期生的大家
還不太能好好說上話
前幾天彩排的時候
她們稍微跟我搭話了
感覺非常有點
像是「請問您是？」的感覺
然後跟我搭話
我想說是不是發生了什麼事
就問「怎麼了？」
結果被說「不好意思 那是我的站位」
哎呀 我真的覺得自己真是沒用
我已經不行了
我真的為什麼啊
為什麼當不了前輩啊
她們真的非常小心翼翼地跟我搭話
我還很前輩地問「怎麼了？」
像個前輩一樣問「怎麼了？」
像是「什麼都可以說哦」那樣
像是「我會聽你說的哦」

 78%|███████▊  | 7/9 [01:47<00:24, 12.15s/it]

那樣的感覺
都這麼說了
結果被說「那是我的站位」
啊~ 就變成「抱歉」了
所以從一開始我就已經啊
我在Roki-chan進來之前就說過了
就算被說「富里前輩 請教我這裡」
我也只能說「抱歉 我已經不懂了」50 50
已經過了相當久的時間了
完全沒有進展
還為了那個買了衣服什麼的
還買了Ayano的衣服
想說把那個當作生日禮物送給她
然後穿著那個來拍照
但那時候好像也很忙
一直沒辦法兩個人一起去外面拍照
那件衣服也一直沒能送出去
現在還睡著呢
希望能在某個時間點
送給她
對了 我想在花田裡拍Ayano
希望Ayano能在花田裡
拿著花
想拍她輕飄飄的樣子
今年能去嗎
7月 7月
是鏡球
總之希望能在某個地方去
是這樣啊
啊 寢movera很好呢
對對對對
啊 向日葵田絕對很適合Ayano呢
對了 和Roki-chan 6期生的大家
還不太能好好說上話
前幾天彩排的時候
她們稍微跟我搭話了
感覺非常有點
像是「請問您是？」的感覺
然後跟我搭話
我想說是不是發生了什麼事
就問「怎麼了？」
結果被說「不好意思 那是我的站位」
哎呀 我真的覺得自己真是沒用
我已經不行了
我真的為什麼啊
為什麼當不了前輩啊
她們真的非常小心翼翼地跟我搭話
我還很前輩地問「怎麼了？」
像個前輩一樣問「怎麼了？」
像是「什麼都可以說哦」那樣
像是「我會聽你說的哦」那樣的感覺
都這麼說了
結果被說「那是我的站位」
啊~ 就變成「抱歉」了
所以從一開始我就已經啊
我在Roki-chan進來之前就說過了
就算被說「富里前輩 請教我這裡」
我也只能說「抱歉 我已經不懂了」
一直覺得可能會變成那樣
和五期生的大家還有工作人員們聊著
結果真的變成那樣了的感覺
不過雖然發生了那樣的事
想普通地聊天
我是想如果能普通地聊天就好了
但我也有點意外地做不到
所以想稍微努力看看
等著有人來搭話
如果有正在看這個的孩子的話
雖然有點狡猾但我等著
是嗎 也有那樣的事呢
啊 對了 我稍微聊著聊著
就會聊很長
所以一個話題
我想稍微先決定一下作業吧
是啊 謝謝
那麼我想決定一下作業
那麼下次的成員還沒決定
但我想出個作業
那麼什麼比較好呢
大家夏天想去的地方 很好呢
用同樣的作業去吧 巴士的感想
啊～確實呢 怎麼辦呢
最近但我很想去旅行
哎呀 會變成我自己的話題了
欸～怎麼辦
一邊生氣一邊說夏天想見面的事
之類的怎麼樣
是啊 

 89%|████████▉ | 8/9 [01:55<00:10, 10.68s/it]

裡
好的 我問了
烤肉 很好呢
想烤肉啊
想吃好多肉啊
啊 生氣啊 忘記了
會加入生氣
會加入生氣
咦 我有說要加入生氣嗎
生氣 那麼就生氣吧
夏天想去的地方是哪裡
一邊生氣
好的 所以就來生氣吧
好的 我50 50
一直覺得可能會變成那樣
和五期生的大家還有工作人員們聊著
結果真的變成那樣了的感覺
不過雖然發生了那樣的事
想普通地聊天
我是想如果能普通地聊天就好了
但我也有點意外地做不到
所以想稍微努力看看
等著有人來搭話
如果有正在看這個的孩子的話
雖然有點狡猾但我等著
是嗎 也有那樣的事呢
啊 對了 我稍微聊著聊著
就會聊很長
所以一個話題
我想稍微先決定一下作業吧
是啊 謝謝
那麼我想決定一下作業
那麼下次的成員還沒決定
但我想出個作業
那麼什麼比較好呢
大家夏天想去的地方 很好呢
用同樣的作業去吧 巴士的感想
啊～確實呢 怎麼辦呢
最近但我很想去旅行
哎呀 會變成我自己的話題了
欸～怎麼辦
一邊生氣一邊說夏天想見面的事
之類的怎麼樣
是啊 我很想去旅行
想吃很多好吃的飯
太好了 先考慮這個作業
我絕對會為這個煩惱的
那麼就定為夏天想去的地方吧
夏天跑到上面去了
沒有那回事嗎
夏天想去的地方是哪裡
好的 我問了
烤肉 很好呢
想烤肉啊
想吃好多肉啊
啊 生氣啊 忘記了
會加入生氣
會加入生氣
咦 我有說要加入生氣嗎
生氣 那麼就生氣吧
夏天想去的地方是哪裡
一邊生氣
好的 所以就來生氣吧
好的 我
好的，所以
啊，還有兩分鐘呢
欸，說什麼好呢
我養了一隻狗狗
牠叫做Koko君
超級可愛的喔
大家有看過嗎
牠是博美犬和西施犬的
米克斯
超級可愛
毛茸茸的喔
之前蠻小的
現在還沒滿一歲
大概七個月六個月大
之前是這樣用單手
就能抱起來那麼小
現在要用雙手這樣抱
才能抱起來那麼大
雖然超級重的
但超級可愛
最近牠已經學會了乖乖的「握手」
還有「坐下」、「握手」、「換手」
以及「擊掌」
牠的頭腦蠻天才的呢
牠的頭腦很好，是天才
牠的頭腦還是蠻好的喔
牠蠻天才的，我們家人也
覺得牠如果好好學的話
可以學會很多把戲
很可愛
最近牠學會了散步
如果跟牠說「要去散步囉」
牠就會噠噠噠噠噠噠地
把牽繩拿過來喔
牠會咬著牽繩，超級可愛的呢
牠不聽話的時候，我就會說「散步」
雖然是騙牠，或是不能去的時候
我

100%|██████████| 9/9 [02:03<00:00, 13.74s/it]

還是會說「要去散步囉」
讓牠聽話過來
我是這樣做的
超級可愛
我在Mail裡發了很多照片
如果可以的話請大家看看
好的，所以
今天的乃木坂配信中就到此為止了
已經30分鐘了呢
幸好我先把那個作業做完了
謝謝大家
那麼再見囉 謝謝49 49
好的，所以
啊，還有兩分鐘呢
欸，說什麼好呢
我養了一隻狗狗
牠叫做Koko君
超級可愛的喔
大家有看過嗎
牠是博美犬和西施犬的
米克斯
超級可愛
毛茸茸的喔
之前蠻小的
現在還沒滿一歲
大概七個月六個月大
之前是這樣用單手
就能抱起來那麼小
現在要用雙手這樣抱
才能抱起來那麼大
雖然超級重的
但超級可愛
最近牠已經學會了乖乖的「握手」
還有「坐下」、「握手」、「換手」
以及「擊掌」
牠的頭腦蠻天才的呢
牠的頭腦很好，是天才
牠的頭腦還是蠻好的喔
牠蠻天才的，我們家人也
覺得牠如果好好學的話
可以學會很多把戲
很可愛
最近牠學會了散步
如果跟牠說「要去散步囉」
牠就會噠噠噠噠噠噠地
把牽繩拿過來喔
牠會咬著牽繩，超級可愛的呢
牠不聽話的時候，我就會說「散步」
雖然是騙牠，或是不能去的時候
我還是會說「要去散步囉」
讓牠聽話過來
我是這樣做的
超級可愛
我在Mail裡發了很多照片
如果可以的話請大家看看
好的，所以
今天的乃木坂配信中就到此為止了
已經30分鐘了呢
幸好我先把那個作業做完了
謝謝大家
那麼再見囉 謝謝





<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

双语字幕生成完毕 All done!


In [None]:
#@title **【实验功能】Experimental Features:**

# @markdown **Ollama AI文本翻译/Ollama AI Translation:**
# @markdown **</br>**<font size="2"> 使用Ollama来执行本地部署的LLM，想要免费使用AI翻译的用户可以执行以下单元格。
# @markdown **</br>**阅读项目文档以了解更多。</font>
# @markdown **</br>**<font size="2"> Since Ollama provides the ability to deploy LLMs locally, the users that want to use free AI translations can execute the following blocks of code.
# @markdown **</br>**Then generate bilingual subtitle files in same sub style.Read documentaion to learn more.</font>

In [None]:
#@title **下载Ollama Library/Importing Ollama Library**

!sudo apt update

!sudo apt install -y pciutils

!curl https://ollama.ai/install.sh | sh

In [None]:
#@title **初始化Ollama Server/Starting Ollama Server**


import threading
import subprocess
import time

def run_ollama_serve():
  subprocess.Popen(["ollama", "serve"])

thread = threading.Thread(target=run_ollama_serve)
thread.start()
time.sleep(5)

In [None]:
#@title **下载Ollama LLM/Pulling Ollama LLM**

# @markdown **用户可以在这里选择想要部署的LLM**

# @markdown **The user can choose the LLM type for the deployment here**

model_type = "deepseek-llm"  # @param ["llama3.2:3b", "deepseek-r1:7b", "deepseek-llm"]

!ollama pull $model_type

In [None]:
#@title **进行翻译/Translating The Subtitles**

!pip install -U langchain-ollama

from langchain_core.prompts import ChatPromptTemplate
from langchain_ollama.llms import OllamaLLM

import sys
import os
import re
import time
import codecs
import regex as re
from pathlib import Path
from tqdm import tqdm
from google.colab import files
from IPython.display import clear_output

uploaded = files.upload()
sub_name = list(uploaded.keys())[0]
sub_basename = Path(sub_name).stem

clear_output()

!pip install pysubs2

import pysubs2

output_format = "ass"  # @param ["ass","srt"]

target_language = 'zh-hans'# @param ["zh-hans","english"]
template = "You are a language expert.Your task is to translate the input subtitle text, sentence by sentence, into {target_language}.However, please utilize the context to improve the accuracy and quality of translation.Please be aware that the input text could contain typos and grammar mistakes, utilize the context to correct the translation.Please return only translated content and do not include the origin text. Do not return your thinking process and only return the translated text. Please do not use any punctuation around the returned text.Please do not translate people's name and leave it as original language. Here is the text to translate: {text}\"" # @param {type:"string"}

# @markdown <font size="4">Default prompt: </br>
# @markdown ```You are a language expert.```</br>
# @markdown ```Your task is to translate the input subtitle text, sentence by sentence, into {target_language}.```</br>
# @markdown ```Please utilize the context to improve the accuracy and quality of translation.```</br>
# @markdown ```Please be aware that the input text could contain typos and grammar mistakes, utilize the context to correct the translation.```</br>
# @markdown ```Please return only translated content and do not include the origin text.```</br>
# @markdown ```Do not return your thinking process and only return the translated text.```</br>
# @markdown ```Please do not use any punctuation around the returned text.```</br>
# @markdown ```Please do not translate people's name and leave it as original language.```</br>
# @markdown ```Here is the text to translate: {text}```</br>

llm = OllamaLLM(model=model_type)
prompt = ChatPromptTemplate.from_template(template)
chain = prompt | llm

def translate(prompt, language, text):
        # print(text)
        # self.rotate_key()
        t_text = chain.invoke({"target_language": language, "text": text})
        print(t_text)
        return t_text

class SubtitleTranslator():
    def __init__(self, sub_src):
        self.sub_src = sub_src
        self.translations = []

    def translate_by_line(self):
        sub_trans = pysubs2.load(self.sub_src)
        total_lines = len(sub_trans)
        for line in tqdm(sub_trans,total = total_lines):
            line_trans = translate(prompt, target_language, line.text)
            line.text += (r'\N'+ line_trans)
            print(line_trans)
            self.translations.append(line_trans)
        return sub_trans, self.translations


clear_output()

t = SubtitleTranslator(sub_src=sub_name)

translation, _, = t.translate_by_line()

if output_format == 'ass':
  translation.save(sub_basename + '_translation.ass')
  files.download(sub_basename + '_translation.ass')
elif output_format == 'srt':
  translation.save(sub_basename + '_translation.srt')
  files.download(sub_basename + '_translation.srt')

print('双语字幕生成完毕 All done!')