# Whisper による文字起こし

## 📖 使い方

1. "セットアップ" を実行する (30 秒ほどかかります)
2. 左のサイドバーの「フォルダアイコン」を開く
3. 音声ファイルを `input` フォルダにアップロードする
4. `file_name` に音声ファイルの名前を入力する
5. `language` を選択する
6. "文字起こし" を実行する


In [None]:
# @title セットアップ

import os

# ディレクトリ作成
input_dir = "input"
output_dir = "output"

exist_input_dir = os.path.exists(input_dir)
exist_output_dir = os.path.exists(output_dir)

if not exist_input_dir:
  os.mkdir(input_dir)
if not exist_output_dir:
  os.mkdir(output_dir)

# パッケージのインストール
%pip install git+https://github.com/openai/whisper.git > /dev/null

In [None]:
# @title 文字起こし

import whisper
import csv

# パラメータ設定 # TODO: loop する
file_name = "sample.m4a" # @param { type : "string" }
language = "ja" # @param ["ja", "en"]

# 文字起こし
model = whisper.load_model("large")
result = model.transcribe(f"{input_dir}/{file_name}", language=language)

# 書き出し
fname_wo_ext = file_name.split(".")[0]
with open(f"{output_dir}/{fname_wo_ext}.csv", "w") as f:
  fieldnames = ["start", "end", "text"] # list(result["segments"][0])
  writer = csv.DictWriter(f, fieldnames=fieldnames, extrasaction='ignore')
  writer.writeheader()
  for segment in result["segments"]:
    writer.writerow(segment)

In [None]:
#@title 結果を zip でダウンロード

import subprocess

from google.colab import files

zip_file_name = "transcription_results.zip"

subprocess.run(f"zip -r {zip_file_name} {output_dir}", shell=True)
files.download(zip_file_name)