# Whisper による文字起こし

## 📖 使い方

1. "セットアップ" を実行する (30 秒ほどかかります)
2. 左のサイドバーの「フォルダアイコン」を開く
3. 音声ファイルを `input` フォルダにアップロードする <br>
   - フォルダアイコンに `input` や `output` が見当たらない場合、更新ボタンを押してみてください <br>
   - 間違えて親フォルダ (`..` のフォルダ) に移動してしまった場合、`content` フォルダを探して戻ってください
4. "文字起こし" を実行する
5. "結果を zip でダウンロード" を実行する


In [None]:
# @title セットアップ

import os

# ディレクトリ作成
input_dir = "input"
output_dir = "output"

exist_input_dir = os.path.exists(input_dir)
exist_output_dir = os.path.exists(output_dir)

if not exist_input_dir:
  os.mkdir(input_dir)
if not exist_output_dir:
  os.mkdir(output_dir)

# パッケージのインストール
%pip install git+https://github.com/openai/whisper.git > /dev/null

In [None]:
# @title 文字起こし

import whisper
import csv

language = "ja"
model = whisper.load_model("large")

def write_transcription_to_csv(result, original_fname, output_dir):
  fname_wo_ext = fname.split(".")[0]
  with open(f"{output_dir}/{fname_wo_ext}.csv", "w") as f:
    fieldnames = ["start", "end", "text"] # list(result["segments"][0])
    writer = csv.DictWriter(f, fieldnames=fieldnames, extrasaction='ignore')
    writer.writeheader()
    for segment in result["segments"]:
      writer.writerow(segment)

for fname in os.listdir(input_dir):
  result = model.transcribe(f"{input_dir}/{fname}", language=language)
  write_transcription_to_csv(result, fname, output_dir)

In [None]:
#@title 結果を zip でダウンロード

import subprocess

from google.colab import files

zip_fname = "transcription_results.zip"

subprocess.run(f"zip -r {zip_fname} {output_dir}", shell=True)
files.download(zip_fname)