<a href="https://colab.research.google.com/github/S-Ando-Biophysics/AI-transcription/blob/main/AI-transcription.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 文字起こし
Open AIのWhisperというAIを用いて、アップロードされた音声の文字起こしを行います。


## セットアップ

In [7]:
pip install git+https://github.com/openai/whisper.git

Collecting git+https://github.com/openai/whisper.git
  Cloning https://github.com/openai/whisper.git to /tmp/pip-req-build-4k5xugqn
  Running command git clone --filter=blob:none --quiet https://github.com/openai/whisper.git /tmp/pip-req-build-4k5xugqn
  Resolved https://github.com/openai/whisper.git to commit c0d2f624c09dc18e709e37c2ad90c039a4eb72a2
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone


In [3]:
import whisper

## 音声ファイルのアップロード

In [8]:
import ipywidgets as widgets
from IPython.display import display
language_dropdown = widgets.Dropdown(
    options=[
        ("日本語", "ja"),
        ("英語", "en"),
    ],
    value=None,
    description="Language:"
)
display(language_dropdown)

Dropdown(description='Language:', options=(('日本語', 'ja'), ('英語', 'en')), value=None)

In [9]:
from google.colab import files
uploaded = files.upload()
audio_file = list(uploaded.keys())[0]
print("Uploaded file:", audio_file)

Saving 米国への薬物の持込.m4a to 米国への薬物の持込 (1).m4a
Uploaded file: 米国への薬物の持込 (1).m4a


## Whisperのモデルの選択
各モデルの特徴は公式サイト (https://github.com/openai/whisper) で確認してください。基本的にはデフォルトの「base」のままで良いと思います。

In [10]:
import ipywidgets as widgets
from IPython.display import display
model_dropdown = widgets.Dropdown(
    options=["tiny", "base", "small", "medium", "large", "turbo"],
    value="base",
    description="Model:",
)
display(model_dropdown)

Dropdown(description='Model:', index=1, options=('tiny', 'base', 'small', 'medium', 'large', 'turbo'), value='…

## 文字起こしの実行

In [11]:
import whisper
import os
selected_model = model_dropdown.value
model = whisper.load_model(selected_model)
selected_language = language_dropdown.value
result = model.transcribe(audio_file, language=selected_language)
text = result["text"]
basename = os.path.splitext(audio_file)[0]
output_filename = f"{basename}_transcription.txt"
with open(output_filename, "w", encoding="utf-8") as f:
    f.write(text)
print("===== Result =====\n")
print(text)

100%|████████████████████████████████████████| 139M/139M [00:01<00:00, 114MiB/s]


===== Result =====

一種の新観所と初放線のコピー その初類の栄薬分と本薬者の証明があればおどんの場合で持ち込みや可能となります薬の量の目指としては 質量以上あるいは必要以下の量を持ち込まないでください上手性のアブ薬物や マイアクを持ち込む必要がある場合は次のことをしてくださいそれは薬物が一種のシリーのもと 適切に初放され特徴中の健康を生きするために必要であるということを担当以下ら発行を受けた 新観所と初放線のコピーをご用意くださいまたその初類が日本語で記載されている場合英語に本薬し 末日に絵薬した方の証明をご記入ください本薬は英語のできる方であれば ドアドでもまたコンピューターを持ちいた自動本薬でも可能です持ち込むすべての薬物や薬材 そのだ同様のブッディンな指に 意思の信断書、初放不線など初類の現破及び 絵薬分を 入国地のCDP職員に提出しそれらの薬物を もとの容器に入れた状態でお持ち込みください治療を受けている本人に限った使用も 適で服用する薬物の通常料のみお持ち込みくださいやっきくなるで販売されている 記輪薬物に関しては発見者や説明書の英文を訪ねしクリート一緒に入国地のCDP職員にお見せください薬物を米国に入そうする場合は異常にあげた書類を冬党にで 薬が入った小豆に貼り付け空党表面に英語でCDP職員と記載し 優募してくださいまた台内に親族などが埋め込まれている場合一緒からの信断書とその絵薬分をご準備し金属貪戸を通過する前に空港職員にご提出くださいその段を詳細につきましては 米国大使館CDPホームテージの米国への若物の持ち込みまたは米国CDPホームテージの メディケーションの項目をご参照くださいこのメニューをもう一度聞きない台場合は メディーション


## 文字起こし結果のダウンロード

In [12]:
files.download(output_filename)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>