Releases: mzsm/logia
Releases · mzsm/logia
v0.1.0-beta.1
First beta release!! 🎉
動画クリエイターのための文字起こし・字幕制作支援アプリです
音声認識により自動で動画・音声ファイルの文字起こしを行います
英語や日本語、中国語、フランス語、韓国語など、約100の言語に対応しています
YouTubeやHTML5ビデオ用字幕ファイルの出力に対応しており、動画に高品質な字幕を手軽に付与できます
また、長時間の動画の内容をテキストで手早く確認するためにも使えるかも知れません(認識にかかる時間はマシンの性能によります)
CSVやプレーンテキストでの出力も可能なので、動画制作だけでなく幅広い用途で利用可能です
なお、音声認識処理はローカルマシン上で実行されるため、音声データが外部に送信されることはありません
ある程度の機能が実装できたので、皆様に実際に使っていただき評価していただくためにリリースします
まだ未実装の機能やバグも若干残っていますがご了承ください…
改善のご意見、不具合のご指摘などあれば、ぜひGitHubのIssuesまでお寄せください
※自動書き起こしの初回実行時は音声認識モデルのダウンロードを行うため、開始までしばらく時間がかかります。
(ダウンロードはモデルごとに1回ずつ行われます)
また、音声認識モデルは最大3GB程度あるため、携帯回線をご利用の場合はご注意ください。