·
2 commits
to master
since this release
OCR Screen Capture Transcription v1
Windows 常駐型の OCR(画面文字認識)ツールです。Win + Shift + S で範囲をスニップ
するだけで、画像内の文字をテキスト化してクリップボードにコピー。読み上げ・翻訳にも
対応し、すべて CPU のみ・ローカルで動作します(外部 OCR バイナリのインストール不要)。
インストール
- 下の Assets から
OCR_Transcribe_Setup.exeをダウンロード - ダブルクリックで実行(管理者権限不要 / UAC なし。
%LocalAppData%\Programsにインストールされます) - 初回起動でセットアップ画面が開くので、言語を選んでモデルをダウンロードして完了
SmartScreen の警告が出た場合は「詳細情報」→「実行」を選んでください(未署名のため)。
主な機能
- 自動 OCR:
Win + Shift + Sのスニップ画像を自動検知して即テキスト化 - クリップボードへコピー / 読み上げ(オフライン TTS) / 翻訳(ローカル LLM 起動時)
- トレイ常駐 + 通知。メニューから各機能を ON/OFF
- 可愛いセットアップ / 設定 UI(ネイティブ窓・ブラウザは開きません)
- 多言語モデル: 日本語 / 英語 / 中国語 / 韓国語 を選択して自動ダウンロード
- モデル保存先の指定に対応
動作環境
- Windows 11(64bit)
- Microsoft Edge WebView2 ランタイム(Windows 11 は標準搭載)
- 初回のモデルダウンロード時のみインターネット接続が必要
使い方
- インストール後、タスクトレイに
OCRアイコンが常駐します Win + Shift + Sで画面の範囲をスニップ → 自動で OCR、テキストがクリップボードに入ります- トレイの 設定を開く から、読み上げ・自動翻訳・言語切替などを設定できます
翻訳(任意)
Ollama などの OpenAI 互換ローカル LLM を起動し、設定画面の「翻訳」で
エンドポイント・モデル名・翻訳先言語を指定すると、OCR 結果を翻訳できます。LLM 未起動時は
翻訳のみスキップされ、OCR は通常どおり動作します。
補足・既知の事項
- 日本語スクリーンショット向けに最適化しています。英語のみの文章は精度が落ちる場合があるため、
設定で「英語」モデルへの切替が可能です。 - 設定
config.jsonとログocr_tool.logはインストール先フォルダに作成されます。
ライセンス
- 本体: MIT License(同梱の
LICENSE) - 同梱 OSS の表記:
THIRD_PARTY_NOTICES.md(RapidOCR/PaddleOCR モデルは Apache-2.0、
pystray は LGPL-3.0 など。詳細は同ファイル参照)
OCR エンジン: RapidOCR (ONNX, CPU) /
UI: pywebview + Flask / TTS: pyttsx3 / パッケージング: PyInstaller + Inno Setup