OCR Screen Capture Transcription v1

Windows 常駐型の OCR（画面文字認識）ツールです。Win + Shift + S で範囲をスニップ
するだけで、画像内の文字をテキスト化してクリップボードにコピー。読み上げ・翻訳にも
対応し、すべて CPU のみ・ローカルで動作します（外部 OCR バイナリのインストール不要）。

インストール

下の Assets から OCR_Transcribe_Setup.exe をダウンロード
ダブルクリックで実行（管理者権限不要 / UAC なし。%LocalAppData%\Programs にインストールされます）
初回起動でセットアップ画面が開くので、言語を選んでモデルをダウンロードして完了

SmartScreen の警告が出た場合は「詳細情報」→「実行」を選んでください（未署名のため）。

主な機能

自動 OCR: Win + Shift + S のスニップ画像を自動検知して即テキスト化
クリップボードへコピー / 読み上げ（オフライン TTS） / 翻訳（ローカル LLM 起動時）
トレイ常駐 + 通知。メニューから各機能を ON/OFF
可愛いセットアップ / 設定 UI（ネイティブ窓・ブラウザは開きません）
多言語モデル: 日本語 / 英語 / 中国語 / 韓国語を選択して自動ダウンロード
モデル保存先の指定に対応

動作環境

Windows 11（64bit）
Microsoft Edge WebView2 ランタイム（Windows 11 は標準搭載）
初回のモデルダウンロード時のみインターネット接続が必要

使い方

インストール後、タスクトレイに OCR アイコンが常駐します
Win + Shift + S で画面の範囲をスニップ → 自動で OCR、テキストがクリップボードに入ります
トレイの 設定を開く から、読み上げ・自動翻訳・言語切替などを設定できます

翻訳（任意）

Ollama などの OpenAI 互換ローカル LLM を起動し、設定画面の「翻訳」で
エンドポイント・モデル名・翻訳先言語を指定すると、OCR 結果を翻訳できます。LLM 未起動時は
翻訳のみスキップされ、OCR は通常どおり動作します。

補足・既知の事項

日本語スクリーンショット向けに最適化しています。英語のみの文章は精度が落ちる場合があるため、
設定で「英語」モデルへの切替が可能です。
設定 config.json とログ ocr_tool.log はインストール先フォルダに作成されます。

ライセンス

本体: MIT License（同梱の LICENSE）
同梱 OSS の表記: THIRD_PARTY_NOTICES.md（RapidOCR/PaddleOCR モデルは Apache-2.0、
pystray は LGPL-3.0 など。詳細は同ファイル参照）

OCR エンジン: RapidOCR (ONNX, CPU) /
UI: pywebview + Flask / TTS: pyttsx3 / パッケージング: PyInstaller + Inno Setup

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

OCR_screen_capture_v1.0.0

Choose a tag to compare

Sorry, something went wrong.