Skip to content

OCR_screen_capture_v1.0.0

Latest

Choose a tag to compare

@Me1td0wn76 Me1td0wn76 released this 24 Jun 14:58
· 2 commits to master since this release

OCR Screen Capture Transcription v1

Windows 常駐型の OCR(画面文字認識)ツールです。Win + Shift + S で範囲をスニップ
するだけで、画像内の文字をテキスト化してクリップボードにコピー。読み上げ・翻訳にも
対応し、すべて CPU のみ・ローカルで動作します(外部 OCR バイナリのインストール不要)。

インストール

  1. 下の Assets から OCR_Transcribe_Setup.exe をダウンロード
  2. ダブルクリックで実行(管理者権限不要 / UAC なし%LocalAppData%\Programs にインストールされます)
  3. 初回起動でセットアップ画面が開くので、言語を選んでモデルをダウンロードして完了

SmartScreen の警告が出た場合は「詳細情報」→「実行」を選んでください(未署名のため)。

主な機能

  • 自動 OCR: Win + Shift + S のスニップ画像を自動検知して即テキスト化
  • クリップボードへコピー / 読み上げ(オフライン TTS) / 翻訳(ローカル LLM 起動時)
  • トレイ常駐 + 通知。メニューから各機能を ON/OFF
  • 可愛いセットアップ / 設定 UI(ネイティブ窓・ブラウザは開きません)
  • 多言語モデル: 日本語 / 英語 / 中国語 / 韓国語 を選択して自動ダウンロード
  • モデル保存先の指定に対応

動作環境

  • Windows 11(64bit)
  • Microsoft Edge WebView2 ランタイム(Windows 11 は標準搭載)
  • 初回のモデルダウンロード時のみインターネット接続が必要

使い方

  1. インストール後、タスクトレイに OCR アイコンが常駐します
  2. Win + Shift + S で画面の範囲をスニップ → 自動で OCR、テキストがクリップボードに入ります
  3. トレイの 設定を開く から、読み上げ・自動翻訳・言語切替などを設定できます

翻訳(任意)

Ollama などの OpenAI 互換ローカル LLM を起動し、設定画面の「翻訳」で
エンドポイント・モデル名・翻訳先言語を指定すると、OCR 結果を翻訳できます。LLM 未起動時は
翻訳のみスキップされ、OCR は通常どおり動作します。

補足・既知の事項

  • 日本語スクリーンショット向けに最適化しています。英語のみの文章は精度が落ちる場合があるため、
    設定で「英語」モデルへの切替が可能です。
  • 設定 config.json とログ ocr_tool.log はインストール先フォルダに作成されます。

ライセンス

  • 本体: MIT License(同梱の LICENSE
  • 同梱 OSS の表記: THIRD_PARTY_NOTICES.md(RapidOCR/PaddleOCR モデルは Apache-2.0、
    pystray は LGPL-3.0 など。詳細は同ファイル参照)

OCR エンジン: RapidOCR (ONNX, CPU) /
UI: pywebview + Flask / TTS: pyttsx3 / パッケージング: PyInstaller + Inno Setup