Skip to content

shogokaji/extractor-mock

Repository files navigation

Extractor-mock

PDF、Officeファイルからテキストを抽出し、results配下にファイル出力する

使用方法

※ M2 MacOS, python 3.11で動作確認

1、抽出対象ファイルをdocs/に置く
2、対象拡張子のプログラムファイルのlocal_pathに指定する
3、対象拡張子のファイルを実行すると、results/に抽出結果がテキストファイルで出力される

Docker使用の場合

docker run --name test -d extractor-mock-image:latest bin/bash
docker exec -it test /bin/bash

Note

  • PDF
    • 鍵付き、コピー禁止ファイルには非対応
  • Office
    • doc, pptなどの旧形式は非対応

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published