App::Greple::tee - マッチしたテキストを外部コマンドの結果に置き換えるモジュールです。
greple -Mtee command -- ...
Greple の -Mtee モジュールは、マッチしたテキスト部分を指定されたフィルタコマンドに送り、その結果で置き換えます。このアイデアは、teipというコマンドから派生したものです。これは、外部のフィルタコマンドに部分的なデータをバイパスするようなものです。
Filterコマンドはモジュール宣言(-Mtee
)に続き、2つのダッシュ(--
)で終了します。例えば、次のコマンドは、データ中の一致した単語に対して、a-z A-Z
の引数を持つコマンド tr
コマンドを呼び出します。
greple -Mtee tr a-z A-Z -- '\w+' ...
上記のコマンドは、マッチした単語をすべて小文字から大文字に変換します。grepleは**--cm**オプションでより効果的に同じことができるので、実はこの例自体はあまり意味がありません。
デフォルトでは、コマンドは1つのプロセスとして実行され、マッチしたデータはすべて混在してプロセスに送られます。マッチしたテキストが改行で終わっていない場合は、送信前に追加され、受信後に削除されます。入力データと出力データは行ごとにマップされるので、入力と出力の行数は同じでなければなりません。
--discreteオプションを使うと、マッチしたテキスト・エリアごとにコマンドが呼び出されます。この違いは以下のコマンドでわかります。
greple -Mtee cat -n -- copyright LICENSE
greple -Mtee cat -n -- copyright LICENSE --discrete
--discreteオプションを使用する場合、入出力データの行数は同一である必要はありません。
Version 0.9902
-
--discrete
一致した部品に対して、個別に新しいコマンドを起動します。
-
--fillup
一連の空白でない行を1行にまとめてからフィルターコマンドに渡します。幅の広い文字の間の改行文字は削除され、その他の改行文字はスペースに置き換えられます。
-
--blocks
通常、指定された検索パターンにマッチする領域が外部コマンドに送られます。このオプションが指定されると、マッチした領域ではなく、それを含むブロック全体が処理されます。
例えば、パターン
foo
を含む行を外部コマンドに送るには、行全体にマッチするパターンを指定する必要があります:greple -Mtee cat -n -- '^.*foo.*\n' --all
しかし、--blocks オプションを使えば、次のように簡単にできます:
greple -Mtee cat -n -- foo --blocks
--blocks オプションをつけると、このモジュールは teip(1) の -g オプションに似た挙動をします。--blocks オプションを使うと、このモジュールはより teip(1) の -g オプションに近い動作をします。
--blocks を --all オプションと一緒に使わないでください。
-
--squeeze
2つ以上の連続する改行文字を1つにまとめます。
まず第一に、teipコマンドでできることは、いつでもそれを使ってください。これは優れたツールで、grepleよりずっと速いです。
grepleは文書ファイルの処理を目的としているため、マッチエリアの制御など、それに適した機能を多く持っています。それらの機能を活用するために、grepleを使う価値はあるかもしれません。
また、teipは複数行のデータを1つの単位として扱うことができませんが、grepleは複数行からなるデータチャンクに対して個別のコマンドを実行することが可能です。
次のコマンドは,Perlモジュールファイルに含まれるperlpod(1)スタイルドキュメント内のテキストブロックを検索します。
greple --inside '^=(?s:.*?)(^=cut|\z)' --re '^(\w.+\n)+' tee.pm
このようにMteeモジュールと組み合わせてdeeplコマンドを呼び出すと、DeepLサービスによって翻訳することができます。
greple -Mtee deepl text --to JA - -- --fillup ...
ただし、この場合は専用モジュール App::Greple::xlate::deepl の方が効果的です。実は、teeモジュールの実装のヒントはxlateモジュールからきています。
次に、LICENSE文書にインデントされた部分があります。
greple --re '^[ ]{2}[a-z][)] .+\n([ ]{5}.+\n)*' -C LICENSE
a) distribute a Standard Version of the executables and library files,
together with instructions (in the manual page or equivalent) on where to
get the Standard Version.
b) accompany the distribution with the machine-readable source of the Package
with your modifications.
この部分はteeモジュールとansifoldコマンドで整形することができます。
greple -Mtee ansifold -rsw40 --prefix ' ' -- --discrete --re ...
a) distribute a Standard Version of
the executables and library files,
together with instructions (in the
manual page or equivalent) on where
to get the Standard Version.
b) accompany the distribution with the
machine-readable source of the
Package with your modifications.
discreteオプションは複数のプロセスを起動するので、プロセスの実行に時間がかかります。そのため、--separate ' \r'
オプションとansifold
を併用すると、NLの代わりにCR文字を使って1行にすることができます。
greple -Mtee ansifold -rsw40 --prefix ' ' --separate '\r' --
その後、tr(1)コマンドなどでCRをNLに変換します。
... | tr '\r' '\n'
ヘッダ行以外から文字列を grep したい場合を考えてみましょう。例えば、docker image ls
コマンドからDockerイメージ名を検索したいが、ヘッダ行は残したいとします。以下のコマンドで可能です。
greple -Mtee grep perl -- -Mline -L 2: --discrete --all
オプション-Mline -L 2:
は2行目から最後の行を検索し、grep perl
コマンドに送ります。入出力の行数が変わるので-discreteオプションが必要ですが、コマンドは一度しか実行されないので性能上の欠点はありません。
teipコマンドで同じことをしようとすると、teip -l 2- -- grep
は出力行数が入力行数より少ないのでエラーになります。しかし、得られる結果に問題はありません。
$ cpanm App::Greple::tee
App::Greple::tee、https://github.com/kaz-utashiro/App-Greple-tee。
https://github.com/greymd/teip
App::Greple, https://github.com/kaz-utashiro/greple
https://github.com/tecolicom/Greple
App::Greple::xlateを使用します。
--fillup
オプションは、韓国語テキストを連結する際に、ハングル文字間の空白を削除します。
Kazumasa Utashiro
Copyright © 2023 Kazumasa Utashiro.
This library is free software; you can redistribute it and/or modify it under the same terms as Perl itself.