# 外部ライブラリの調査のためのツール

# はじめに

世の中へ言語を問わず次から次へと外部ライブラリが出てきて調査が大変

使い方を覚えてもすぐ忘れてしまう

どうせ使うなら便利に使いたい

# 背景

IDEの補完でそれっぽいものを選択してコーディングしている時期があった

外部ライブラリの全貌を把握できていなかったからそうせざるを得なかった

外部ライブラリの機能を一覧取得するやり方が知りたかった

いろいろ書いているうちに把握するやり方がわかってきた

初めて触れた言語がjavalangだったので、実装した

# 実装方針

リフレクションの機能がある言語ではメタ定義を参照できる定数ないしメソッドを提供している

この機能を利用して実装した

入出力の設計はコマンドラインベースで動くプログラムとした

コマンドライン引数にはクラス名やjarファイル名を指定し、定数情報ないしメソッド情報のどちらの情報を一覧取得するかどうかのオプションを指定できるようにした

パイプでつないだり、リダイレクトでファイル保存したり、データファイルとして他のミドルと連携しやすいように標準出力にはTSV形式で出力するようにした

# プログラム名

jacdumpとjardumpを個人で作成した

- [jacdump](https://github.com/ukijumotahaneniarukenia/jacdump)


- [jardump](https://github.com/ukijumotahaneniarukenia/jardump)

# 使い方

## jacdump

CMD

```
$ java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar 
```

OUT
```
Usageだよーん

java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --method

java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --list-up

java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --method java.lang.ClassLoader java.lang.Thread

java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --constant

java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --constant java.lang.ClassLoader java.lang.Thread
```

CMD

インストールしたjdkに梱包されているクラスファイル名リストの一覧取得

```
$ java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --list-up | head | tr '/' '.'
```

OUT

```
java.io.BufferedInputStream
java.io.BufferedOutputStream
java.io.BufferedWriter
java.io.ByteArrayInputStream
java.io.ByteArrayOutputStream
java.io.Closeable
java.io.DataInput
java.io.DataInputStream
java.io.DataOutput
java.io.DefaultFileSystem
```

CMD

標準エラー出力にクラスロード時ないし実行時の完了件数・スキップ件数を出力

```
$ java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --constant java.lang.Thread 1>/dev/null
```

OUT

```
classLoadDoneCnt	1
classLoadSkipCnt	0
classExecuteDoneCnt	1
classExecuteSkipCnt	0

classExecuteSkipList	[]
```

CMD

標準出力にクラス情報を出力

```
$ java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar  --constant java.lang.Thread 2>/dev/null | head
```

OUT

```
クラス名	定数かメソッドか	クラス番号	クラスシーケンス番号	クラス名	定数名
java.lang.Thread	CCCCC	00000001	0001	java.lang.Thread	NORM_PRIORITY
java.lang.Thread	CCCCC	00000001	0002	java.lang.Thread	MAX_PRIORITY
java.lang.Thread	CCCCC	00000001	0003	java.lang.Thread	MIN_PRIORITY
```

CMD

```
$ java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar --method java.lang.Thread 1>/dev/null
```

OUT

```
classLoadDoneCnt	1
classLoadSkipCnt	0
classExecuteDoneCnt	1
classExecuteSkipCnt	0

classExecuteSkipList	[]
```

CMD

```
$ java -jar jacdump-2-0-0-SNAPSHOT-jar-with-dependencies.jar  --method java.lang.Thread 2>/dev/null | head
```

OUT

```
クラス名	定数かメソッドか	クラス番号	クラスシーケンス番号	クラス名	アクセス修飾子	戻り値の型	メソッド名	可変長引数があるか	引数の個数	型パラメータリスト	型パラメータ記号リスト	引数の型リスト	仮引数の変数名リスト
java.lang.Thread	MMMMM	00000001	0001	java.lang.Thread	public final	boolean	isDaemon	false	0				
java.lang.Thread	MMMMM	00000001	0002	java.lang.Thread	public	java.lang.StackTraceElement[]	getStackTrace	false	0				
java.lang.Thread	MMMMM	00000001	0003	java.lang.Thread	public final	void	join	false	0				
java.lang.Thread	MMMMM	00000001	0004	java.lang.Thread	public final synchronized	void	join	false	2			long,int	arg0,arg1
java.lang.Thread	MMMMM	00000001	0005	java.lang.Thread	public final synchronized	void	join	false	1			long	arg0
java.lang.Thread	MMMMM	00000001	0006	java.lang.Thread	public	boolean	equals	false	1			java.lang.Object	arg0
java.lang.Thread	MMMMM	00000001	0007	java.lang.Thread	public	void	interrupt	false	0				
java.lang.Thread	MMMMM	00000001	0008	java.lang.Thread	public final	java.lang.String	getName	false	0				
java.lang.Thread	MMMMM	00000001	0009	java.lang.Thread	public	void	setContextClassLoader	false	1			java.lang.ClassLoader	arg0
```

## jardump

CMD

```
java -jar jardump-X-X-X-SNAPSHOT.jar
```

OUT
```
Usageだよーん
java -jar jardump-X-X-X-SNAPSHOT.jar --maven
or
java -jar jardump-X-X-X-SNAPSHOT.jar --gradle
or
java -jar jardump-X-X-X-SNAPSHOT.jar --kotlin
or
java -jar jardump-X-X-X-SNAPSHOT.jar --scala
or
java -jar jardump-X-X-X-SNAPSHOT.jar --scala --method
or
java -jar jardump-X-X-X-SNAPSHOT.jar --scala --constant
or
java -jar jardump-X-X-X-SNAPSHOT.jar /home/aine/.m2/repository/org/jsoup/jsoup/1.10.2/jsoup-1.10.2.jar /home/aine/.m2/repository/org/apache/commons/commons-lang3/3.11/commons-lang3-3.11.jar
or
java -jar jardump-X-X-X-SNAPSHOT.jar /home/aine/.m2/repository/xmlpull/xmlpull/1.1.3.1/xmlpull-1.1.3.1.jar
```

jacdumpと代替同じなので、割愛

# ミドルと連携例

jupyter notebookを例に

## ライブラリインポート

In [1]:
import pandas as pd

## 定数の場合

### TSVファイルインポート

In [2]:
df_constant = pd.read_csv('java-lang-Thread-constant.tsv',sep='\t')

### データ俯瞰

In [3]:
df_constant.head(10)

Unnamed: 0,クラス名,定数かメソッドか,クラス番号,クラスシーケンス番号,クラス名.1,定数名
0,java.lang.Thread,CCCCC,1,1,java.lang.Thread,NORM_PRIORITY
1,java.lang.Thread,CCCCC,1,2,java.lang.Thread,MAX_PRIORITY
2,java.lang.Thread,CCCCC,1,3,java.lang.Thread,MIN_PRIORITY


### データ型確認

In [4]:
pd.DataFrame(df_constant.dtypes,columns=["columnName"])

Unnamed: 0,columnName
クラス名,object
定数かメソッドか,object
クラス番号,int64
クラスシーケンス番号,int64
クラス名.1,object
定数名,object


### 抽出条件を指定して取得

#### 取得列リストを指定して取得

In [5]:
df_constant[['クラス名','定数名']]

Unnamed: 0,クラス名,定数名
0,java.lang.Thread,NORM_PRIORITY
1,java.lang.Thread,MAX_PRIORITY
2,java.lang.Thread,MIN_PRIORITY


#### 定数名が先頭Mで始まる一覧を取得

In [6]:
df_constant[df_constant['定数名'].str.contains('^M', regex=True)]

Unnamed: 0,クラス名,定数かメソッドか,クラス番号,クラスシーケンス番号,クラス名.1,定数名
1,java.lang.Thread,CCCCC,1,2,java.lang.Thread,MAX_PRIORITY
2,java.lang.Thread,CCCCC,1,3,java.lang.Thread,MIN_PRIORITY


#### 定数名が先頭Mで始まらない一覧を取得

In [7]:
df_constant[ ~ df_constant['定数名'].str.contains('^M', regex=True)]

Unnamed: 0,クラス名,定数かメソッドか,クラス番号,クラスシーケンス番号,クラス名.1,定数名
0,java.lang.Thread,CCCCC,1,1,java.lang.Thread,NORM_PRIORITY


## メソッドの場合

### TSVファイルインポート

In [8]:
df_method = pd.read_csv('java-lang-Thread-method.tsv',sep='\t')

### データ俯瞰

In [9]:
df_method.head(10)

Unnamed: 0,クラス名,定数かメソッドか,クラス番号,クラスシーケンス番号,クラス名.1,アクセス修飾子,戻り値の型,メソッド名,可変長引数があるか,引数の個数,型パラメータリスト,型パラメータ記号リスト,引数の型リスト,仮引数の変数名リスト
0,java.lang.Thread,MMMMM,1,1,java.lang.Thread,public final,boolean,isDaemon,False,0,,,,
1,java.lang.Thread,MMMMM,1,2,java.lang.Thread,public,java.lang.StackTraceElement[],getStackTrace,False,0,,,,
2,java.lang.Thread,MMMMM,1,3,java.lang.Thread,public final,void,join,False,0,,,,
3,java.lang.Thread,MMMMM,1,4,java.lang.Thread,public final synchronized,void,join,False,2,,,"long,int","arg0,arg1"
4,java.lang.Thread,MMMMM,1,5,java.lang.Thread,public final synchronized,void,join,False,1,,,long,arg0
5,java.lang.Thread,MMMMM,1,6,java.lang.Thread,public,boolean,equals,False,1,,,java.lang.Object,arg0
6,java.lang.Thread,MMMMM,1,7,java.lang.Thread,public,void,interrupt,False,0,,,,
7,java.lang.Thread,MMMMM,1,8,java.lang.Thread,public final,java.lang.String,getName,False,0,,,,
8,java.lang.Thread,MMMMM,1,9,java.lang.Thread,public,void,setContextClassLoader,False,1,,,java.lang.ClassLoader,arg0
9,java.lang.Thread,MMMMM,1,10,java.lang.Thread,public,void,run,False,0,,,,


### データ型確認

In [10]:
pd.DataFrame(df_method.dtypes,columns=["columnName"])

Unnamed: 0,columnName
クラス名,object
定数かメソッドか,object
クラス番号,int64
クラスシーケンス番号,int64
クラス名.1,object
アクセス修飾子,object
戻り値の型,object
メソッド名,object
可変長引数があるか,bool
引数の個数,int64


### 抽出条件を指定して取得

#### 取得列リストを指定して取得

In [11]:
df_method[['クラス名','メソッド名','戻り値の型','引数の個数','引数の型リスト']].head(10)

Unnamed: 0,クラス名,メソッド名,戻り値の型,引数の個数,引数の型リスト
0,java.lang.Thread,isDaemon,boolean,0,
1,java.lang.Thread,getStackTrace,java.lang.StackTraceElement[],0,
2,java.lang.Thread,join,void,0,
3,java.lang.Thread,join,void,2,"long,int"
4,java.lang.Thread,join,void,1,long
5,java.lang.Thread,equals,boolean,1,java.lang.Object
6,java.lang.Thread,interrupt,void,0,
7,java.lang.Thread,getName,java.lang.String,0,
8,java.lang.Thread,setContextClassLoader,void,1,java.lang.ClassLoader
9,java.lang.Thread,run,void,0,


#### 引数の個数が0個かつ戻り値の型がjava.lang.Stringの一覧を取得

In [12]:
df_method[(df_method['引数の個数']==0) & (df_method['戻り値の型']=='java.lang.String')]

Unnamed: 0,クラス名,定数かメソッドか,クラス番号,クラスシーケンス番号,クラス名.1,アクセス修飾子,戻り値の型,メソッド名,可変長引数があるか,引数の個数,型パラメータリスト,型パラメータ記号リスト,引数の型リスト,仮引数の変数名リスト
7,java.lang.Thread,MMMMM,1,8,java.lang.Thread,public final,java.lang.String,getName,False,0,,,,
39,java.lang.Thread,MMMMM,1,40,java.lang.Thread,public,java.lang.String,toString,False,0,,,,


# 応用

androidなどのネイティブアプリはapkファイルで配布されているがjarファイルに変換できるコマンドがある

- [dex2jar](https://github.com/pxb1988/dex2jar)

jarファイルになれば、アプリが使用しているライブラリ等も調査できる

# 余談

pythonは試したが型付けが任意のため実装者依存で出力にムラがある

# 今後

swiftやtypescript等で同様のことができるとコスパいい

型付けが強制され、リフレクションの機能が備わっている言語であれば、同様の機能を作成できる可能性が高い

# おわりに

おしまい