# Scalaマイクロパフォーマンス測定についてのまとめ



In [None]:
## 目的

## 計測方法

### 使用するツール
[JMH](https://github.com/ktoso/sbt-jmh)をsbtで使用するためのプラグイン   
[sbt-jmh](https://github.com/ktoso/sbt-jmh)を使用          
          
          

### 使用方法

#### 準備
plugiin.sbtに以下の一文を追加

```
addSbtPlugin("pl.project13.scala" % "sbt-jmh" % "0.2.27")
```

build.sbtに使用するモジュールをしてする

```
lazy val bench = project.dependsOn(anotherModule % "test->test").enablePlugins(JmhPlugin)
```

#### 実行

- ベンチマーク一覧表示  
`sbt 'jmh:run l' `

- ヘルプ  
`sbt 'jmh:run h' `

- 実行  
`sbt 'project [projectName]' 'jmh :run [Nam]e -wi [3] -i [3] -f[1] -t[1]'`

```
x 計測回数
Name:ベンチマークするメソッド名かクラス名 .*Test.*など正規表現でも指定可能（これだと、Testと名前が入る全て実行される）
w: ウォームアップ回数
i: 計測回数
f: 全体での実行回数
t: スレッド数
```
上記のパラメータは`sbt`実行時にも設定できるが、下記のユースケースに書いてあるように、ファイル内でも指定できる

#### 注意点

- 公式では少なくとも10回から20回は10回から20回それぞれウォームアップと計測することを推奨している

> For "real" results we recommend to at least warm up 10 to 20 iterations, and then measure 10 to 20 iterations again. Forking the JVM is required to avoid falling into specific optimisations (no JVM optimisation is really "completely" predictable)

- ファイル内にパッケージ名を記述しないとJMH上でエラーが出る
- object内のメソッドは計測不可能

### ユースケース

In [None]:
//アウトプットの単位
@OutputTimeUnit(TimeUnit.SECONDS)
// ウォームアップの設定
@Warmup(iterations = 3, timeUnit = TimeUnit.SECONDS)
// 計測回数の設定
@Measurement(iterations = 3, timeUnit = TimeUnit.SECONDS)
// 全体の計測回数（-Xms1Gは使用するメモリ）
@Fork(value = 1, jvmArgs = Array("-Xms1G", "-Xmx1G"))
// 使用するスレッド数
@Threads(value = 1)
class Test {

  @Benchmark
  def testList() = List.fill(100000)(2) map (i => Nil :+ Data(i))

  @Benchmark
  def testList2() = List.fill(100000)(2) map (i => Data(i) :: Nil)

  @Benchmark
  def testList3() = List.fill(100000)(2) map (i => Data2(i) :: Nil)

  @Benchmark
  def testList4() = List.fill(100000)(2) map (i => Data2(i) :: Nil)

}

//普通のオブジェクト
case class Data(num: Long)

//Value Classとして定義する事で、プリミティブ型と同等に扱われる
case class Data2(num: Long) extends AnyVal

//boxingされなくなる
// https://ja.wikipedia.org/wiki/%E3%82%AA%E3%83%BC%E3%83%88%E3%83%9C%E3%82%AF%E3%82%B7%E3%83%B3%E3%82%B0
case class Data3(@specialized num: Long)

#### 結果

デフォルトでは`Score`は`Throughput`となる
```
[info] Benchmark        Mode  Cnt    Score     Error  Units
[info] Test.testList   thrpt    3   36.725 ? 249.934  ops/s
[info] Test.testList2  thrpt    3   88.394 ? 579.437  ops/s
[info] Test.testList3  thrpt    3   80.317 ? 581.095  ops/s
[info] Test.testList4  thrpt    3  111.443 ? 385.614  ops/s
[success] Total time: 67 s, completed 2017/09/03 13:30:29
```

testList4が最も速い。  
- ::を使用してつなげていく事で処理が格段によくなる
- AnyValは今回あまり処理速度とは関係ない
- ボクシングをしないことで、処理速度に明らかな向上がみられる  
ことがわかった  
理由は以下を参照のこと  
https://www.amazon.co.jp/Scala%E3%82%B9%E3%82%B1%E3%83%BC%E3%83%A9%E3%83%96%E3%83%AB%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0%E7%AC%AC2%E7%89%88-Martin-Odersky/dp/4844330845  
http://techlog.mvrck.co.jp/entry/specialize-in-scala/

ユースケースについては公式のサンプルも参照のこと  
https://github.com/ktoso/sbt-jmh/tree/master/plugin/src/sbt-test/sbt-jmh/jmh-asm/src/main/scala/org/openjdk/jmh/samples


## 参考資料
[jmh公式ドキュメント](http://openjdk.java.net/projects/code-tools/jmh/)  
[アドテク×Scala×パフォーマンスチューニング](https://www.slideshare.net/mogproject/scala-41799241)
