# ScalaHighPerfomance

### パフォーマンス測定方法

1. javaのバイトコードを人に読みやすく変換した形に変換するjavap（ジャパピー）に変換し、どれほどメモリを消費するか確認する。変換したニーモニックコードの読み方は[こちら](http://warabanshi.hatenablog.com/entry/2014/12/25/235644)

2. javaのパフォーマンス測定用のライブラリ、jmhをsbt上で使用できる **sbt-jmh**を使用し、実行時のパフォーマンスを測定する。詳細はOneTeamの[こちらの記事参照](https://fringe81.one-team.io/topics/7544)

### AnyVal

#### ボトルネック

DDDに即して、ドメイン言語に対応するオブジェクトを作成するために、`case class` を大量に作ると、メモリ効率が悪くなる

#### 改善方法

`AnyVal`を継承する事で、独自のプリミティブ型を定義する

In [0]:
case class Price(num:Long) extends AnyVal

: 

(scala2-10から任意のValueClassが定義可能。)[http://www.scala-lang.org/api/current/#scala.AnyVal]
これにより、ドメインに対応したオブジェクトを定義してもインスタンスの数を少なくする事ができ、GCに負荷をかけなくてすむ

In [0]:
  case class Price(num: Long) extends AnyVal {
// メソッドも定義可能
    def isLowerThan(price: Price) = num < price.num
  }

: 

#### リスクと制約

Valle class には、フィールドが一つしか持てない、classの内部では定義できないなどさまざまな制約があるが、継承する事によるリスクはない

In [0]:
// ValueClassはフィールドを一つしか持てないため、以下の場合エラーになる
case class Price(num: Long,ng:Long) extends AnyVal 

: 

#### まとめ

AnyValで定義可能なものを定義する

### ボクシング

#### ボトルネック

以下のように大量のデータを作成するとプリミティブ型がボクシングされてしまい、処理が遅くなる

In [0]:
def testList() = List.fill(100000)(2) map (i => Data(i) :: Nil)

case class Data(num: Long) extends AnyVal

: 

##### 改善方法

ボクシング処理が行われなくなり、大量のボクシングが行われる場合、処理速度が向上する

In [None]:
 class SpecializedClass[@specialized T](t: T) 

// メソッドにも定義可能
def createSpecialized[@specialized T](t: T): Foo[T] = new Foo(t) 

In [None]:
パフォーマンス測定コード

In [None]:
import java.util.concurrent.TimeUnit
import org.openjdk.jmh.annotations._


//アウトプットの単位
@OutputTimeUnit(TimeUnit.SECONDS)
// ウォームアップの設定
@Warmup(iterations = 3, timeUnit = TimeUnit.SECONDS)
// 計測回数の設定
@Measurement(iterations = 3, timeUnit = TimeUnit.SECONDS)
// 全体の計測回数（-Xms1Gは使用するメモリ）
@Fork(value = 1, jvmArgs = Array("-Xms1G", "-Xmx1G"))
// 使用するスレッド数
@Threads(value = 1)
class Specialized {

  @Benchmark
  def testList() = List.fill(100000)(2) map (i => Data(i) :: Nil)

  @Benchmark
  def testList2() = List.fill(100000)(2) map (i => Data(i) :: Nil)

}
//Value Classとして定義する事で、プリミティブ型と同等に扱われる
case class Data(num: Long) extends AnyVal

//boxingされなくなる
// https://ja.wikipedia.org/wiki/%E3%82%AA%E3%83%BC%E3%83%88%E3%83%9C%E3%82%AF%E3%82%B7%E3%83%B3%E3%82%B0
case class Data2(@specialized num: Long)

測定結果

In [0]:
[info] Benchmark                                              Mode  Cnt    Score      Error  Units
[info] ScalaHighPerformancePtorgaming.Specialized.testList   thrpt    3   95.929 ? 1064.152  ops/s
[info] ScalaHighPerformancePtorgaming.Specialized.testList2  thrpt    3  124.449 ?  196.243  ops/s

: 

#### リスクと制約

- それぞれのプリミティブ型のためのコードが生成されるため、コンパイル時間が長くなる
- 継承すると、子には@specializedの特性は失われてしまうので、改めて付ける必要がある

以下のように、継承する場合は、子にもアノテーションを付ける必要がある

In [None]:
  trait ParentBar[@specialized T] { 
    def t(): T 
  } 
 
  class ChildBar[@specialized T](val t: T) extends ParentBar[T] 
 
  def newChildBar(i: Int): ChildBar[Int] = new ChildBar(i) 

#### まとめ
機械学習など、大量の数値計算が必要な場合には、劇的に処理速度が向上すると期待できる

###  Tuble

#### ボトルネック

In [None]:
def tuple: (Int, Int) = (1, 2)

In [None]:
のように、同じプリミティブ型のタプルの場合、最適化され、'Boxing' はされないが、

In [None]:
def tuple2: (Int, HogeInt) = (1, HogeInt(2))
case class HogeInt(int:Int) extends AnyVal

In [None]:
とすると、以下のバイトコードのように、別々の型をもつタプルはボクシングされてしまい、過剰にメモリが消費される可能性がある

In [None]:
バイトコード

In [None]:
// def tuple  
public scala.Tuple2<java.lang.Object, java.lang.Object> tuple();
    Code:
       0: new           #24                 // class scala/Tuple2$mcII$sp
       3: dup
       4: iconst_1
       5: iconst_2
       6: invokespecial #27                 // Method scala/Tuple2$mcII$sp."<init>":(II)V
       9: areturn


// def tuple2
  public scala.Tuple2<java.lang.Object, TupleAndClass$HogeInt> tuple2();
    Code:
       0: new           #31                 // class scala/Tuple2
       3: dup
       4: iconst_1
       5: invokestatic  #37                 // Method scala/runtime/BoxesRunTime.boxToInteger:(I)Ljava/lang/Integer;
       8: new           #12                 // class TupleAndClass$HogeInt
      11: dup
      12: iconst_2
      13: invokespecial #40                 // Method TupleAndClass$HogeInt."<init>":(I)V
      16: invokespecial #43                 // Method scala/Tuple2."<init>":(Ljava/lang/Object;Ljava/lang/Object;)V
      19: areturn

以上のように、例え'AnyVal' を継承しても、違う型のタプルの場合、メモリをより消費するリスクがある

#### パフォーマンス改善

タプルを使わず`case class`を定義する

In [None]:
def useClass=Class(1, HogeInt(1))
case class Class(int:Int,hogeInt:HogeInt)

とタプルの代わりに新たに`case Class`を定義すると、バイトコードは以下のようになり、上と比べて、メモリの消費を抑えられる

In [None]:
  public TupleAndClass$Class useClass();
    Code:
       0: new           #7                  // class TupleAndClass$Class
       3: dup
       4: iconst_1
       5: iconst_1
       6: invokespecial #46                 // Method TupleAndClass$Class."<init>":(II)V
       9: areturn

#### まとめ
- 違う型を持つタプルを過剰に使うと、必要以上にメモリを消費する
- どうしてもそのようなタプルを定義する必要がある場合、`Class` を定義するとメモリの消費が押さえられる

In [None]:
### Pattern Match

In [None]:
#### ボトルネック

In [None]:
#### 改善案

In [None]:
#### まとめ