# ScalaHighPerfomance

## この記事の目的
[ScalaHighPerforman](https://www.amazon.co.jp/dp/B01BKL1PGA/ref=dp-kindle-redirect?_encoding=UTF8&btkr=1)の部分から、Tipsとして、使えそうな部分を取り出しました。ボトルネックごとにまとめてますが、よりわかりやすくするために、改めて丁寧にまとめます。（なお、この記事はJupyterにScalaカーネルを入れて作成しました。）

### パフォーマンス測定方法

1. javaのバイトコードを人に読みやすく変換した形に変換するjavap（ジャパピー）に変換し、どれほどメモリを消費するか確認する。変換したニーモニックコードの読み方は[こちら](http://warabanshi.hatenablog.com/entry/2014/12/25/235644)

2. javaのパフォーマンス測定用のライブラリ、jmhをsbt上で使用できる **sbt-jmh**を使用し、実行時のパフォーマンスを測定する。詳細はOneTeamの[こちらの記事参照](https://fringe81.one-team.io/topics/7544)

### AnyVal

#### ボトルネック

ドメイン言語に対応するオブジェクトを作成するために、`case class` を大量に作ると、メモリ効率が悪くなる

#### 改善方法

`AnyVal`を継承する事で、独自のプリミティブ型を定義する

In [0]:
case class Price(num:Long) extends AnyVal

: 

(scala2-10から任意のValueClassが定義可能。)[http://www.scala-lang.org/api/current/#scala.AnyVal]
これにより、ドメインに対応したオブジェクトを定義してもインスタンスの数を少なくする事ができ、GCに負荷をかけなくてすむ

In [0]:
  case class Price(num: Long) extends AnyVal {
// メソッドも定義可能
    def isLowerThan(price: Price) = num < price.num
  }

: 

#### リスクと制約

Valle class には、フィールドが一つしか持てない、classの内部では定義できないなどさまざまな制約があるが、継承する事によるリスクはない

In [0]:
// ValueClassはフィールドを一つしか持てないため、以下の場合エラーになる
case class Price(num: Long,ng:Long) extends AnyVal 

: 

#### まとめ

AnyValを継承可能なものは行った方が良い

### ボクシング

#### ボトルネック

以下のように大量のデータを作成する、とプリミティブ型がボクシングされてしまい、処理が遅くなる

In [0]:
def testList() = List.fill(100000)(2) map (i => Data(i) :: Nil)

case class Data(num: Long) extends AnyVal

: 

##### 改善方法

ボクシング処理が行われなくなり、大量のボクシングが行われる場合、処理速度が向上する

In [None]:
 class SpecializedClass[@specialized T](t: T) 

// メソッドにも定義可能
def createSpecialized[@specialized T](t: T): Foo[T] = new Foo(t) 

In [None]:
パフォーマンス測定コード

In [None]:
import java.util.concurrent.TimeUnit
import org.openjdk.jmh.annotations._


//アウトプットの単位
@OutputTimeUnit(TimeUnit.SECONDS)
// ウォームアップの設定
@Warmup(iterations = 3, timeUnit = TimeUnit.SECONDS)
// 計測回数の設定
@Measurement(iterations = 3, timeUnit = TimeUnit.SECONDS)
// 全体の計測回数（-Xms1Gは使用するメモリ）
@Fork(value = 1, jvmArgs = Array("-Xms1G", "-Xmx1G"))
// 使用するスレッド数
@Threads(value = 1)
class Specialized {

  @Benchmark
  def testList() = List.fill(100000)(2) map (i => Data(i) :: Nil)

  @Benchmark
  def testList2() = List.fill(100000)(2) map (i => Data(i) :: Nil)

}
//Value Classとして定義する事で、プリミティブ型と同等に扱われる
case class Data(num: Long) extends AnyVal

//boxingされなくなる
// https://ja.wikipedia.org/wiki/%E3%82%AA%E3%83%BC%E3%83%88%E3%83%9C%E3%82%AF%E3%82%B7%E3%83%B3%E3%82%B0
case class Data2(@specialized num: Long)

測定結果

In [0]:
[info] Benchmark                                              Mode  Cnt    Score      Error  Units
[info] ScalaHighPerformancePtorgaming.Specialized.testList   thrpt    3   95.929 ? 1064.152  ops/s
[info] ScalaHighPerformancePtorgaming.Specialized.testList2  thrpt    3  124.449 ?  196.243  ops/s

: 

#### リスクと制約

- それぞれのプリミティブ型のためのコードが生成されるため、コンパイル時間が長くなる
- 継承すると、子には@specializedの特性は失われてしまうので、改めて付ける必要がある

以下のように、継承する場合は、子にもアノテーションを付ける必要がある

In [None]:
  trait ParentBar[@specialized T] { 
    def t(): T 
  } 
 
  class ChildBar[@specialized T](val t: T) extends ParentBar[T] 
 
  def newChildBar(i: Int): ChildBar[Int] = new ChildBar(i) 

#### まとめ
機械学習など、大量の数値計算が必要な場合には、劇的に処理速度が向上すると期待できる

###  Tuble

#### ボトルネック

In [None]:
def tuple: (Int, Int) = (1, 2)

In [None]:
のように、同じプリミティブ型のタプルの場合、最適化され、'Boxing' はされない。だた、

In [None]:
def tuple2: (Int, HogeInt) = (1, HogeInt(2))
case class HogeInt(int:Int) extends AnyVal

とすると、以下のバイトコードのように、別々の型をもつタプルはボクシングされてしまい、過剰にメモリが消費される可能性がある

バイトコード

In [None]:
// def tuple  
public scala.Tuple2<java.lang.Object, java.lang.Object> tuple();
    Code:
       0: new           #24                 // class scala/Tuple2$mcII$sp
       3: dup
       4: iconst_1
       5: iconst_2
       6: invokespecial #27                 // Method scala/Tuple2$mcII$sp."<init>":(II)V
       9: areturn


// def tuple2
  public scala.Tuple2<java.lang.Object, TupleAndClass$HogeInt> tuple2();
    Code:
       0: new           #31                 // class scala/Tuple2
       3: dup
       4: iconst_1
       5: invokestatic  #37                 // Method scala/runtime/BoxesRunTime.boxToInteger:(I)Ljava/lang/Integer;
       8: new           #12                 // class TupleAndClass$HogeInt
      11: dup
      12: iconst_2
      13: invokespecial #40                 // Method TupleAndClass$HogeInt."<init>":(I)V
      16: invokespecial #43                 // Method scala/Tuple2."<init>":(Ljava/lang/Object;Ljava/lang/Object;)V
      19: areturn

以上のように、例え'AnyVal' を継承しても、違う型のタプルの場合、メモリをより消費するリスクがある

#### 改善方法

タプルを使わず`case class`を定義する

In [None]:
def useClass=Class(1, HogeInt(1))
case class Class(int:Int,hogeInt:HogeInt)

とタプルの代わりに新たに`case Class`を定義すると、バイトコードは以下のようになり、上と比べて、メモリの消費を抑えられる

In [None]:
  public TupleAndClass$Class useClass();
    Code:
       0: new           #7                  // class TupleAndClass$Class
       3: dup
       4: iconst_1
       5: iconst_1
       6: invokespecial #46                 // Method TupleAndClass$Class."<init>":(II)V
       9: areturn

#### まとめ
- 違う型を持つタプルを過剰に使うと、必要以上にメモリを消費する
- どうしてもそのようなタプルを定義する必要がある場合、`Class` を定義するとメモリの消費が押さえられる

### Option

#### ボトルネック

In [None]:
sealed abstract class Option[+A] extends Product with Serializable 
final case class Some[+A](x: A) extends Option[A] 
case object None extends Option[Nothing] 

In [None]:
Option型は`AnyVal` を継承していない。よって、boxingが起こり、多用するとメモリが過剰に消費されてしまうリスクが存在する。だが、使わないとなると、
今度はScalaの良さが半減してしまう。仮にパフォーマンスの観点上、Option型がネックとなる場合、以下のようにScalazのTaggedTypeを応用する

#### 改善方法

In [None]:
Scalazライブラリを導入する

In [1]:
val scalazVersion="7.1.0"
classpath.add("org.scalaz" %% "scalaz-core" % scalazVersion)
classpath.add("org.scalaz" %% "scalaz-effect" % scalazVersion)
classpath.add("org.scalaz" %% "scalaz-typelevel" % scalazVersion)
classpath.add("org.scalaz" %% "scalaz-scalacheck-binding" % scalazVersion )

// val scalazVersion="7.1.0"
// libraryDependencies++=Seq(
// "org.scalaz" %% "scalaz-core" % scalazVersion,
// "org.scalaz" %% "scalaz-effect" % scalazVersion,
// "org.scalaz" %% "scalaz-typelevel" % scalazVersion,
// "org.scalaz" %% "scalaz-scalacheck-binding" % scalazVersion)

Adding 1 artifact(s)
Adding 1 artifact(s)
Adding 1 artifact(s)
Adding 6 artifact(s)


[36mscalazVersion[0m: [32mString[0m = [32m"7.1.0"[0m

In [2]:
import scalaz.{@@, Tag}

sealed trait Opt 
 
object OptOps { 
 
  def some[@specialized A](x: A): A @@ Opt = Tag(x) 
  def nullCheckingSome[@specialized A](x: A): A @@ Opt = 
    if (x == null) sys.error("Null values disallowed") else Tag(x) 
  def none[A]: A @@ Opt = Tag(null.asInstanceOf[A]) 
 
  def isSome[A](o: A @@ Opt): Boolean = o != null 
  def isEmpty[A](o: A @@ Opt): Boolean = !isSome(o) 
 
  def unsafeGet[A](o: A @@ Opt): A = 
    if (isSome(o)) o.asInstanceOf[A] else sys.error("Cannot get None") 
 
  def fold[A, B](o: A @@ Opt)(ifEmpty: => B)(f: A => B): B = 
    if (o == null) ifEmpty else f(o.asInstanceOf[A]) 
} 

[32mimport [36mscalaz.{@@, Tag}[0m
defined [32mtrait [36mOpt[0m
defined [32mobject [36mOptOps[0m

In [None]:
TaggedTypeを応用して、実質的に`Option`と同様の機能をもたせる。

In [None]:
パフォーマンス測定用コード

In [None]:
 class OptionCreationBenchmarks { 
 
//      普通のSome
  @Benchmark 
  def scalaSome(): Option[ShareCount] = Some(ShareCount(1)) 
 
//      普通のNone
  @Benchmark 
  def scalaNone(): Option[ShareCount] = None 
 
//      TaggedTypeを使用したsome
  @Benchmark 
  def optSome(): ShareCount @@ Opt = OptOps.some(ShareCount(1)) 
 
     //      TaggedTypeを使用し、かつ中身がnullの場合、エラーを吐くsome
  @Benchmark 
  def optSomeWithNullChecking(): ShareCount @@ Opt = 
    OptOps.nullCheckingSome(ShareCount(1)) 
 
//      TaggedTypeのNone
  @Benchmark 
  def optNone(): ShareCount @@ Opt = OptOps.none 
} 
 
object OptionCreationBenchmarks { 
  case class ShareCount(value: Long) extends AnyVal 
  val noShares: ShareCount @@ Opt = OptOps.none 
} 

In [None]:
測定結果

[info] Benchmark                                                                         Mode  Cnt          Score          Error  Units
[info] ScalaHighPerformancePtorgaming.OptionCreationBenchmarks.optNone                  thrpt   30  316034368.030 ± 14056162.057  ops/s
[info] ScalaHighPerformancePtorgaming.OptionCreationBenchmarks.optSome                  thrpt   30  209310940.093 ± 11409613.732  ops/s
[info] ScalaHighPerformancePtorgaming.OptionCreationBenchmarks.optSomeWithNullChecking  thrpt   30  210272202.104 ±  9088559.516  ops/s
[info] ScalaHighPerformancePtorgaming.OptionCreationBenchmarks.scalaNone                thrpt   30  324445881.942 ± 10275884.879  ops/s
[info] ScalaHighPerformancePtorgaming.OptionCreationBenchmarks.scalaSome                thrpt   30  123983068.995 ±  3587226.273  ops/sb

処理速度としては
--------------------------------------------------------------
Some
TaggedTypeのSome:                              209310940.093    1.68倍
TaggedTypeのNullチェックを含むSome: 210272202.104    1.70倍
普通のSome:                                            123983068.995  1倍(基準軸とする)
--------------------------------------------------------------
None
TaggedTypeのNone:                               316034368.030  0.97倍
普通のNone:                                             324445881.942  1倍(基準軸とする)

#### まとめ
- `Option`は`AnyVal`を継承していないので、boxingされずにメモリを消費する
- ただし、使用しない方がリスクが高いので、よほどパフォーマンスに懸念がある場合以外は、基本的に使用した方が良い
- どうしてもパフォーマンス上、ボトルネックになる場合はTaggedTypeでだいようすることを選択肢にいれる