# <center><font face="STCAIYUN" color=green size=7>S C A L A</font></center>

# 第1章 Scala的变量及函数 
---
## 变量定义与基本类型
### 定义一个变量
<font face="宋体" size=3>Scala在首次定义一个变量时，必须在变量名前面添加关键字“var”或者“val”。     
    用“var”修饰的变量，可以重新赋予新的值，并且把原值抛弃，类似于Java的非final变量。在后续重新赋值时，就不用再写“var”了。      
    用“val”修饰的变量，则禁止被重新赋值，类似于Java的final变量，换句话说，就是只能读不能写的变量。       
    变量名可以是任意的字母、数字和下划线的组合，但是不能以数字开头。Scala推荐的命名方法是“驼峰命名法”，即每个单词的首字母大写，并且变量名和函数名以小写字母开头，类、对象和特质则以大写字母开头。在首次定义变量时，就必须赋予具体的值来初始化。不能出现如下形式：

 </font>

In [None]:
//以下代码都是合法的变量定义：

val x = 1
var y = 2
val msg = "Hello, world!"

<font face="宋体" size=3>var类型的变量在重新赋值时，新值必须和旧值是同一个类型，否则会发生类型匹配错误：
 </font>

In [None]:
var x = 1
x = 10
//重新对x赋值 
x = "abc"

In [None]:
//val类型的变量则直接禁止重新赋值：
val x = 1
x = 10

<font face="宋体" size=3>如果要赋给多个变量相同的值，那么没必要逐条定义，而是在一条语句里用逗号间隔的变量名。例如：
 </font>

In [None]:
val a, b, c = 1

<font face="宋体" size=3>Scala的变量定义具有覆盖性，也就是说，如果出现了同名的变量，则后出现的变量会覆盖前面的变量。例如：
 </font>

In [None]:
val x = 1
val x = 10
x

<font face="宋体" size=3>要注意的是，赋给变量的对象存在可变与不可变之分。要理解到底是变量指向的对象本身发生了改变，还是变量指向了新的对象。即使是val类型的变量，也能被指向一个可变对象。这个可变对象能够被重新修改，例如，给可变映射添加新的键值对。事实上，这只是旧对象发生了改变，并未产生新的对象。
Scala提倡定义val类型的变量，因为它是函数式编程，而函数式编程的思想之一就是传入函数的参数不应该被改变。所以，在Scala里，所有函数的参数都必须是val类型的。但是，Scala也允许指令式编程，因而预留了var类型的变量，</font>
### Scala的基本类型
<font face="宋体" size=3>Scala是静态语言，在编译期间会检查每个对象的类型。对于类型不匹配的非法操作，在编译时就能被发现。对于动态语言而言，这种非法操作需要等到运行时才能被发现，此时可能造成严重错误。所以，静态语言相比诸如Python这样的动态语言在某些方面是有优势的。对于Chisel而言，我们就需要这种优势。因为Chisel需要编译成Verilog HDL，我们不能产生非法的Verilog HDL语句并且等到模块运行时才去发现它。
Scala标准库定义了一些基本类型，如下表所示。
 </font>

||scala基本类型|
|:----:|:----:|
|Byte|8-bit有符号整数，补码表示，范围是-27 到27-1|
|Short|16-bit有符号整数，补码表示，范围是 -215 到215-1|
|Int|32-bit有符号整数，补码表示，范围是 -231 到 231-1|
|Long|64-bit有符号整数，补码表示，范围是 -263 到 263-1|
|Char|16-bit无符号字符，Unicode编码，范围是 0 到 216-1|
|String|字符串|
|Float|32-bit单精度浮点数，符合IEEE 754标准|
|Double|64-bit双精度浮点数，符合IEEE 754标准|
|Boolean|布尔值，其值为true或者false|

<font face="宋体" size=3>事实上，在定义变量时，应该指明变量的类型，只不过Scala的编译器具有自动推断类型的功能，可以根据赋给变量的对象的类型，来自动推断出变量的类型。如果要显式声明变量的类型，或者无法推断时，则只需在变量名后面加上一个冒号“ : ”，然后在等号与冒号之间写出类型名即可。例如：

 </font>

In [None]:
val x: Int = 123
val y: String = "123"
val z: Double = 1.2

#### 整数字面量
<font face="宋体" size=3>整数有四种类型，默认情况下推断为Int类型。如果字面量的结尾有l或者L，则推断为Long类型。此外，Byte和Short则需要定义变量时显式声明。注意，赋给的字面值不能超过类型的表示范围。
整数字面量默认是十进制的，但如果以“0x”或者“0X”开头，则字面量被认为是十六进制。十六进制的字母不区分大小写。例如：

 </font>

In [None]:
val a = 100
val b = 0X123Abc
val c = 200L

#### 浮点数字面量 
<font face="宋体" size=3>浮点数的字面量都是十进制的，类型默认是Double类型。可以增加一个字母“e”或者“E”，再添加一个整数作为指数，这样就构成10的n次幂。最末尾可以写一个“f”或者“F”，表示Float类型；也可以写一个“d”或者“D”，表示Double类型，但这不是必要的。注意，Double类型的字面量不能赋给Float类型的变量。虽然Float允许扩展成Double类型，但是会发生精度损失。例如
 </font>：


In [None]:
val a = 1.2E3
val b = -3.2f

In [None]:
val c: Float = -3.2

In [None]:
val d: Double = -3.2F

#### 字符与字符串字面量
 <font face="宋体" size=3>字符字面量是以单引号‘’包起来的一个字符，采用Unicode编码。
 </font>


In [None]:
val a = 'D'

<font face="宋体" size=3>也可以用‘\u编码号'的方式来构造一个字符，而且Unicode编码可以出现在代码的任何地方，甚至是名称命名。
 </font>

In [None]:
val b = '\u0041'
val c = '\u0042'

<font face="宋体" size=3>此外，还支持转义字符
 </font>。

In [None]:
val d = ‘\\’

<font face="宋体" size=3>字符串字面量就是用双引号""包起来的字符序列，长度任意，允许掺杂转义字符。
 </font>

In [None]:
val a = "\\\\\\"

<font face="宋体" size=3>此外，也可以用前后各三个双引号"""  """包起来，这样字符串里也能出现双引号，而且转义字符不会被解读。
 </font>

In [None]:
val b = """So long \u0041 String \\\'\"!"""

#### 字符串插值
<font face="宋体" size=3>Scala构建了一个灵活的机制进行字符串插值，这使得表达式可以被嵌入在字符串字面量中并被求值。       
    第一种形式是s插值器，即在字符串的双引号前加一个s，形如s“…${表达式}…”。s插值器会对内嵌的每个表达式求值，并调用内置的toString方法，得到求值结果后替换掉字面量中的表达式。
 </font>


In [None]:
val name = "ABC"
println(s"$name DEFG")
s"Sum = ${1 + 10}"
s"\\\\"

<font face="宋体" size=3>第二种形式是raw插值器，它与s插值器类似，只不过不识别转义字符。第三种形式是f插值器，允许给内嵌的表达式加上printf风格的指令，指令放在表达式之后并以百分号开始。指令语法来自java.util.Formatter。分别举例如下：
 </font>

In [None]:
raw"\\\\"
printf(f"${math.Pi}%.5f")

## 函数及其几种形式
### 定义一个函数
<font face="宋体" size=3>Scala的函数定义以“def”开头，然后是一个自定义的函数名(推荐驼峰命名法)，接着是用圆括号“( )”包起来的参数列表。在参数列表里，多个参数用逗号隔开，并且每个参数名后面要紧跟一个冒号以及显式声明的参数类型，因为编译器在编译期间无法推断出入参类型。写完参数列表后，应该紧跟一个冒号，再添加函数返回结果的类型。最后，再写一个等号“=”，等号后面是用花括号“{ }”包起来的函数体。
 </font>


#### 分号推断
<font face="宋体" size=3>在Scala的代码里，语句末尾的分号是可选的，因为编译器会自动推断分号。如果一行只有一条完整的语句，那么分号可写可不写；如果一行有多条语句，则必须用分号隔开。有三种情况句末不会推断出分号：        
    ①句末是以非法结尾字符结尾，例如以句点符号“.”或中缀操作符结尾。     
    ②下一行的句首是以非法起始字符开始，例如以句点符号“.”开头。      
    ③跨行出现的圆括号对“( )”或者方括号对“[ ]”，因为它们里面不能进行分号的自动推断，要么只包含一条完整语句，要么包含用分号显式隔开的多条语句。另外，花括号对“{ }”的里面可以进行分号的自动推断。      
    为了简洁起见，同时不产生无意的错误和歧义，建议一行只写一条完整的语句，句末分号省略，让编译器自动推断。而且内层的语句最好比外一层语句向内缩进两个空格，使得代码层次分明。
 </font>
#### 函数的返回结果
<font face="宋体" size=3>在Scala里，“return”关键字也是可选的。默认情况下，编译器会自动为函数体里的最后一个表达式加上“return”，将其作为返回结果。建议不要显式声明“return”，这会引发warning，而且使得代码风格看上去像指令式风格。
 </font>


In [None]:
def add(x: Int, y: Int) = { x + y }
add(1, 2)
def nothing(x: Int, y: Int): Unit = { x + y }
nothing(1, 2)

#### 等号与函数体
<font face="宋体" size=3>Scala的函数体是用花括号包起来的，这与C、C++、Java等语言类似。函数体里可以有多条语句，并自动推断分号、返回最后一个表达式。如果只有一条语句，那么花括号也可以省略。      
    Scala的函数定义还有一个等号，这使得它看起来类似数学里的函数“f(x) = ...”。当函数的返回类型没有显式声明时，那么这个等号可以省略，但是返回类型一定会被推断成Unit类型，不管有没有值返回，函数体都必须有花括号。当函数的返回类型显式声明时，则无论如何都不能省略等号。建议写代码时不要省略等号，避免产生不必要的错误，返回类型最好也显式声明。
 </font>
#### 无参函数
<font face="宋体" size=3>如果一个函数没有参数，那么可以写一个空括号作参数列表，也可以不写。如果有空括号，那么调用时可以写也可以不写空括号；如果没有空括号，那么调用时就一定不能写空括号。原则上，无副作用的无参函数省略括号，有副作用的无参函数添加括号，这提醒使用者需要额外小心。
 </font>
### 方法
<font face="宋体" size=3>方法其实就是定义在class、object、trait里面的函数，这种函数叫做“成员函数”或者“方法”，与多数oop(object-oriented programming)语言一样。
 </font>
### 嵌套函数
<font face="宋体" size=3>函数体内部还可以定义函数，这种函数的作用域是局部的，只能被定义它的外层函数调用，外部无法访问。局部函数可以直接使用外层函数的参数，也可以直接使用外层函数的内部变量
 </font>


In [None]:
def addSub(x: Int, y: Int) = {
    def sub(z: Int) = z - 10
    if(x > y) sub(x - y) else sub(y - x)
     }
addSub(100, 20)


### 函数字面量
<font face="宋体" size=3>Scala可以定义函数的字面量。函数字面量是一种匿名函数的形式，它可以存储在变量里、成为函数参数或者当作函数返回值，其定义形式为：
(参数1: 参数1类型, 参数2: 参数2类型, ...) => { 函数体 }      
    通常，函数字面量会赋给一个变量，这样就能通过“变量名(参数)”的形式来使用函数字面量。在参数类型可以被推断的情况下，可以省略类型，并且参数只有一个时，圆括号也可以省略。
函数字面量的形式可以更精简，即只保留函数体，并用下划线“_”作为占位符来代替参数。在参数类型不明确时，需要在下划线后面显式声明其类型。多个占位符代表多个参数，即第一个占位符是第一个参数，第二个占位符是第二个参数……，因此不能重复使用某个参数。
 </font>

In [None]:
 val f = (_: Int) + (_: Int)
 f(1, 2)

<font face="宋体" size=3>无论是用“def”定义的函数，还是函数字面量，它们的函数体都可以把一个函数字面量作为一个返回结果，这样就成为了返回函数的函数；它们的参数变量的类型也可以是一个函数，这样调用时给的入参就可以是一个函数字面量。类型为函数的变量，其冒号后面的类型写法是“(参数1类型, 参数2类型,...) => 返回结果的类型”。
 </font>

In [None]:
val add = (x: Int) => { (y: Int) => x + y }
add(1)(10)
def aFunc(f: Int => Int) = f(1) + 1
aFunc(x => x + 1)


<font face="宋体" size=3>在第一个例子中，变量add被赋予了一个返回函数的函数字面量。在调用时，第一个括号里的“1”是传递给参数x，第二个括号里的“10”是传递给参数y。如果没有第二个括号，得到的就不是11，而是“(y: Int) => 1 + y”这个函数字面量。      
   
 </font>

<font face="宋体" size=3>在第二个例子中，函数aFunc的参数f是一个函数，并且该函数要求是一个入参为Int类型、返回结果也是Int类型的函数。在调用时，给出了函数字面量“x => x + 1”。这里没有显式声明x的类型，因为可以通过f的类型来推断出x必须是一个Int类型。在执行时，首先求值f(1)，结合参数“1”和函数字面量，可以算出结果是2。那么，“f(1) + 1”就等于3了。
 </font>

### 部分应用函数
<font face="宋体" size=3>上面介绍的函数字面量实现了函数作为一等值的功能，而用“def”定义的函数也具有同样的功能，只不过需要借助部分应用函数的形式来实现。例如，有一个函数定义为“def max(...) ...”，若想要把这个函数存储在某个变量里，不能直接写成“val x = max”的形式，而必须像函数调用那样，给出一部分参数，故而称作部分应用函数(如果参数全给了，就成了函数调用)。部分应用函数的作用，就是把def函数打包到一个函数值里，使它可以赋给变量，或当作函数参数进行传递。例如：

 </font>

In [None]:
def sum(x: Int, y: Int, z: Int) = x + y + z
val a1 = sum(4, 5, 6)
val a2 = sum(4, _: Int, 6)
a2(5)
val a3 = sum _
a3(4, 5, 6)


<font face="宋体" size=3>变量a1其实是获得了函数sum调用的返回结果，变量a2则是获得了部分应用函数打包的sum函数，因为只给出了参数x和z的值，参数y没有给出。注意，没给出的参数用下划线代替，而且必须显式声明参数类型。变量a3也是部分应用函数，只不过一个参数都没有明确给出。像这样一个参数都不给的部分应用函数，只需要在函数名后面给一个下划线即可，注意函数名和下划线之间必须有空格。
如果部分应用函数一个参数都没有给出，比如例子中的a3，那么在需要该函数作入参的地方，下划线也可以省略。例如：
 </font>

### 闭包
<font face="宋体" size=3>个函数除了可以使用它的参数外，还能使用定义在函数以外的其他变量。其中，函数的参数称为绑定变量，因为完全可以根据函数的定义得知参数的信息；而函数以外的变量称为自由变量，因为函数自身无法给出这些变量的定义。这样的函数称为闭包，因为它要在运行期间捕获自由变量，让函数闭合，定义明确。自由变量必须在函数前面定义，否则编译器就找不到，会报错。     
    闭包捕获的自由变量是闭包创建时活跃的那个自由变量，后续若新建同名的自由变量来覆盖前面的定义，由于闭包已经闭合完成，所以新自由变量与已创建的闭包无关。如果闭包捕获的自由变量本身是一个可变对象(例如var类型变量)，那么闭包会随之改变。

 </font>

### 函数的特殊调用形式
#### 具名参数
<font face="宋体" size=3>普通函数调用形式是按参数的先后顺序逐个传递的，但如果调用时显式声明参数名并给其赋值，则可以无视参数顺序。按位置传递的参数和按名字传递的参数可以混用。

 </font>

In [None]:
def max(x: Int, y: Int, z: Int) = {
    if(x > y && x > z) println("x is maximum")
    else if(y > x && y > z) println("y is maximum")
    else println("z is maximum")
    }
 max(1, z = 10, y = 100)

#### 默认参数值
<font face="宋体" size=3>函数定义时，可以给参数一个默认值，如果调用函数时缺省了这个参数，那么就会使用定义时给的默认值。默认参数值通常和具名参数结合使用。

 </font>

In [None]:
def max(x: Int = 10, y: Int, z: Int) = {
    if(x > y && x > z) println("x is maximum")
    else if(y > x && y > z) println("y is maximum")
    else println("z is maximum")
    }
max(y = 3, z = 5)

#### 重复参数
<font face="宋体" size=3>Scala允许把函数的最后一个参数标记为重复参数，其形式为在最后一个参数的类型后面加上星号“*”。重复参数的意思是可以在运行时传入任意个相同类型的元素，包括零个。类型为“T*”的参数的实际类型是“Array[T]”，即若干个T类型对象构成的数组。尽管是T类型的数组，但要求传入参数的类型仍然是T。如果传入的实参是T类型对象构成的数组，则会报错，除非用“变量名: _*”的形式告诉编译器把数组元素一个一个地传入。
 </font>


In [None]:
def addMany(msg: String, num: Int*) = {
              var sum = 0
              for(x <- num) sum += x
              println(msg + sum)
           }
addMany("sum = ", 1, 2, 3)
addMany("sum = ")
addMany("sum = ", Array(1, 2, 3): _*)

<font face="宋体" size=3>但是这种写法在Scala2.13版本中是不赞成的，会出现warning。因为数组的内容是可更改的，将数组值传递给入参，会导致数据的复制。
推荐在Array外面包一层unsafeWrap,避免了数据的复制，更加高效。
 </font>


In [None]:
import scala.collection.immutable.ArraySeq.unsafeWrapArray
addMany("sum = ",unsafeWrapArray(Array(1,2,3)):_*)

<font face="宋体" size=3>或者传入一个List，List的内容是不可更改的，作为入参，可避免数据的复制。
 </font>

In [None]:
addMany("sum = ",List(1,2,3):_*)

### 柯里化
<font face="宋体" size=3>对大多数编程语言来说，函数只能有一个参数列表，但是列表里可以有若干个用逗号间隔的参数。Scala有一个独特的语法——柯里化，也就是一个函数可以有任意个参数列表。柯里化往往与另一个语法结合使用：当参数列表里只有一个参数时，在调用该函数时允许单个参数不用圆括号包起来，改用花括号也是可行的。这样，在自定义类库时，自定义方法就好像“if(...) {...}”、“while(...) {...}”、“for(...) {...}”等内建控制结构一样，让人看上去以为是内建控制，丝毫看不出是自定义语法。例如：

 </font>

In [None]:
def add(x: Int, y: Int, z: Int) = x + y + z
add(1, 2, 3)
def addCurry(x: Int)(y: Int)(z: Int) = x + y + z
addCurry(1)(2) {3}

### 传名参数
<font face="宋体" size=3>在1.2.4介绍了函数字面量如何作为函数的参数进行传递，以及如何表示类型为函数时参数的类型。如果某个函数的入参类型是一个无参函数，那么通常的类型表示法是“() => 函数的返回类型”。在调用这个函数时，给出的参数就必须写成形如“() => 函数体”这样的函数字面量。      
    为了让代码看起来更舒服，也为了让自定义控制结构更像内建结构，Scala又提供了一个特殊语法——传名参数。也就是类型是一个无参函数的函数入参，传名参数的类型表示法是“=> 函数的返回类型”，即相对常规表示法去掉了前面的空括号。在调用该函数时，传递进去的函数字面量则可以只写“函数体”，去掉了“() =>”。例如[1]（引自《Scala编程（第3版）》）：

 </font>

In [None]:
var assertionEnabled = false

// predicate是类型为无参函数的函数入参
def myAssert(predicate: () => Boolean) =
     if(assertionEnabled && !predicate())
     throw new AssertionError
// 常规版本的调用
myAssert(() => 5 > 3)
 
// 传名参数的用法，注意因为去掉了空括号，所以调用predicate时不能有括号
def byNameAssert(predicate: => Boolean) =
    if(assertionEnabled && !predicate)
    throw new AssertionError

// 传名参数版本的调用，看上去更自然
byNameAssert(5 > 3)

<font face="宋体" size=3>可以看到，传名参数使得代码更加简洁、自然，而常规写法则很别扭。事实上，predicate的类型可以改成Boolean，而不必是一个返回布尔值的函数，这样调用函数时与传名参数是一致的。例如（引自《Scala编程（第3版）》）：

 </font>

In [None]:
// 使用布尔型参数的版本
def boolAssert(predicate: Boolean) =
     if(assertionEnabled && !predicate)
     throw new AssertionError
// 布尔型参数版本的调用
boolAssert(5 > 3)


 <font face="宋体" size=3>尽管byNameAssert和boolAssert在调用形式上是一样的，但是两者的运行机制却不完全一样。如果给函数的实参是一个表达式，比如“5 > 3”这样的表达式，那么boolAssert在运行之前会先对表达式求值，然后把求得的值传递给函数去运行。而myAssert和byNameAssert则不会一开始就对表达式求值，它们是直接运行函数，直到函数调用入参时才会对表达式求值，也就是例子中的代码运行到“!predicate”时才会求“5 > 3”的值。
 </font>

In [None]:
myAssert(() => 5 / 0 == 0)
byNameAssert(5 / 0 == 0)

----
### 小结
<font face="宋体" size=3>本节内容是对Scala的函数的讲解，重点在于理解函数作为一等值的概念，函数字面量的作用以及部分应用函数的作用。在阅读复杂的代码时，常常遇见诸如“def xxx(f: T => U, ...) ...”或 “def xxx(...): T => U”的代码，要理解前者表示需要传入一个函数作为参数，后者表示函数返回的对象是一个函数。在学习初期，理解函数是一等值的概念可能有些费力，通过大量阅读和编写代码才能熟能生巧。同时不要忘记前一节说过，函数的参数都是val类型的，在函数体内不能修改传入的参数。
 </font>


# <font face="STCAIYUN" color=green size=5>E   N   D</font>