<a href="https://colab.research.google.com/github/kalz2q/mycolabnotebooks/blob/master/haskell_gentle.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# メモ

a gentle introduction to haskell  
https://www.sampou.org/haskell/tutorial-j/  
を読む。ノート。

In [None]:
# 型付け
%%script false
                         5  :: Integer
                        'a' :: Char
                        inc :: Integer -> Integer
                    [1,2,3] :: [Integer]
                    ('b',4) :: (Char,Integer)

# :: はなになにの型はなになに "has type" と読むことができる


In [None]:
# 関数定義
%%script false

inc n          = n+1

inc            :: Integer -> Integer



In [None]:
# e1 が評価され e2 になることを
# e1 => e2
# と書く。

# 例えば
%%script false

inc (inc 3) => 5



In [None]:
# list とは
%%script false

length                  :: [a] -> Integer
length []               =  0
length (x:xs)           =  1 + length xs

length [1,2,3]	=>	3
length ['a','b','c']	=>	3
length [[1],[2],[3]]	=>	3

In [None]:
# head と tail
%%script false

head                    :: [a] -> a
head (x:xs)             =  x

tail                    :: [a] -> [a]
tail (x:xs)             =  xs

#  head と tail はカラのリストではエラーになる


In [None]:
# 型の定義
%%script false

data Bool               = False | True

# Bool, False, True は引数を持たないコンストラクタ nullary constructor
# Bool が型の名前、型コンストラクタで、False, True がデータコンストラクタ

data Color              = Red | Green | Blue | Indigo | Violet

# Bool, Color は列挙型 enumerated type


In [None]:
# 次のは 1つだけデータコンストラクタ(Pt a a)を持つ型

data Point a            = Pt a a

# Point のような型はタプル型と呼ばれる。 なぜなら本質的に他の型の直積(デカルト積)だから。
# Bool, Color のような複数のデータコンストラクタを持つ型は直和型((disjoint) union or sum types)と呼ばれる。

# Point は多相型なので、次のは正しい。

Pt 2.0 3.0 :: Point Float
Pt 'a' 'b' :: Point Char
Pt True False :: Point Bool

# 多相型の型コンストラクタとして、[] や -> がある。

# データコンストラクタを適用して値を得ることと、型コンストラクタを適用して型を得ることを区別する。
# 名前空間が違うので、同じ名前が使える。
data Point a = Point a a

In [None]:
# 再帰型
%%script false

data Tree a = Leaf a | Branch (Tree a) (Tree a)

# ここで Tree は型コンストラクタで Branch や Leaf はデータコンストラクタなので

Branch :: Tree a -> Tree a -> Tree a
Leaf :: a -> Tree a

# ということになる。

# fringeという、木を左から右へたどって「葉」にある要素のリストを返す関数を定義したいとする。
# その定義は次のようになる

fringe :: Tree a -> [a]
fringe (Leaf x) = [x]
fringe (Branch left right) = fringe left ++ fringe right


In [None]:
# type synonym 型の同義名、シノニム
%%script false

type String = [Char]
type Person = (Name, Address)
type Name = String
data Address = None | Addr String

type AssocList a b = [(a,b)]


In [None]:
# Built-in 組み込みの型について
# 例えば Char は
%%script false
data Char = 
    Ca | Cb | Cc | ...
    | CA | CB | CC | ...
    | C1 | C2 | C3 | ...
    ...

# 同様に

data Int = -65532 | ... | -1 | 0 | 1 | ... | 65532

data Integer = ... -2 | -1 | 0 | 1 | 2 ...

# のように考えることができる。ここで、-65532と65532は、与えられた処理系における固定精度整数の最小値と最大値。

# タプルもこのやりかたで定義できる。

data (a,b) = (a,b)
data (a,b,c) = (a,b,c)
data (a,b,c,d) = (a,b,c,d)
        . .
        . .
        . .

# リストも同様に定義できる。リストの場合は再帰的になる。

data [a] = [] | a : [a]

# タプルとリストの違いから次のようなルールが明らかである。

# (e1,e2,...,en), n>=2 に対して、もし、ti が ei の型であるとす るならば、タプルの型は (t1,t2,...,tn) 
# [e1,e2,...,en], n>=0 に対して各 ei が必ず同じ型 t であるなら、そのリストの 型は [t]



In [None]:
# リスト内包表記 List Comprehensions と 数列 Arithmetic Sequences
%%script false

[ f x | x <- xs ]

[ (x,y) | x <- xs, y <- ys ]

# xs = [1,2] 、ys = [3,4] ならば =>  [(1,3),(1,4),(2,3),(2,4)] となる。

# ガード guard

quicksort [] = []
quicksort (x:xs) = quicksort [y | y <- xs, y<x ] ++ [x] ++ quicksort [y | y <- xs, y>=x]

# 数列 Arithmetic Sequences

[1..10] => [1,2,3,4,5,6,7,8,9,10] -- 10 も入ることに注意
[1,3..10] => [1,3,5,7,9] -- 10 以下の奇数
[1,3..] => [1,3,5,7,9, ...] -- 無限



In [None]:
# 文字列 String
%%script false

['h','e','l','l','o'] = "hello"

type String = [Char]

"hello" ++ " world" => "hello world"


In [None]:
# 関数
%%script false

add :: Integer -> Integer -> Integer
add x y = x + y

# これは add (x,y) = x + y とは違う


In [22]:
# 実験
!ghc -e $'let {add x y = x + y; inc = add 1} in print (inc 4) '
!ghc -e $'let {add (x y) = x + y; inc = add 1} in print (inc 4) ' #=> Parse error
!ghc -e $'let {add x y = x + y; inc = add 1} in print (add 4 5) '
!ghc -e $'let {add (x, y) = x + y} in print (add (4, 5)) '

5

<interactive>:0:11: error: Parse error in pattern: x
9
9


In [None]:
# map 関数は関数を引数にとる
%%script false

map :: (a->b) -> [a] -> [b]
map f [] = []
map f (x:xs) = f x : map f xs

map (add 1) [1,2,3] => [2,3,4]

# この例は関数が第一級の対象 (first-class object) であることを示している。
# このような使いかたをする関数は高階 (higher-order)関数とよばれる。


In [None]:
# ラムダ抽象 (lambda abstraction) 無名関数
# 例えば inc は  \x -> x+1 と書く。
# add は \x -> \y -> x + y と書く。
# 陥落かして \x y -> x + y と書く。
%%script false

inc x = x+1
add x y = x+y

# は次の等式と同等

inc = \x -> x+1
add = \x y -> x+y


# いまここ

In [None]:
# 中置演算子 infix operator
# 中置演算子は関数なので、等式を使って定義する。
%%script false

# リストの連結演算子
(++) :: [a] -> [a] -> [a]
[] ++ ys = ys
(x:xs) ++ ys = x : (xs++ys)

# マイナス(-)は前置演算子にも、中置演算子にもなる。

# 関数合成(function composition)演算子

(.) :: (b->c) -> (a->b) -> (a->c)
f . g = \ x -> f (g x)

# 中置演算子の部分適用は section と呼ばれる

(x+) = \y -> x+y
(+y) = \x -> x+y
(+) = \x y -> x+y


In [None]:

3.2.1 セクション
中置演算子はまさに関数ですから、関数と同じように、部分適用が可能です。
Haskell では中置演算子の部分適用のことをセクション
( section )といいます。例を見ましょう。

(x+) = \y -> x+y
(+y) = \x -> x+y
(+) = \x y -> x+y
[ここでの括弧は必須です。]

上の例の最後のセクションの形式は中置演算子から同等の関数値へ変換する働き
をします。この形式は中置演算子を関数の引数として渡すときに便利な方法です。
たとえば、map (+) [1,2,3]
のようにします。(読者の皆さ
んはここで、関数のリストが返されていることを確かめてください。)
関数の型 を与える際にも必要になります。これはすでに
(++) および (.)
の例で示しましたね。さて、これですでに定義した add が
(+)、inc が (+1) で定義できることがわかり
ます。実際これらの定義がすっきりします。

inc = (+ 1)
add = (+)


中置演算子を関数値に変換できましたが、それでは、その逆は可能なのでしょう
か。可能です。関数値をバッククウォートで括るだけです。たとえば、
x `add` y は、add x y と同じです。
(これは、add がバッククオート で括るのであって、文字の
場合のアポストロフィ(あるいはシングルクウォート)で括る
わけではありません。つまり、'f' は文字で、`f`
は中置演 算子です。幸い、ほとんどの ASCII
端末ではこのふたつを区別できるようになっ
ています。(手で書くとそうはいかないようです。)
関数によっては、中置演算
子にしたほうが読みやすくなります。たとえば、リストの要素かどうかを調べる
述語関数 elem がその例です。x `elem` xs
は直 観的に「x が属しているのは xs である。( x
is an element of xs )」と読めます。

[前置/中置演算子 -
のセクションについてはいくつかの特別なルール
があります。(§3.5,§3.4)。]

ここまでで、読者のみなさんは関数の定義のしかたにいろいろあって、混乱した
かもしれません。これらの定義のメカニズムのサポートを決定するにあたっては、
歴史的な慣習も部分的には反映されていますし、一貫性を確保したい(たとえば、
中置演算子と普通の関数の取り扱いなど)という要望も反映されています。



In [None]:

3.2.2 結合性宣言
結合性宣言( fixity declaration )
はすべての中置演算子と 中置構築子 ( `elem`
のような一般の識別子に由来するものも含む)に
対しておこなうことができます。この宣言では 0 から 9
までの優先レベル( 9
が最強です。一般の関数適用の優先レベルは 10
と仮定されています。)と、右
結合性、左結合性をもつ、あるいは結合性をもたない、という指定をします。例
をあげると ++ と . の結合性宣言は、

infixr 5 ++
infixr 9 .

です。両方とも右結合性が指定されています。++ は優先レベル
5 で . は優先レベル 9 と指定されています。左結合性は
infixl を使って指定し、結合性のないことは infix
で指定 します。おなじ結合性宣言で 1
つ以上の演算子の結合性について指定できます。
もし、ある演算子に対して、結合性宣言をしない場合はデフォルトで
infixl 9 が指定されたことになります。(
結合性ルールの定義 の詳細については §5.6
参照のこと。)



In [None]:

3.3 関数は非正格
bot が次のように定義されているとしましょう。

bot = bot

bot は停止しない式です。このような停止しない式の値を抽
象的に
_|_(ボトムと読む)と表わします。ある種の実行時エラーになる式、たと
えば、1/0
のような式もこの値を持ちます。このようなエラーは回復
不可能で、プログラムはこれ以上継続することはできなくなります。I/O
システ ムのエラー(たとえば、EOF
エラーなど)は回復可能で、べつの方法で取り扱い
ます。(このような I/O
エラーは、実はエラーではなく、例外です。例外につい
ての詳細は 7 節でふれます。)

関数 f が正格 ( strict )
であるとは、停止しない
式に適用されれば、その適用式も停止しないことをいいます。いいかえると、
f bot が _|_ の時でかつその時にかぎり、f
は正格で
あるといいます。ほとんどのプログラミング言語では、すべての関数
が正格です。ただ、 Haskell
では違います。簡単な例、つねに 1 を返す関数 const1
を考えましょう。定義は、

const1 x = 1

です。const1 bot の値は Haskell では 1
です。操作 的な観点からいうと、const1
はその引数の値を「必要」としないので、
引数は決して評価されません。だから停止しない計算に陥いることがないのです。
こういうわけで、非正格関数は「遅延関数 ( lazy
function ) 」とも呼ばれ、
その引数の評価については「遅延評価」とか「必要呼び評価」とかいわれていま
す。

Haskell
では、エラーや停止しない値は、意味論的に同じものですから、上の引数
にはエラーも含まれています。たとえば、 const1
(1/0) もちゃ んと評価されて 1 になります。

非正格関数は多くの場面で、たいへん役に立ちます。そのなかで、主要な利点は、
プログラマが評価の順に気をくばらなくてもよい、ということです。計算上高価
な値を、必要もないのに余分な計算をしなければならないかもしれない、などと
心配せずに関数へ渡すことができます。重要な例のひとつは、無限の
( infinite ) データ構造です。

もうひとつ別のやりかたで非正格関数を説明しましょう。Haskell
は伝統的な言 語のように代入 ( assignment )
ではなく、定義 ( definition )
を用いて計算をすすめます。たとえば、

v = 1/0

のような宣言は、「 v を 1/0
と定義する」と読みます。こ れは、「 1/0
を計算し、その結果を v へ格納する」とは読 みません。v
の値(定義)が必要になったときにのみゼロ除算エラーが
発生します。宣言それだけでは計算は起こりません。代入を必要とするプロ
グラミングではその代入の順序に細心の注意をはらう必要があります。プログラ
ムの意味は代入がおこる順序に依存します。一方、定義はずっと単純で、プログ
ラムの意味には影響あたえず、どのような順で出現してもかまいません。


3.4 「無限の」データ構造
Haskell
の非正格な性質の利点のひとつは、データコンストラクタもが非正格で
あることです。このことはべつに驚くべきことではありません。コンストラクタ
は特殊な関数にすぎません(ふつうの関数との違いは、パターンマッチで使われ
るということです)。たとえば、リストの構築子、:
は非正格です。

非正格の構築子で(概念的に)無限の( infinite
)データ構造を 定義することができます。これは、1
の無限リストです。

ones = 1 : ones

さらに面白いのは、numsFrom 関数です。

numsFrom n = n : numsFrom
(n+1)

numsFrom n は n
から始まる無限の整数リストです。
これを使って、平方数の無限リストを構成することができます。

squares = map (^2) (numsFrom
0)

(ここで、セクションの使いかたに注目してください。^
は中置の指数 演算子です。)

当然のことながら、実際の計算では、そこから、有限の部分を取り出したいわけ
です。Haskell
ではこの用途で使える関数があらかじめたくさん定義されていま
す。take、takeWhile、filter
等々です。Haskell
の定義には多くの組み込みの関数や型が含まれています。これらを「標準プレリュー
ド( Standard Prelude
)」と呼びます。標準プレリュード全体は、Haskell
Report の付録 A
にあります。リスト上の数多くの有用な関数が
PreludeList
の部分にありますので、参照してください。例をあげま
しょう。take はリストから最初の n
個の要素を取り出しま す。

take 5 squares => [0,1,4,9,16]

上にあげた、ones の定義は、循環リスト(
circular list
)の例です。ほとんどの場合、遅延性は効率の面で非常に重要です。表
現が本当の循環リストとして実装されるので、空間が節約できます。


In [None]:

循環性を使用した別の例をみてみましょう。フィボナッチ数列はつぎのような循
環数列をつかって効率よく計算することができます。

fib = 1 : 1 : [ a+b | (a,b) <-
zip fib (tail fib) ]

ここで、zip
は標準プレリュードにある関数で、引数のふたつのリス
トの要素を互いにペアにしたリストを返す関数です。

zip (x:xs) (y:ys) = (x,y) :
zip xs ys
zip xs ys = []

無限リスト fib
が自分自身をつかってどのように定義されているかに
注目してください。「自分の尻尾をおいかける」ような定義になっていますね。
実際、この計算を絵にえがくと図 1 のようになります。

Fib Example
図 1
無限リストの応用のさらにもうひとつの例については 4.4
節を参照のこと


3.5 エラー関数
Haskell には error
という組み込みの関数があります。この関数の型 は
String->a
です。これはすこしばかり奇妙な関数です。型から
すると、この関数の返す値の型は多相の型で実際の型がわかりません。この型の
引数を受けとるわけではないからです。

すべての型によって「共有」される値 _|_
というのが存在します。 実際、意味論的には、error
の返す値は常にこの値です(すべてのエラー の値は _|_
であることを思い出してください)。しかし、実装はチェックのため
の error
の文字列引数を印字するというのが妥当なところでしょう。
それで、この関数は、なにか「誤りがあった場合」、プログラムを停止させたい
ときに便利です。たとえば、標準プレリュードでは、head
の定義は以 下のようになっています。

head (x:xs) = x
head [] = error
"head{PreludeList}: head []"
