<a href="https://colab.research.google.com/github/kalz2q/mycolabnotebooks/blob/master/haskell_gentle.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# メモ

a gentle introduction to haskell  
https://www.sampou.org/haskell/tutorial-j/  
https://www.haskell.org/tutorial/  
を読む。ノート。

In [1]:
%%capture
!apt install haskell-platform

In [2]:
!ghc --version

The Glorious Glasgow Haskell Compilation System, version 8.0.2


In [None]:
# 型付け
%%script false
                         5  :: Integer
                        'a' :: Char
                        inc :: Integer -> Integer
                    [1,2,3] :: [Integer]
                    ('b',4) :: (Char,Integer)

# :: はなになにの型はなになに "has type" と読むことができる


In [None]:
# 関数定義
%%script false

inc n          = n+1

inc            :: Integer -> Integer



In [None]:
# e1 が評価され e2 になることを
# e1 => e2
# と書く。

# 例えば
%%script false

inc (inc 3) => 5



In [None]:
# list とは
%%script false

length                  :: [a] -> Integer
length []               =  0
length (x:xs)           =  1 + length xs

length [1,2,3]	=>	3
length ['a','b','c']	=>	3
length [[1],[2],[3]]	=>	3

In [None]:
# head と tail
%%script false

head                    :: [a] -> a
head (x:xs)             =  x

tail                    :: [a] -> [a]
tail (x:xs)             =  xs

#  head と tail はカラのリストではエラーになる


In [None]:
# 型の定義
%%script false

data Bool               = False | True

# Bool, False, True は引数を持たないコンストラクタ nullary constructor
# Bool が型の名前、型コンストラクタで、False, True がデータコンストラクタ

data Color              = Red | Green | Blue | Indigo | Violet

# Bool, Color は列挙型 enumerated type


In [None]:
# 次のは 1つだけデータコンストラクタ(Pt a a)を持つ型

data Point a            = Pt a a

# Point のような型はタプル型と呼ばれる。 なぜなら本質的に他の型の直積(デカルト積)だから。
# Bool, Color のような複数のデータコンストラクタを持つ型は直和型((disjoint) union or sum types)と呼ばれる。

# Point は多相型なので、次のは正しい。

Pt 2.0 3.0 :: Point Float
Pt 'a' 'b' :: Point Char
Pt True False :: Point Bool

# 多相型の型コンストラクタとして、[] や -> がある。

# データコンストラクタを適用して値を得ることと、型コンストラクタを適用して型を得ることを区別する。
# 名前空間が違うので、同じ名前が使える。
data Point a = Point a a

In [None]:
# 再帰型
%%script false

data Tree a = Leaf a | Branch (Tree a) (Tree a)

# ここで Tree は型コンストラクタで Branch や Leaf はデータコンストラクタなので

Branch :: Tree a -> Tree a -> Tree a
Leaf :: a -> Tree a

# ということになる。

# fringeという、木を左から右へたどって「葉」にある要素のリストを返す関数を定義したいとする。
# その定義は次のようになる

fringe :: Tree a -> [a]
fringe (Leaf x) = [x]
fringe (Branch left right) = fringe left ++ fringe right


In [None]:
# type synonym 型の同義名、シノニム
%%script false

type String = [Char]
type Person = (Name, Address)
type Name = String
data Address = None | Addr String

type AssocList a b = [(a,b)]


In [None]:
# Built-in 組み込みの型について
# 例えば Char は
%%script false
data Char = 
    Ca | Cb | Cc | ...
    | CA | CB | CC | ...
    | C1 | C2 | C3 | ...
    ...

# 同様に

data Int = -65532 | ... | -1 | 0 | 1 | ... | 65532

data Integer = ... -2 | -1 | 0 | 1 | 2 ...

# のように考えることができる。ここで、-65532と65532は、与えられた処理系における固定精度整数の最小値と最大値。

# タプルもこのやりかたで定義できる。

data (a,b) = (a,b)
data (a,b,c) = (a,b,c)
data (a,b,c,d) = (a,b,c,d)
        . .
        . .
        . .

# リストも同様に定義できる。リストの場合は再帰的になる。

data [a] = [] | a : [a]

# タプルとリストの違いから次のようなルールが明らかである。

# (e1,e2,...,en), n>=2 に対して、もし、ti が ei の型であるとす るならば、タプルの型は (t1,t2,...,tn) 
# [e1,e2,...,en], n>=0 に対して各 ei が必ず同じ型 t であるなら、そのリストの 型は [t]



In [None]:
# リスト内包表記 List Comprehensions と 数列 Arithmetic Sequences
%%script false

[ f x | x <- xs ]

[ (x,y) | x <- xs, y <- ys ]

# xs = [1,2] 、ys = [3,4] ならば =>  [(1,3),(1,4),(2,3),(2,4)] となる。

# ガード guard

quicksort [] = []
quicksort (x:xs) = quicksort [y | y <- xs, y<x ] ++ [x] ++ quicksort [y | y <- xs, y>=x]

# 数列 Arithmetic Sequences

[1..10] => [1,2,3,4,5,6,7,8,9,10] -- 10 も入ることに注意
[1,3..10] => [1,3,5,7,9] -- 10 以下の奇数
[1,3..] => [1,3,5,7,9, ...] -- 無限



In [None]:
# 文字列 String
%%script false

['h','e','l','l','o'] = "hello"

type String = [Char]

"hello" ++ " world" => "hello world"


In [None]:
# 関数
%%script false

add :: Integer -> Integer -> Integer
add x y = x + y

# これは add (x,y) = x + y とは違う


In [None]:
# 実験
!ghc -e $'let {add x y = x + y; inc = add 1} in print (inc 4) '
!ghc -e $'let {add (x y) = x + y; inc = add 1} in print (inc 4) ' #=> Parse error
!ghc -e $'let {add x y = x + y; inc = add 1} in print (add 4 5) '
!ghc -e $'let {add (x, y) = x + y} in print (add (4, 5)) '

5

<interactive>:0:11: error: Parse error in pattern: x
9
9


In [None]:
# map 関数は関数を引数にとる
%%script false

map :: (a->b) -> [a] -> [b]
map f [] = []
map f (x:xs) = f x : map f xs

map (add 1) [1,2,3] => [2,3,4]

# この例は関数が第一級の対象 (first-class object) であることを示している。
# このような使いかたをする関数は高階 (higher-order)関数とよばれる。


In [None]:
# ラムダ抽象 (lambda abstraction) 無名関数
# 例えば inc は  \x -> x+1 と書く。
# add は \x -> \y -> x + y と書く。
# 簡略化して \x y -> x + y と書く。
%%script false

inc x = x+1
add x y = x+y

# は次の等式と同等

inc = \x -> x+1
add = \x y -> x+y


In [None]:
# 中置演算子 infix operator
# 中置演算子は関数なので、等式を使って定義
%%script false

# リストの連結演算子
(++) :: [a] -> [a] -> [a]
[] ++ ys = ys
(x:xs) ++ ys = x : (xs++ys)

# マイナス(-)は前置演算子にも、中置演算子にもなる。

# 関数合成(function composition)演算子

(.) :: (b->c) -> (a->b) -> (a->c)
f . g = \ x -> f (g x)

# 中置演算子の部分適用は section と呼ばれる

(x+) = \y -> x+y
(+y) = \x -> x+y
(+) = \x y -> x+y


In [None]:
# 実験 中置演算子の部分適用が関数を返すことの確認
# map (+) [1,2,3] は関数のリスト

!ghc -e $'((map (+) [1,2,3])!!1) 5' #=> 7
!ghc -e $'((map (/) [1,2,3])!!1) 5' #=> 0.4
!ghc -e $'(map (5/) [1,2,3])!!1' #=> 2.5
!echo
!ghc -e $'map (/5) [1,2,3]'
!ghc -e $'map (5/) [1,2,3]'
!echo
!ghc -e $'map (^2) [1,2,3]'
!ghc -e $'map (2^) [1,2,3]'

7
0.4
2.5

[0.2,0.4,0.6]
[5.0,2.5,1.6666666666666667]

[1,4,9]
[2,4,8]


In [None]:
# したがって
%%script false

inc = (+ 1)
add = (+)

# と書ける


In [None]:
# 関数をバッククオートで括ると中置演算子になる
%%script false

x `elem` xs

# は直感的に、x は xs の要素である ( x is an element of xs ) と読める。

# (-) については特別なルールがある。


In [None]:
# 結合度 fixity の優先順位
# fixity declaration では 0 から 9 を指定する。 9 が最強。
# 一般の関数は 10 と仮定されている。
# infixr は右結合、 infixl は左結合
%%script false

infixr 5 ++
infixr 9 .

# デフォルトは infixl 9



In [None]:
# 関数は非正格 non-strict
# bot が次のように定義されているとする。
%%script false

bot = bot

# このような停止しない式の値を抽象的に _|_(ボトム)と表わす。
# 1/0 もこの値を持ち、エラーは回復不可能で、プログラムはこれ以上継続することはできなくなる。
# I/O のシステムのエラー(たとえば、EOFエラーなどの例外)は回復可能。

# 関数 f が正格 strict であるとは、停止しない式に適用されれば、その適用式も停止しないこと。
# ほとんどのプログラミング言語では、すべての関数が正格。Haskell では違う。

const1 x = 1

# のとき、const1 bot は 1 であり、引数は評価されない。 これを遅延評価と呼ぶ。

const1 (1/0)

# も 1 になる。

# 遅延評価により、無限 infinite のデータ構造が扱える。

# 別のやり方で説明すると、Haskell では代入 assignment ではなく、定義 definition を用いる。

v = 1/0

# は、v を 1/0と定義すると読む。vの値が必要になったときにのみゼロ除算エラーが発生する。


In [None]:
# 無限のデータ構造
# データコンストラクタも非正格である。
# リストのコンストラクタ、: も非正格。
# 非正格の構築子で(概念的に)無限の infinite データ構造を 定義することができる。
%%script false

ones = 1 : ones

numsFrom n = n : numsFrom (n+1)

squares = map (^2) (numsFrom 0)


In [None]:
# 実験 take 5 squares => [0,1,4,9,16]
!ghc -e $'let{numsFrom n = n:numsFrom(n+1); squares = map (^2)(numsFrom 0)} in print (take 5 squares)'

[0,1,4,9,16]


In [None]:
# 実験 ones は循環リスト circular list
!ghc -e $'let{ones=1:ones} in print (take 5 ones)'

[1,1,1,1,1]


In [None]:
# フィボナッチ関数
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# ここで zip とは

zip (x:xs) (y:ys) = (x,y) : zip xs ys
zip xs ys = []

# エラー関数 error

error :: String-> a

# 型からは返す値の型は多相の型で実際の型がわからない。
# すべての型によって「共有」される値 _|_ bottom が存在する。
# error の返す値は常にこの値。しかし、実装はチェックのための error の文字列引数を印字する。

head (x:xs) = x
head [] = error "head{PreludeList}: head []"


In [None]:
# Case 式
# パターンは入れ子にも使える。
%%script false

contrived :: ([a], Char, (Int, Float), String, Bool) -> Bool
contrived ([], 'b', (1, 2.0), "hi", True) = False

# 仮引数 (formal parameters) もパターンであり、値にかならず照合が成功する。
# その副作用として、仮引数は照合が成功した値に束縛される。
# なぜなら、ひとつの等式であれば、そのなかのパターンには、2つ以上の同じ仮引数が含まれてはいけないから。
# これは、線型性 (linearity) と呼ばれる。
# 仮引数のような必ず照合が成功するようなパターンのことを irrefutable パターンと呼び、
# refutable パターンは照合が成功しない可能性があり contrived の例はこの refutable の例。
# 不可反駁パターンに は 3つの種類がありそのうち 2つを紹介する。

# アズパターン
# たとえばリストの第一要素を複製する関数

f (x:xs) = x:x:xs

# 明日パターンを使うと次のようになる。

f s@(x:xs) = x:s

# アズパターンは照合に常に成功するが、サブパターン(この場合は、x:xs)はもちろん照合が成功しないこともある。

# ワイルドカード
# head 関数や tail 関数は次のように書き換えることができる。

head (x:_) = x
tail (_:xs) = xs

# 仮引数の場合とちがい、ワイルドカードはひとつの等式のなかに 1つ以上あっても構わない。


In [None]:
# パターン照合の意味論 semantics

# パターン照合は、fail, succeed, diverge (発散) の場合がある。
# 成功すると、パターンの中の仮引数が束縛される。
# 発散 diverge はパターンが必要とした値がエラー( _|_ )を含んでいた場合。
# すべての等式でパターン照合が失敗すると、その関数適用の値は _|_ になり、 実行時エラーとなる。
#
# たとえば、[1,2] を [0,bot] に照合させようとすると、0 と 1 がマッチしないので照合は失敗。
# しかし、もし、[1,2] を [bot,0] にマッチさせようとすると、1 を botへ照合させる際に発散がおこる。

# パターンがガード部を持つこともある。
%%script false

sign x |  x >  0        =   1
       |  x == 0        =   0
       |  x <  0        =  -1


In [None]:
# パターン照合が関数の意味に微妙な影響を与える場合がある

%%script false

take 0 _ = []
take _ [] = []
take n (x:xs) = x : take (n-1) xs

# と

take1 _ [] = []
take1 0 _ = []
take1 n (x:xs) = x : take1
(n-1) xs

# 次の結果を見る。

take 0 bot => []
take1 0 bot => _|_
take bot [] => _|_
take1 bot [] => []

# どちらがよいということでなく、違いがあるということを覚えておく。

In [None]:
# Case 式
# 関数定義のなかでのパターン照合の意味は、実は case 式のより単純なものと考えられる。
%%script false

# 次のような関数定義があったとする。
f p11 ... p1k = e1
...
f pn1 ... pnk = en

# これは以下と同等。

f x1 x2 ... xk = case (x1, ..., xk) of
    (p11, ..., p1k) -> e1
    ...
    (pn1, ..., pnk) -> en

# take についても

take m ys = case (m,ys) of
    (0,_) -> []
    (_,[]) -> []
    (n,x:xs) -> x : take (n-1) xs

# となる。
# case 式の右辺はすべて同じ主型である。

# if 式の

if e1 then e2 else e3

# は次の構文の簡略形である。

case e1 of True -> e2
        False -> e3

# つまり、if_then_else_ を関数とみなせば

Bool -> a -> a -> a 

# という型である。


In [None]:
# 遅延 lazy パターン
# 遅延パターンは ~pat であらわされる。
# 不可反駁 irrefutable で値 v の ~pat に 対する照合は常に成功する。
# pat のなかの識別子が右辺で「利用」されるとすると、それは v が pat に
# マッチすると仮定した場合の値に束縛されるか、_|_ となる。

# 遅延パターンは無限のデータ構造が再帰的に定義されているような場合に便利。
# 無限リストはシミュレーションプログラムを書くのに使いやすいデータ構造で、ストリームといいます。

# server と client との間のやりとりの簡単なケースを考える。
# client は一連の要求を server に送り、server は各々の要求に対して、応答を返す。
# client は引数として初期メッセージもとることに注意。

%%script false

reqs = client init resps
resps = server reqs

# さらに、サーバとクライアントの構造を、以下のように仮定する。

client init (resp:resps) = init : client (next resp) resps
server (req:reqs) = process req : server reqs

# next はサーバからの応答を与えられて、次の要求を決定する関数であり、
# process はクライアントからの要求を与えられて、応答を返す関数であるとする。

# 残念ながら、このプログラムには大きな問題がある。
# 問題は、client が reqs と resps の再帰的な設定のなかで使われているので、
# 最初の要求を送信する前に応答リストと照合を試みようとする。つまり、
# パターン照合がおこなわれるのが「早すぎる」。
# これを是正するひとつの方法は以下のように client を再定義する。

client init resps = init : client (next (head resps)) (tail resps)

# これで動作するようになるが、もっとよい解決法は遅延パターンを使う方法である。

client init ~(resp:resps) = init : client (next resp) resps

# 遅延パターンは不可反駁なので、照合はただちに成功し、最初の要求が発信され、
# それから最初の応答が生成される。

#  この例は、以下のように定義を加えれば、実際に動作する。

init = 0
next resp = resp
process req = req+1

# 実際に動作させてみると、

take 10 reqs => [0,1,2,3,4,5,6,7,8,9]

## 動作しない!!!!

# いまここ

In [None]:
# フィボナッチ関数 遅延評価版
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# これをアズパターンを使って次のように書き換える。

fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]

このバージョンの fib の利点(小さいですが)は、左辺の
tfib で展開した形式を使用できるので、 tail
を右辺で使 わなくてよいということです。

[この種の等式はパターン束縛( patternbinding )とよばれま
す。その理由は、トップレベルにある等式で左辺全体がひとつのパターンになっ
ているからです。すなわち、fib と tfibはともに宣言内で 束縛されているということです。]

さて、以前と同じ論法でいうとこのプログラムはなんの出力もないということを
導くことができそうです。しかし、奇妙なことにこのプログラムは出力が生
成されます。その理由は簡単です。Haskell
ではパターン束縛は暗黙のう ちに ~
がパターンの前についているものとみなすからです。このことは、
パターン束縛に期待される共通のふるまいのほとんどを反映しています。ある種
の変則的な状況はこのチュートリアルの守備範囲を越えるので、ここでは説明し
ません。このようにして、Haskell
の遅延パターンは暗黙のうちに重要な役割を
はたすことが理解できます。



In [4]:
# 実験
!ghc -e $'let {fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]} in print (take 5 fib)'
!ghc -e $'let {fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]} in print (take 5 fib)'

[1,1,2,3,5]
[1,1,2,3,5]


In [None]:

4.5 字句の有効範囲と入れ子形式

ひとつの式のなかで入れ子の有効範囲をつくりたいことがよくあります。これは、
その部分だけの局所的な束縛をつくりたいときです。ある種の「ブロック構造」
の形式が欲しくなります。Haskell
ではこれを実現するのに 2 つの方法が用意 されています。

let 式
Haskell のlet 式( let expression
)は入れ子になった束縛の
集まりが必要なときに役に立ちます。簡単な例を考えてみましょう。

let y = a*b
f x = (x+y)/y
in f c + f d

let 式によってつくられる束縛の集りは、相互再帰的 (
mutually recursive
)で、パターン束縛は遅延パターンとして扱われ ます(
~が暗黙のうちについているということです)。ここで許される
宣言は、型シグネチャー、関数束縛、パターン束縛 のみです。

where 節
ときには、いくつかのガードをもつ等式にまたがる有効範囲束縛があれば便利な
こともあります。そんなときには where 節( where
clause ) が必要です。

f x y | y>z = ...
| y==z = ...
| y<z = ...
where z = x*x

これは、let
式と同じようには使えないことに注意してください。 where
節はそれが覆う式の上にしか有効範囲がありません。 where
節は等式の集まりあるいは case
式のトップレベルでしか認め られていません。また、let
式での束縛の性質と制約が where
節の束縛にも適用されます。

入れ子の有効範囲のこれら 2
つの形式は非常によく似たものですが、 let
式はひとつの式であり、一方、where 節は
式ではないということを覚えてください。where 節は関数宣
言および case 式の構文の一部です。



In [None]:

4.6 レイアウト
読者のなかには、なぜ Haskell
ではセミコロンあるいはそれにかわる終端記号
を使わずにすんでいるのか不思議におもった方もいるでしょう。これらの記号は
等式や宣言などの終端を示すものですが、それがなぜ必要ないのでしょうか。例
をあげましょう。前の節の let 式を考えてみましょう。

let y = a*b
f x = (x+y)/y
in f c + f d

構文解析はなぜ次のように解析したりしないのでしょうか。

let y = a*b f
x = (x+y)/y
in f c + f d


答えは、Haskell はレイアウト( layout
)と呼ばれる、二次元
構文を用いているからです。レイアウトは「カラム位置にならべられた」宣言に
依存しています。上の例で、y と f とは同一のカラム位置
からはじまっていることに注目してください。レイアウトのルールの詳細は
Haskell
レポート(§1.5,§B.3)の方にまかせますが、
実用上はこのレイアウトの使い方は直観的にわかります。ただ、覚えておいてほ
しいことがふたつあります。

まず第一は、キーワード where、let, あるいは of
につづく次の文字は、それぞれ、where 節、let
式、case 式のな
かの宣言のはじまるカラム位置を決定するものであることです。(このルールは、
クラス宣言やインスタンス宣言のなかの where
にも適用されます。こ れについては 5 節を参照して
ください。)
これにより、宣言部はキーワードと同じ行でも、次の行ででもはじ
めることができます。( do
キーワード、これについては後で議論しま
すが、これもレイアウトを使います。)

ふたつめは、開始カラムは直接囲われている節の開始カラムよりも右になければ
ならないということです。(そうしなければ、曖昧になってしまいます。)
宣言
の「終端」は束縛形式の開始カラムの位置あるいはそれよりも左側でなにかが開
始されたときに起こります。( Haskell
では慣習として、タブは 8 個のスペー
スとして見なします。なので、エディタで 8
カラムタブ以外の表示を使ってい る場合には注意が必要です。)

レイアウトは実際には明示的なグルーピング機構の簡略表記です。あ
る種の状況ではグルーピング機構は大変役に立つので、これについては言及する
価値があります。上の let の例は以下のものと同等です。

let { y = a*b
; f x = (x+y)/y
}
in f c + f d

明示的な波括弧とセミコロンに注目してください。この明示的な表記方が便利な
のは、ふたつ以上の宣言を 1
行におさめたいときです。たとえば、以下は正し い式です。

let y = a*b; z = a/b
f x = (x+y)/z
in f c + f d

もうひとつのレイアウトを明示的な区切り子に展開する例については
§1.5 を参照してく ださい。

レイアウトを利用すれば、宣言リストが構文的にごしゃごしゃするのが少なくな
り、可読性がまします。使いかたを覚えるのは簡単ですので、どしどし使ってく
ださい。

A Gentle Introduction to
Haskell, Version 98
back next top
