<a href="https://colab.research.google.com/github/kalz2q/mycolabnotebooks/blob/master/haskell_gentle.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# メモ

a gentle introduction to haskell  
https://www.sampou.org/haskell/tutorial-j/  
https://www.haskell.org/tutorial/  
を読む。ノート。

In [1]:
%%capture
!apt install haskell-platform

In [2]:
!ghc --version

The Glorious Glasgow Haskell Compilation System, version 8.0.2


In [None]:
# 型付け
%%script false
                         5  :: Integer
                        'a' :: Char
                        inc :: Integer -> Integer
                    [1,2,3] :: [Integer]
                    ('b',4) :: (Char,Integer)

# :: はなになにの型はなになに "has type" と読むことができる


In [None]:
# 関数定義
%%script false

inc n          = n+1

inc            :: Integer -> Integer



In [None]:
# e1 が評価され e2 になることを
# e1 => e2
# と書く。

# 例えば
%%script false

inc (inc 3) => 5



In [None]:
# list とは
%%script false

length                  :: [a] -> Integer
length []               =  0
length (x:xs)           =  1 + length xs

length [1,2,3]	=>	3
length ['a','b','c']	=>	3
length [[1],[2],[3]]	=>	3

In [None]:
# head と tail
%%script false

head                    :: [a] -> a
head (x:xs)             =  x

tail                    :: [a] -> [a]
tail (x:xs)             =  xs

#  head と tail はカラのリストではエラーになる


In [None]:
# 型の定義
%%script false

data Bool               = False | True

# Bool, False, True は引数を持たないコンストラクタ nullary constructor
# Bool が型の名前、型コンストラクタで、False, True がデータコンストラクタ

data Color              = Red | Green | Blue | Indigo | Violet

# Bool, Color は列挙型 enumerated type


In [None]:
# 次のは 1つだけデータコンストラクタ(Pt a a)を持つ型

data Point a            = Pt a a

# Point のような型はタプル型と呼ばれる。 なぜなら本質的に他の型の直積(デカルト積)だから。
# Bool, Color のような複数のデータコンストラクタを持つ型は直和型((disjoint) union or sum types)と呼ばれる。

# Point は多相型なので、次のは正しい。

Pt 2.0 3.0 :: Point Float
Pt 'a' 'b' :: Point Char
Pt True False :: Point Bool

# 多相型の型コンストラクタとして、[] や -> がある。

# データコンストラクタを適用して値を得ることと、型コンストラクタを適用して型を得ることを区別する。
# 名前空間が違うので、同じ名前が使える。
data Point a = Point a a

In [None]:
# 再帰型
%%script false

data Tree a = Leaf a | Branch (Tree a) (Tree a)

# ここで Tree は型コンストラクタで Branch や Leaf はデータコンストラクタなので

Branch :: Tree a -> Tree a -> Tree a
Leaf :: a -> Tree a

# ということになる。

# fringeという、木を左から右へたどって「葉」にある要素のリストを返す関数を定義したいとする。
# その定義は次のようになる

fringe :: Tree a -> [a]
fringe (Leaf x) = [x]
fringe (Branch left right) = fringe left ++ fringe right


In [None]:
# type synonym 型の同義名、シノニム
%%script false

type String = [Char]
type Person = (Name, Address)
type Name = String
data Address = None | Addr String

type AssocList a b = [(a,b)]


In [None]:
# Built-in 組み込みの型について
# 例えば Char は
%%script false
data Char = 
    Ca | Cb | Cc | ...
    | CA | CB | CC | ...
    | C1 | C2 | C3 | ...
    ...

# 同様に

data Int = -65532 | ... | -1 | 0 | 1 | ... | 65532

data Integer = ... -2 | -1 | 0 | 1 | 2 ...

# のように考えることができる。ここで、-65532と65532は、与えられた処理系における固定精度整数の最小値と最大値。

# タプルもこのやりかたで定義できる。

data (a,b) = (a,b)
data (a,b,c) = (a,b,c)
data (a,b,c,d) = (a,b,c,d)
        . .
        . .
        . .

# リストも同様に定義できる。リストの場合は再帰的になる。

data [a] = [] | a : [a]

# タプルとリストの違いから次のようなルールが明らかである。

# (e1,e2,...,en), n>=2 に対して、もし、ti が ei の型であるとす るならば、タプルの型は (t1,t2,...,tn) 
# [e1,e2,...,en], n>=0 に対して各 ei が必ず同じ型 t であるなら、そのリストの 型は [t]



In [None]:
# リスト内包表記 List Comprehensions と 数列 Arithmetic Sequences
%%script false

[ f x | x <- xs ]

[ (x,y) | x <- xs, y <- ys ]

# xs = [1,2] 、ys = [3,4] ならば =>  [(1,3),(1,4),(2,3),(2,4)] となる。

# ガード guard

quicksort [] = []
quicksort (x:xs) = quicksort [y | y <- xs, y<x ] ++ [x] ++ quicksort [y | y <- xs, y>=x]

# 数列 Arithmetic Sequences

[1..10] => [1,2,3,4,5,6,7,8,9,10] -- 10 も入ることに注意
[1,3..10] => [1,3,5,7,9] -- 10 以下の奇数
[1,3..] => [1,3,5,7,9, ...] -- 無限



In [None]:
# 文字列 String
%%script false

['h','e','l','l','o'] = "hello"

type String = [Char]

"hello" ++ " world" => "hello world"


In [None]:
# 関数
%%script false

add :: Integer -> Integer -> Integer
add x y = x + y

# これは add (x,y) = x + y とは違う


In [None]:
# 実験
!ghc -e $'let {add x y = x + y; inc = add 1} in print (inc 4) '
!ghc -e $'let {add (x y) = x + y; inc = add 1} in print (inc 4) ' #=> Parse error
!ghc -e $'let {add x y = x + y; inc = add 1} in print (add 4 5) '
!ghc -e $'let {add (x, y) = x + y} in print (add (4, 5)) '

5

<interactive>:0:11: error: Parse error in pattern: x
9
9


In [None]:
# map 関数は関数を引数にとる
%%script false

map :: (a->b) -> [a] -> [b]
map f [] = []
map f (x:xs) = f x : map f xs

map (add 1) [1,2,3] => [2,3,4]

# この例は関数が第一級の対象 (first-class object) であることを示している。
# このような使いかたをする関数は高階 (higher-order)関数とよばれる。


In [None]:
# ラムダ抽象 (lambda abstraction) 無名関数
# 例えば inc は  \x -> x+1 と書く。
# add は \x -> \y -> x + y と書く。
# 簡略化して \x y -> x + y と書く。
%%script false

inc x = x+1
add x y = x+y

# は次の等式と同等

inc = \x -> x+1
add = \x y -> x+y


In [None]:
# 中置演算子 infix operator
# 中置演算子は関数なので、等式を使って定義
%%script false

# リストの連結演算子
(++) :: [a] -> [a] -> [a]
[] ++ ys = ys
(x:xs) ++ ys = x : (xs++ys)

# マイナス(-)は前置演算子にも、中置演算子にもなる。

# 関数合成(function composition)演算子

(.) :: (b->c) -> (a->b) -> (a->c)
f . g = \ x -> f (g x)

# 中置演算子の部分適用は section と呼ばれる

(x+) = \y -> x+y
(+y) = \x -> x+y
(+) = \x y -> x+y


In [None]:
# 実験 中置演算子の部分適用が関数を返すことの確認
# map (+) [1,2,3] は関数のリスト

!ghc -e $'((map (+) [1,2,3])!!1) 5' #=> 7
!ghc -e $'((map (/) [1,2,3])!!1) 5' #=> 0.4
!ghc -e $'(map (5/) [1,2,3])!!1' #=> 2.5
!echo
!ghc -e $'map (/5) [1,2,3]'
!ghc -e $'map (5/) [1,2,3]'
!echo
!ghc -e $'map (^2) [1,2,3]'
!ghc -e $'map (2^) [1,2,3]'

7
0.4
2.5

[0.2,0.4,0.6]
[5.0,2.5,1.6666666666666667]

[1,4,9]
[2,4,8]


In [None]:
# したがって
%%script false

inc = (+ 1)
add = (+)

# と書ける


In [None]:
# 関数をバッククオートで括ると中置演算子になる
%%script false

x `elem` xs

# は直感的に、x は xs の要素である ( x is an element of xs ) と読める。

# (-) については特別なルールがある。


In [None]:
# 結合度 fixity の優先順位
# fixity declaration では 0 から 9 を指定する。 9 が最強。
# 一般の関数は 10 と仮定されている。
# infixr は右結合、 infixl は左結合
%%script false

infixr 5 ++
infixr 9 .

# デフォルトは infixl 9



In [None]:
# 関数は非正格 non-strict
# bot が次のように定義されているとする。
%%script false

bot = bot

# このような停止しない式の値を抽象的に _|_(ボトム)と表わす。
# 1/0 もこの値を持ち、エラーは回復不可能で、プログラムはこれ以上継続することはできなくなる。
# I/O のシステムのエラー(たとえば、EOFエラーなどの例外)は回復可能。

# 関数 f が正格 strict であるとは、停止しない式に適用されれば、その適用式も停止しないこと。
# ほとんどのプログラミング言語では、すべての関数が正格。Haskell では違う。

const1 x = 1

# のとき、const1 bot は 1 であり、引数は評価されない。 これを遅延評価と呼ぶ。

const1 (1/0)

# も 1 になる。

# 遅延評価により、無限 infinite のデータ構造が扱える。

# 別のやり方で説明すると、Haskell では代入 assignment ではなく、定義 definition を用いる。

v = 1/0

# は、v を 1/0と定義すると読む。vの値が必要になったときにのみゼロ除算エラーが発生する。


In [None]:
# 無限のデータ構造
# データコンストラクタも非正格である。
# リストのコンストラクタ、: も非正格。
# 非正格の構築子で(概念的に)無限の infinite データ構造を 定義することができる。
%%script false

ones = 1 : ones

numsFrom n = n : numsFrom (n+1)

squares = map (^2) (numsFrom 0)


In [None]:
# 実験 take 5 squares => [0,1,4,9,16]
!ghc -e $'let{numsFrom n = n:numsFrom(n+1); squares = map (^2)(numsFrom 0)} in print (take 5 squares)'

[0,1,4,9,16]


In [None]:
# 実験 ones は循環リスト circular list
!ghc -e $'let{ones=1:ones} in print (take 5 ones)'

[1,1,1,1,1]


In [None]:
# フィボナッチ関数
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# ここで zip とは

zip (x:xs) (y:ys) = (x,y) : zip xs ys
zip xs ys = []

# エラー関数 error

error :: String-> a

# 型からは返す値の型は多相の型で実際の型がわからない。
# すべての型によって「共有」される値 _|_ bottom が存在する。
# error の返す値は常にこの値。しかし、実装はチェックのための error の文字列引数を印字する。

head (x:xs) = x
head [] = error "head{PreludeList}: head []"


In [None]:
# Case 式
# パターンは入れ子にも使える。
%%script false

contrived :: ([a], Char, (Int, Float), String, Bool) -> Bool
contrived ([], 'b', (1, 2.0), "hi", True) = False

# 仮引数 (formal parameters) もパターンであり、値にかならず照合が成功する。
# その副作用として、仮引数は照合が成功した値に束縛される。
# なぜなら、ひとつの等式であれば、そのなかのパターンには、2つ以上の同じ仮引数が含まれてはいけないから。
# これは、線型性 (linearity) と呼ばれる。
# 仮引数のような必ず照合が成功するようなパターンのことを irrefutable パターンと呼び、
# refutable パターンは照合が成功しない可能性があり contrived の例はこの refutable の例。
# 不可反駁パターンに は 3つの種類がありそのうち 2つを紹介する。

# アズパターン
# たとえばリストの第一要素を複製する関数

f (x:xs) = x:x:xs

# 明日パターンを使うと次のようになる。

f s@(x:xs) = x:s

# アズパターンは照合に常に成功するが、サブパターン(この場合は、x:xs)はもちろん照合が成功しないこともある。

# ワイルドカード
# head 関数や tail 関数は次のように書き換えることができる。

head (x:_) = x
tail (_:xs) = xs

# 仮引数の場合とちがい、ワイルドカードはひとつの等式のなかに 1つ以上あっても構わない。


In [None]:
# パターン照合の意味論 semantics

# パターン照合は、fail, succeed, diverge (発散) の場合がある。
# 成功すると、パターンの中の仮引数が束縛される。
# 発散 diverge はパターンが必要とした値がエラー( _|_ )を含んでいた場合。
# すべての等式でパターン照合が失敗すると、その関数適用の値は _|_ になり、 実行時エラーとなる。
#
# たとえば、[1,2] を [0,bot] に照合させようとすると、0 と 1 がマッチしないので照合は失敗。
# しかし、もし、[1,2] を [bot,0] にマッチさせようとすると、1 を botへ照合させる際に発散がおこる。

# パターンがガード部を持つこともある。
%%script false

sign x |  x >  0        =   1
       |  x == 0        =   0
       |  x <  0        =  -1


In [None]:
# パターン照合が関数の意味に微妙な影響を与える場合がある

%%script false

take 0 _ = []
take _ [] = []
take n (x:xs) = x : take (n-1) xs

# と

take1 _ [] = []
take1 0 _ = []
take1 n (x:xs) = x : take1
(n-1) xs

# 次の結果を見る。

take 0 bot => []
take1 0 bot => _|_
take bot [] => _|_
take1 bot [] => []

# どちらがよいということでなく、違いがあるということを覚えておく。

In [None]:
# Case 式
# 関数定義のなかでのパターン照合の意味は、実は case 式のより単純なものと考えられる。
%%script false

# 次のような関数定義があったとする。
f p11 ... p1k = e1
...
f pn1 ... pnk = en

# これは以下と同等。

f x1 x2 ... xk = case (x1, ..., xk) of
    (p11, ..., p1k) -> e1
    ...
    (pn1, ..., pnk) -> en

# take についても

take m ys = case (m,ys) of
    (0,_) -> []
    (_,[]) -> []
    (n,x:xs) -> x : take (n-1) xs

# となる。
# case 式の右辺はすべて同じ主型である。

# if 式の

if e1 then e2 else e3

# は次の構文の簡略形である。

case e1 of True -> e2
        False -> e3

# つまり、if_then_else_ を関数とみなせば

Bool -> a -> a -> a 

# という型である。


In [None]:
# 遅延 lazy パターン
# 遅延パターンは ~pat であらわされる。
# 不可反駁 irrefutable で値 v の ~pat に 対する照合は常に成功する。
# pat のなかの識別子が右辺で「利用」されるとすると、それは v が pat に
# マッチすると仮定した場合の値に束縛されるか、_|_ となる。

# 遅延パターンは無限のデータ構造が再帰的に定義されているような場合に便利。
# 無限リストはシミュレーションプログラムを書くのに使いやすいデータ構造で、ストリームといいます。

# server と client との間のやりとりの簡単なケースを考える。
# client は一連の要求を server に送り、server は各々の要求に対して、応答を返す。
# client は引数として初期メッセージもとることに注意。

%%script false

reqs = client init resps
resps = server reqs

# さらに、サーバとクライアントの構造を、以下のように仮定する。

client init (resp:resps) = init : client (next resp) resps
server (req:reqs) = process req : server reqs

# next はサーバからの応答を与えられて、次の要求を決定する関数であり、
# process はクライアントからの要求を与えられて、応答を返す関数であるとする。

# 残念ながら、このプログラムには大きな問題がある。
# 問題は、client が reqs と resps の再帰的な設定のなかで使われているので、
# 最初の要求を送信する前に応答リストと照合を試みようとする。つまり、
# パターン照合がおこなわれるのが「早すぎる」。
# これを是正するひとつの方法は以下のように client を再定義する。

client init resps = init : client (next (head resps)) (tail resps)

# これで動作するようになるが、もっとよい解決法は遅延パターンを使う方法である。

client init ~(resp:resps) = init : client (next resp) resps

# 遅延パターンは不可反駁なので、照合はただちに成功し、最初の要求が発信され、
# それから最初の応答が生成される。

#  この例は、以下のように定義を加えれば、実際に動作する。

init = 0
next resp = resp
process req = req+1

# 実際に動作させてみると、

take 10 reqs => [0,1,2,3,4,5,6,7,8,9]

## 動作しない!!!!

In [None]:
# フィボナッチ関数 遅延評価版
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# これをアズパターンを使って次のように書き換える。

fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]

# この種の等式はパターン束縛( patternbinding )と呼ばれる。
# 理由は、トップレベルにある等式で左辺全体がひとつのパターンになっているから。
# すなわち、fib と tfibはともに宣言内で 束縛されているということです。
# Haskellのパターン束縛は暗黙のう ちに ~ がパターンの前についているものとみなす。


In [4]:
# 実験
!ghc -e $'let {fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]} in print (take 5 fib)'
!ghc -e $'let {fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]} in print (take 5 fib)'

[1,1,2,3,5]
[1,1,2,3,5]


In [None]:
# 字句の有効範囲と入れ子形式 Lexical Scoping and Nested Forms
# let 式
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# let 式 expression によってつくられる束縛は、相互再帰的 (mutually recursive)で、遅延パターンとして扱われる。
# ~ が暗黙のうちについている。

# where 節 clause
# いくつかのガードをもつ等式にまたがる有効範囲束縛が便利なときには where 節を使う。

f x y  |  y>z           =  ...
       |  y==z          =  ...
       |  y<z           =  ...
     where z = x*x

# where 節はそれが覆う式の上にしか有効範囲がない。
# where 節は等式の集まりあるいは case 式のトップレベルでしか認められない。

# let 式は式であり、where 節は式ではない。where 節は関数宣言および case 式の構文の一部である。



In [None]:
# レイアウト
# Haskell はセミコロンあるいはそれにかわる終端記号を使わずにすんでいるのか。
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# 構文解析 parser はなぜ次のように解析したりしないのか。

let y   = a*b f
    x   = (x+y)/y
in f c + f d

# Haskell はレイアウト (layout) と呼ばれる、二次元構文を用いているから。
# カラム位置に依存している。
# 上の例は次のように解釈される。

let { y   = a*b
    ; f x = (x+y)/y
    }
in f c + f d

# 1行に複数の式を書きたいときにはセミコロンが便利である。

let y   = a*b;  z = a/b
    f x = (x+y)/z
in f c + f d


# いまここ

In [None]:
# 型クラスと多重定義 overloading
# すでに述べてきた多相 polymorphism は、パラメータ多相 parametric polymorphism とよばれる。
# アドホック多相は多重定義 overloading という呼びかたのほうが知られている。
# たとえば

1、2 などのリテラルは、固定長の整数と任意長の整数の両
方でつかわれることが多い。

+
のような数値演算子は何種類もの数値上で定義されることが多い。

同値演算子( Haskell では ==
)はふつう数値とその他多く(すべてで
はない)の型の上で動作することが多い。

こうした多重定義されたものの振舞いはそれぞれの型によって違いがあるという
ことに注意してください。(実際には、振舞いが定義されていないか、エラーに
なる場合もある。)
また、一方で、パラメータ多相では型そのものは重要で
はないことに注意してください。(たとえば、fringe
は木の葉の要素 の種類がなんであるかには関係あらない。)
Haskell では、 型クラス( class type
)によってアドホック多相あるいは多重
定義を制御する方法が提供されている。
単純だが、重要な例、同値性の例からはじめよう。同値性を定義したい型
には多くの型がある。しかし、いくつかの型については同値性を定義したく
ないこともある。たとえば、一般的にいって、関数が同値であるかどうかの
判定は計算では処理が困難だ。その一方で、ふたつのリストが同じかどうかを比
較したいことはよくあることだ。(ここで、同値性といっているのは、「値同値
性」のことだ。対照的な概念としては、「ポインタ同値性」というのがありま
す。たとえば、Java 言語の ==
だ。ポインタ同値性は参照透明性を
持ちない。それゆえに純粋な関数型言語とは相性がよくあらない。)
このこ
とをもっと明かにするために、リストの要素かどうかを検証する
elem という関数の定義をみてみよう。

x `elem` [] = False
x `elem` (y:ys) = x==y || (x
`elem` ys)

[ 3.1 節で議論した構文的な理由に より、elem
を定義するのに中置形式を選択する。== と ||
は、それぞれ、同値演算子と論理和演算子だ。]

直観的にいえば、elem の型は a->[a]->Bool
「でな ければならない。」 しかし、そのためには ==
の型は a->a->Bool
でなければならない。さきほど、全ての型につい て ==
を定義したいわけではないと言ったばかりにもかかわらずだ。


In [None]:

さらに、こんなことにも注目している。もし、 ==
を全ての型の上
で定義できたとしても、ふたつのリストを比較することと、ふたつの数を比較す
ることは全然違うことだ。こういう意味で、これらいろいろな仕事をさせるた
めに、== が多重定義できることを期待するわけだ。

型クラス( type class
)はこのふたつの問題を解決するのに都
合のよい仕組だ。型クラスを使うと型をいずれかのクラスのインスタンスとし
て定義できる。また、クラスに付随した多重定義された操作の定義
をおこなうことができる。たとえば、同値演算子を含むクラスの定義をしてみ
よう。

class Eq a where
(==) :: a -> a -> Bool

ここでは、Eq は定義するクラスの名前だ。また == はこ
のクラスでの唯一の操作だ。この宣言は、「型 a がクラス
Eq のインスタンスであるのは、(多重定義された) ==
が存
在し、そのうえで定義された適切な型をもつ場合である」と読むことができる。
(このとき、==
は同じ型の対象の組の上でのみ定義されることに注意
してください。)

型 a がクラス Eq のインスタンスでなければならない、と
いう制約は、 Eq a のように書くる。ということは、
Eq a
は型式ではなく、型に対する制約を表現していますので、 文脈(
context )と呼ばれる。文脈は型式の前に置くる。
たとえば、上のクラス宣言の効果は、次のような型を ==
に割当るこ とになる。

(==) :: (Eq a) => a -> a ->
Bool

これは、「クラス Eq のインスタンスであるような型 a の
それぞれに対して、== は a->a->Bool
という型をもつ」 と読むことができる。これは、まさに
elem の例で使われている ==
の型だ。実際にも、この文脈による制約が elem の主
型に波及する。

elem :: (Eq a) => a -> [a] ->
Bool

これは、「クラス Eq のインスタンスであるような型 a の
それぞれに対して、elem は a->[a]->Bool
という型
をもつ」と読むべきだ。これこそ、求めていたものに他ならない。これは、
elem
がすべての型の上で定義されているわけではなく、その要素につ
いて同値性の比較方法がわかっている型の上で定義されているということを示し
ている。


In [None]:

ここまではいいだろう。しかし、どのようにして、どの型が
Eq ク ラスのインスタンスになるかを指定し、その型に対する
== の実際の
振舞いを指定するのでしょうか。これは、インスタンス宣言 (
instance declaration
)でおこないる。たとえば、

instance Eq Integer where
x == y = x `integerEq` y

のようにする。== の定義はメソッド( method )と
呼びる。integerEq
関数は、この場合、たまたま、整数の同値性を
比較するプリミティブ関数だが、一般には、右辺では適正なものであれば、ど
のような式でもよいことになっている。これは、一般の関数の定義と同じだ。
この宣言全体は、「 Integer 型はクラス Eq
のインスタン スで、ここに、操作 ==
に対応するメソッドを定義する。」 と読むこ
とができる。この宣言をすれば、任意倍長の整数の同値性を
== を 用いて比較することができる。同様にして、

instance Eq Float where
x == y = x `floatEq` y

により浮動小数の比較を ==
を用いておこなうことができる。

前に定義した Tree
のような再帰的な型でも同じよう扱うことができ る。

instance (Eq a) => Eq (Tree a)
where
Leaf a == Leaf b = a == b
(Branch l1 r1) == (Branch l2
r2) = (l1==l2) && (r1==r2)
_ == _ = False

最初の行の Eq a という文脈は必須だ。なぜなら、
葉のもつ要素(型は a )は 2
番目の行の同値性を用いて比較する。
付加される制約は本質的には、a
の木の同値性の比較は、すでにその やりかたが知れている a
の同値性比較を用いて実現できるということ
だ。もし、文脈をインスタンス宣言から取り除くと、静的型エラーが発生しま
す。

Haskell
レポート、特にプレリュードには便利な型クラスの例が豊富に含まれて
いる。実際には、Eq
クラスの定義は前に定義したものよりは、もう
すこし規模がおおきいものだ。

class Eq a where
(==), (/=) :: a -> a -> Bool
x /= y = not (x == y)

これは、ふたつの操作子をもつクラスの例だ。ひとつは同値性の操作子、もう
ひとつは、非同値性の操作子だ。この例は、また、
デフォルトメソッドの使い方の例示になっている。この場合は非同
値性操作 /=
がそれだ。ある特定の操作に対するメソッドがインス
タンス宣言に含まれていないければ、そのクラス宣言中に定義されているデフォ
ルトメソッドがあれば、それが使われる。たとえば、まえに定義した
3 つの Eq
クラスのインスタンスは上のクラス宣言で完全に動作する。この
とき、望む非同値性の正しい定義(同値性の論理否定)がつくりだされている。


In [None]:

Haskell ではクラス拡張( class
extension )の記法もサポー
トされている。たとえば、Eq クラスからすべての操作を
継承( inherit )した Ord
クラスを定義したいとし よう。このクラスは Eq
クラスから継承した操作のほかに、比較 操作子と min
関数および max 関数をもつものとする。

class (Eq a) => Ord a where
(<), (<=), (>=), (>) :: a -> a
-> Bool
max, min :: a -> a -> a

このクラス宣言の文脈に注目してください。Eq は Ord の
スーパークラス( super class
)であるといいる。(反対に、 Ord は Eq
のサブクラス( subclass )であ るといいる。)
Ord のインスタンスである型はすべて Eq
のインスタンスでなければならない。(次節では Ord
の完全な定義 をプレリュードから抜きだし紹介する。)

このようなクラスの包含の利点のひとつは、文脈の簡略化にある。
Eq と Ord
の両方のクラスの操作を使用する関数に対する型 式は文脈
(Eq a, Ord a) ではなくて (Ord a)
を利用することができる。それは、Ord が Eq
を包含しているからだ。さらに重要なことは、サブクラスの操作
に対するメソッドは、スーパークラスの操作に対するメソッドが存在することを
仮定することができるということだ。たとえば、プレリュード中の
Ord の宣言は、(<) に対応するデフォルトメソッドを含
んでいる。

x < y = x <= y && x /= y

Ord の使用方法の一例として、2.4.1 節で定義した
quicksort の主型の型付を見ると次のようになる。

quicksort :: (Ord a) => [a] ->
[a]

いいかえれば、quicksort
は順序付の型の値のリスト上でのみ操作で
きるということだ。この quicksort
に対する型付は定義のなかの比 較操作子< と >=
の使い方から導かれる。

Haskell では多重継承( multiple
inheritance )も認められて
いる。それはクラスは 2
つ以上のスーパークラスを持つこともあるからだ。
たとえば、次の宣言をみてみよう。

class (Eq a, Show a) => C a
where ...

これは、C というクラスをつくっていますが、操作を Eq と
Show の両方から継承している。

Haskell
ではクラスメソッドはトップレベルの宣言として扱われる。これらは、
ふつうの変数と同様に同じ名前空間を共有する。名前はクラスメソッドと変数
名あるいは別のクラスのメソッドとの両方を表示するのには使えない。

文脈はデータ宣言のなかで使うことができる。これについては
§4.2.1 を参照して ください。

クラスメソッドには、あらゆる型変数(定義しようとしているものを除く)の上の
制約を付加することができる。たとえば、

class C a where
m :: Show b => a -> b

このようなクラスでは、メソッド m は型 b が Show
クラスに属していることを要求する。しかしながら、メソッド
m は型 a については、いかなるクラス制約も付加しない。
これらは、クラス宣言のなかの文脈でおこなう必要がある。

ここまで、「1階の」型を使ってくる。つまり、型構築子
Tree
はこれまで常にひとつの引数と組になっていた。たとえば、
Tree Integer ( Integer
型の値を含む木)、あるいは、 Tree a ( a
型の値を含む木の族をあらわす)だ。し かし、Tree
それ自身は型構築子であり、ひとつの型を引数としてとり、
ひとつの型を返する。Haskell
にはこの種の値はありないが、このような
「高階の」型はクラス宣言のなかで使用することができる。


In [None]:

まずはじめに、以下のような Functor クラス
(これはプレリュードか らの引用) を考えよう。

class Functor f where
fmap :: (a -> b) -> f a -> f b

fmap 関数は以前につかった map
関数を一般化したものだ。 型変数 f は f a
のなかで他の型に適用される。こ のように、型変数が
Tree のような引数をとる型に束縛されることが
期待される。型 Tree に対する Functor
のインスタンス は、

instance Functor Tree where
fmap f (Leaf x) = Leaf (f x)
fmap f (Branch t1 t2) = Branch
(fmap f t1) (fmap f t2)

となる。このインスタンス宣言は Tree a ではなく
Tree が Functor
のインスタンスであることを宣言していま
す。こうした能力は大変便利なものだ。これは総称的「コンテナ」型を記述す
る能力のあることを示し、fmap
のような、任意の木、リストあるいは
他の型の上で統一的に動作する関数を可能にする。

[型適用は関数適用とおなじやりかたで書くる。型 T a b
は (T a) b
のように構文解析される。タプルのような特
別な構文を使う型はカリー化可能な別のスタイルで書くる。関数については、
(->) が型構築子だ。f -> g と (->) f g
とは同じだ。同様に、[a] と [] a
とは同じだ。タプルについては、型構築子(同時にデー
タ構築子でもありますが)は (,)、(,,)
などとなる。]

すでにご存知のように、型システムは式の中で型付けエラーを検出する。しか
し、不正な型式に起因するエラーについてはどうでしょうか。式
(+) 1 2 3 は型エラーになる。それは、 (+)
は 2 つしか引数をとらないからだ。同様に、 Tree
Int Int は、ある種のエラーを起こすはずだ。それ
は、Tree
型はひとつの引数しかとらないからだ。では、Haskell
は
どのようにして不正な型式を検出するのでしょうか。その答は、型の正当性を確
認する第 2 の型システムにある。それぞれの型は類 (
kind
)と結びついている。これはその型が正しく使用されることを
確認するものだ。

型式は別々の類に分類される。これは次の 2
つの形式をとる。

記号 *
は具体的なデータ対象に結びついた型の類をあらわす。すなわち、
もし、値 v の型が t であるなら、v の類は * で
なければならない。

もし、k1 と k2 とが類ならば、k1->k2 は k1
という類の型をとり、k2 という類の型を返す型の類である。

型構築子 Tree の類は、 *->* であり、Tree
Int の類は * だ。Functor
クラスのメンバーはすべて、類 *->* で
なければならず、類付けのエラーは、次のような宣言により引き起こされる。

instance Functor Integer where
...

なぜなら、Integer の類は * だからである。
類は Haskell
のプログラムの直接あらわれることはあらない。コンパイラが
型検査の前に類を推論する。「類宣言」のようなものは必要あらない。型シ
グネチャが類エラーをおこすとき以外は、類は Haskell
のプログラムの後ろに
隠れている。類は非常にシンプルなので、コンパイラは、類衝突がおこれば、
その旨のエラーメッセージを表示することができなければならない。類に関す
る詳細は §4.1.1 や §4.6 を参照してく ださい。


In [None]:

別の見方
型クラスの使い方のさらに進んだ例にいくまえに、Haskell
の型クラスのふたつ
の別の観点について言及してもいいかと思いる。第一は、オブジェクト指向プ
ログラミング( OOP
)とのアナロジーによる観点だ。OOP に関してよくある次
のような謂は、単純にクラスを型クラスへ置き換え、オブジェクトを
型へ置き換えれば、ほぼ Haskell
の型クラス機構になる。

「クラスは操作の共通集合を捕捉するものである。ある特定
のオブジェクトはクラスのインスタンスであり、おのおのの操作に対
応するメソッドをもつ。クラスは階層構造をもつことがあり、スー
パークラスやサブクラスという概念があり、操作/メソッドの継
承も許されている。デフォルトメソッドがある操作と結びつくことも
ある。」

OOP
と対比すると、型はオブジェクトではないというのは明かで、特
に、オブジェクトや型の可変の内部状態などという概念はあらない。いくつか
の OOP 言語に対する利点は、Haskell
のメソッドは完全に型安全であるという
ことだ。必要なクラスのなかにはない型の値にメソッドを適用しようとしてい
るかどうかは、実行時ではなくコンパイル時に検出される。つまり、メソッド
が実行時に「検索」されるのではなく、単純に高階関数として引き渡されるだけ
だ。

パラメータ多相とアドホック多相と関係を考察すると別の見方をすることができ
る。すべての型の上で全称修飾することで型の族を定義するさいに、パラメー
タ多相がどれほど便利かということは既に示した。しかしながら、ときには、
このような全称修飾では広すぎることもある。もっと小さい型の集合の上で
限量修飾をしたい場合がある。たとえば、比較同値性をもつような型の集合
の上で、ということだ。型クラスは、これを実現する構造的方法とみなすこと
ができる。実際のところは、パラメータ多相は一種の多重定義とみなすことが
できるのだ。まさに、多重定義は暗黙にすべての型の上で起こるのであって、
限定された型の集合(つまり、型クラス)上で起こるのではあらない。

他の言語との比較
Haskell で用いられるクラスは C++ や Java
のようなオブジェクト指向言語で
用いられるクラスに類似している。しかし、いくつかの重大な相違がある。

Haskell
は、型の定義とその型に結びついているメソッドの定義を分離す
る。 C++ や Java
のクラスは、ふつう、データ構造(メンバー変数)とその
データ構造と結びついた関数(メソッド)との両方を定義する。Haskell
ではこれらの定義は別々におこなう。

Haskell
のクラスにより定義されたクラスメソッドは、C++
のクラスにお
ける仮想関数に対応している。クラスのインスタンスのそれぞれは、各メ
ソッドについてそのインスタンス自身の定義を与える。デフォルトメソッ
ドはベースクラスの仮想関数のデフォルト定義に対応している。

Haskell のクラスは大筋では Java
のインタフェースに類似している。 Java
のインタフェース宣言とおなじように、Haskell
のクラス宣言はオブ
ジェクトそのものを定義するのではなく、オブジェクトを使う手順を定義
している。

Haskell は、型の違う関数が共通の名前を共有するような
C++ 流の多重定義 はサポートしていない。

Haskell
のオブジェクトの型は暗黙の型変換を受けない。値が投入あるい
は投出される Object
のようなすべての基になるようなクラスは ない。

C++ や Java ではオブジェクトの実行時表現に(
VTable のような)同定情 報を付加する。Haskell
ではこのような情報は、型システムを通じて物理
的にではなく、論理的に、値に付加する。

Haskell のクラスシステムには、( public
あるいは private などといっ
たクラス構成要素のような)アクセスコントロールの機構は組込まれていな
い。

A Gentle Introduction to
Haskell, Version 98
back next top
