<a href="https://colab.research.google.com/github/kalz2q/mycolabnotebooks/blob/master/haskell_gentle.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# メモ

a gentle introduction to haskell  
https://www.sampou.org/haskell/tutorial-j/  
https://www.haskell.org/tutorial/  
を読む。ノート。

In [1]:
%%capture
!apt install haskell-platform

In [2]:
!ghc --version

The Glorious Glasgow Haskell Compilation System, version 8.0.2


In [None]:
# 型付け
%%script false
                         5  :: Integer
                        'a' :: Char
                        inc :: Integer -> Integer
                    [1,2,3] :: [Integer]
                    ('b',4) :: (Char,Integer)

# :: はなになにの型はなになに "has type" と読むことができる


In [None]:
# 関数定義
%%script false

inc n          = n+1

inc            :: Integer -> Integer



In [None]:
# e1 が評価され e2 になることを
# e1 => e2
# と書く。

# 例えば
%%script false

inc (inc 3) => 5



In [None]:
# list とは
%%script false

length                  :: [a] -> Integer
length []               =  0
length (x:xs)           =  1 + length xs

length [1,2,3]	=>	3
length ['a','b','c']	=>	3
length [[1],[2],[3]]	=>	3

In [None]:
# head と tail
%%script false

head                    :: [a] -> a
head (x:xs)             =  x

tail                    :: [a] -> [a]
tail (x:xs)             =  xs

#  head と tail はカラのリストではエラーになる


In [None]:
# 型の定義
%%script false

data Bool               = False | True

# Bool, False, True は引数を持たないコンストラクタ nullary constructor
# Bool が型の名前、型コンストラクタで、False, True がデータコンストラクタ

data Color              = Red | Green | Blue | Indigo | Violet

# Bool, Color は列挙型 enumerated type


In [None]:
# 次のは 1つだけデータコンストラクタ(Pt a a)を持つ型

data Point a            = Pt a a

# Point のような型はタプル型と呼ばれる。 なぜなら本質的に他の型の直積(デカルト積)だから。
# Bool, Color のような複数のデータコンストラクタを持つ型は直和型((disjoint) union or sum types)と呼ばれる。

# Point は多相型なので、次のは正しい。

Pt 2.0 3.0 :: Point Float
Pt 'a' 'b' :: Point Char
Pt True False :: Point Bool

# 多相型の型コンストラクタとして、[] や -> がある。

# データコンストラクタを適用して値を得ることと、型コンストラクタを適用して型を得ることを区別する。
# 名前空間が違うので、同じ名前が使える。
data Point a = Point a a

In [None]:
# 再帰型
%%script false

data Tree a = Leaf a | Branch (Tree a) (Tree a)

# ここで Tree は型コンストラクタで Branch や Leaf はデータコンストラクタなので

Branch :: Tree a -> Tree a -> Tree a
Leaf :: a -> Tree a

# ということになる。

# fringeという、木を左から右へたどって「葉」にある要素のリストを返す関数を定義したいとする。
# その定義は次のようになる

fringe :: Tree a -> [a]
fringe (Leaf x) = [x]
fringe (Branch left right) = fringe left ++ fringe right


In [None]:
# type synonym 型の同義名、シノニム
%%script false

type String = [Char]
type Person = (Name, Address)
type Name = String
data Address = None | Addr String

type AssocList a b = [(a,b)]


In [None]:
# Built-in 組み込みの型について
# 例えば Char は
%%script false
data Char = 
    Ca | Cb | Cc | ...
    | CA | CB | CC | ...
    | C1 | C2 | C3 | ...
    ...

# 同様に

data Int = -65532 | ... | -1 | 0 | 1 | ... | 65532

data Integer = ... -2 | -1 | 0 | 1 | 2 ...

# のように考えることができる。ここで、-65532と65532は、与えられた処理系における固定精度整数の最小値と最大値。

# タプルもこのやりかたで定義できる。

data (a,b) = (a,b)
data (a,b,c) = (a,b,c)
data (a,b,c,d) = (a,b,c,d)
        . .
        . .
        . .

# リストも同様に定義できる。リストの場合は再帰的になる。

data [a] = [] | a : [a]

# タプルとリストの違いから次のようなルールが明らかである。

# (e1,e2,...,en), n>=2 に対して、もし、ti が ei の型であるとす るならば、タプルの型は (t1,t2,...,tn) 
# [e1,e2,...,en], n>=0 に対して各 ei が必ず同じ型 t であるなら、そのリストの 型は [t]



In [None]:
# リスト内包表記 List Comprehensions と 数列 Arithmetic Sequences
%%script false

[ f x | x <- xs ]

[ (x,y) | x <- xs, y <- ys ]

# xs = [1,2] 、ys = [3,4] ならば =>  [(1,3),(1,4),(2,3),(2,4)] となる。

# ガード guard

quicksort [] = []
quicksort (x:xs) = quicksort [y | y <- xs, y<x ] ++ [x] ++ quicksort [y | y <- xs, y>=x]

# 数列 Arithmetic Sequences

[1..10] => [1,2,3,4,5,6,7,8,9,10] -- 10 も入ることに注意
[1,3..10] => [1,3,5,7,9] -- 10 以下の奇数
[1,3..] => [1,3,5,7,9, ...] -- 無限



In [None]:
# 文字列 String
%%script false

['h','e','l','l','o'] = "hello"

type String = [Char]

"hello" ++ " world" => "hello world"


In [None]:
# 関数
%%script false

add :: Integer -> Integer -> Integer
add x y = x + y

# これは add (x,y) = x + y とは違う


In [None]:
# 実験
!ghc -e $'let {add x y = x + y; inc = add 1} in print (inc 4) '
!ghc -e $'let {add (x y) = x + y; inc = add 1} in print (inc 4) ' #=> Parse error
!ghc -e $'let {add x y = x + y; inc = add 1} in print (add 4 5) '
!ghc -e $'let {add (x, y) = x + y} in print (add (4, 5)) '

5

<interactive>:0:11: error: Parse error in pattern: x
9
9


In [None]:
# map 関数は関数を引数にとる
%%script false

map :: (a->b) -> [a] -> [b]
map f [] = []
map f (x:xs) = f x : map f xs

map (add 1) [1,2,3] => [2,3,4]

# この例は関数が第一級の対象 (first-class object) であることを示している。
# このような使いかたをする関数は高階 (higher-order)関数とよばれる。


In [None]:
# ラムダ抽象 (lambda abstraction) 無名関数
# 例えば inc は  \x -> x+1 と書く。
# add は \x -> \y -> x + y と書く。
# 簡略化して \x y -> x + y と書く。
%%script false

inc x = x+1
add x y = x+y

# は次の等式と同等

inc = \x -> x+1
add = \x y -> x+y


In [None]:
# 中置演算子 infix operator
# 中置演算子は関数なので、等式を使って定義
%%script false

# リストの連結演算子
(++) :: [a] -> [a] -> [a]
[] ++ ys = ys
(x:xs) ++ ys = x : (xs++ys)

# マイナス(-)は前置演算子にも、中置演算子にもなる。

# 関数合成(function composition)演算子

(.) :: (b->c) -> (a->b) -> (a->c)
f . g = \ x -> f (g x)

# 中置演算子の部分適用は section と呼ばれる

(x+) = \y -> x+y
(+y) = \x -> x+y
(+) = \x y -> x+y


In [None]:
# 実験 中置演算子の部分適用が関数を返すことの確認
# map (+) [1,2,3] は関数のリスト

!ghc -e $'((map (+) [1,2,3])!!1) 5' #=> 7
!ghc -e $'((map (/) [1,2,3])!!1) 5' #=> 0.4
!ghc -e $'(map (5/) [1,2,3])!!1' #=> 2.5
!echo
!ghc -e $'map (/5) [1,2,3]'
!ghc -e $'map (5/) [1,2,3]'
!echo
!ghc -e $'map (^2) [1,2,3]'
!ghc -e $'map (2^) [1,2,3]'

7
0.4
2.5

[0.2,0.4,0.6]
[5.0,2.5,1.6666666666666667]

[1,4,9]
[2,4,8]


In [None]:
# したがって
%%script false

inc = (+ 1)
add = (+)

# と書ける


In [None]:
# 関数をバッククオートで括ると中置演算子になる
%%script false

x `elem` xs

# は直感的に、x は xs の要素である ( x is an element of xs ) と読める。

# (-) については特別なルールがある。


In [None]:
# 結合度 fixity の優先順位
# fixity declaration では 0 から 9 を指定する。 9 が最強。
# 一般の関数は 10 と仮定されている。
# infixr は右結合、 infixl は左結合
%%script false

infixr 5 ++
infixr 9 .

# デフォルトは infixl 9



In [None]:
# 関数は非正格 non-strict
# bot が次のように定義されているとする。
%%script false

bot = bot

# このような停止しない式の値を抽象的に _|_(ボトム)と表わす。
# 1/0 もこの値を持ち、エラーは回復不可能で、プログラムはこれ以上継続することはできなくなる。
# I/O のシステムのエラー(たとえば、EOFエラーなどの例外)は回復可能。

# 関数 f が正格 strict であるとは、停止しない式に適用されれば、その適用式も停止しないこと。
# ほとんどのプログラミング言語では、すべての関数が正格。Haskell では違う。

const1 x = 1

# のとき、const1 bot は 1 であり、引数は評価されない。 これを遅延評価と呼ぶ。

const1 (1/0)

# も 1 になる。

# 遅延評価により、無限 infinite のデータ構造が扱える。

# 別のやり方で説明すると、Haskell では代入 assignment ではなく、定義 definition を用いる。

v = 1/0

# は、v を 1/0と定義すると読む。vの値が必要になったときにのみゼロ除算エラーが発生する。


In [None]:
# 無限のデータ構造
# データコンストラクタも非正格である。
# リストのコンストラクタ、: も非正格。
# 非正格の構築子で(概念的に)無限の infinite データ構造を 定義することができる。
%%script false

ones = 1 : ones

numsFrom n = n : numsFrom (n+1)

squares = map (^2) (numsFrom 0)


In [None]:
# 実験 take 5 squares => [0,1,4,9,16]
!ghc -e $'let{numsFrom n = n:numsFrom(n+1); squares = map (^2)(numsFrom 0)} in print (take 5 squares)'

[0,1,4,9,16]


In [None]:
# 実験 ones は循環リスト circular list
!ghc -e $'let{ones=1:ones} in print (take 5 ones)'

[1,1,1,1,1]


In [None]:
# フィボナッチ関数
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# ここで zip とは

zip (x:xs) (y:ys) = (x,y) : zip xs ys
zip xs ys = []

# エラー関数 error

error :: String-> a

# 型からは返す値の型は多相の型で実際の型がわからない。
# すべての型によって「共有」される値 _|_ bottom が存在する。
# error の返す値は常にこの値。しかし、実装はチェックのための error の文字列引数を印字する。

head (x:xs) = x
head [] = error "head{PreludeList}: head []"


In [None]:
# Case 式
# パターンは入れ子にも使える。
%%script false

contrived :: ([a], Char, (Int, Float), String, Bool) -> Bool
contrived ([], 'b', (1, 2.0), "hi", True) = False

# 仮引数 (formal parameters) もパターンであり、値にかならず照合が成功する。
# その副作用として、仮引数は照合が成功した値に束縛される。
# なぜなら、ひとつの等式であれば、そのなかのパターンには、2つ以上の同じ仮引数が含まれてはいけないから。
# これは、線型性 (linearity) と呼ばれる。
# 仮引数のような必ず照合が成功するようなパターンのことを irrefutable パターンと呼び、
# refutable パターンは照合が成功しない可能性があり contrived の例はこの refutable の例。
# 不可反駁パターンに は 3つの種類がありそのうち 2つを紹介する。

# アズパターン
# たとえばリストの第一要素を複製する関数

f (x:xs) = x:x:xs

# 明日パターンを使うと次のようになる。

f s@(x:xs) = x:s

# アズパターンは照合に常に成功するが、サブパターン(この場合は、x:xs)はもちろん照合が成功しないこともある。

# ワイルドカード
# head 関数や tail 関数は次のように書き換えることができる。

head (x:_) = x
tail (_:xs) = xs

# 仮引数の場合とちがい、ワイルドカードはひとつの等式のなかに 1つ以上あっても構わない。


In [None]:
# パターン照合の意味論 semantics

# パターン照合は、fail, succeed, diverge (発散) の場合がある。
# 成功すると、パターンの中の仮引数が束縛される。
# 発散 diverge はパターンが必要とした値がエラー( _|_ )を含んでいた場合。
# すべての等式でパターン照合が失敗すると、その関数適用の値は _|_ になり、 実行時エラーとなる。
#
# たとえば、[1,2] を [0,bot] に照合させようとすると、0 と 1 がマッチしないので照合は失敗。
# しかし、もし、[1,2] を [bot,0] にマッチさせようとすると、1 を botへ照合させる際に発散がおこる。

# パターンがガード部を持つこともある。
%%script false

sign x |  x >  0        =   1
       |  x == 0        =   0
       |  x <  0        =  -1


In [None]:
# パターン照合が関数の意味に微妙な影響を与える場合がある

%%script false

take 0 _ = []
take _ [] = []
take n (x:xs) = x : take (n-1) xs

# と

take1 _ [] = []
take1 0 _ = []
take1 n (x:xs) = x : take1
(n-1) xs

# 次の結果を見る。

take 0 bot => []
take1 0 bot => _|_
take bot [] => _|_
take1 bot [] => []

# どちらがよいということでなく、違いがあるということを覚えておく。

In [None]:
# Case 式
# 関数定義のなかでのパターン照合の意味は、実は case 式のより単純なものと考えられる。
%%script false

# 次のような関数定義があったとする。
f p11 ... p1k = e1
...
f pn1 ... pnk = en

# これは以下と同等。

f x1 x2 ... xk = case (x1, ..., xk) of
    (p11, ..., p1k) -> e1
    ...
    (pn1, ..., pnk) -> en

# take についても

take m ys = case (m,ys) of
    (0,_) -> []
    (_,[]) -> []
    (n,x:xs) -> x : take (n-1) xs

# となる。
# case 式の右辺はすべて同じ主型である。

# if 式の

if e1 then e2 else e3

# は次の構文の簡略形である。

case e1 of True -> e2
        False -> e3

# つまり、if_then_else_ を関数とみなせば

Bool -> a -> a -> a 

# という型である。


In [None]:
# 遅延 lazy パターン
# 遅延パターンは ~pat であらわされる。
# 不可反駁 irrefutable で値 v の ~pat に 対する照合は常に成功する。
# pat のなかの識別子が右辺で「利用」されるとすると、それは v が pat に
# マッチすると仮定した場合の値に束縛されるか、_|_ となる。

# 遅延パターンは無限のデータ構造が再帰的に定義されているような場合に便利。
# 無限リストはシミュレーションプログラムを書くのに使いやすいデータ構造で、ストリームといいます。

# server と client との間のやりとりの簡単なケースを考える。
# client は一連の要求を server に送り、server は各々の要求に対して、応答を返す。
# client は引数として初期メッセージもとることに注意。

%%script false

reqs = client init resps
resps = server reqs

# さらに、サーバとクライアントの構造を、以下のように仮定する。

client init (resp:resps) = init : client (next resp) resps
server (req:reqs) = process req : server reqs

# next はサーバからの応答を与えられて、次の要求を決定する関数であり、
# process はクライアントからの要求を与えられて、応答を返す関数であるとする。

# 残念ながら、このプログラムには大きな問題がある。
# 問題は、client が reqs と resps の再帰的な設定のなかで使われているので、
# 最初の要求を送信する前に応答リストと照合を試みようとする。つまり、
# パターン照合がおこなわれるのが「早すぎる」。
# これを是正するひとつの方法は以下のように client を再定義する。

client init resps = init : client (next (head resps)) (tail resps)

# これで動作するようになるが、もっとよい解決法は遅延パターンを使う方法である。

client init ~(resp:resps) = init : client (next resp) resps

# 遅延パターンは不可反駁なので、照合はただちに成功し、最初の要求が発信され、
# それから最初の応答が生成される。

#  この例は、以下のように定義を加えれば、実際に動作する。

init = 0
next resp = resp
process req = req+1

# 実際に動作させてみると、

take 10 reqs => [0,1,2,3,4,5,6,7,8,9]

## 動作しない!!!!

In [None]:
# フィボナッチ関数 遅延評価版
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# これをアズパターンを使って次のように書き換える。

fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]

# この種の等式はパターン束縛( patternbinding )と呼ばれる。
# 理由は、トップレベルにある等式で左辺全体がひとつのパターンになっているから。
# すなわち、fib と tfibはともに宣言内で 束縛されているということです。
# Haskellのパターン束縛は暗黙のう ちに ~ がパターンの前についているものとみなす。


In [None]:
# 実験
!ghc -e $'let {fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]} in print (take 5 fib)'
!ghc -e $'let {fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]} in print (take 5 fib)'

[1,1,2,3,5]
[1,1,2,3,5]


In [None]:
# 字句の有効範囲と入れ子形式 Lexical Scoping and Nested Forms
# let 式
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# let 式 expression によってつくられる束縛は、相互再帰的 (mutually recursive)で、遅延パターンとして扱われる。
# ~ が暗黙のうちについている。

# where 節 clause
# いくつかのガードをもつ等式にまたがる有効範囲束縛が便利なときには where 節を使う。

f x y  |  y>z           =  ...
       |  y==z          =  ...
       |  y<z           =  ...
     where z = x*x

# where 節はそれが覆う式の上にしか有効範囲がない。
# where 節は等式の集まりあるいは case 式のトップレベルでしか認められない。

# let 式は式であり、where 節は式ではない。where 節は関数宣言および case 式の構文の一部である。



In [None]:
# レイアウト
# Haskell はセミコロンあるいはそれにかわる終端記号を使わずにすんでいるのか。
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# 構文解析 parser はなぜ次のように解析したりしないのか。

let y   = a*b f
    x   = (x+y)/y
in f c + f d

# Haskell はレイアウト (layout) と呼ばれる、二次元構文を用いているから。
# カラム位置に依存している。
# 上の例は次のように解釈される。

let { y   = a*b
    ; f x = (x+y)/y
    }
in f c + f d

# 1行に複数の式を書きたいときにはセミコロンが便利である。

let y   = a*b;  z = a/b
    f x = (x+y)/z
in f c + f d


In [None]:
# 型クラスと多重定義 overloading
# すでに述べてきた多相 polymorphism は、パラメータ多相 parametric polymorphism とよばれる。
# アドホック多相は多重定義 overloading という呼びかたのほうが知られている。
# たとえば
# 1、2 などのリテラルは、固定長の整数と任意長の整数の両方で使われる。
# + のような数値演算子は何種類もの数値上で定義される。
# 同値演算子 (Haskell では == ) は数値とその他多くの型の上で動作する。
# Haskell では、 型クラスによって多重定義を制御する。

# elem 関数の定義を見てみよう。
%%script false

x `elem`  []            = False
x `elem` (y:ys)         = x==y || (x `elem` ys)

# ここで (==) を使っている。
# 型クラス type class によって解決している。


In [None]:
# 実験
!ghc -e $':t elem'
!ghc -e $':t (==)'

elem :: (Eq a, Foldable t) => a -> t a -> Bool
(==) :: Eq a => a -> a -> Bool


In [None]:
# 同値演算子を含むクラスの定義をしてみよう。
%%script false

class Eq a where
    (==) :: a -> a -> Bool

# Eq は定義するクラスの名前である。
# 型 a がクラス Eq のインスタンスでなければならない、という制約 constraint は、

Eq a 

# のように書く。
# Eq a は 式 expression ではなく、constraint を表しているので、文脈 context と呼ばれる。

(==) :: (Eq a) => a -> a -> Bool

# は、クラス Eq のインスタンスである型 a に対して、== は a->a->Boolという型をもつ、と読む。
# したがって

elem :: (Eq a) => a -> [a] -> Bool

# となり、求めていたものに他ならない。


In [None]:
# 実験
!ghc -e $':k Eq'
!ghc -e $':k Foldable'

Eq :: * -> Constraint
Foldable :: (* -> *) -> Constraint


In [None]:
# どの型が Eq クラスのインスタンスになるかを指定し、その型に対する == の実際の振舞いがどうなるかは
# インスタンス宣言 (instance declaration)で行う。
%%script false

instance Eq Integer where 
  x == y                =  x `integerEq` y

# 同様に

instance Eq Float where
  x == y                =  x `floatEq` y

instance (Eq a) => Eq (Tree a) where 
  Leaf a         == Leaf b          =  a == b
  (Branch l1 r1) == (Branch l2 r2)  =  (l1==l2) && (r1==r2)
  _              == _               =  False

# 最初の行の Eq a という文脈は必須である。なぜなら、
# 葉のもつ要素 (型は a ) は 2番目の行の同値性を用いて比較する。

# 実際の Eq の定義
class  Eq a  where
  (==), (/=)            :: a -> a -> Bool
  x /= y                =  not (x == y)

# :i で調べたら次のようだった。 同じと思われる。
class Eq a where
  (==) :: a -> a -> Bool
  (/=) :: a -> a -> Bool


In [None]:
# クラス拡張 (class extension) もサポートされている。
# たとえば、Eq クラスからすべての操作を継承 (inherit)した Ord クラスを定義したいとしよう。
# このクラスは Eq クラスから継承した操作のほかに、比較 操作子と min 関数および max 関数をもつものとする。
%%script false

class  (Eq a) => Ord a  where
  (<), (<=), (>=), (>)  :: a -> a -> Bool
  max, min              :: a -> a -> a

# Eq は Ord のスーパークラス、 Ord は Eq のサブクラス( subclass )である。

# Ord の宣言は、(<) に対応するデフォルトメソッドを含んでいる。

x < y               =  x <= y && x /= y

# quicksort の型は次のようになっている。

quicksort :: (Ord a) => [a] -> [a]

# 多重継承 (multiple inheritance) 

class (Eq a, Show a) => C a 
    where ...

# C というクラスをつくっている、操作を Eq と Show の両方から継承している。

# クラスメソッドはトップレベルの宣言として扱われる。

# クラスメソッドには、制約を付加することができる。

class C a where
    m :: Show b => a -> b


In [None]:
# クラス宣言の中で、高階型 higher-order type を使う。
# 以下のような Functor クラスを考えよう。
%%script false

class Functor f where
    fmap :: (a -> b) -> f a -> f b

# fmap 関数は以前に使った map 関数を一般化したもの。
# 型変数 f は f a のなかで他の型に適用される。こ のように、型変数が
# 型 Tree に対する Functor のインスタンス は、

instance Functor Tree where
  fmap f (Leaf x)       = Leaf   (f x)
  fmap f (Branch t1 t2) = Branch (fmap f t1) (fmap f t2)

# このインスタンス宣言は Tree a ではなく Tree が Functor のインスタンスであることを宣言している。
# これは総称的「コンテナ」型を記述する能力のあることを示し、fmap のような、任意の木、
# リストあるいは他の型の上で統一的に動作する関数を可能にする。

# 型適用は関数適用とおなじやりかたで書ける。型 T a b は (T a) b　と構文解析される。
# タプルのような特別な構文を使う型はカリー化可能な別のスタイルで書ける。
# 関数については、(->) が型構築子だ。f -> g と (->) f g とは同じだ。
# 同様に、[a] と [] aとは同じだ。
# タプルについては、型構築子は (,)、(,,) などとなる。


In [None]:
# 型システムは式の中で型付けエラーを検出する。
# 式 (+) 1 2 3 は型エラーになる。それは (+) は 2 つしか引数をとらないからだ。
# 同様に、 Tree Int Int は、エラーを起こす。それは Tree 型はひとつの引数しかとらないからだ。
# Haskellはどのようにして不正な型式を検出するのか。

# その答は、型の正当性を確認する第2の型システムにある。
# 型は類 (kind)と結びついている。


In [None]:
!ghc -e $':k Eq'
!ghc -e $':k Integer'
!ghc -e $':k Functor'
!ghc -e $':k Num'
!ghc -e $':k Foldable'
!ghc -e $':k Ord'

Eq :: * -> Constraint
Integer :: *
Functor :: (* -> *) -> Constraint
Num :: * -> Constraint
Foldable :: (* -> *) -> Constraint
Ord :: * -> Constraint


In [None]:
# 型はは次の 2つの形式をとる。

# 記号 * は具体的なデータ対象に結びついた型の類をあらわす。
# k1 と k2 とが類ならば、k1->k2 は k1 という類の型をとり、k2 という類の型を返す型の類である。

# 型構築子 Tree の類は、 *->* であり、Tree Int の類は * だ。
# Functor クラスのメンバーはすべて、類 *->* でなければならず、
# 類付けのエラーは、次のような宣言により引き起こされる。
%%script false

instance Functor Integer where ...

# なぜなら、Integer の類は * だからである。
# 類は Haskell のプログラムの直接あらわれることはない。
# コンパイラが型検査の前に類を推論する。「類宣言」のようなものは必要ない。
# 型シグネチャが類エラーをおこすとき以外は、類は Haskellのプログラムの後ろに隠れている。
# 類は非常にシンプルなので、コンパイラは、類衝突がおこれば、その旨のエラーメッセージを表示する。


# いまここ

In [None]:
# オブジェクト指向プログラミング OOP とのアナロジー
# OOP におけるクラスを型クラスへ置き換え、オブジェクトを型へ置き換えれば、ほぼ Haskell の型クラスになる。

# OOP と比べると、型はオブジェクトではないというのは明かで、
# OOP 言語に対する利点は、Haskellのメソッドは完全に型安全である。
# 必要なクラスのなかにはない型の値にメソッドを適用しようとしているかどうかは、
# コンパイル時に検出される。単純に高階関数として引き渡される。

# パラメータ多相とアドホック多相 overloading との関係を考察すると別の見方をすることができる。
# パラメータ多相がどれほど便利かということは既に示した。
# しかしながら、ときには、このような包括的グルーピングでは広すぎることもある。
# もっと小さい型の集合の上でコントロールをしたい場合がある。たとえば、比較同値性をもつような型の集合
# の上で、という時、型クラスは、これを実現する構造的方法とみなすことができる。
# パラメータ多相は一種の多重定義とみなすことができ、多重定義は暗黙にすべての型の上で起こり、
# 限定された型の集合(つまり、型クラス)上で起こるのではない。

# 他の言語との比較
# Haskell で用いられるクラスは OOP で用いられるクラスに類似している。しかし、いくつかの重大な相違がある。

# Haskell は、型の定義とその型に結びついているメソッドの定義を分離する。 
# C++ や Java のクラスは、ふつう、データ構造(メンバー変数)とそのデータ構造と結びついた関数(メソッド)
# の両方を定義する。Haskell ではこれらの定義は別々におこなう。

# Haskell は、型の違う関数が共通の名前を共有するような C++ 流の多重定義 はサポートしていない。

# Haskell のオブジェクトの型は暗黙の型変換を受けない。値が投入あるい
# は投出される Object のようなすべての基になるようなクラスは ない。

# C++ や Java ではオブジェクトの実行時表現に (VTable のような) 同定情報を付加する。
# Haskellではこのような情報は、型システムを通じて物理的にではなく、論理的に、値に付加する。

# Haskell のクラスシステムには、(publicあるいは private などといっ
# たクラス構成要素のような) アクセスコントロールの機構は組込まれていない。


# 再び、型について

In [None]:
# 再び、型について

# Newtype 宣言
# 表現が既存の型と同一だが，型システムの中では別の型として識別されるような型を定義する。
# Haskell
では newtype
宣言が既存の型から新しい型をつくりだする。たとえば、
Integer
型を次のような宣言で用いて、自然数を表現することができ る。

newtype Natural = MakeNatural Integer

この宣言は、完全に新しい型 Natural
を生成し、その構築子はひとつ の Integer
だけを引数にとる。この構築子 MakeNatural は
Natural と Integer との間の変
換をおこなう。

toNatural :: Integer ->
Natural
toNatural x | x < 0 = error
"Can't create negative
naturals!"
| otherwise = MakeNatural x

fromNatural :: Natural ->
Integer
fromNatural (MakeNatural i) =
i

次のインスタンス宣言は Natural を Num
クラスに所属させ るものだ。

instance Num Natural where
fromInteger = toNatural
x + y = toNatural (fromNatural
x + fromNatural y)
x - y = let r = fromNatural x
- fromNatural y in
if r < 0 then error "Unnatural
subtraction"
else toNatural r
x * y = toNatural (fromNatural
x * fromNatural y)

この宣言なしでは、Natural は Num
には属することができ
ない。元の型に対するインスタンス宣言内容が、新しい型に持ち越されることはあ
らない。実際、この型の目的は、別の Num
のインスタンスを導入す ることなのだ。もし、Natural
が Integer の型シノニム
として宣言されていれば、これはできない。

これらはすべて、newtype 宣言ではなく data
宣言を用いて も機能する。しかし、data
宣言では、Natural の値の表
現にオーバヘッドが生じる。newtype を用いることで
data
宣言によって間接参照のレベルが深くなる(これは遅延性の故に
生じる)のを避けることができる。newtype、data
および type
宣言の間の関係についてのさらに詳しい議論は、レポートの
4.2.3 節を参照してくだ さい。

[キーワードをのぞけば、newtype
宣言は、単一フィールドをもつ単一 構築子の data
宣言と同じ構文を用いる。newtype を用い
て定義された型は通常の data
宣言で生成された型とほとんど同一な
のですから、これは当然だろう。]



In [None]:

6.2 フィールドラベル
Haskell
のデータ型内のフィールドは、位置を手がかりにアクセスすることも、
フィールドラベルを用いて名前でアクセスすることもできる。2
次 元の点に対する型について考察しよう。

data Point = Pt Float Float

Point の構成要素は、構築子 Pt
の第一引数と第二引数だ。 次のような関数

pointx :: Point -> Float
pointx (Pt x _) = x

は、第一の構成要素をいくぶん説明的に参照するのに使われていますが、もっと、
大きな構造に対して、このような関数を手でつくるのは面倒だ。

data 宣言における構築子は、フィールド名(波括弧でくくら
れて)付で宣言されることもある。フィールド名は構築子の構成要素を位置
によってではなく、名前で同定する。以下はもうひとつの
Point の 定義だ。

data Point = Pt {pointx,
pointy :: Float}

このデータ型はその前で定義した Point
と同一のものだ。構築子 Pt
は両方でおなじだ。しかし、この宣言ではふたつのフィールド名、
pointx と pointy
とが定義されている。これらのフィー
ルド名は構造の中から構成要素を取り出すための選択関数 (
selector function )
としても使うことができる。この例では 選択関数は、

pointx :: Point -> Float
pointy :: Point -> Float

だ。つぎは、これらの選択関数をつかった関数定義だ。

absPoint :: Point -> Float
absPoint p = sqrt (pointx p *
pointx p +
pointy p * pointy p)


フィールドラベルは新しい値を構築するときにも使える。式 Pt
{pointx=1, pointy=2} は式 Pt 1 2
と同一だ。このデータ構築子の宣言でのフィール
ド名の使い方は、位置をよりどころとしたフィールドへのアクセスを排除するも
のではあらない。Pt {pointx=1,
pointy=2} と Pt 1 2
とはともに可能だ。フィールド名を使って値を構
築する場合、フィールドをいくつか省略することができる。

省略されたフィールドは定義されない。

フィールド名を使ったパターンマッチングは構築子 Pt
のときと同じ ような構文で使いる。

absPoint (Pt {pointx = x,
pointy = y}) = sqrt (x*x +
y*y)


更新関数は、既存の構造中のフィールド値を使って、新しい構造の構成要素を埋
める。もし、p が Point ならば、 p
{pointx=2} は p と同じ pointy をもちま
すが、pointx は 2 に置き換る。これは、破壊的更新で
はあらない。この更新関数は、指定されたフィールドを新しい値で埋めること
で、オブジェクトの新しいコピーを生成しているにすぎない。

[フィールドラベルと併せて使用した波括弧はいくぶん特殊な使い方だ。
Haskell
の構文では、レイアウトルールを無視するのに波括
弧を使うのが普通だ。(レイアウトルールについては 4.6
節であつかっている。) しかし、
フィールド名とむすびついた波括弧は明示的に書かなければならない。]

フィールド名は単一構築子の型(レコード型とよばれることが多い)に限るも
のではあらない。複数の構築子をもつ型では、フィールド名を用いての選択や
更新の操作は実行時エラーを引き起こす可能性がある。これは、空リストに
head を適用したときと似ている。

フィールドラベルは一般の変数やクラスメソッドとトップレベルの名前空間を共
有する。スコープのなかで同じ名前のフィールド一つ以上のデータ型で使うこ
とはできない。しかし、一つのデータ型の中でなら、型付けが同じあるかぎり、
一つ以上の構築子のなかで、使うことができる。たとえば、次のようなデータ
型のなかで、

data T = C1 {f :: Int, g ::
Float}
| C2 {f :: Int, h :: Bool}

フィールド名 f は型 T の両方の構築子に適用されている。
つまり、もし、x の型が T ならば、x {f=5} は T
内のどちらの構築子が生成した値に対しても機能する。

フィールド名が代数的データ型の基本性質を変えることはあらない。フィール
ド名は、データ構造の構成要素にアクセスするのに位置を手がかりにするより、
名前を手がかりにするために用意された、便宜的な構文にすぎない。この構文
のおかげで、多くの構成要素をもつ構築子の扱いが簡単になる。それは、フィー
ルドは構築子へのそれぞれの参照を変更することなく追加したり削除したりする
ことができるからだ。フィールドラベルの詳細とその意味論についてはレポー
トの §4.2.1 を参照 してください。



In [None]:

6.3 正格データ構築子
Haskell
ではデータ構造は一般的に遅延性をもちる。構成要素は必
要になるまで評価されない。この性質のおかげで、データ構造はもし評価され
るとエラーあるいは停止できないような要素を含むことができる。遅延データ
構造は Haskell の表現力を強化し、Haskell
のプログラミングスタイルの要に なる。

内部的には、遅延データオブジェクトの各フィールドはサンク (
thunk )
とよくいわれる構造に包みこまれている。サンクはフィー
ルド値を定義した計算をカプセル化したものだ。値が必要にならないかぎり、
サンクの中へ入ることはあらない。エラー ( _|_ )
を含むサンクが
あってもデータ構造の他の要素には影響しない。たとえば、タプル
('a',_|_) は完全に正しい Haskell の値だ。
この 'a'
はこのタプルのもう一方の要素にかまうことなく、使うことが
できる。ほとんどのプログラミング言語は遅延性ではなく正格性をもっていま
す。すなわち、データ構造のすべての要素はそのデータ構造に入れる前に値にま
で簡約される。

サンクにはいろいろなオーバヘッドがついてまわる。サンクを構成するにも、
それを評価するにも時間がかかる。ヒープの領域をとりますし、そのサンク
の評価のために必要な別の構造を確保するため、ガーベッジコレクタを起動する
こともある。こうしたオーバヘッドを回避するために、
正格性フラグを data 宣言で使いる。こうして、選択的に
遅延性を抑制することで、指定した構築子のフィールドをただちに評価する。
data 宣言の中で、! でマークされたフィールドは、サンク
に入れて遅延するのではなく、構造が生成される際に、直ちに評価される。こ
の正格性フラグを用いるほうがよい状況はいくつかある。

プログラム実行中に必ず評価されることが確定している構成要素
簡単に評価できて絶対にエラーを起こさないことが確定している構成要素
部分的に未定義の値であると意味のない型
たとえば、複素数のライブラリが定義している Complex
型はこんなふ うになっている。

data RealFloat a => Complex a
= !a :+ !a

[構築子 :+ の中置定義に注意してください。]
この定義では、ふたつ
の構成要素にマークがついている。複素数の実数部と虚数部は正格性をもつよ
うにマークされている。これは、複素数のよりコンパクトな表現だが、たと
えば、1 :+ _|_ のように未定義の構成要素があっ
た場合、全体が未定義 (_|_)
になってしまうという代償をはらったうえ
でのことだ。しかし、部分的にしか定義されていない複素数が必要になること
は実際にはありませんから、効率のよい表現を達成するために正格性フラグを使
用するのは意味のあることだ。
正格性フラグはメモリリーク(もはや使うことはないのにガーベッジコレクタに
回収されない構造)を解決するために使うこともできる。

正格性フラグ ! は data 宣言のなかでのみ使われる。そ
のほかの型シグネチャーや型定義では使えない。関数の引数に対して正格性を
もつようにマークをつける方法はあらない。しかし、 seq
あるいは !$
という関数を使用することで同じ効果が得られる。詳細について
はレポート §4.2.1 を参照して ください。

正格性フラグの使い方の正確なガイドラインを示すのは難しいことだ。注意し
て使用しなければならない。遅延性は Haskell
の基本的な特徴のひとつであっ
て、そこへ正格性フラグをつけ加えることは無限ループの発見を困難なものにし、
ほかの予期せぬ結果をまねきかねないということだ。

A Gentle Introduction to
Haskell, Version 98
back next top
