<a href="https://colab.research.google.com/github/kalz2q/mycolabnotebooks/blob/master/haskell_gentle.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# メモ

a gentle introduction to haskell  
https://www.sampou.org/haskell/tutorial-j/  
https://www.haskell.org/tutorial/  
を読む。ノート。

In [2]:
%%capture
!apt install haskell-platform

In [1]:
!ghc --version

/bin/bash: ghc: command not found


# 新しいセクション

In [None]:
# 型付け
%%script false
                         5  :: Integer
                        'a' :: Char
                        inc :: Integer -> Integer
                    [1,2,3] :: [Integer]
                    ('b',4) :: (Char,Integer)

# :: はなになにの型はなになに "has type" と読むことができる


In [None]:
# 関数定義
%%script false

inc n          = n+1

inc            :: Integer -> Integer



In [None]:
# e1 が評価され e2 になることを
# e1 => e2
# と書く。

# 例えば
%%script false

inc (inc 3) => 5



In [None]:
# list とは
%%script false

length                  :: [a] -> Integer
length []               =  0
length (x:xs)           =  1 + length xs

length [1,2,3]	=>	3
length ['a','b','c']	=>	3
length [[1],[2],[3]]	=>	3

In [None]:
# head と tail
%%script false

head                    :: [a] -> a
head (x:xs)             =  x

tail                    :: [a] -> [a]
tail (x:xs)             =  xs

#  head と tail はカラのリストではエラーになる


In [None]:
# 型の定義
%%script false

data Bool               = False | True

# Bool, False, True は引数を持たないコンストラクタ nullary constructor
# Bool が型の名前、型コンストラクタで、False, True がデータコンストラクタ

data Color              = Red | Green | Blue | Indigo | Violet

# Bool, Color は列挙型 enumerated type


In [None]:
# 次のは 1つだけデータコンストラクタ(Pt a a)を持つ型

data Point a            = Pt a a

# Point のような型はタプル型と呼ばれる。 なぜなら本質的に他の型の直積(デカルト積)だから。
# Bool, Color のような複数のデータコンストラクタを持つ型は直和型((disjoint) union or sum types)と呼ばれる。

# Point は多相型なので、次のは正しい。

Pt 2.0 3.0 :: Point Float
Pt 'a' 'b' :: Point Char
Pt True False :: Point Bool

# 多相型の型コンストラクタとして、[] や -> がある。

# データコンストラクタを適用して値を得ることと、型コンストラクタを適用して型を得ることを区別する。
# 名前空間が違うので、同じ名前が使える。
data Point a = Point a a

In [None]:
# 再帰型
%%script false

data Tree a = Leaf a | Branch (Tree a) (Tree a)

# ここで Tree は型コンストラクタで Branch や Leaf はデータコンストラクタなので

Branch :: Tree a -> Tree a -> Tree a
Leaf :: a -> Tree a

# ということになる。

# fringeという、木を左から右へたどって「葉」にある要素のリストを返す関数を定義したいとする。
# その定義は次のようになる

fringe :: Tree a -> [a]
fringe (Leaf x) = [x]
fringe (Branch left right) = fringe left ++ fringe right


In [None]:
# type synonym 型の同義名、シノニム
%%script false

type String = [Char]
type Person = (Name, Address)
type Name = String
data Address = None | Addr String

type AssocList a b = [(a,b)]


In [None]:
# Built-in 組み込みの型について
# 例えば Char は
%%script false
data Char = 
    Ca | Cb | Cc | ...
    | CA | CB | CC | ...
    | C1 | C2 | C3 | ...
    ...

# 同様に

data Int = -65532 | ... | -1 | 0 | 1 | ... | 65532

data Integer = ... -2 | -1 | 0 | 1 | 2 ...

# のように考えることができる。ここで、-65532と65532は、与えられた処理系における固定精度整数の最小値と最大値。

# タプルもこのやりかたで定義できる。

data (a,b) = (a,b)
data (a,b,c) = (a,b,c)
data (a,b,c,d) = (a,b,c,d)
        . .
        . .
        . .

# リストも同様に定義できる。リストの場合は再帰的になる。

data [a] = [] | a : [a]

# タプルとリストの違いから次のようなルールが明らかである。

# (e1,e2,...,en), n>=2 に対して、もし、ti が ei の型であるとす るならば、タプルの型は (t1,t2,...,tn) 
# [e1,e2,...,en], n>=0 に対して各 ei が必ず同じ型 t であるなら、そのリストの 型は [t]



In [None]:
# リスト内包表記 List Comprehensions と 数列 Arithmetic Sequences
%%script false

[ f x | x <- xs ]

[ (x,y) | x <- xs, y <- ys ]

# xs = [1,2] 、ys = [3,4] ならば =>  [(1,3),(1,4),(2,3),(2,4)] となる。

# ガード guard

quicksort [] = []
quicksort (x:xs) = quicksort [y | y <- xs, y<x ] ++ [x] ++ quicksort [y | y <- xs, y>=x]

# 数列 Arithmetic Sequences

[1..10] => [1,2,3,4,5,6,7,8,9,10] -- 10 も入ることに注意
[1,3..10] => [1,3,5,7,9] -- 10 以下の奇数
[1,3..] => [1,3,5,7,9, ...] -- 無限



In [None]:
# 文字列 String
%%script false

['h','e','l','l','o'] = "hello"

type String = [Char]

"hello" ++ " world" => "hello world"


In [None]:
# 関数
%%script false

add :: Integer -> Integer -> Integer
add x y = x + y

# これは add (x,y) = x + y とは違う


In [None]:
# 実験
!ghc -e $'let {add x y = x + y; inc = add 1} in print (inc 4) '
!ghc -e $'let {add (x y) = x + y; inc = add 1} in print (inc 4) ' #=> Parse error
!ghc -e $'let {add x y = x + y; inc = add 1} in print (add 4 5) '
!ghc -e $'let {add (x, y) = x + y} in print (add (4, 5)) '

5

<interactive>:0:11: error: Parse error in pattern: x
9
9


In [None]:
# map 関数は関数を引数にとる
%%script false

map :: (a->b) -> [a] -> [b]
map f [] = []
map f (x:xs) = f x : map f xs

map (add 1) [1,2,3] => [2,3,4]

# この例は関数が第一級の対象 (first-class object) であることを示している。
# このような使いかたをする関数は高階 (higher-order)関数とよばれる。


In [None]:
# ラムダ抽象 (lambda abstraction) 無名関数
# 例えば inc は  \x -> x+1 と書く。
# add は \x -> \y -> x + y と書く。
# 簡略化して \x y -> x + y と書く。
%%script false

inc x = x+1
add x y = x+y

# は次の等式と同等

inc = \x -> x+1
add = \x y -> x+y


In [None]:
# 中置演算子 infix operator
# 中置演算子は関数なので、等式を使って定義
%%script false

# リストの連結演算子
(++) :: [a] -> [a] -> [a]
[] ++ ys = ys
(x:xs) ++ ys = x : (xs++ys)

# マイナス(-)は前置演算子にも、中置演算子にもなる。

# 関数合成(function composition)演算子

(.) :: (b->c) -> (a->b) -> (a->c)
f . g = \ x -> f (g x)

# 中置演算子の部分適用は section と呼ばれる

(x+) = \y -> x+y
(+y) = \x -> x+y
(+) = \x y -> x+y


In [None]:
# 実験 中置演算子の部分適用が関数を返すことの確認
# map (+) [1,2,3] は関数のリスト

!ghc -e $'((map (+) [1,2,3])!!1) 5' #=> 7
!ghc -e $'((map (/) [1,2,3])!!1) 5' #=> 0.4
!ghc -e $'(map (5/) [1,2,3])!!1' #=> 2.5
!echo
!ghc -e $'map (/5) [1,2,3]'
!ghc -e $'map (5/) [1,2,3]'
!echo
!ghc -e $'map (^2) [1,2,3]'
!ghc -e $'map (2^) [1,2,3]'

7
0.4
2.5

[0.2,0.4,0.6]
[5.0,2.5,1.6666666666666667]

[1,4,9]
[2,4,8]


In [None]:
# したがって
%%script false

inc = (+ 1)
add = (+)

# と書ける


In [None]:
# 関数をバッククオートで括ると中置演算子になる
%%script false

x `elem` xs

# は直感的に、x は xs の要素である (x is an element of xs)と読める。

# (-) については特別なルールがある。


In [None]:
# 結合度 fixity の優先順位
# fixity declaration では 0 から 9 を指定する。 9 が最強。
# 一般の関数は 10 と仮定されている。
# infixr は右結合、 infixl は左結合
%%script false

infixr 5 ++
infixr 9 .

# デフォルトは infixl 9



In [None]:
# 関数は非正格 non-strict
# bot が次のように定義されているとする。
%%script false

bot = bot

# このような停止しない式の値を抽象的に _|_(ボトム)と表わす。
# 1/0 もこの値を持ち、エラーは回復不可能で、プログラムはこれ以上継続することはできなくなる。
# I/O のシステムのエラー(たとえば、EOFエラーなどの例外)は回復可能。

# 関数 f が正格 strict であるとは、停止しない式に適用されれば、その適用式も停止しないこと。
# ほとんどのプログラミング言語では、すべての関数が正格。Haskell では違う。

const1 x = 1

# のとき、const1 bot は 1 であり、引数は評価されない。 これを遅延評価と呼ぶ。

const1 (1/0)

# も 1 になる。

# 遅延評価により、無限 infinite のデータ構造が扱える。

# 別のやり方で説明すると、Haskell では代入 assignment ではなく、定義 definition を用いる。

v = 1/0

# は、v を 1/0と定義すると読む。vの値が必要になったときにのみゼロ除算エラーが発生する。


In [None]:
# 無限のデータ構造
# データコンストラクタも非正格である。
# リストのコンストラクタ、: も非正格。
# 非正格の構築子で(概念的に)無限の infinite データ構造を 定義することができる。
%%script false

ones = 1 : ones

numsFrom n = n : numsFrom (n+1)

squares = map (^2) (numsFrom 0)


In [None]:
# 実験 take 5 squares => [0,1,4,9,16]
!ghc -e $'let{numsFrom n = n:numsFrom(n+1); squares = map (^2)(numsFrom 0)} in print (take 5 squares)'

[0,1,4,9,16]


In [None]:
# 実験 ones は循環リスト circular list
!ghc -e $'let{ones=1:ones} in print (take 5 ones)'

[1,1,1,1,1]


In [None]:
# フィボナッチ関数
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# ここで zip とは

zip (x:xs) (y:ys) = (x,y) : zip xs ys
zip xs ys = []

# エラー関数 error

error :: String-> a

# 型からは返す値の型は多相の型で実際の型がわからない。
# すべての型によって「共有」される値 _|_ bottom が存在する。
# error の返す値は常にこの値。しかし、実装はチェックのための error の文字列引数を印字する。

head (x:xs) = x
head [] = error "head{PreludeList}: head []"


In [None]:
# Case 式
# パターンは入れ子にも使える。
%%script false

contrived :: ([a], Char, (Int, Float), String, Bool) -> Bool
contrived ([], 'b', (1, 2.0), "hi", True) = False

# 仮引数 (formal parameters) もパターンであり、値にかならず照合が成功する。
# その副作用として、仮引数は照合が成功した値に束縛される。
# なぜなら、ひとつの等式であれば、そのなかのパターンには、2つ以上の同じ仮引数が含まれてはいけないから。
# これは、線型性 (linearity) と呼ばれる。
# 仮引数のような必ず照合が成功するようなパターンのことを irrefutable パターンと呼び、
# refutable パターンは照合が成功しない可能性があり contrived の例はこの refutable の例。
# 不可反駁パターンに は 3つの種類がありそのうち 2つを紹介する。

# アズパターン
# たとえばリストの第一要素を複製する関数

f (x:xs) = x:x:xs

# 明日パターンを使うと次のようになる。

f s@(x:xs) = x:s

# アズパターンは照合に常に成功するが、サブパターン(この場合は、x:xs)はもちろん照合が成功しないこともある。

# ワイルドカード
# head 関数や tail 関数は次のように書き換えることができる。

head (x:_) = x
tail (_:xs) = xs

# 仮引数の場合とちがい、ワイルドカードはひとつの等式のなかに 1つ以上あっても構わない。


In [None]:
# パターン照合の意味論 semantics

# パターン照合は、fail, succeed, diverge (発散) の場合がある。
# 成功すると、パターンの中の仮引数が束縛される。
# 発散 diverge はパターンが必要とした値がエラー(_|_ )を含んでいた場合。
# すべての等式でパターン照合が失敗すると、その関数適用の値は _|_ になり、 実行時エラーとなる。
#
# たとえば、[1,2] を [0,bot] に照合させようとすると、0 と 1 がマッチしないので照合は失敗。
# しかし、もし、[1,2] を [bot,0] にマッチさせようとすると、1 を botへ照合させる際に発散がおこる。

# パターンがガード部を持つこともある。
%%script false

sign x |  x >  0        =   1
       |  x == 0        =   0
       |  x <  0        =  -1


In [None]:
# パターン照合が関数の意味に微妙な影響を与える場合がある

%%script false

take 0 _ = []
take _ [] = []
take n (x:xs) = x : take (n-1) xs

# と

take1 _ [] = []
take1 0 _ = []
take1 n (x:xs) = x : take1
(n-1) xs

# 次の結果を見る。

take 0 bot => []
take1 0 bot => _|_
take bot [] => _|_
take1 bot [] => []

# どちらがよいということでなく、違いがあるということを覚えておく。

In [None]:
# Case 式
# 関数定義のなかでのパターン照合の意味は、実は case 式のより単純なものと考えられる。
%%script false

# 次のような関数定義があったとする。
f p11 ... p1k = e1
...
f pn1 ... pnk = en

# これは以下と同等。

f x1 x2 ... xk = case (x1, ..., xk) of
    (p11, ..., p1k) -> e1
    ...
    (pn1, ..., pnk) -> en

# take についても

take m ys = case (m,ys) of
    (0,_) -> []
    (_,[]) -> []
    (n,x:xs) -> x : take (n-1) xs

# となる。
# case 式の右辺はすべて同じ主型である。

# if 式の

if e1 then e2 else e3

# は次の構文の簡略形である。

case e1 of True -> e2
        False -> e3

# つまり、if_then_else_ を関数とみなせば

Bool -> a -> a -> a 

# という型である。


In [None]:
# 遅延 lazy パターン
# 遅延パターンは ~pat であらわされる。
# 不可反駁 irrefutable で値 v の ~pat に 対する照合は常に成功する。
# pat のなかの識別子が右辺で「利用」されるとすると、それは v が pat に
# マッチすると仮定した場合の値に束縛されるか、_|_ となる。

# 遅延パターンは無限のデータ構造が再帰的に定義されているような場合に便利。
# 無限リストはシミュレーションプログラムを書くのに使いやすいデータ構造で、ストリームといいます。

# server と client との間のやりとりの簡単なケースを考える。
# client は一連の要求を server に送り、server は各々の要求に対して、応答を返す。
# client は引数として初期メッセージもとることに注意。

%%script false

reqs = client init resps
resps = server reqs

# さらに、サーバとクライアントの構造を、以下のように仮定する。

client init (resp:resps) = init : client (next resp) resps
server (req:reqs) = process req : server reqs

# next はサーバからの応答を与えられて、次の要求を決定する関数であり、
# process はクライアントからの要求を与えられて、応答を返す関数であるとする。

# 残念ながら、このプログラムには大きな問題がある。
# 問題は、client が reqs と resps の再帰的な設定のなかで使われているので、
# 最初の要求を送信する前に応答リストと照合を試みようとする。つまり、
# パターン照合がおこなわれるのが「早すぎる」。
# これを是正するひとつの方法は以下のように client を再定義する。

client init resps = init : client (next (head resps)) (tail resps)

# これで動作するようになるが、もっとよい解決法は遅延パターンを使う方法である。

client init ~(resp:resps) = init : client (next resp) resps

# 遅延パターンは不可反駁なので、照合はただちに成功し、最初の要求が発信され、
# それから最初の応答が生成される。

#  この例は、以下のように定義を加えれば、実際に動作する。

init = 0
next resp = resp
process req = req+1

# 実際に動作させてみると、

take 10 reqs => [0,1,2,3,4,5,6,7,8,9]

## 動作しない!!!!

In [None]:
# フィボナッチ関数 遅延評価版
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# これをアズパターンを使って次のように書き換える。

fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]

# この種の等式はパターン束縛(patternbinding )と呼ばれる。
# 理由は、トップレベルにある等式で左辺全体がひとつのパターンになっているから。
# すなわち、fib と tfibはともに宣言内で 束縛されているということです。
# Haskellのパターン束縛は暗黙のう ちに ~ がパターンの前についているものとみなす。


In [None]:
# 実験
!ghc -e $'let {fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]} in print (take 5 fib)'
!ghc -e $'let {fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]} in print (take 5 fib)'

[1,1,2,3,5]
[1,1,2,3,5]


In [None]:
# 字句の有効範囲と入れ子形式 Lexical Scoping and Nested Forms
# let 式
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# let 式 expression によってつくられる束縛は、相互再帰的 (mutually recursive)で、遅延パターンとして扱われる。
# ~ が暗黙のうちについている。

# where 節 clause
# いくつかのガードをもつ等式にまたがる有効範囲束縛が便利なときには where 節を使う。

f x y  |  y>z           =  ...
       |  y==z          =  ...
       |  y<z           =  ...
     where z = x*x

# where 節はそれが覆う式の上にしか有効範囲がない。
# where 節は等式の集まりあるいは case 式のトップレベルでしか認められない。

# let 式は式であり、where 節は式ではない。where 節は関数宣言および case 式の構文の一部である。



In [None]:
# レイアウト
# Haskell はセミコロンあるいはそれにかわる終端記号を使わずにすんでいるのか。
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# 構文解析 parser はなぜ次のように解析したりしないのか。

let y   = a*b f
    x   = (x+y)/y
in f c + f d

# Haskell はレイアウト (layout) と呼ばれる、二次元構文を用いているから。
# カラム位置に依存している。
# 上の例は次のように解釈される。

let { y   = a*b
    ; f x = (x+y)/y
    }
in f c + f d

# 1行に複数の式を書きたいときにはセミコロンが便利である。

let y   = a*b;  z = a/b
    f x = (x+y)/z
in f c + f d


In [None]:
# 型クラスと多重定義 overloading
# すでに述べてきた多相 polymorphism は、パラメータ多相 parametric polymorphism とよばれる。
# アドホック多相は多重定義 overloading という呼びかたのほうが知られている。
# たとえば
# 1、2 などのリテラルは、固定長の整数と任意長の整数の両方で使われる。
# + のような数値演算子は何種類もの数値上で定義される。
# 同値演算子 (Haskell では ==)は数値とその他多くの型の上で動作する。
# Haskell では、 型クラスによって多重定義を制御する。

# elem 関数の定義を見てみよう。
%%script false

x `elem`  []            = False
x `elem` (y:ys)         = x==y || (x `elem` ys)

# ここで (==) を使っている。
# 型クラス type class によって解決している。


In [None]:
# 実験
!ghc -e $':t elem'
!ghc -e $':t (==)'

elem :: (Eq a, Foldable t) => a -> t a -> Bool
(==) :: Eq a => a -> a -> Bool


In [None]:
# 同値演算子を含むクラスの定義をしてみよう。
%%script false

class Eq a where
    (==) :: a -> a -> Bool

# Eq は定義するクラスの名前である。
# 型 a がクラス Eq のインスタンスでなければならない、という制約 constraint は、

Eq a 

# のように書く。
# Eq a は 式 expression ではなく、constraint を表しているので、文脈 context と呼ばれる。

(==) :: (Eq a) => a -> a -> Bool

# は、クラス Eq のインスタンスである型 a に対して、== は a->a->Boolという型をもつ、と読む。
# したがって

elem :: (Eq a) => a -> [a] -> Bool

# となり、求めていたものに他ならない。


In [None]:
# 実験
!ghc -e $':k Eq'
!ghc -e $':k Foldable'

Eq :: * -> Constraint
Foldable :: (* -> *) -> Constraint


In [None]:
# どの型が Eq クラスのインスタンスになるかを指定し、その型に対する == の実際の振舞いがどうなるかは
# インスタンス宣言 (instance declaration)で行う。
%%script false

instance Eq Integer where 
  x == y                =  x `integerEq` y

# 同様に

instance Eq Float where
  x == y                =  x `floatEq` y

instance (Eq a) => Eq (Tree a) where 
  Leaf a         == Leaf b          =  a == b
  (Branch l1 r1) == (Branch l2 r2)  =  (l1==l2) && (r1==r2)
  _              == _               =  False

# 最初の行の Eq a という文脈は必須である。なぜなら、
# 葉のもつ要素 (型は a)は 2番目の行の同値性を用いて比較する。

# 実際の Eq の定義
class  Eq a  where
  (==), (/=)            :: a -> a -> Bool
  x /= y                =  not (x == y)

# :i で調べたら次のようだった。 同じと思われる。
class Eq a where
  (==) :: a -> a -> Bool
  (/=) :: a -> a -> Bool


In [None]:
# クラス拡張 (class extension) もサポートされている。
# たとえば、Eq クラスからすべての操作を継承 (inherit)した Ord クラスを定義したいとする。
# このクラスは Eq クラスから継承した操作のほかに、比較 操作子と min 関数および max 関数をもつものとする。
%%script false

class  (Eq a) => Ord a  where
  (<), (<=), (>=), (>)  :: a -> a -> Bool
  max, min              :: a -> a -> a

# Eq は Ord のスーパークラス、 Ord は Eq のサブクラス(subclass )である。

# Ord の宣言は、(<) に対応するデフォルトメソッドを含んでいる。

x < y               =  x <= y && x /= y

# quicksort の型は次のようになっている。

quicksort :: (Ord a) => [a] -> [a]

# 多重継承 (multiple inheritance) 

class (Eq a, Show a) => C a 
    where ...

# C というクラスをつくっている、操作を Eq と Show の両方から継承している。

# クラスメソッドはトップレベルの宣言として扱われる。

# クラスメソッドには、制約を付加することができる。

class C a where
    m :: Show b => a -> b


In [None]:
# クラス宣言の中で、高階型 higher-order type を使う。
# 以下のような Functor クラスを考えよう。
%%script false

class Functor f where
    fmap :: (a -> b) -> f a -> f b

# fmap 関数は以前に使った map 関数を一般化したもの。
# 型変数 f は f a のなかで他の型に適用される。こ のように、型変数が
# 型 Tree に対する Functor のインスタンス は、

instance Functor Tree where
  fmap f (Leaf x)       = Leaf   (f x)
  fmap f (Branch t1 t2) = Branch (fmap f t1) (fmap f t2)

# このインスタンス宣言は Tree a ではなく Tree が Functor のインスタンスであることを宣言している。
# これは総称的「コンテナ」型を記述する能力のあることを示し、fmap のような、任意の木、
# リストあるいは他の型の上で統一的に動作する関数を可能にする。

# 型適用は関数適用とおなじやりかたで書ける。型 T a b は (T a) b　と構文解析される。
# タプルのような特別な構文を使う型はカリー化可能な別のスタイルで書ける。
# 関数については、(->) が型構築子である。f -> g と (->) f g とは同じである。
# 同様に、[a] と [] aとは同じである。
# タプルについては、型構築子は (,)、(,,) などとなる。


In [None]:
# 型システムは式の中で型付けエラーを検出する。
# 式 (+) 1 2 3 は型エラーになる。それは (+) は 2 つしか引数をとらないからである。
# 同様に、 Tree Int Int は、エラーを起こす。それは Tree 型はひとつの引数しかとらないからである。
# Haskellはどのようにして不正な型式を検出するのか。

# その答は、型の正当性を確認する第2の型システムにある。
# 型は類 (kind)と結びついている。


In [None]:
!ghc -e $':k Eq'
!ghc -e $':k Integer'
!ghc -e $':k Functor'
!ghc -e $':k Num'
!ghc -e $':k Foldable'
!ghc -e $':k Ord'

Eq :: * -> Constraint
Integer :: *
Functor :: (* -> *) -> Constraint
Num :: * -> Constraint
Foldable :: (* -> *) -> Constraint
Ord :: * -> Constraint


In [None]:
# 型はは次の 2つの形式をとる。

# 記号 * は具体的なデータ対象に結びついた型の類をあらわす。
# k1 と k2 とが類ならば、k1->k2 は k1 という類の型をとり、k2 という類の型を返す型の類である。

# 型構築子 Tree の類は、 *->* であり、Tree Int の類は * である。
# Functor クラスのメンバーはすべて、類 *->* でなければならず、
# 類付けのエラーは、次のような宣言により引き起こされる。
%%script false

instance Functor Integer where ...

# なぜなら、Integer の類は * だからである。
# 類は Haskell のプログラムの直接あらわれることはない。
# コンパイラが型検査の前に類を推論する。「類宣言」のようなものは必要ない。
# 型シグネチャが類エラーをおこすとき以外は、類は Haskellのプログラムの後ろに隠れている。
# 類は非常にシンプルなので、コンパイラは、類衝突がおこれば、その旨のエラーメッセージを表示する。


In [None]:
# オブジェクト指向プログラミング OOP とのアナロジー
# OOP におけるクラスを型クラスへ置き換え、オブジェクトを型へ置き換えれば、ほぼ Haskell の型クラスになる。

# OOP と比べると、型はオブジェクトではないというのは明かで、
# OOP 言語に対する利点は、Haskellのメソッドは完全に型安全である。
# 必要なクラスのなかにはない型の値にメソッドを適用するとしているかどうかは、
# コンパイル時に検出される。単純に高階関数として引き渡される。

# パラメータ多相とアドホック多相 overloading との関係を考察すると別の見方をすることができる。
# パラメータ多相がどれほど便利かということは既に示した。
# しかしながら、ときには、このような包括的グルーピングでは広すぎることもある。
# もっと小さい型の集合の上でコントロールをしたい場合がある。たとえば、比較同値性をもつような型の集合
# の上で、という時、型クラスは、これを実現する構造的方法とみなすことができる。
# パラメータ多相は一種の多重定義とみなすことができ、多重定義は暗黙にすべての型の上で起こり、
# 限定された型の集合(つまり、型クラス)上で起こるのではない。

# 他の言語との比較
# Haskell で用いられるクラスは OOP で用いられるクラスに類似している。しかし、いくつかの重大な相違がある。

# Haskell は、型の定義とその型に結びついているメソッドの定義を分離する。 
# C++ や Java のクラスは、ふつう、データ構造(メンバー変数)とそのデータ構造と結びついた関数(メソッド)
# の両方を定義する。Haskell ではこれらの定義は別々におこなう。

# Haskell は、型の違う関数が共通の名前を共有するような C++ 流の多重定義 はサポートしていない。

# Haskell のオブジェクトの型は暗黙の型変換を受けない。値が投入あるい
# は投出される Object のようなすべての基になるようなクラスは ない。

# C++ や Java ではオブジェクトの実行時表現に (VTable のような) 同定情報を付加する。
# Haskellではこのような情報は、型システムを通じて物理的にではなく、論理的に、値に付加する。

# Haskell のクラスシステムには、(publicあるいは private などといっ
# たクラス構成要素のような) アクセスコントロールの機構は組込まれていない。


# 再び、型について

In [None]:
# 再び、型について

# newtype 宣言
# 表現が既存の型と同一だが，型システムの中では別の型として識別されるような型を定義する。
# たとえば、Integer 型を次のような宣言で用いて、自然数を表現することができ る。
%%script false

newtype Natural = MakeNatural Integer

# 完全に新しい型 Natural を生成し、その構築子はひとつ の Integerだけを引数にとる。
# この構築子 MakeNatural は Natural と Integer との間の変換をおこなう。

toNatural               :: Integer -> Natural
toNatural x | x < 0     = error "Can't create negative naturals!" 
            | otherwise = MakeNatural x

fromNatural             :: Natural -> Integer
fromNatural (MakeNatural i) = i

# 次のインスタンス宣言は Natural を Num クラスに所属させる。

instance Num Natural where
    fromInteger         = toNatural
    x + y               = toNatural (fromNatural x + fromNatural y)
    x - y               = let r = fromNatural x - fromNatural y in
                            if r < 0 then error "Unnatural subtraction"
                                     else toNatural r
    x * y               = toNatural (fromNatural x * fromNatural y)

# この宣言なしでは、Natural は Num には属することができない。
# 元の型に対するインスタンス宣言内容が、新しい型に持ち越されることはない。
# 実際、この型の目的は、別の Num のインスタンスを導入することな。
# もし、Naturalが Integer の型シノニムとして宣言されていれば、これはできない。

# これらはすべて、newtype 宣言ではなく data 宣言を用いて も機能する。
# しかし、data宣言では、Natural の値の表現にオーバヘッドが生じる。
# newtype を用いることで data 宣言によって間接参照のレベルが深くなる (これは遅延性の故) 
# のを避けることができる。

# キーワードをのぞけば、newtype 宣言は、単一フィールドをもつ単一 構築子の data
# 宣言と同じ構文を用いる。


In [None]:
# フィールドラベル
# Haskell のデータ型内のフィールドは、位置を手がかりにアクセスすることも、
# フィールドラベルを用いて名前でアクセスすることもできる。
# 2次元の点に対する型について考察する。
%%script false

data Point = Pt Float Float

# Point の構成要素は、構築子 Pt の第一引数と第二引数である。 次のような関数が考えられる。

pointx :: Point -> Float
pointx (Pt x _) = x

# data 宣言における構築子は、フィールド名付で (波括弧で括られて) 宣言することができる。
# フィールド名は構築子の構成要素を位置によってではなく、名前で同定する。

data Point = Pt {pointx, pointy :: Float}

# このデータ型は Point と同一、構築子 Pt も同じ。
# しかし、この宣言ではふたつのフィールド名、pointx と pointyとが定義されている。
# これらのフィールド名は構造の中から構成要素を取り出すための選択関数 (selector function) として使うことができる。

pointx :: Point -> Float
pointy :: Point -> Float

# この selector を使って次のような関数を作ることができる。

absPoint :: Point -> Float
absPoint p = sqrt (pointx p * pointx p + pointy p * pointy p)


In [None]:
# 実験
%%writefile point01.hs

data Point = Pt {pointx, pointy :: Float}

absPoint :: Point -> Float
absPoint p = sqrt (pointx p * pointx p + pointy p * pointy p)

somepoint = Pt 3.1 3.9

main = print $ absPoint somepoint

Overwriting point01.hs


In [None]:
!runghc point01.hs

4.9819674


In [None]:
# フィールドラベルは新しい値を構築するときに使う。
# 式 Pt {pointx=1, pointy=2} は式 Pt 1 2 と同一。
# フィールド名を使って値を構築する場合、フィールドをいくつか省略することができる。
# 省略されたフィールドは定義されない。
# フィールド名を使ったパターンマッチングは構築子 Pt のときと同じような構文で使いる。
%%script false

absPoint (Pt {pointx = x, pointy = y}) = sqrt (x*x + y*y)

# 既存の構造中のフィールド値を使って、新しい構造の構成要素を作る (update) ことができる。
# p が Point ならば、 p {pointx=2} は p と同じ pointy をもつが、pointx は 2 に置き換る。
# 破壊的更新ではなく、オブジェクトの新しいコピーを生成する。

# フィールドラベルと併せて使用した波括弧はいくぶん特殊な使い方で、
# 通常、波括弧はレイアウトルールを無視するのに使われるが、
# フィールド名とむすびついた波括弧は明示的に書かなければならない。

# フィールド名は単一構築子の型 (レコード型とよばれる) に限るものではない。
# 複数の構築子をもつ型では、フィールド名を用いての選択や更新の操作は実行時エラーを引き起こす可能性がある。
# これは、空リストにhead を適用したときと似ている。

# フィールドラベルは一般の変数やクラスメソッドとトップレベルの名前空間を共有する。
# スコープのなかで同じ名前のフィールド、一つ以上のデータ型で使うことはできない。
# しかし、一つのデータ型の中でなら、型付けが同じあるかぎり、一つ以上の構築子のなかで、使うことができる。
# たとえば、次のようなデータ型のなかで、

data T = C1 {f :: Int, g :: Float} | C2 {f :: Int, h :: Bool}

# フィールド名 f は型 T の両方の構築子に適用されている。
# つまり、もし、x の型が T ならば、x {f=5} は T 内のどちらの構築子が生成した値に対しても機能する。

# フィールド名が代数的データ型の基本性質を変えることはない。
# フィールド名は、データ構造の構成要素にアクセスするのに位置を手がかりにするより、
# 名前を手がかりにするために用意された、便宜的な構文にすぎない。この構文
# のおかげで、多くの構成要素をもつ構築子の扱いが簡単になる。
# フィールドは構築子へのそれぞれの参照を変更することなく追加したり削除したりすることができるからである。


In [None]:
# 正格データ構築子

# Haskell ではデータ構造は一般的に遅延性をもつ。
# 構成要素は必要になるまで評価されない。
# この性質のおかげで、データ構造はもし評価されるとエラーあるいは停止できないような要素を含むことができる。
# 遅延データ構造は Haskell の表現力を強化し、Haskellのプログラミングスタイルの要になる。

# 内部的には、遅延データオブジェクトの各フィールドはサンク (thunk) とよくいわれる構造に包みこまれている。
# サンクはフィールド値を定義した計算をカプセル化したもの。
# 値が必要にならないかぎり、サンクの中へ入ることはない。
# エラー (_|_ )を含むサンクがあってもデータ構造の他の要素には影響しない。
# たとえば、タプル ('a',_|_) は完全に正しい Haskell の値である。
# この 'a' はこのタプルのもう一方の要素にかまうことなく、使うことができる。
# 他のプログラミング言語は遅延性ではなく正格性をもっている。
# すなわち、データ構造のすべての要素はそのデータ構造に入れる前に値にまで簡約される。

# サンクにはいろいろなオーバヘッドがついてまわる。
# サンクを構成するにも、それを評価するにも時間がかかる。
# ヒープの領域をとるし、そのサンクの評価のために必要な別の構造を確保するため、
# ガーベッジコレクタを起動することもある。
# こうしたオーバヘッドを回避するために、正格性フラグを data 宣言で使いる。
# こうして、選択的に遅延性を抑制することで、指定した構築子のフィールドをただちに評価する。
# data 宣言の中で、! でマークされたフィールドは、サンクに入れて遅延するのではなく、
# 構造が生成される際に、直ちに評価される。この正格性フラグを用いるほうがよい状況はいくつかある。

# * プログラム実行中に必ず評価されることが確定している構成要素
# * 簡単に評価できて絶対にエラーを起こさないことが確定している構成要素
# * 部分的に未定義の値であると意味のない型

# たとえば、複素数のライブラリが定義している Complex 型は次のようになっている。
%%script false

data RealFloat a => Complex a = !a :+ !a

# 構築子 :+ の中置定義に注意!
# この定義では、ふたつの構成要素にマークがついている。
# 複素数の実数部と虚数部は正格性をもつようにマークされている。
# これは、複素数のよりコンパクトな表現だが、たとえば、1 :+ _|_ のように未定義の構成要素があっ
# た場合、全体が未定義 (_|_)になってしまうという代償をはらっている。
# しかし、部分的にしか定義されていない複素数が必要になることは実際にはありえないので、
# 効率のよい表現を達成するために正格性フラグを使用するのは意味のあることである。

# 正格性フラグはメモリリーク(もはや使うことはないのにガーベッジコレクタに
# 回収されない構造)を解決するために使うこともできる。

# 正格性フラグ ! は data 宣言のなかでのみ使われる。
# そのほかの型シグネチャーや型定義では使えない。
# 関数の引数に対して正格性をもつようにマークをつける方法はない。
# しかし、 seq あるいは !$ という関数を使用することで同じ効果が得られる
 
# 正格性フラグの使い方の正確なガイドラインを示すのは難しい。
# 注意して使用しなければならない。
# 遅延性は Haskell の基本的な特徴のひとつであって、
# そこへ正格性フラグをつけ加えることは無限ループの発見を困難なものにし、ほかの予期せぬ結果をまねきかねない。


In [None]:
# 入出力
# Haskell の I/O システムは純粋に関数的である。
# 命令型の言語では、プログラムは環境を変更するアクションを通じて進行する。
# 典型的なアクションには、グローバル変数を読むこと、設定すること、ファイルへの書き込み、
# 入力の読み込み、ウィンドウのオープンなどがある。
# このようなアクションは Haskell の言語のコアの部分からは、切離されている。

# Haskell の I/O システムは数学のモナド (monad) を基礎として築かれている。
# しかし、I/O システムを使う上で底流にあるモナドの理論を理解する必要はない。
# モナドの理論は、I/O にたまたま適合した概念上の構造である。
# 単純な算術演算を実行するのに群論を理解する必要がないのと同じで、
# Haskell の I/O を実行するのにモナド理論を理解する必要はない。

# I/O システムを構築しているモナド演算子は別の目的にも使用される。
# ここでは、モナドという用語を使うのは避けて、I/O システムの使い方に集中する。
# I/O モナドを単に抽象データ型だと考えておくのがいいだろう。

# アクションは Haskell では呼出すのではなく定義するものである。
# アクションの定義を評価することでは、実際のアクションは起こらない。
# むしろ、アクションは、ここまで考えてきた式の評価というものの外側で起こることである。

# アクションはシステムプリミティブとして定義されるようにアトミックなものであり、
# また、一連のアクションの合成でもある。
# I/O モナドは複合アクションを構成するためのプリミティブをふくみ、
# 他の言語では ; (セミコロン) を使って、 文を一列にならべるのと同じように構成する。
# このモナドの機構はプログラムのなかのアクションをくっつける糊のような役目をする。



In [None]:
# I/O の基本演算
# 各 I/O のアクションはそれぞれ値を返する。
# 型システムにおいては、返り値 は、IO という「タグ」がつけられている。
# これはアクションを他の 値と区別するためである。
# たとえば、関数 getChar の型は、次のようなものである。
%%script false

getChar :: IO Char

# この IO Char は getChar が呼出されたときに、文字を返すなんらかの動作をする、ということを示している。
# 意味のある値を 返さないアクションにたいしてはユニット型 () を用いる。
# たとえば、関数 putChar の型は、次のようなものである。

putChar :: Char -> IO ()

# この関数は引数として文字を取るが、特に意味のある値は返さない。


In [None]:

# アクションは、演算子 >>= (`bind`)を使って、順序付けをする。
# この演算子を直接使わず、 do 記法という糖衣構文を使うこともできる。
# この記法では、順序制御の演算子は構文の後に隠れるので、伝統的な言語に近くなる。
# do 記法は簡単に >>= に展開することができる。

# キーワード do により順に実行される文のならびが導入される。
# 文はアクションであるとともに、<- を使ってアクションの結果に束縛されたパターンであり、
# let を使った局所的な定義の集合でもある。
# do 記法は let や where と同じく、レイアウトを使いる。
# 適正なインデントをつかえば、波括弧とセミコロンを省略することができる。
# 次のは一文字よみこみそれを印字する簡単なプログラムである。

main :: IO ()
main = do c <- getChar
          putChar c

# main の使い方は重要である。
# main は (C の main 関数と同様に) Haskell のプログラムのエントリポイントとして定義されている。
# main は IO 型でなければならない。ふつうは IO () である。
# main は Main モジュールのなかだけで特別な意味をもつ。
# 上のプログラムは順に 2 つのアクションを実行する。
# 最初に、一文字に読み込み、その結果を変数 cへ束縛する。
# それからその文字を印字する。
# let 式とはちがい、<- で定義した変数は、そのあとに続く文のなかでのみ有効である。

# do を用いて、アクションを起動し、その結果を知ることができるが、
# 一連のアクションから結果を返すのはどうするか。
# たとえば、一文字読み込んでその文字が 'y' であれば、True を返す ready という関数を考えてみよう。

%%script false

ready :: IO Bool
ready = do c <- getChar
            c == 'y' -- ダメ!!!

# この関数は、do のなかの 2つめの文が、アクションではなく、単なる真理値なので、動作しない。
# この真理値をとって、なにもしないが、結果としてこの真理値を返すアクションを生成しなければならない。
# return 関数はまさにこれを行う。

return :: a -> IO a

# この return 関数はプリミティブの実行を完成させる。
# ready の最後の行は、return (c == 'y') でなくてはならない。

# では、もっと複雑な I/O 関数を見てみよう。
# まず、getLine 関数である。

getLine     :: IO String
getLine     =  do c <- getChar
                  if c == '\n'
                       then return ""
                       else do l <- getLine
                               return (c:l)

# else 節にある、ふたつめの do に注目。
# それぞれの do は一本の文の列を構成している。
# if のように介入的な言語要素はその先のアクション列を導入するのに新たな doを使う必要がある。

# return 関数は真理値などの一般の値を I/O アクションの領域に入れる。
# その逆はどうか。
# いくつかの I/O アクションをふつうの式のなかで起動できるか。
# たとえば、x + print y を式のなかに入れて、y がその式の評価の結果として印字されるようにすることはできるか。
# できない。
# 純粋関数型のコードのなかで、こっそりと命令型の世界にしのび込むことはできない。
# 命令型の世界に「影響される」値にはそれとわかるタグがついている必要がある。

# 次のよう な関数

f :: Int -> Int -> Int

# は絶対に I/O を行うことはできない。
# それは IO が返り値にあらわ れていないからである。
# このことは、デバッグのときに文字通りコード全体にわたって
# print 文を埋めこむことの多いプログラマにとっては悩みの種だろう。
# 実際のところは、この問題に対処するために、いくつかの安全ではない関数が用意されている。
# しかし、これらは、上級プログラマにとっておいた方がよいものである。
# デバッグ用のパッケージ (Trace など) は往々にして「禁じ手」となっている関数を気前よく使っている。


In [None]:
# アクションをつかったプログラミング
# I/O アクションはふつうの Haskell の値である。
# 関数にわたされることもあるだろうし、なかに入れることも、Haskell のほかの値とおなじようにできる。
# 次にアクションのリストを考えてみよう。
%%script false

todoList :: [IO ()]

todoList = [putChar 'a',
            do putChar 'b'
               putChar 'c',
            do c <- getChar
               putChar c]

# このリストは実際にはアクションを起動することはない。
# アクションを保持しているだけである。
# これらのアクションを一つのアクションにまとめるのは、sequence_ のような関数が必要である。

sequence_        :: [IO ()] -> IO ()
sequence_ []     =  return ()
sequence_ (a:as) =  do a
                       sequence as

# この関数は、なにもせずに、do x;y を x >> y へ展開する。

:t (>>)
(>>) :: Monad m => m a -> m b -> m b

:i (>>)
class Applicative m => Monad (m :: * -> *) where
  (>>) :: m a -> m b -> m b
        -- Defined in ‘GHC.Base’
infixl 1 >>

# このパターンの再帰は、foldr 関数でとらえることができる。
# さらによい sequence_ の定義は以下のようなものである。

sequence_        :: [IO ()] -> IO ()
sequence_        =  foldr (>>) (return ())

# この do 記法は便利なツールだが、この場合には、その底流にあるモナド演算子 >> を使うほうが適当である。
# do の構築の基になる演算子を理解することは、Haskell プログラマにとって役にたつこと である。

# sequence_ 関数は、putStr を putChar をつかって構築するときにも使える。

putStr                  :: String -> IO ()
putStr s                =  sequence_ (map putChar s)

# Haskell と伝統的な命令型の言語との違いのひとつがこの putStr にみてとれる。
# 命令型の言語では、命令型の putChar を文字列上でマッピングするだけで印字が可能である。
# しかし、Haskell では map 関数はアクションを実行しない。
# そのかわり、それぞれ、文字列の一文字に対応するアクションのリストを生成する。
# sequence_ のなかの畳み込み演算は >>関数をつかって、それぞれの個別の演算をひとつの演算にまとめる。
# ここでも return () は必要である。
# foldr は一連のアクションの最後になにもしないアクションを必要とする。

# プレリュードやライブラリには I/O アクションの順序付けに便利な関数がたくさんある。
# これらの関数はだいたいのものが、任意のモナド用に汎用化されている。
# Monad m => という文脈を含む関数はどれも IO 型で使える。


In [None]:
# 例外処理 exception handling
# ここまでは、I/O 演算中の例外の問題を避けてきた。
# もし、getChar がファイルの最後にあたったら、どうなるか。
# _|_ に対してはエラー error という用語を使う。
# これは、停止しない、あるいは、パターンマッチが失敗した、というような回復不可能な場合に使う。
# 一方、例外 exception は、I/O モナド内で捕捉可能および処理可能なものである。
# I/O モナド中での、「file not found」などの例外的状況をあつかうには、standard ML
# の入出力にある機能にあるような、ハンドリング機構を使いる。
# 特別な構文や意味論を用いることはない。
# 例外処理は、I/Oの順序付け演算子の定義の一部になっている。

In [None]:
# 例外は特別なデータ型 IOError としてコード化されている。
# この 型は I/O モナド中でおこりうるすべての例外を表わしている。
# これは一種の 抽象型で、ユーザが利用可能な IOError の構築子はない。
# IOError 型の値に対して使うことができる述語がいくつかある。

%%script false

isEOFError :: IOError -> Bool

# という関数はエラーが、ファイル終端条件でひきおこされたものかどうかを判定する。
# IOError を抽象型とすることで、明示的なデータ型の変更なしで、新しい種類のエラーをシステムに導入することができる。
# この isEOFError 関数は IO ライブラリのなかで定義されているので、明示的にインポートする必要がある。

# 例外ハンドラ は IOError -> IO a という型になる。
# catch 関数は例外ハンドラをアクションあるいはアクションの集まりと関連づける。

catch                     :: IO a -> (IOError -> IO a) -> IO a

# catch の引数はアクションとハンドラである。
# アクションが成功すれば、ハンドラを起動せずにその結果だけを返する。
# エラーが起これば、IOError 型の値をハンドラに渡し、そのハンドラに関連づけられているアクションを起動する。
# 例として、エラーにであうと改行を返す getChar をあげておこう。

getChar'                :: IO Char
getChar'                =  getChar `catch` (\e -> return '\n')

# これは、すべてのエラーについて同じ処理をしているので、あまり洗練された実装ではない。
# もし、ファイル終端になった場合だけをわけたい場合には、エラーの種類を確かめなければならない。

getChar'                :: IO Char
getChar'                =  getChar `catch` eofHandler where
    eofHandler e = if isEofError e then return '\n' else ioError e

# ここで使われている ioError 関数は次の例外ハンドラに例外を投げる。
# ioError の型は、

ioError :: IOError -> IO a

# である。
# これは、つぎの I/O アクションを実行するかわりに、
# 制御を例外ハンドラに移すという点をのぞけば、return と類似している。
# catch の入れ子になった呼び出しも可能である。
# 入れ子になった catch の呼び出しは、入れ子になった例外ハンドラを生成する。
# この例を、getChar' を使って getLine を再定義することで示そう。

getLine'        :: IO String
getLine'        = catch getLine'' (\err -> return ("Error: " ++ show err))
        where
                   getLine'' = do c <- getChar'
                         if c == '\n' then return ""
                                            else do l <- getLine'
                                                    return (c:l)


# 入れ子になったエラーハンドラは getChar' がファイル終端を捕捉することを可能にしている。
# 一方で、ほかのエラーがおこると "Error: " ではじまる文字列が、getLine' から戻る。

# Haskell では利便性確保のために、プログラムの最上位レベルにプログラムを停止し、
# 例外を印字する例外ハンドラが用意されている。


In [None]:
# ファイル、チャネル、ハンドル
# I/O モナドや例外処理機構が提供するもののほか、
# Haskell の I/O は、他の言語にあるものとほとんど同じ機構が備わっている。

# ファイルをオープンするとハンドル (型は Handle) が生成されて、これを使って I/O のやりとりをする。
# このハンドルをクローズすると、それに関連付けられているファイルがクローズする。
%%script false

type FilePath         =  String  -- path names in the file system
openFile              :: FilePath -> IOMode -> IO Handle
hClose                :: Handle -> IO () 
data IOMode           =  ReadMode | WriteMode | AppendMode | ReadWriteMode

# ハンドルはチャネルにも関連付けられる。
# チャネルはファイルとは直接結びつかないコミュニケーションポートである。
# いくつかのチャネルハンドルは定義済になっている。
# たとえば、stdin (標準入力)、 stdout (標準出力)、stderr (標準エラー) である。
# hGetChar や hPutChar の文字単位の I/O演算は、引数のひ とつとして、ハンドルをとる。
# さきほどの getChar 関数は次のように定義されている。

getChar = hGetChar stdin

# Haskellでは内容全体をひとつの文字列として返すファイルやチャネルが使える。

getContents :: Handle -> IO String

# 実行上、getContents はチャネルやファイルの全内容を一度にすべて
# 読みこまなければならず、メモリや実行時間が足りなくなるということが起こりそうに見える。
# しかし、それは間違いである。
# 鍵となる要点は、 getContents は文字の「遅延」(すなわち非正格)リストを返すということである。
# このリストの要素は、他のリストと同様に、「必要になってはじめて」読み込まれるのである。
# この要求駆動の振舞いの実装は、計算側からの要求があるたびに、
# 一度に一文字づつファイルから読みこむことで実現する。

# 次の例はファイルをコピーする Haskell のプログラムである。

main = do fromHandle <- getAndOpenFile "Copy from: " ReadMode
          toHandle   <- getAndOpenFile "Copy to: " WriteMode 
          contents   <- hGetContents fromHandle
          hPutStr toHandle contents
          hClose toHandle
          putStr "Done."

getAndOpenFile          :: String -> IOMode -> IO Handle
getAndOpenFile prompt mode =
    do putStr prompt
       name <- getLine
       catch (openFile name mode)
             (\_ -> do putStrLn ("Cannot open "++ name ++ "\n")
                       getAndOpenFile prompt mode)


# 遅延性のある getContents 関数を使うと、ファイルの内容全部を一度にメモリへ読み込む必要がなくなる。
# もし、hPutStr がバッファとして固定長の文字列を採用するなら、一度にメモリへ読み込むには、
# 入力ファイル 1 ブロック分だけが必要である。
# 入力ファイルは最後の文字が読み出されれば、暗黙のうちにクローズされる。


In [None]:
# Haskell と命令型 imperativeプログラミング
# 最後に、I/O プログラミングは重大な問題を表面化したことについて考える。
# このスタイルは従来の命令型のプログラミングとさしてかわらないではないということである。

# たとえば、getLine 関数、
%%script false

getLine         = do c <- getChar
                     if c == '\n'
                          then return ""
                          else do l <- getLine
                                  return (c:l)

これは、つぎの命令型のコードと酷似している。

function getLine() {
  c := getChar();
  if c == `\n` then return ""
               else {l := getLine();
                     return c:l}}

# ということは、結局、Haskell は単に命令型の車輪を再発明しただけなのか。

# ある意味では、そのとおりである。
# I/O モナドは Haskell のなかに小さな命令型のサブ言語を構成している。
# それゆえ、プログラムの I/O の構成要素は従来の命令型のコードにそっくりになるのである。
# しかし、ひとつ大きな違いがある。
# これを扱うのに特別な意味論を必要としないということである。
# 特に、 Haskell における等式論証の仕組みはなんら損われていない。
# プログラム中のモナドのコードの命令型のフィーリングは
# Haskell の関数的な側面をそこなうものではない。
# 経験を積んだ関数プログラマはプログラム中の命令型の構成要素を最小限にし、
# トップレベルで順序付けを最小にし、それについてだけ、I/O モナドを使用することができる。
# モナドはプログラムの関数的な構成要素と命令的な構成要素を綺麗にわける。
# 一方で、関数的なサブセットをもつ命令型の言語では純粋に関数的な世界と命令的な世界をへだて
# るものがハッキリとは定義されていない。


# 標準クラス

In [None]:
# 8 Haskell の標準クラス
# このセクションでは、Haskellの定義済標準型クラスを紹介する。
# 一部のクラスについては Haskell の標準ライブラリの一部になっている。

# 同値クラスと順序クラス
# Eq クラスと Ord クラスについては既に述べた。
# プレリュードにある Ord クラスの定義は、以前に定義した単純なものよりも、複雑だ。
# 特に、compare メソッドは、以下のようになっている。
%%script false

data Ordering           =  EQ | LT | GT 
compare                 :: Ord a => a -> a -> Ordering

# compare メソッドがあれば、このクラスの他のすべてのメソッドは定義できる。
# Ord のインスタンスを生成するにはこの方法が一番すぐれている。

# 列挙クラス
# Enum クラスには数列表現の糖衣構文の底流にある一連の演算がある。
# たとえば、数列式 [1,3..] は enumFromThen 1 3 を表わしている。
# これで、Enum のインスタンスの型であればどの型に対しても、
# この数列式を用いてリストの生成ができることがわかる。
# Enum のインスタンスにはほとんどの数値型が含まれているばかりではなく、
# Char 型も含まれており、['a'..'z'] はアルファベット順にならべた、小文字のリストを表す。
# さらに、Color のよ うな、ユーザ定義の列挙型を Enum のインスタンスとして宣言できる。
# それは次のようになる。

[Red .. Violet] => [Red, Green, Blue, Indigo, Violet]

# ここで、注意すべきことは、このような列は、算術的であるということだ。
# すなわち、各値の増分はそれが数値であろうとなかろうと、一定であるということだ。
# Enum のほとんどのインスタンスは固定長の整数上に写像することが可能だ。
# この目的のために、fromEnum や toEnum が用意されており、Int と Enum
# のインスタンスの間での変換 をおこなう。



In [None]:
# Read クラスと Show クラス
# Show クラスのインスタンスは文字列への変換 (典型的な目的はI/O) が可能な型だ。
# Read クラスには、その値を表現する文字列を構文解析する演算が用意されている。
# Show クラスの最も単純な関数は show だ。
%%script false

show :: (Show a) => a -> String

# show は当然、対応する型のあらゆる値をとり、その表現として、文字列を返す。
# たとえば、show (2+2) は "4" を返す。
# このように正しく動作するものについてはいいが、それぞれの型のいろいろな値について、
# 複雑な表現が必要になる。
# たとえば、


"The sum of " ++ show x ++ " and " ++ show y ++ " is " ++ show (x+y) ++ "."

# のような場合、それぞれの文字列を連結しているのでは、能率的ではない。
# ことに、二分木の文字列表現を考えてみよう。
# 入れ子になった部分木を表示するために適当なマークをつけてたり、左の枝と右の枝をわける印をつけたりする。

showTree                :: (Show a) => Tree a -> String
showTree (Leaf x)       =  show x
showTree (Branch l r)   =  "<" ++ showTree l ++ "|" ++ showTree r ++ ">"

# (++) は左側の引数の長さの線型で効く計算量をもつので、
# showTree は木のサイズの 2 次で効く計算量になる。

# 線型の複雑さを持つように、関数 shows を以下のように定義する。

shows                   :: (Show a) => a -> String -> String

# この shows は印字可能な値と文字列をとり、前の部分にその値の文字列表現を連結した文字列を返す。
# ふたつめの引数は一種の文字列積算子になる。
# show は shows にナル積算子をあたえたものとして定義することができる。
# これは Show クラスの定義のなかの show のデフォルトの定義となる。

show x = shows x ""

# shows を使って、showTree のより効率のよい定義をすることができる。
# このときも、文字列積算子引数をもたせる。

showsTree               :: (Show a) => Tree a -> String -> String
showsTree (Leaf x) s    =  shows x s
showsTree (Branch l r) s=  '<' : showsTree l ('|' : showsTree r ('>' : s))

# この定義により効率の問題は解決した。
# (showsTree の計算量は 線型のオーダだ。) 
# しかし、この関数の表現をさらに改良することができる。
# まず、型シノニムをつくってみよう。

type ShowS = String -> String

# この型は、なにかの文字列表現に積算子文字列を連ねた文字列を返す関数の型である。
# つぎに、積算子をもちまわり、長い文字列の構築の右端での括弧の蓄積を
# 回避するために、関数合成を使うことができる。

showsTree               :: (Show a) => Tree a -> ShowS
showsTree (Leaf x)      =  shows x
showsTree (Branch l r)  =  ('<':) . showsTree l . ('|':) . showsTree r . ('>':)

# コードを整理することよりもさらに重要なことが、このプログラム変換によってあきらかになった。
# それは、オブジェクトレベルでの表現から関数レベルの表現への変換だ。
# ここで、showsTree の型付 けは、tree から表示関数への写像ということができる。
# ('<' :) あるいは ("a string" ++) のような関数はプリミティブな表示関数で、
# 関数合成を用いて、より複雑な関数を構築することができる。


# いまここ

In [None]:
# さて、tree を文字列に換える話に戻ろう。
# こんどは逆の問題を考える。
# 基本のアイディアは、型 a に対する構文解析子だ。
# 型 a の構文解析子は文字列を引数としてとり、 (a,String) のリストを返す関数だ。
# Prelude にはこのような関数の型シノニムが備えられている。
%%script false

type ReadS a = String -> [(a,String)]

ふつうの状況では、パーザは単一の要素を含むリストを返する。
この要素は、 入力文字列から読み込んだ型 aの値と、そのあと構文解析される、残りの文字列の組だ。
もし、構文解析が不可能であれば、結果は空リストだ。
もし、2つ以上の構文解析が可能であるなら(この場合は曖昧な構文ということになる)、
結果は、2 つ以上の組を含むリストになる。
標準関数の reads は Read のあらゆるインスタンスに対応する構文解析子関数だ。

reads :: (Read a) => ReadS a

この関数を使って、showTree を使ってつくった、二分木の文字列表現を構文解析する関数を定義することができる。
リストの内包表記はこのような構文解析関数を構築するのに便利なイディオムだ。
(モナドや構文解析結合子を使ったもっとエレガントな方法もある。
これらは、ほとんどの Haskellシステムとともに配布される標準の構文解析ライブラリの一部となっている。)

readsTree :: (Read a) => ReadS
(Tree a)
readsTree ('<':s) = [(Branch l
r, u) | (l, '|':t) <-
readsTree s,
(r, '>':u) <- readsTree t ]
readsTree s = [(Leaf x, t) |
(x,t) <- reads s]

すこし、時間をかけてこの関数の定義を詳細にみていこう。
考慮すべき状 況がふたつある。
もし、構文解析の対象となる文字列の最初の文字が '<' の場合、これは、枝の表現にちがいあらない。
そうでなかっ た場合、これは葉の表現だ。
最初の場合は、開き三角括弧につづく入力文字列 の残りの部分を s とすると、
可能な構文解析はなんであれ、 Branch l r となり、残りの文字列は、u となり、以下の条件に従う。

木 l は文字列 s の最初から構文解析されたものとすることができる。
( l の文字列表現に続く)残りの文字列は '|' で始まる。
この文字列の先頭をのぞく部分を t とする。
木 r は文字列 t の最初から構文解析されたものとすることができる。
この構文解析の残りの文字列は '>' で始まる。
この文字列の先 頭をのぞく部分は u である。
リスト内包表記のパターンマッチングの組み合わせによる表現力に注目する。
リスト内包表記されたメインの式であたえられている構文解析結果の形式は、
まず、上にあげた 2 つの条件を最初の生成部 ((l,'|':t) は、s の構文解析結果のリストから引出されている。) 
によって表現されている。
のこりの条件は、2 つめの生成部によって表現されている。
上の 2つめの定義等式は葉の表現に対する構文解析は、この木の要素の表現を
構文解析し、その結果に構築子 Leafを適用して、値をうる、という 意味だ。

信仰上、とりあえず、(色々な型があるなかで) Integer の Read (および Show)
インスタンスがあって、期待通りの振舞いをする reads が備わっていることを受容する。
つまりは以 下のとおりだ。

(reads "5 golden rings") :: [(Integer,String)] => [(5, "golden rings")]

これが理解できれば、次の評価を確認できるはずだ。

readsTree "<1|<2|3>>" =>
[(Branch (Leaf 1) (Branch
(Leaf 2) (Leaf 3)), "")]
readsTree "<1|2" => []

いま定義した readsTree には、2 つの欠点がある。
ひとつは、この構文解析器はたいへん厳格にできていて、木の表現の文字列の要
素の前や間に空白を許さないというもので、もうひとつは、区切の記号を構文解
析する方法が葉の値の場合と部分木の場合ではすっかり違うということだ。
この統一性のなさが、この関数の定義を読みづらいものにしている。
この 2つの問題をプレリュードで定義されている字句解析器を使って解決することができる。

lex :: ReadS String

lex は通常は、文字列の組の単一要素のリストを返する。
その組は、 入力の最初の字句と入力ののこりだ。
ここでの字句のルールは、Haskell プログラムの字句のルールだ。
lex は空白をスキップする。
もし、入力文字列が空あるいは空白およびコメントしか含まなければ、lex は [("","")] を返する。
もし、この意味で空ではなく、かつ、空白のつづく有効な字句ではじまっていない場合には、lex は[] を返す。

この字句解析器を使うと、木の構文解析器はこんなふうになる。

readsTree :: (Read a) => ReadS
(Tree a)
readsTree s = [(Branch l r, x)
| ("<", t) <- lex s,
(l, u) <- readsTree t,
("|", v) <- lex u,
(r, w) <- readsTree v,
(">", x) <- lex w ]
++
[(Leaf x, t) | (x, t) <- reads
s ]


さて、ここで、readsTree と showsTree
を使って、 Read のインスタンス (Read a) =>
Tree a と Show のインスタンス (Show a)
=> Tree a を宣言 してみよう。
こうすれば、木の構文解析と表示用にプレリュードにある総称
的多重定義関数を利用することができる。
さらに、構成要素に木を含むほかの
多くの型の構文解析や表示ができるようになる。
たとえば、 [Tree Integer] のようなものだ。
ここでわかるように、 readsTree と
showsTree はほぼ、Show および Read
のメソッドの型を満している。
showsPrec と readsPrec
のメソッドは、shows と reads をパラ
メータ化したものだ。
追加されたパラメータは、優先レベルだ。
これは、中
置構築子が式に含まれている場合に正しく、括弧付けをおこなうために使用しま
す。
Tree のような型に対しては優先度は無視される。
Show と Read のインスタンスとしての Tree
は以 下のようになる。

instance Show a => Show (Tree
a) where
showsPrec _ x = showsTree x

instance Real a => Read (Tree
a) where
readsPrec _ s = readsTree s

また、Show のインスタンスは showTree
を使って、次のよ うに定義することもできる。

instance Show a => Show (Tree
a) where
show t = showTree t

しかし、これは、ShowS バージョンよりも効率の面で劣る。
Show クラスでは showsPrec と show
の両方につ
いてデフォルトのメソッドを定義しており、ユーザはインスタンスひとつにつき、
どちらかを定義すればいいようになっている。
これらのデフォルトメソッドは
相互再帰的になっていますので、インスタンス宣言のなかで、これらの関数のど
ちらも定義しなかった場合、呼び出しの際にループを引き起こする。
Num
のようなクラスの場合でも、このような「相互ロック性のデフォ
ルトメソッド」がある。

(read . show)
(これは恒等関数になるはず)をいくつかの 木に適用することで
Read および Show のインスタンスをテストすることができる。
ここで、read は reads を特殊化 したものだ。

read :: (Read a) => String -> a

入力に対して、構文解析結果が唯一でない場合、あるいは、
入力が、a の型のひとつの値に対して 2つ以上の表現(あるいは、コメントや空白)を
含むような場合には、この関数は失敗する。



In [None]:
# 導出されたインスタンス
5 節で紹介した木の Eq インスタンスについて思い出す。
このような宣言をいち いち書くのは単純だが、面倒だ。
葉の要素の型が同値型であることを要求し ているのだから、2つの葉は同値の要素をもつ場合、
そして、その場合にかぎり同値であり、ふたつの枝は、その左の部分木と右の部分木がそれぞれ等しい場合、
かつ、その場合にかぎり等しいわけで、それ以外の場合、ふたつの木は同値でない。

instance (Eq a) => Eq (Tree a)
where
(Leaf x) == (Leaf y) = x == y
(Branch l r) == (Branch l' r')
= l == l' && r == r'
_ == _ = False


幸い、この面倒な作業を、新しい型の同値演算子が必要になるたびに繰り返す必要はない。
Eq インスタンスは、データ宣言でそのように指定すれば、自動的に導出される。

data Tree a = Leaf a | Branch
(Tree a) (Tree a) deriving Eq

deriving 節は暗黙のうちに、 5 節にあるように
Eq インスタンス宣言を生成する。
Ord、Enum、Ix、 Read、Show
の各インスタンスも同様に deriving
節を使って生成することができる。
[ここでは 2 つ以上のクラス名を指定することができる。その場合にはクラス
の名前リストは括弧でかこまれ、名前はそれぞれコンマで区切る必要がある。]

Tree に対して導出された Ord インスタンスは Eq の場合にくらべていくぶん複雑だ。

instance (Ord a) => Ord (Tree
a) where
(Leaf _) <= (Branch _) = True
(Leaf x) <= (Leaf y) = x <= y
(Branch _) <= (Leaf _) = False
(Branch l r) <= (Branch l' r')
= l == l' && r <= r' || l <=
l'

ここでは、辞書順 を指定している。
構築子は、data 宣言
中でその出現の順にならべられている。
そして、構築子への引数は左から右へ と比較されていくる。
組み込みのリスト型は意味論的には2つの構築子をもつ
型と同じであることを思いだしてください。
実際にこの完全な定義は

data [a] = [] | a : [a]
deriving (Eq, Ord) --
pseudo-code

だ。
(リストは、Text
インスタンスでもありますが、これは導出さ れない。
) リストに対して導出された Eq および Ord の
インスタンスはごくふつうのものだ。
特に、文字のリストとしての文字列は、 その基になる Char
型の順序によって、ならべられる。
先頭部分文 字列はそれより長い文字列よりも小さいと判定する。
たとえば、 "cat" < "catalog" だ。

An intransitive (==)
predicate, for example, could
be disastrous, confusing
readers of the program and
confounding manual or
automatic program
transformations that rely on
the (==) predicate's being an
approximation to definitional
equality.
実際問題として、Eq および Ord
のインスタンスは、ほとん
どの場合、ユーザの定義ではなく、導出される。
実際、すこしばかり、どきどきしますが、同値関係と全順序関係という代数的
な性質を維持するように注意しながら、独自の同値述語や順序述語を定義しなけ
ればならない。
自動詞的な (==)
述語は、たとえば、大変苦痛で、プログラムを読
むものを困惑させ、手動あるいは自動的な、(==)
述語が明白な同値性
の近似であることに依存する、プログラム変換を困難なものにする。
とはいうものの、導出されるものとはちがう Eq あるいは
Ord のインスタンスが必要な場合もある。
もっとも重要な例は、
同じ抽象値をあらわす別の具体的な値となるような抽象型のインスタンスの例で
す。

列挙型は導出された Enum のインスタンスをもちる。
ここで、この 型の順序は data
宣言での構築子の出現順になる。
たとえば、

data Day = Sunday | Monday |
Tuesday | Wednesday
| Thursday | Friday | Saturday
deriving (Enum)

このとき、この型に対して導出されたインスタンスを用いた単純な例は次のよう
なものになる。

[Wednesday .. Friday] =>
[Wednesday, Thursday, Friday]
[Monday, Wednesday ..] =>
[Monday, Wednesday, Friday]
その構成要素が Read (Show)
のインスタンスであるような 型なら、その型に対して Read
(Show) のインスタンスであ
ることを導出することが可能だ。
(標準の型のほとんどについては、 Read および Show
のインスタンスであることが、プレリュー
ドのなかで示されている。
関数の型である (->) のような型の いくつかは、Show
インスタンスではありますが、それに対応した Read
のインスタンスではあらない。
) 導出された Show
インスタンスで定義されるテキストでの表現は、対象となる型の
Haskell での 定数式の見かけと整合性がある。
例えば、型 Day について Show と Read をその
deriving 節に加えると、

show [Monday .. Wednesday] =>
"[Monday,Tuesday,Wednesday]"

を得ることができる。

A Gentle Introduction to
Haskell, Version 98
back next top
