<a href="https://colab.research.google.com/github/kalz2q/mycolabnotebooks/blob/master/haskell_gentle.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# メモ

a gentle introduction to haskell  
https://www.sampou.org/haskell/tutorial-j/  
https://www.haskell.org/tutorial/  
を読む。ノート。

In [1]:
%%capture
!apt install haskell-platform

In [2]:
!ghc --version

The Glorious Glasgow Haskell Compilation System, version 8.0.2


In [None]:
# 型付け
%%script false
                         5  :: Integer
                        'a' :: Char
                        inc :: Integer -> Integer
                    [1,2,3] :: [Integer]
                    ('b',4) :: (Char,Integer)

# :: はなになにの型はなになに "has type" と読むことができる


In [None]:
# 関数定義
%%script false

inc n          = n+1

inc            :: Integer -> Integer



In [None]:
# e1 が評価され e2 になることを
# e1 => e2
# と書く。

# 例えば
%%script false

inc (inc 3) => 5



In [None]:
# list とは
%%script false

length                  :: [a] -> Integer
length []               =  0
length (x:xs)           =  1 + length xs

length [1,2,3]	=>	3
length ['a','b','c']	=>	3
length [[1],[2],[3]]	=>	3

In [None]:
# head と tail
%%script false

head                    :: [a] -> a
head (x:xs)             =  x

tail                    :: [a] -> [a]
tail (x:xs)             =  xs

#  head と tail はカラのリストではエラーになる


In [None]:
# 型の定義
%%script false

data Bool               = False | True

# Bool, False, True は引数を持たないコンストラクタ nullary constructor
# Bool が型の名前、型コンストラクタで、False, True がデータコンストラクタ

data Color              = Red | Green | Blue | Indigo | Violet

# Bool, Color は列挙型 enumerated type


In [None]:
# 次のは 1つだけデータコンストラクタ(Pt a a)を持つ型

data Point a            = Pt a a

# Point のような型はタプル型と呼ばれる。 なぜなら本質的に他の型の直積(デカルト積)だから。
# Bool, Color のような複数のデータコンストラクタを持つ型は直和型((disjoint) union or sum types)と呼ばれる。

# Point は多相型なので、次のは正しい。

Pt 2.0 3.0 :: Point Float
Pt 'a' 'b' :: Point Char
Pt True False :: Point Bool

# 多相型の型コンストラクタとして、[] や -> がある。

# データコンストラクタを適用して値を得ることと、型コンストラクタを適用して型を得ることを区別する。
# 名前空間が違うので、同じ名前が使える。
data Point a = Point a a

In [None]:
# 再帰型
%%script false

data Tree a = Leaf a | Branch (Tree a) (Tree a)

# ここで Tree は型コンストラクタで Branch や Leaf はデータコンストラクタなので

Branch :: Tree a -> Tree a -> Tree a
Leaf :: a -> Tree a

# ということになる。

# fringeという、木を左から右へたどって「葉」にある要素のリストを返す関数を定義したいとする。
# その定義は次のようになる

fringe :: Tree a -> [a]
fringe (Leaf x) = [x]
fringe (Branch left right) = fringe left ++ fringe right


In [None]:
# type synonym 型の同義名、シノニム
%%script false

type String = [Char]
type Person = (Name, Address)
type Name = String
data Address = None | Addr String

type AssocList a b = [(a,b)]


In [None]:
# Built-in 組み込みの型について
# 例えば Char は
%%script false
data Char = 
    Ca | Cb | Cc | ...
    | CA | CB | CC | ...
    | C1 | C2 | C3 | ...
    ...

# 同様に

data Int = -65532 | ... | -1 | 0 | 1 | ... | 65532

data Integer = ... -2 | -1 | 0 | 1 | 2 ...

# のように考えることができる。ここで、-65532と65532は、与えられた処理系における固定精度整数の最小値と最大値。

# タプルもこのやりかたで定義できる。

data (a,b) = (a,b)
data (a,b,c) = (a,b,c)
data (a,b,c,d) = (a,b,c,d)
        . .
        . .
        . .

# リストも同様に定義できる。リストの場合は再帰的になる。

data [a] = [] | a : [a]

# タプルとリストの違いから次のようなルールが明らかである。

# (e1,e2,...,en), n>=2 に対して、もし、ti が ei の型であるとす るならば、タプルの型は (t1,t2,...,tn) 
# [e1,e2,...,en], n>=0 に対して各 ei が必ず同じ型 t であるなら、そのリストの 型は [t]



In [None]:
# リスト内包表記 List Comprehensions と 数列 Arithmetic Sequences
%%script false

[ f x | x <- xs ]

[ (x,y) | x <- xs, y <- ys ]

# xs = [1,2] 、ys = [3,4] ならば =>  [(1,3),(1,4),(2,3),(2,4)] となる。

# ガード guard

quicksort [] = []
quicksort (x:xs) = quicksort [y | y <- xs, y<x ] ++ [x] ++ quicksort [y | y <- xs, y>=x]

# 数列 Arithmetic Sequences

[1..10] => [1,2,3,4,5,6,7,8,9,10] -- 10 も入ることに注意
[1,3..10] => [1,3,5,7,9] -- 10 以下の奇数
[1,3..] => [1,3,5,7,9, ...] -- 無限



In [None]:
# 文字列 String
%%script false

['h','e','l','l','o'] = "hello"

type String = [Char]

"hello" ++ " world" => "hello world"


In [None]:
# 関数
%%script false

add :: Integer -> Integer -> Integer
add x y = x + y

# これは add (x,y) = x + y とは違う


In [None]:
# 実験
!ghc -e $'let {add x y = x + y; inc = add 1} in print (inc 4) '
!ghc -e $'let {add (x y) = x + y; inc = add 1} in print (inc 4) ' #=> Parse error
!ghc -e $'let {add x y = x + y; inc = add 1} in print (add 4 5) '
!ghc -e $'let {add (x, y) = x + y} in print (add (4, 5)) '

5

<interactive>:0:11: error: Parse error in pattern: x
9
9


In [None]:
# map 関数は関数を引数にとる
%%script false

map :: (a->b) -> [a] -> [b]
map f [] = []
map f (x:xs) = f x : map f xs

map (add 1) [1,2,3] => [2,3,4]

# この例は関数が第一級の対象 (first-class object) であることを示している。
# このような使いかたをする関数は高階 (higher-order)関数とよばれる。


In [None]:
# ラムダ抽象 (lambda abstraction) 無名関数
# 例えば inc は  \x -> x+1 と書く。
# add は \x -> \y -> x + y と書く。
# 簡略化して \x y -> x + y と書く。
%%script false

inc x = x+1
add x y = x+y

# は次の等式と同等

inc = \x -> x+1
add = \x y -> x+y


In [None]:
# 中置演算子 infix operator
# 中置演算子は関数なので、等式を使って定義
%%script false

# リストの連結演算子
(++) :: [a] -> [a] -> [a]
[] ++ ys = ys
(x:xs) ++ ys = x : (xs++ys)

# マイナス(-)は前置演算子にも、中置演算子にもなる。

# 関数合成(function composition)演算子

(.) :: (b->c) -> (a->b) -> (a->c)
f . g = \ x -> f (g x)

# 中置演算子の部分適用は section と呼ばれる

(x+) = \y -> x+y
(+y) = \x -> x+y
(+) = \x y -> x+y


In [None]:
# 実験 中置演算子の部分適用が関数を返すことの確認
# map (+) [1,2,3] は関数のリスト

!ghc -e $'((map (+) [1,2,3])!!1) 5' #=> 7
!ghc -e $'((map (/) [1,2,3])!!1) 5' #=> 0.4
!ghc -e $'(map (5/) [1,2,3])!!1' #=> 2.5
!echo
!ghc -e $'map (/5) [1,2,3]'
!ghc -e $'map (5/) [1,2,3]'
!echo
!ghc -e $'map (^2) [1,2,3]'
!ghc -e $'map (2^) [1,2,3]'

7
0.4
2.5

[0.2,0.4,0.6]
[5.0,2.5,1.6666666666666667]

[1,4,9]
[2,4,8]


In [None]:
# したがって
%%script false

inc = (+ 1)
add = (+)

# と書ける


In [None]:
# 関数をバッククオートで括ると中置演算子になる
%%script false

x `elem` xs

# は直感的に、x は xs の要素である (x is an element of xs)と読める。

# (-) については特別なルールがある。


In [None]:
# 結合度 fixity の優先順位
# fixity declaration では 0 から 9 を指定する。 9 が最強。
# 一般の関数は 10 と仮定されている。
# infixr は右結合、infixl は左結合
%%script false

infixr 5 ++
infixr 9 .

# デフォルトは infixl 9



In [None]:
# 関数は非正格 non-strict
# bot が次のように定義されているとする。
%%script false

bot = bot

# このような停止しない式の値を抽象的に _|_(ボトム)と表わす。
# 1/0 もこの値を持ち、エラーは回復不可能で、プログラムはこれ以上継続することはできなくなる。
# I/O のシステムのエラー(たとえば、EOFエラーなどの例外)は回復可能。

# 関数 f が正格 strict であるとは、停止しない式に適用されれば、その適用式も停止しないこと。
# ほとんどのプログラミング言語では、すべての関数が正格。Haskell では違う。

const1 x = 1

# のとき、const1 bot は 1 であり、引数は評価されない。 これを遅延評価と呼ぶ。

const1 (1/0)

# も 1 になる。

# 遅延評価により、無限 infinite のデータ構造が扱える。

# 別のやり方で説明すると、Haskell では代入 assignment ではなく、定義 definition を用いる。

v = 1/0

# は、v を 1/0と定義すると読む。vの値が必要になったときにのみゼロ除算エラーが発生する。


In [None]:
# 無限のデータ構造
# データコンストラクタも非正格である。
# リストのコンストラクタ、: も非正格。
# 非正格の構築子で(概念的に)無限の infinite データ構造を 定義することができる。
%%script false

ones = 1 : ones

numsFrom n = n : numsFrom (n+1)

squares = map (^2) (numsFrom 0)


In [None]:
# 実験 take 5 squares => [0,1,4,9,16]
!ghc -e $'let{numsFrom n = n:numsFrom(n+1); squares = map (^2)(numsFrom 0)} in print (take 5 squares)'

[0,1,4,9,16]


In [None]:
# 実験 ones は循環リスト circular list
!ghc -e $'let{ones=1:ones} in print (take 5 ones)'

[1,1,1,1,1]


In [None]:
# フィボナッチ関数
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# ここで zip とは

zip (x:xs) (y:ys) = (x,y) : zip xs ys
zip xs ys = []

# エラー関数 error

error :: String-> a

# 型からは返す値の型は多相の型で実際の型がわからない。
# すべての型によって「共有」される値 _|_ bottom が存在する。
# error の返す値は常にこの値。しかし、実装はチェックのための error の文字列引数を印字する。

head (x:xs) = x
head [] = error "head{PreludeList}: head []"


In [None]:
# Case 式
# パターンは入れ子にも使える。
%%script false

contrived :: ([a], Char, (Int, Float), String, Bool) -> Bool
contrived ([], 'b', (1, 2.0), "hi", True) = False

# 仮引数 (formal parameters) もパターンであり、値にかならず照合が成功する。
# その副作用として、仮引数は照合が成功した値に束縛される。
# なぜなら、1つの等式であれば、そのなかのパターンには、2つ以上の同じ仮引数が含まれてはいけないから。
# これは、線型性 (linearity) と呼ばれる。
# 仮引数のような必ず照合が成功するようなパターンのことを irrefutable パターンと呼び、
# refutable パターンは照合が成功しない可能性があり contrived の例はこの refutable の例。
# 不可反駁パターンに は 3つの種類がありそのうち 2つを紹介する。

# アズパターン
# たとえばリストの第一要素を複製する関数

f (x:xs) = x:x:xs

# 明日パターンを使うと次のようになる。

f s@(x:xs) = x:s

# アズパターンは照合に常に成功するが、サブパターン(この場合は、x:xs)はもちろん照合が成功しないこともある。

# ワイルドカード
# head 関数や tail 関数は次のように書き換えることができる。

head (x:_) = x
tail (_:xs) = xs

# 仮引数の場合とちがい、ワイルドカードは 1つの等式のなかに 1つ以上あっても構わない。


In [None]:
# パターン照合の意味論 semantics

# パターン照合は、fail, succeed, diverge (発散) の場合がある。
# 成功すると、パターンの中の仮引数が束縛される。
# 発散 diverge はパターンが必要とした値がエラー(_|_ )を含んでいた場合。
# すべての等式でパターン照合が失敗すると、その関数適用の値は _|_ になり、実行時エラーとなる。
#
# たとえば、[1,2] を [0,bot] に照合させようとすると、0 と 1 がマッチしないので照合は失敗。
# しかし、もし、[1,2] を [bot,0] にマッチさせようとすると、1 を botへ照合させる際に発散がおこる。

# パターンがガード部を持つこともある。
%%script false

sign x |  x >  0        =   1
       |  x == 0        =   0
       |  x <  0        =  -1


In [None]:
# パターン照合が関数の意味に微妙な影響を与える場合がある

%%script false

take 0 _ = []
take _ [] = []
take n (x:xs) = x : take (n-1) xs

# と

take1 _ [] = []
take1 0 _ = []
take1 n (x:xs) = x : take1
(n-1) xs

# 次の結果を見る。

take 0 bot => []
take1 0 bot => _|_
take bot [] => _|_
take1 bot [] => []

# どちらがよいということでなく、違いがあるということを覚えておく。

In [None]:
# Case 式
# 関数定義のなかでのパターン照合の意味は、実は case 式のより単純なものと考えられる。
%%script false

# 次のような関数定義があったとする。
f p11 ... p1k = e1
...
f pn1 ... pnk = en

# これは以下と同等。

f x1 x2 ... xk = case (x1, ..., xk) of
    (p11, ..., p1k) -> e1
    ...
    (pn1, ..., pnk) -> en

# take についても

take m ys = case (m,ys) of
    (0,_) -> []
    (_,[]) -> []
    (n,x:xs) -> x : take (n-1) xs

# となる。
# case 式の右辺はすべて同じ主型である。

# if 式の

if e1 then e2 else e3

# は次の構文の簡略形である。

case e1 of True -> e2
        False -> e3

# つまり、if_then_else_ を関数とみなせば

Bool -> a -> a -> a 

# という型である。


In [None]:
# 遅延 lazy パターン
# 遅延パターンは ~pat であらわされる。
# 不可反駁 irrefutable で値 v の ~pat に 対する照合は常に成功する。
# pat のなかの識別子が右辺で「利用」されるとすると、それは v が pat に
# マッチすると仮定した場合の値に束縛されるか、_|_ となる。

# 遅延パターンは無限のデータ構造が再帰的に定義されているような場合に便利。
# 無限リストはシミュレーションプログラムを書くのに使いやすいデータ構造で、ストリームという。

# server と client との間のやりとりの簡単なケースを考える。
# client は一連の要求を server に送り、server は各々の要求に対して、応答を返す。
# client は引数として初期メッセージもとることに注意。

%%script false

reqs = client init resps
resps = server reqs

# さらに、サーバとクライアントの構造を、以下のように仮定する。

client init (resp:resps) = init : client (next resp) resps
server (req:reqs) = process req : server reqs

# next はサーバからの応答を与えられて、次の要求を決定する関数であり、
# process はクライアントからの要求を与えられて、応答を返す関数であるとする。

# 残念ながら、このプログラムには大きな問題がある。
# 問題は、client が reqs と resps の再帰的な設定のなかで使われているので、
# 最初の要求を送信する前に応答リストと照合を試みようとする。つまり、
# パターン照合がおこなわれるのが「早すぎる」。
# これを是正する 1つの方法は以下のように client を再定義する。

client init resps = init : client (next (head resps)) (tail resps)

# これで動作するようになるが、もっとよい解決法は遅延パターンを使う方法である。

client init ~(resp:resps) = init : client (next resp) resps

# 遅延パターンは不可反駁なので、照合はただちに成功し、最初の要求が発信され、
# それから最初の応答が生成される。

#  この例は、以下のように定義を加えれば、実際に動作する。

init = 0
next resp = resp
process req = req+1

# 実際に動作させてみると、

take 10 reqs => [0,1,2,3,4,5,6,7,8,9]

## 動作しない!!!!

In [None]:
# フィボナッチ関数 遅延評価版
%%script false

fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]

# これをアズパターンを使って次のように書き換える。

fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]

# この種の等式はパターン束縛(patternbinding )と呼ばれる。
# 理由は、トップレベルにある等式で左辺全体が 1つのパターンになっているから。
# すなわち、fib と tfibはともに宣言内で 束縛されているということです。
# Haskellのパターン束縛は暗黙のう ちに ~ がパターンの前についているものとみなす。


In [None]:
# 実験
!ghc -e $'let {fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ]} in print (take 5 fib)'
!ghc -e $'let {fib@(1:tfib) = 1 : 1 : [ a+b | (a,b) <- zip fib tfib ]} in print (take 5 fib)'

[1,1,2,3,5]
[1,1,2,3,5]


In [None]:
# 字句の有効範囲と入れ子形式 Lexical Scoping and Nested Forms
# let 式
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# let 式 expression によってつくられる束縛は、相互再帰的 (mutually recursive)で、遅延パターンとして扱われる。
# ~ が暗黙のうちについている。

# where 節 clause
# いくつかのガードをもつ等式にまたがる有効範囲束縛が便利なときには where 節を使う。

f x y  |  y>z           =  ...
       |  y==z          =  ...
       |  y<z           =  ...
     where z = x*x

# where 節はそれが覆う式の上にしか有効範囲がない。
# where 節は等式の集まりあるいは case 式のトップレベルでしか認められない。

# let 式は式であり、where 節は式ではない。where 節は関数宣言および case 式の構文の一部である。



In [None]:
# レイアウト
# Haskell はセミコロンあるいはそれにかわる終端記号を使わずにすんでいるのか。
%%script false

let y   = a*b
    f x = (x+y)/y
in f c + f d

# 構文解析子 parser はなぜ次のように解析したりしないのか。

let y   = a*b f
    x   = (x+y)/y
in f c + f d

# Haskell はレイアウト (layout) と呼ばれる、二次元構文を用いているから。
# カラム位置に依存している。
# 上の例は次のように解釈される。

let { y   = a*b
    ; f x = (x+y)/y
    }
in f c + f d

# 1行に複数の式を書きたいときにはセミコロンが便利である。

let y   = a*b;  z = a/b
    f x = (x+y)/z
in f c + f d


In [None]:
# 型クラスと多重定義 overloading
# すでに述べてきた多相 polymorphism は、パラメータ多相 parametric polymorphism とよばれる。
# アドホック多相は多重定義 overloading という呼びかたのほうが知られている。
# たとえば
# 1、2 などのリテラルは、固定長の整数と任意長の整数の両方で使われる。
# + のような数値演算子は何種類もの数値上で定義される。
# 同値演算子 (Haskell では ==)は数値とその他多くの型の上で動作する。
# Haskell では、型クラスによって多重定義を制御する。

# elem 関数の定義を見てみよう。
%%script false

x `elem`  []            = False
x `elem` (y:ys)         = x==y || (x `elem` ys)

# ここで (==) を使っている。
# 型クラス type class によって解決している。


In [None]:
# 実験
!ghc -e $':t elem'
!ghc -e $':t (==)'

elem :: (Eq a, Foldable t) => a -> t a -> Bool
(==) :: Eq a => a -> a -> Bool


In [None]:
# 同値演算子を含むクラスの定義をしてみよう。
%%script false

class Eq a where
    (==) :: a -> a -> Bool

# Eq は定義するクラスの名前である。
# 型 a がクラス Eq のインスタンスでなければならない、という制約 constraint は、

Eq a 

# のように書く。
# Eq a は 式 expression ではなく、constraint を表しているので、文脈 context と呼ばれる。

(==) :: (Eq a) => a -> a -> Bool

# は、クラス Eq のインスタンスである型 a に対して、== は a->a->Boolという型をもつ、と読む。
# したがって

elem :: (Eq a) => a -> [a] -> Bool

# となり、求めていたものに他ならない。


In [None]:
# 実験
!ghc -e $':k Eq'
!ghc -e $':k Foldable'

Eq :: * -> Constraint
Foldable :: (* -> *) -> Constraint


In [None]:
# どの型が Eq クラスのインスタンスになるかを指定し、その型に対する == の実際の振舞いがどうなるかは
# インスタンス宣言 (instance declaration)で行う。
%%script false

instance Eq Integer where 
  x == y                =  x `integerEq` y

# 同様に

instance Eq Float where
  x == y                =  x `floatEq` y

instance (Eq a) => Eq (Tree a) where 
  Leaf a         == Leaf b          =  a == b
  (Branch l1 r1) == (Branch l2 r2)  =  (l1==l2) && (r1==r2)
  _              == _               =  False

# 最初の行の Eq a という文脈は必須である。なぜなら、
# 葉のもつ要素 (型は a)は 2番目の行の同値性を用いて比較する。

# 実際の Eq の定義
class  Eq a  where
  (==), (/=)            :: a -> a -> Bool
  x /= y                =  not (x == y)

# :i で調べたら次のようだった。 同じと思われる。
class Eq a where
  (==) :: a -> a -> Bool
  (/=) :: a -> a -> Bool


In [None]:
# クラス拡張 (class extension) もサポートされている。
# たとえば、Eq クラスからすべての操作を継承 (inherit)した Ord クラスを定義したいとする。
# このクラスは Eq クラスから継承した操作のほかに、比較 操作子と min 関数および max 関数をもつものとする。
%%script false

class  (Eq a) => Ord a  where
  (<), (<=), (>=), (>)  :: a -> a -> Bool
  max, min              :: a -> a -> a

# Eq は Ord のスーパークラス、Ord は Eq のサブクラス(subclass )である。

# Ord の宣言は、(<) に対応するデフォルトメソッドを含んでいる。

x < y               =  x <= y && x /= y

# quicksort の型は次のようになっている。

quicksort :: (Ord a) => [a] -> [a]

# 多重継承 (multiple inheritance) 

class (Eq a, Show a) => C a 
    where ...

# C というクラスをつくっている、操作を Eq と Show の両方から継承している。

# クラスメソッドはトップレベルの宣言として扱われる。

# クラスメソッドには、制約を付加することができる。

class C a where
    m :: Show b => a -> b


In [None]:
# クラス宣言の中で、高階型 higher-order type を使う。
# 以下のような Functor クラスを考えよう。
%%script false

class Functor f where
    fmap :: (a -> b) -> f a -> f b

# fmap 関数は以前に使った map 関数を一般化したもの。
# 型変数 f は f a のなかで他の型に適用される。こ のように、型変数が
# 型 Tree に対する Functor のインスタンス は、

instance Functor Tree where
  fmap f (Leaf x)       = Leaf   (f x)
  fmap f (Branch t1 t2) = Branch (fmap f t1) (fmap f t2)

# このインスタンス宣言は Tree a ではなく Tree が Functor のインスタンスであることを宣言している。
# これは総称的「コンテナ」型を記述する能力のあることを示し、fmap のような、任意の木、
# リストあるいは他の型の上で統一的に動作する関数を可能にする。

# 型適用は関数適用とおなじやりかたで書ける。型 T a b は (T a) b　と構文解析される。
# タプルのような特別な構文を使う型はカリー化可能な別のスタイルで書ける。
# 関数については、(->) が型構築子である。f -> g と (->) f g とは同じである。
# 同様に、[a] と [] aとは同じである。
# タプルについては、型構築子は (,)、(,,) などとなる。


In [None]:
# 型システムは式の中で型付けエラーを検出する。
# 式 (+) 1 2 3 は型エラーになる。それは (+) は 2 つしか引数をとらないからである。
# 同様に、Tree Int Int は、エラーを起こす。それは Tree 型は 1つの引数しかとらないからである。
# Haskellはどのようにして不正な型式を検出するのか。

# その答は、型の正当性を確認する第2の型システムにある。
# 型は類 (kind)と結びついている。


In [None]:
!ghc -e $':k Eq'
!ghc -e $':k Integer'
!ghc -e $':k Functor'
!ghc -e $':k Num'
!ghc -e $':k Foldable'
!ghc -e $':k Ord'

Eq :: * -> Constraint
Integer :: *
Functor :: (* -> *) -> Constraint
Num :: * -> Constraint
Foldable :: (* -> *) -> Constraint
Ord :: * -> Constraint


In [None]:
# 型はは次の 2つの形式をとる。

# 記号 * は具体的なデータ対象に結びついた型の類をあらわす。
# k1 と k2 とが類ならば、k1->k2 は k1 という類の型をとり、k2 という類の型を返す型の類である。

# 型構築子 Tree の類は、*->* であり、Tree Int の類は * である。
# Functor クラスのメンバーはすべて、類 *->* でなければならず、
# 類付けのエラーは、次のような宣言により引き起こされる。
%%script false

instance Functor Integer where ...

# なぜなら、Integer の類は * だからである。
# 類は Haskell のプログラムの直接あらわれることはない。
# コンパイラが型検査の前に類を推論する。「類宣言」のようなものは必要ない。
# 型シグネチャが類エラーをおこすとき以外は、類は Haskellのプログラムの後ろに隠れている。
# 類は非常にシンプルなので、コンパイラは、類衝突がおこれば、その旨のエラーメッセージを表示する。


In [None]:
# オブジェクト指向プログラミング OOP とのアナロジー
# OOP におけるクラスを型クラスへ置き換え、オブジェクトを型へ置き換えれば、ほぼ Haskell の型クラスになる。

# OOP と比べると、型はオブジェクトではないというのは明かで、
# OOP 言語に対する利点は、Haskellのメソッドは完全に型安全である。
# 必要なクラスのなかにはない型の値にメソッドを適用するとしているかどうかは、
# コンパイル時に検出される。単純に高階関数として引き渡される。

# パラメータ多相とアドホック多相 overloading との関係を考察すると別の見方をすることができる。
# パラメータ多相がどれほど便利かということは既に示した。
# しかしながら、ときには、このような包括的グルーピングでは広すぎることもある。
# もっと小さい型の集合の上でコントロールをしたい場合がある。たとえば、比較同値性をもつような型の集合
# の上で、という時、型クラスは、これを実現する構造的方法とみなすことができる。
# パラメータ多相は一種の多重定義とみなすことができ、多重定義は暗黙にすべての型の上で起こり、
# 限定された型の集合(つまり、型クラス)上で起こるのではない。

# 他の言語との比較
# Haskell で用いられるクラスは OOP で用いられるクラスに類似している。しかし、いくつかの重大な相違がある。

# Haskell は、型の定義とその型に結びついているメソッドの定義を分離する。 
# C++ や Java のクラスは、ふつう、データ構造(メンバー変数)とそのデータ構造と結びついた関数(メソッド)
# の両方を定義する。Haskell ではこれらの定義は別々におこなう。

# Haskell は、型の違う関数が共通の名前を共有するような C++ 流の多重定義 はサポートしていない。

# Haskell のオブジェクトの型は暗黙の型変換を受けない。値が投入あるい
# は投出される Object のようなすべての基になるようなクラスは ない。

# C++ や Java ではオブジェクトの実行時表現に (VTable のような) 同定情報を付加する。
# Haskellではこのような情報は、型システムを通じて物理的にではなく、論理的に、値に付加する。

# Haskell のクラスシステムには、(publicあるいは private などといっ
# たクラス構成要素のような) アクセスコントロールの機構は組込まれていない。


# 再び、型について

In [None]:
# 再び、型について

# newtype 宣言
# 表現が既存の型と同一だが，型システムの中では別の型として識別されるような型を定義する。
# たとえば、Integer 型を次のような宣言で用いて、自然数を表現することができる。
%%script false

newtype Natural = MakeNatural Integer

# 完全に新しい型 Natural を生成し、その構築子は 1つ の Integerだけを引数にとる。
# この構築子 MakeNatural は Natural と Integer との間の変換をおこなう。

toNatural               :: Integer -> Natural
toNatural x | x < 0     = error "Can't create negative naturals!" 
            | otherwise = MakeNatural x

fromNatural             :: Natural -> Integer
fromNatural (MakeNatural i) = i

# 次のインスタンス宣言は Natural を Num クラスに所属させる。

instance Num Natural where
    fromInteger         = toNatural
    x + y               = toNatural (fromNatural x + fromNatural y)
    x - y               = let r = fromNatural x - fromNatural y in
                            if r < 0 then error "Unnatural subtraction"
                                     else toNatural r
    x * y               = toNatural (fromNatural x * fromNatural y)

# この宣言なしでは、Natural は Num には属することができない。
# 元の型に対するインスタンス宣言内容が、新しい型に持ち越されることはない。
# 実際、この型の目的は、別の Num のインスタンスを導入することな。
# もし、Naturalが Integer の型シノニムとして宣言されていれば、これはできない。

# これらはすべて、newtype 宣言ではなく data 宣言を用いて も機能する。
# しかし、data宣言では、Natural の値の表現にオーバヘッドが生じる。
# newtype を用いることで data 宣言によって間接参照のレベルが深くなる (これは遅延性の故) 
# のを避けることができる。

# キーワードをのぞけば、newtype 宣言は、単一フィールドをもつ単一 構築子の data
# 宣言と同じ構文を用いる。


In [None]:
# フィールドラベル
# Haskell のデータ型内のフィールドは、位置を手がかりにアクセスすることも、
# フィールドラベルを用いて名前でアクセスすることもできる。
# 2次元の点に対する型について考察する。
%%script false

data Point = Pt Float Float

# Point の構成要素は、構築子 Pt の第一引数と第二引数である。 次のような関数が考えられる。

pointx :: Point -> Float
pointx (Pt x _) = x

# data 宣言における構築子は、フィールド名付で (波括弧で括られて) 宣言することができる。
# フィールド名は構築子の構成要素を位置によってではなく、名前で同定する。

data Point = Pt {pointx, pointy :: Float}

# このデータ型は Point と同一、構築子 Pt も同じ。
# しかし、この宣言では2つのフィールド名、pointx と pointyとが定義されている。
# これらのフィールド名は構造の中から構成要素を取り出すための選択関数 (selector function) として使うことができる。

pointx :: Point -> Float
pointy :: Point -> Float

# この selector を使って次のような関数を作ることができる。

absPoint :: Point -> Float
absPoint p = sqrt (pointx p * pointx p + pointy p * pointy p)


In [None]:
# 実験
%%writefile point01.hs

data Point = Pt {pointx, pointy :: Float}

absPoint :: Point -> Float
absPoint p = sqrt (pointx p * pointx p + pointy p * pointy p)

somepoint = Pt 3.1 3.9

main = print $ absPoint somepoint

Overwriting point01.hs


In [None]:
!runghc point01.hs

4.9819674


In [None]:
# フィールドラベルは新しい値を構築するときに使う。
# 式 Pt {pointx=1, pointy=2} は式 Pt 1 2 と同一。
# フィールド名を使って値を構築する場合、フィールドをいくつか省略することができる。
# 省略されたフィールドは定義されない。
# フィールド名を使ったパターンマッチングは構築子 Pt のときと同じような構文で使いる。
%%script false

absPoint (Pt {pointx = x, pointy = y}) = sqrt (x*x + y*y)

# 既存の構造中のフィールド値を使って、新しい構造の構成要素を作る (update) ことができる。
# p が Point ならば、p {pointx=2} は p と同じ pointy をもつが、pointx は 2 に置き換る。
# 破壊的更新ではなく、オブジェクトの新しいコピーを生成する。

# フィールドラベルと併せて使用した波括弧はいくぶん特殊な使い方で、
# 通常、波括弧はレイアウトルールを無視するのに使われるが、
# フィールド名とむすびついた波括弧は明示的に書かなければならない。

# フィールド名は単一構築子の型 (レコード型とよばれる) に限るものではない。
# 複数の構築子をもつ型では、フィールド名を用いての選択や更新の操作は実行時エラーを引き起こす可能性がある。
# これは、空リストにhead を適用したときと似ている。

# フィールドラベルは一般の変数やクラスメソッドとトップレベルの名前空間を共有する。
# スコープのなかで同じ名前のフィールド、1つ以上のデータ型で使うことはできない。
# しかし、1つのデータ型の中でなら、型付けが同じあるかぎり、1つ以上の構築子のなかで、使うことができる。
# たとえば、次のようなデータ型のなかで、

data T = C1 {f :: Int, g :: Float} | C2 {f :: Int, h :: Bool}

# フィールド名 f は型 T の両方の構築子に適用されている。
# つまり、もし、x の型が T ならば、x {f=5} は T 内のどちらの構築子が生成した値に対しても機能する。

# フィールド名が代数的データ型の基本性質を変えることはない。
# フィールド名は、データ構造の構成要素にアクセスするのに位置を手がかりにするより、
# 名前を手がかりにするために用意された、便宜的な構文にすぎない。この構文
# のおかげで、多くの構成要素をもつ構築子の扱いが簡単になる。
# フィールドは構築子へのそれぞれの参照を変更することなく追加したり削除したりすることができるからである。


In [None]:
# 正格データ構築子

# Haskell ではデータ構造は一般的に遅延性をもつ。
# 構成要素は必要になるまで評価されない。
# この性質のおかげで、データ構造はもし評価されるとエラーあるいは停止できないような要素を含むことができる。
# 遅延データ構造は Haskell の表現力を強化し、Haskellのプログラミングスタイルの要になる。

# 内部的には、遅延データオブジェクトの各フィールドはサンク (thunk) とよくいわれる構造に包みこまれている。
# サンクはフィールド値を定義した計算をカプセル化したもの。
# 値が必要にならないかぎり、サンクの中へ入ることはない。
# エラー (_|_ )を含むサンクがあってもデータ構造の他の要素には影響しない。
# たとえば、タプル ('a',_|_) は完全に正しい Haskell の値である。
# この 'a' はこのタプルのもう一方の要素にかまうことなく、使うことができる。
# 他のプログラミング言語は遅延性ではなく正格性をもっている。
# すなわち、データ構造のすべての要素はそのデータ構造に入れる前に値にまで簡約される。

# サンクにはいろいろなオーバヘッドがついてまわる。
# サンクを構成するにも、それを評価するにも時間がかかる。
# ヒープの領域をとるし、そのサンクの評価のために必要な別の構造を確保するため、
# ガーベッジコレクタを起動することもある。
# こうしたオーバヘッドを回避するために、正格性フラグを data 宣言で使いる。
# こうして、選択的に遅延性を抑制することで、指定した構築子のフィールドをただちに評価する。
# data 宣言の中で、! でマークされたフィールドは、サンクに入れて遅延するのではなく、
# 構造が生成される際に、直ちに評価される。この正格性フラグを用いるほうがよい状況はいくつかある。

# * プログラム実行中に必ず評価されることが確定している構成要素
# * 簡単に評価できて絶対にエラーを起こさないことが確定している構成要素
# * 部分的に未定義の値であると意味のない型

# たとえば、複素数のライブラリが定義している Complex 型は次のようになっている。
%%script false

data RealFloat a => Complex a = !a :+ !a

# 構築子 :+ の中置定義に注意!
# この定義では、2つの構成要素にマークがついている。
# 複素数の実数部と虚数部は正格性をもつようにマークされている。
# これは、複素数のよりコンパクトな表現だが、たとえば、1 :+ _|_ のように未定義の構成要素があっ
# た場合、全体が未定義 (_|_)になってしまうという代償をはらっている。
# しかし、部分的にしか定義されていない複素数が必要になることは実際にはありえないので、
# 効率のよい表現を達成するために正格性フラグを使用するのは意味のあることである。

# 正格性フラグはメモリリーク(もはや使うことはないのにガーベッジコレクタに
# 回収されない構造)を解決するために使うこともできる。

# 正格性フラグ ! は data 宣言のなかでのみ使われる。
# そのほかの型シグネチャーや型定義では使えない。
# 関数の引数に対して正格性をもつようにマークをつける方法はない。
# しかし、seq あるいは !$ という関数を使用することで同じ効果が得られる
 
# 正格性フラグの使い方の正確なガイドラインを示すのは難しい。
# 注意して使用しなければならない。
# 遅延性は Haskell の基本的な特徴の 1つであって、
# そこへ正格性フラグをつけ加えることは無限ループの発見を困難なものにし、ほかの予期せぬ結果をまねきかねない。


In [None]:
# 入出力
# Haskell の I/O システムは純粋に関数的である。
# 命令型の言語では、プログラムは環境を変更するアクションを通じて進行する。
# 典型的なアクションには、グローバル変数を読むこと、設定すること、ファイルへの書き込み、
# 入力の読み込み、ウィンドウのオープンなどがある。
# このようなアクションは Haskell の言語のコアの部分からは、切離されている。

# Haskell の I/O システムは数学のモナド (monad) を基礎として築かれている。
# しかし、I/O システムを使う上で底流にあるモナドの理論を理解する必要はない。
# モナドの理論は、I/O にたまたま適合した概念上の構造である。
# 単純な算術演算を実行するのに群論を理解する必要がないのと同じで、
# Haskell の I/O を実行するのにモナド理論を理解する必要はない。

# I/O システムを構築しているモナド演算子は別の目的にも使用される。
# ここでは、モナドという用語を使うのは避けて、I/O システムの使い方に集中する。
# I/O モナドを単に抽象データ型だと考えておくのがいいだろう。

# アクションは Haskell では呼出すのではなく定義するものである。
# アクションの定義を評価することでは、実際のアクションは起こらない。
# むしろ、アクションは、ここまで考えてきた式の評価というものの外側で起こることである。

# アクションはシステムプリミティブとして定義されるようにアトミックなものであり、
# また、一連のアクションの合成でもある。
# I/O モナドは複合アクションを構成するためのプリミティブをふくみ、
# 他の言語では ; (セミコロン) を使って、文を一列に並べるのと同じように構成する。
# このモナドの機構はプログラムのなかのアクションをくっつける糊のような役目をする。



In [None]:
# I/O の基本演算
# 各 I/O のアクションはそれぞれ値を返する。
# 型システムにおいては、返り値 は、IO という「タグ」がつけられている。
# これはアクションを他の 値と区別するためである。
# たとえば、関数 getChar の型は、次のようなものである。
%%script false

getChar :: IO Char

# この IO Char は getChar が呼出されたときに、文字を返すなんらかの動作をする、ということを示している。
# 意味のある値を 返さないアクションにたいしてはユニット型 () を用いる。
# たとえば、関数 putChar の型は、次のようなものである。

putChar :: Char -> IO ()

# この関数は引数として文字を取るが、特に意味のある値は返さない。


In [None]:

# アクションは、演算子 >>= (`bind`)を使って、順序付けをする。
# この演算子を直接使わず、do 記法という糖衣構文を使うこともできる。
# この記法では、順序制御の演算子は構文の後に隠れるので、伝統的な言語に近くなる。
# do 記法は簡単に >>= に展開することができる。

# キーワード do により順に実行される文のならびが導入される。
# 文はアクションであるとともに、<- を使ってアクションの結果に束縛されたパターンであり、
# let を使った局所的な定義の集合でもある。
# do 記法は let や where と同じく、レイアウトを使いる。
# 適正なインデントをつかえば、波括弧とセミコロンを省略することができる。
# 次のは一文字よみこみそれを印字する簡単なプログラムである。

main :: IO ()
main = do c <- getChar
          putChar c

# main の使い方は重要である。
# main は (C の main 関数と同様に) Haskell のプログラムのエントリポイントとして定義されている。
# main は IO 型でなければならない。ふつうは IO () である。
# main は Main モジュールのなかだけで特別な意味をもつ。
# 上のプログラムは順に 2 つのアクションを実行する。
# 最初に、一文字に読み込み、その結果を変数 cへ束縛する。
# それからその文字を印字する。
# let 式とはちがい、<- で定義した変数は、そのあとに続く文のなかでのみ有効である。

# do を用いて、アクションを起動し、その結果を知ることができるが、
# 一連のアクションから結果を返すのはどうするか。
# たとえば、一文字読み込んでその文字が 'y' であれば、True を返す ready という関数を考えてみよう。

%%script false

ready :: IO Bool
ready = do c <- getChar
            c == 'y' -- ダメ!!!

# この関数は、do のなかの 2つめの文が、アクションではなく、単なる真理値なので、動作しない。
# この真理値をとって、なにもしないが、結果としてこの真理値を返すアクションを生成しなければならない。
# return 関数はまさにこれを行う。

return :: a -> IO a

# この return 関数はプリミティブの実行を完成させる。
# ready の最後の行は、return (c == 'y') でなくてはならない。

# では、もっと複雑な I/O 関数を見てみよう。
# まず、getLine 関数である。

getLine     :: IO String
getLine     =  do c <- getChar
                  if c == '\n'
                       then return ""
                       else do l <- getLine
                               return (c:l)

# else 節にある、2つめの do に注目。
# それぞれの do は一本の文の列を構成している。
# if のように介入的な言語要素はその先のアクション列を導入するのに新たな doを使う必要がある。

# return 関数は真理値などの一般の値を I/O アクションの領域に入れる。
# その逆はどうか。
# いくつかの I/O アクションをふつうの式のなかで起動できるか。
# たとえば、x + print y を式のなかに入れて、y がその式の評価の結果として印字されるようにすることはできるか。
# できない。
# 純粋関数型のコードのなかで、こっそりと命令型の世界にしのび込むことはできない。
# 命令型の世界に「影響される」値にはそれとわかるタグがついている必要がある。

# 次のよう な関数

f :: Int -> Int -> Int

# は絶対に I/O を行うことはできない。
# それは IO が返り値にあらわ れていないからである。
# このことは、デバッグのときに文字通りコード全体にわたって
# print 文を埋めこむことの多いプログラマにとっては悩みの種だろう。
# 実際のところは、この問題に対処するために、いくつかの安全ではない関数が用意されている。
# しかし、これらは、上級プログラマにとっておいた方がよいものである。
# デバッグ用のパッケージ (Trace など) は往々にして「禁じ手」となっている関数を気前よく使っている。


In [None]:
# アクションをつかったプログラミング
# I/O アクションはふつうの Haskell の値である。
# 関数にわたされることもあるだろうし、なかに入れることも、Haskell のほかの値とおなじようにできる。
# 次にアクションのリストを考えてみよう。
%%script false

todoList :: [IO ()]

todoList = [putChar 'a',
            do putChar 'b'
               putChar 'c',
            do c <- getChar
               putChar c]

# このリストは実際にはアクションを起動することはない。
# アクションを保持しているだけである。
# これらのアクションを 1つのアクションにまとめるのは、sequence_ のような関数が必要である。

sequence_        :: [IO ()] -> IO ()
sequence_ []     =  return ()
sequence_ (a:as) =  do a
                       sequence as

# この関数は、なにもせずに、do x;y を x >> y へ展開する。

:t (>>)
(>>) :: Monad m => m a -> m b -> m b

:i (>>)
class Applicative m => Monad (m :: * -> *) where
  (>>) :: m a -> m b -> m b
        -- Defined in ‘GHC.Base’
infixl 1 >>

# このパターンの再帰は、foldr 関数でとらえることができる。
# さらによい sequence_ の定義は以下のようなものである。

sequence_        :: [IO ()] -> IO ()
sequence_        =  foldr (>>) (return ())

# この do 記法は便利なツールだが、この場合には、その底流にあるモナド演算子 >> を使うほうが適当である。
# do の構築の基になる演算子を理解することは、Haskell プログラマにとって役にたつこと である。

# sequence_ 関数は、putStr を putChar をつかって構築するときにも使える。

putStr                  :: String -> IO ()
putStr s                =  sequence_ (map putChar s)

# Haskell と伝統的な命令型の言語との違いの 1つがこの putStr にみてとれる。
# 命令型の言語では、命令型の putChar を文字列上でマッピングするだけで印字が可能である。
# しかし、Haskell では map 関数はアクションを実行しない。
# そのかわり、それぞれ、文字列の一文字に対応するアクションのリストを生成する。
# sequence_ のなかの畳み込み演算は >>関数をつかって、それぞれの個別の演算を 1つの演算にまとめる。
# ここでも return () は必要である。
# foldr は一連のアクションの最後になにもしないアクションを必要とする。

#  Prelude やライブラリには I/O アクションの順序付けに便利な関数がたくさんある。
# これらの関数はだいたいのものが、任意のモナド用に汎用化されている。
# Monad m => という文脈を含む関数はどれも IO 型で使える。


In [None]:
# 例外処理 exception handling
# ここまでは、I/O 演算中の例外の問題を避けてきた。
# もし、getChar がファイルの最後にあたったら、どうなるか。
# _|_ に対してはエラー error という用語を使う。
# これは、停止しない、あるいは、パターンマッチが失敗した、というような回復不可能な場合に使う。
# 一方、例外 exception は、I/O モナド内で捕捉可能および処理可能なものである。
# I/O モナド中での、「file not found」などの例外的状況を扱うには、standard ML
# の入出力にある機能にあるような、ハンドリング機構を使いる。
# 特別な構文や意味論を用いることはない。
# 例外処理は、I/Oの順序付け演算子の定義の一部になっている。

In [None]:
# 例外は特別なデータ型 IOError としてコード化されている。
# この 型は I/O モナド中でおこりうるすべての例外を表わしている。
# これは一種の 抽象型で、ユーザが利用可能な IOError の構築子はない。
# IOError 型の値に対して使うことができる述語がいくつかある。

%%script false

isEOFError :: IOError -> Bool

# という関数はエラーが、ファイル終端条件でひきおこされたものかどうかを判定する。
# IOError を抽象型とすることで、明示的なデータ型の変更なしで、新しい種類のエラーをシステムに導入することができる。
# この isEOFError 関数は IO ライブラリのなかで定義されているので、明示的にインポートする必要がある。

# 例外ハンドラ は IOError -> IO a という型になる。
# catch 関数は例外ハンドラをアクションあるいはアクションの集まりと関連づける。

catch                     :: IO a -> (IOError -> IO a) -> IO a

# catch の引数はアクションとハンドラである。
# アクションが成功すれば、ハンドラを起動せずにその結果だけを返する。
# エラーが起これば、IOError 型の値をハンドラに渡し、そのハンドラに関連づけられているアクションを起動する。
# 例として、エラーにであうと改行を返す getChar をあげておこう。

getChar'                :: IO Char
getChar'                =  getChar `catch` (\e -> return '\n')

# これは、すべてのエラーについて同じ処理をしているので、あまり洗練された実装ではない。
# もし、ファイル終端になった場合だけをわけたい場合には、エラーの種類を確かめなければならない。

getChar'                :: IO Char
getChar'                =  getChar `catch` eofHandler where
    eofHandler e = if isEofError e then return '\n' else ioError e

# ここで使われている ioError 関数は次の例外ハンドラに例外を投げる。
# ioError の型は、

ioError :: IOError -> IO a

# である。
# これは、つぎの I/O アクションを実行するかわりに、
# 制御を例外ハンドラに移すという点をのぞけば、return と類似している。
# catch の入れ子になった呼び出しも可能である。
# 入れ子になった catch の呼び出しは、入れ子になった例外ハンドラを生成する。
# この例を、getChar' を使って getLine を再定義することで示そう。

getLine'        :: IO String
getLine'        = catch getLine'' (\err -> return ("Error: " ++ show err))
        where
                   getLine'' = do c <- getChar'
                         if c == '\n' then return ""
                                            else do l <- getLine'
                                                    return (c:l)


# 入れ子になったエラーハンドラは getChar' がファイル終端を捕捉することを可能にしている。
# 一方で、ほかのエラーがおこると "Error: " ではじまる文字列が、getLine' から戻る。

# Haskell では利便性確保のために、プログラムの最上位レベルにプログラムを停止し、
# 例外を印字する例外ハンドラが用意されている。


In [None]:
# ファイル、チャネル、ハンドル
# I/O モナドや例外処理機構が提供するもののほか、
# Haskell の I/O は、他の言語にあるものとほとんど同じ機構が備わっている。

# ファイルをオープンするとハンドル (型は Handle) が生成されて、これを使って I/O のやりとりをする。
# このハンドルをクローズすると、それに関連付けられているファイルがクローズする。
%%script false

type FilePath         =  String  -- path names in the file system
openFile              :: FilePath -> IOMode -> IO Handle
hClose                :: Handle -> IO () 
data IOMode           =  ReadMode | WriteMode | AppendMode | ReadWriteMode

# ハンドルはチャネルにも関連付けられる。
# チャネルはファイルとは直接結びつかないコミュニケーションポートである。
# いくつかのチャネルハンドルは定義済になっている。
# たとえば、stdin (標準入力)、stdout (標準出力)、stderr (標準エラー) である。
# hGetChar や hPutChar の文字単位の I/O演算は、引数のひ とつとして、ハンドルをとる。
# さきほどの getChar 関数は次のように定義されている。

getChar = hGetChar stdin

# Haskellでは内容全体を 1つの文字列として返すファイルやチャネルが使える。

getContents :: Handle -> IO String

# 実行上、getContents はチャネルやファイルの全内容を一度にすべて
# 読みこまなければならず、メモリや実行時間が足りなくなるということが起こりそうに見える。
# しかし、それは間違いである。
# 鍵となる要点は、getContents は文字の「遅延」(すなわち非正格)リストを返すということである。
# このリストの要素は、他のリストと同様に、「必要になってはじめて」読み込まれるのである。
# この要求駆動の振舞いの実装は、計算側からの要求があるたびに、
# 一度に一文字づつファイルから読みこむことで実現する。

# 次の例はファイルをコピーする Haskell のプログラムである。

main = do fromHandle <- getAndOpenFile "Copy from: " ReadMode
          toHandle   <- getAndOpenFile "Copy to: " WriteMode 
          contents   <- hGetContents fromHandle
          hPutStr toHandle contents
          hClose toHandle
          putStr "Done."

getAndOpenFile          :: String -> IOMode -> IO Handle
getAndOpenFile prompt mode =
    do putStr prompt
       name <- getLine
       catch (openFile name mode)
             (\_ -> do putStrLn ("Cannot open "++ name ++ "\n")
                       getAndOpenFile prompt mode)


# 遅延性のある getContents 関数を使うと、ファイルの内容全部を一度にメモリへ読み込む必要がなくなる。
# もし、hPutStr がバッファとして固定長の文字列を採用するなら、一度にメモリへ読み込むには、
# 入力ファイル 1 ブロック分だけが必要である。
# 入力ファイルは最後の文字が読み出されれば、暗黙のうちにクローズされる。


In [None]:
# Haskell と命令型 imperativeプログラミング
# 最後に、I/O プログラミングは重大な問題を表面化したことについて考える。
# このスタイルは従来の命令型のプログラミングとさしてかわらないではないということである。

# たとえば、getLine 関数、
%%script false

getLine         = do c <- getChar
                     if c == '\n'
                          then return ""
                          else do l <- getLine
                                  return (c:l)

これは、つぎの命令型のコードと酷似している。

function getLine() {
  c := getChar();
  if c == `\n` then return ""
               else {l := getLine();
                     return c:l}}

# ということは、結局、Haskell は単に命令型の車輪を再発明しただけなのか。

# ある意味では、そのとおりである。
# I/O モナドは Haskell のなかに小さな命令型のサブ言語を構成している。
# それゆえ、プログラムの I/O の構成要素は従来の命令型のコードにそっくりになるのである。
# しかし、1つ大きな違いがある。
# これを扱うのに特別な意味論を必要としないということである。
# 特に、Haskell における等式論証の仕組みはなんら損われていない。
# プログラム中のモナドのコードの命令型のフィーリングは
# Haskell の関数的な側面をそこなうものではない。
# 経験を積んだ関数プログラマはプログラム中の命令型の構成要素を最小限にし、
# トップレベルで順序付けを最小にし、それについてだけ、I/O モナドを使用することができる。
# モナドはプログラムの関数的な構成要素と命令的な構成要素を綺麗にわける。
# 一方で、関数的なサブセットをもつ命令型の言語では純粋に関数的な世界と命令的な世界をへだて
# るものがハッキリとは定義されていない。


# 標準クラス

In [None]:
# 8 Haskell の標準クラス
# このセクションでは、Haskellの定義済標準型クラスを紹介する。
# 一部のクラスについては Haskell の標準ライブラリの一部になっている。

# 同値クラスと順序クラス
# Eq クラスと Ord クラスについては既に述べた。
#  Prelude にある Ord クラスの定義は、以前に定義した単純なものよりも、複雑である。
# 特に、compare メソッドは、以下のようになっている。
%%script false

data Ordering           =  EQ | LT | GT 
compare                 :: Ord a => a -> a -> Ordering

# compare メソッドがあれば、このクラスの他のすべてのメソッドは定義できる。
# Ord のインスタンスを生成するにはこの方法が一番すぐれている。

# 列挙クラス
# Enum クラスには数列表現の糖衣構文の底流にある一連の演算がある。
# たとえば、数列式 [1,3..] は enumFromThen 1 3 を表わしている。
# これで、Enum のインスタンスの型であればどの型に対しても、
# この数列式を用いてリストの生成ができることがわかる。
# Enum のインスタンスにはほとんどの数値型が含まれているばかりではなく、
# Char 型も含まれており、['a'..'z'] はアルファベット順に並べた、小文字のリストを表す。
# さらに、Color のよ うな、ユーザ定義の列挙型を Enum のインスタンスとして宣言できる。
# それは次のようになる。

[Red .. Violet] => [Red, Green, Blue, Indigo, Violet]

# ここで、注意すべきことは、このような列は、算術的であるということである。
# すなわち、各値の増分はそれが数値であろうとなかろうと、一定であるということである。
# Enum のほとんどのインスタンスは固定長の整数上に写像することが可能である。
# この目的のために、fromEnum や toEnum が用意されており、Int と Enum
# のインスタンスの間での変換 をおこなう。



In [None]:
# Read クラスと Show クラス
# Show クラスのインスタンスは文字列への変換 (典型的な目的はI/O) が可能な型である。
# Read クラスには、その値を表現する文字列を構文解析する演算が用意されている。
# Show クラスの最も単純な関数は show である。
%%script false

show :: (Show a) => a -> String

# show は当然、対応する型のあらゆる値をとり、その表現として、文字列を返す。
# たとえば、show (2+2) は "4" を返す。
# このように正しく動作するものについてはいいが、それぞれの型のいろいろな値について、
# 複雑な表現が必要になる。
# たとえば、


"The sum of " ++ show x ++ " and " ++ show y ++ " is " ++ show (x+y) ++ "."

# のような場合、それぞれの文字列を連結しているのでは、能率的ではない。
# ことに、二分木の文字列表現を考えてみよう。
# 入れ子になった部分木を表示するために適当なマークをつけてたり、左の枝と右の枝をわける印をつけたりする。

showTree                :: (Show a) => Tree a -> String
showTree (Leaf x)       =  show x
showTree (Branch l r)   =  "<" ++ showTree l ++ "|" ++ showTree r ++ ">"

# (++) は左側の引数の長さの線型で効く計算量をもつので、
# showTree は木のサイズの 2 次で効く計算量になる。

# 線型の複雑さを持つように、関数 shows を以下のように定義する。

shows                   :: (Show a) => a -> String -> String

# この shows は印字可能な値と文字列をとり、前の部分にその値の文字列表現を連結した文字列を返す。
# 2つめの引数は一種の文字列積算子になる。
# show は shows にナル積算子をあたえたものとして定義することができる。
# これは Show クラスの定義のなかの show のデフォルトの定義となる。

show x = shows x ""

# shows を使って、showTree のより効率のよい定義をすることができる。
# このときも、文字列積算子引数をもたせる。

showsTree               :: (Show a) => Tree a -> String -> String
showsTree (Leaf x) s    =  shows x s
showsTree (Branch l r) s=  '<' : showsTree l ('|' : showsTree r ('>' : s))

# この定義により効率の問題は解決した。
# (showsTree の計算量は 線型のオーダである) 
# しかし、この関数の表現をさらに改良することができる。
# まず、型シノニムをつくってみよう。

type ShowS = String -> String

# この型は、なにかの文字列表現に積算子文字列を連ねた文字列を返す関数の型である。
# つぎに、積算子をもちまわり、長い文字列の構築の右端での括弧の蓄積を
# 回避するために、関数合成を使うことができる。

showsTree               :: (Show a) => Tree a -> ShowS
showsTree (Leaf x)      =  shows x
showsTree (Branch l r)  =  ('<':) . showsTree l . ('|':) . showsTree r . ('>':)

# コードを整理することよりもさらに重要なことが、このプログラム変換によってあきらかになった。
# それは、オブジェクトレベルでの表現から関数レベルの表現への変換である。
# ここで、showsTree の型付 けは、tree から表示関数への写像ということができる。
# ('<' :) あるいは ("a string" ++) のような関数はプリミティブな表示関数で、
# 関数合成を用いて、より複雑な関数を構築することができる。


In [None]:
# さて、tree を文字列に換える話に戻ろう。
# こんどは逆の問題を考える。
# 基本のアイディアは、型 a に対する構文解析子である。
# 型 a の構文解析子は文字列を引数としてとり、(a,String) のリストを返す関数である。
# Prelude にはこのような関数の型シノニムが備えられている。
%%script false

type ReadS a = String -> [(a,String)]

# ふつうの状況では、構文解析子は単一の要素を含むリストを返す。
# この要素は、入力文字列から読み込んだ型 aの値と、そのあと構文解析される、残りの文字列の組である。
# もし、構文解析が不可能であれば、結果は空リストである。
# もし、2つ以上の構文解析が可能であるなら (この場合は曖昧な構文ということになる)、
# 結果は、2 つ以上の組を含むリストになる。
# 標準関数の reads は Read のあらゆるインスタンスに対応する構文解析子関数である。

reads :: (Read a) => ReadS a

# この関数を使って、showTree を使って作った、二分木の文字列表現を構文解析する関数を定義することができる。
# リストの内包表記はこのような構文解析関数を構築するのに便利なイディオムである。
# (モナドや構文解析結合子を使ったもっとエレガントな方法もある。
# これらは、ほとんどの Haskellシステムとともに配布される標準の構文解析ライブラリの一部となっている)

readsTree               :: (Read a) => ReadS (Tree a)
readsTree ('<':s)       =  [(Branch l r, u) | (l, '|':t) <- readsTree s,
                                              (r, '>':u) <- readsTree t ]
readsTree s             =  [(Leaf x, t)     | (x,t)      <- reads s]

# すこし、時間をかけてこの関数の定義を詳細にみていこう。
# 考慮すべき状況が2つある。
# もし、構文解析の対象となる文字列の最初の文字が '<' の場合、これは、枝の表現に違いない。
# そうでなかった場合、これは葉の表現である。
# 最初の場合は、開き三角括弧につづく入力文字列 の残りの部分を s とすると、

# 可能な構文解析はなんであれ、Branch l r となり、残りの文字列は、u となり、以下の条件に従う。

# 1. 木 l は文字列 s の最初から構文解析されたものとすることができる。
# 1. ( l の文字列表現に続く)残りの文字列は '|' で始まる) この文字列の先頭をのぞく部分を t とする。
# 1. 木 r は文字列 t の最初から構文解析されたものとすることができる。
# 1. この構文解析の残りの文字列は '>' で始まる。この文字列の先 頭をのぞく部分は u である。

# リスト内包表記のパターンマッチングの組み合わせによる表現力に注目する。
# リスト内包表記されたメインの式であたえられている構文解析結果の形式は、
# まず、上にあげた 2 つの条件を最初の生成部 ((l,'|':t) は、s の構文解析結果のリストから引出されている) 
# によって表現されている。
# 残りの条件は、2 つめの生成部によって表現されている。
# 上の 2つめの定義等式は葉の表現に対する構文解析は、この木の要素の表現を構文解析し、
# その結果に構築子 Leaf を適用して、値を得る、という意味である。

# とりあえず、(色々な型があるなかで) Integer の Read (および Show)
# インスタンスがあって、期待通りの振舞いをする reads が備わっていることを受容する。
# つまりは以下のとおりである。

(reads "5 golden rings") :: [(Integer,String)] => [(5, "golden rings")]

# これが理解できれば、次の評価を確認できるはずである。


readsTree "<1|<2|3>>"	=>	[(Branch (Leaf 1) (Branch (Leaf 2) (Leaf 3)), "")]
readsTree "<1|2"	=>	[]

# いま定義した readsTree には、2 つの欠点がある。
#  1つは、この構文解析器はたいへん厳格にできていて、木の表現の文字列の要素の前や間に空白を許さないというもの。
# もう 1つは、区切の記号を構文解析する方法が葉の値の場合と部分木の場合ではすっかり違うということである。
# この統一性のなさが、この関数の定義を読みづらいものにしている。
# この 2つの問題を Prelude で定義されている字句解析器を使って解決することができる。

lex :: ReadS String

# lex は通常は、文字列の組の単一要素のリストを返する。
# その組は、入力の最初の字句と入力の残りである。
# ここでの字句のルールは、Haskell プログラムの字句のルールである。
# lex は空白をスキップする。
# もし、入力文字列が空あるいは空白およびコメントしか含まなければ、lex は [("","")] を返す。
# もし、この意味で空ではなく、かつ、空白のつづく有効な字句ではじまっていない場合には、lex は [] を返す。

# この字句解析器を使うと、木の構文解析器は次のようになる。

readsTree               :: (Read a) => ReadS (Tree a)
readsTree s             =  [(Branch l r, x) | ("<", t) <- lex s,
                                              (l,   u) <- readsTree t,
                                              ("|", v) <- lex u,
                                              (r,   w) <- readsTree v,
                                              (">", x) <- lex w         ]
                           ++
                           [(Leaf x, t)     | (x,   t) <- reads s       ]


さて、ここで、readsTree と showsTree を使って、
Read のインスタンス (Read a) => Tree a と Show のインスタンス (Show a) => Tree a を宣言してみよう。
こうすれば、木の構文解析と表示用に Prelude にある総称的多重定義関数を利用することができる。
さらに、構成要素に木を含むほかの多くの型の構文解析や表示ができるようになる。
たとえば、[Tree Integer] のようなものである。
ここでわかるように、readsTree と showsTree はほぼ、Show および Read のメソッドの型を満している。
showsPrec と readsPrec のメソッドは、shows と reads をパラメータ化したものである。
追加されたパラメータは、優先レベルである。
これは、中置構築子が式に含まれている場合に正しく、括弧付けをおこなうために使用する。
Tree のような型に対しては優先度は無視される。
Show と Read のインスタンスとしての Tree は以下のようになる。

instance Show a => Show (Tree a) where
    showsPrec _ x = showsTree x

instance Real a => Read (Tree a) where
    readsPrec _ s = readsTree s

# また、Show のインスタンスは showTree を使って、次のよ うに定義することもできる。

instance Show a => Show (Tree a) where
   show t = showTree t

# しかし、これは、ShowS バージョンよりも効率の面で劣る。

# Show クラスでは showsPrec と show の両方についてデフォルトのメソッドを定義しており、
# ユーザはインスタンス 1つにつき、どちらかを定義すればいいようになっている。
# これらのデフォルトメソッドは相互再帰的になっているので、インスタンス宣言のなかで、
# これらの関数のどちらも定義しなかった場合、呼び出しの際にループを引き起こす。
# Num のようなクラスの場合でも、このような「相互ロック性のデフォルトメソッド」がある。

# (read . show) (これは恒等関数になるはず) をいくつかの 木に適用することで
# Read および Show のインスタンスをテストすることができる。
# ここで、read は reads を特殊化 したものである。

read :: (Read a) => String -> a

# 入力に対して、構文解析結果が唯一でない場合、あるいは、入力が、a の型の 1つの値に対して 
# 2つ以上の表現(あるいは、コメントや空白)を含むような場合には、この関数は失敗する。


In [None]:
# 導出されたインスタンス derived instance

# 5 節で紹介した木の Eq インスタンスについて思い出す。
# このような宣言をいちいち書くのは単純だが、面倒である。
# 葉の要素の型が同値型であることを要求しているのだから、2つの葉は同値の要素をもつ場合、
# そして、その場合にかぎり同値であり、2つの枝は、その左の部分木と右の部分木がそれぞれ等しい場合、
# かつ、その場合にかぎり等しいわけで、それ以外の場合、2つの木は同値でない。
%%script false

instance  (Eq a) => Eq (Tree a)  where
    (Leaf x)     == (Leaf y)        =  x == y
    (Branch l r) == (Branch l' r')  =  l == l' && r == r'
    _            == _               =  False


# 幸い、この面倒な作業を、新しい型の同値演算子が必要になるたびに繰り返す必要はない。
# Eq インスタンスは、データ宣言でそのように指定すれば、自動的に導出される。

data  Tree a            =  Leaf a | Branch (Tree a) (Tree a)  deriving Eq

# deriving 節は暗黙のうちに、5 節にあるように Eq インスタンス宣言を生成する。
# Ord、Enum、Ix、Read、Show の各インスタンスも同様に deriving 節を使って生成することができる。
# [ここでは 2 つ以上のクラス名を指定することができる。その場合にはクラス
# の名前リストは括弧でかこまれ、名前はそれぞれコンマで区切る必要がある。]
# 
# Tree に対して導出された Ord インスタンスは Eq の場合にくらべていくぶん複雑である。

instance  (Ord a) => Ord (Tree a)  where
    (Leaf _)     <= (Branch _)      =  True
    (Leaf x)     <= (Leaf y)        =  x <= y
    (Branch _)   <= (Leaf _)        =  False
    (Branch l r) <= (Branch l' r')  =  l == l' && r <= r' || l <= l'

# ここでは、辞書順 を指定している。
# 構築子は、data 宣言中でその出現の順に並べられている。
# そして、構築子への引数は左から右へ と比較されていくる。
# 組み込みのリスト型は意味論的には2つの構築子をもつ型と同じであることを思い出す。
# 実際にこの完全な定義は

data [a]        = [] | a : [a] deriving (Eq, Ord)     -- pseudo-code

# である。(リストは、Textインスタンスでもあるが、これは導出されない) 
# リストに対して導出された Eq および Ord のインスタンスはごくふつうのものである。
# 特に、文字のリストとしての文字列は、その基になる Char型の順序によって、並べられる。
# 先頭部分文 字列はそれより長い文字列よりも小さいと判定する。
# たとえば、"cat" < "catalog" である。

# 実際問題として、Eq および Ord のインスタンスは、ほとんどの場合、自動的に導出され、ユーザーが定義する必要はない。
# ユーザーが定義する場合、同値関係と全順序関係という代数的な性質を維持するように注意しながら、
# 独自の同値述語や順序述語を定義しなければならない。

# (==) 述語をユーザー定義すると、プログラムを読むものを困惑させ、手動あるいは自動的な、(==)
# 述語が明白な同値性の近似であることに依存する、プログラム変換を困難なものにする。

# とはいうものの、導出されるものとはちがう Eq あるいはOrd のインスタンスが必要な場合もある。
# もっとも重要な例は、同じ抽象値をあらわす別の具体的な値となるような抽象型のインスタンスの例である。

# 列挙型は導出された Enum のインスタンスを用いる。
# ここで、この型の順序は data 宣言での構築子の出現順になる。
# たとえば、

data Day = Sunday | Monday | Tuesday | Wednesday
         | Thursday | Friday | Saturday         deriving (Enum)

# このとき、この型に対して導出されたインスタンスを用いた単純な例は次のようなものになる。


[Wednesday .. Friday]	=>	[Wednesday, Thursday, Friday]
[Monday, Wednesday ..]	=>	[Monday, Wednesday, Friday]

# その構成要素が Read (Show) のインスタンスであるような 型なら、その型に対して 
# Read (Show) のインスタンスであることを導出することが可能である。
# (標準の型のほとんどについては、Read および Show のインスタンスであることが、Prelude のなかで示されている。
# 関数の型である (->) のような型の いくつかは、Show インスタンスではあるが、
# それに対応した Read のインスタンスではない。
# ) 導出された Show インスタンスで定義されるテキストでの表現は、
# 対象となる型の Haskell での 定数式の見かけと整合性がある。
# 例えば、型 Day について Show と Read をその deriving 節に加えると、

show [Monday .. Wednesday] => "[Monday,Tuesday,Wednesday]"

# を得ることができる。


# モナド monad

In [None]:
# モナドについて
# はじめて Haskell にふれる多くのひとにとって モナド monad の概念は謎である。
# Haskell ではモナドに頻繁に出会う。
# I/O システムはモナドによって構成されているし、モナドのための特別な構文 ( do 式 )も用意されている。
# また、モナドのためだけのモジュール も標準ライブラリに含まれている。
# このセクションではモナドを使ったプログ ラミングについて詳細にみていく。

# このセクションは他のセクションにくらべるとおそらく「やさしい」というわけにいかない。
# ここでは、モナドをふくむ言語の特徴を示すだけではなく、もっと壮大な絵を明かにしようと思う。
# なぜモナドがこれほど重要なツー ルであり、どのようにこれを使うか、ということである。
# だれにとっても、わかるモナドの説明は、これだ、というものはない。
# 詳細な説明は、haskell.org から辿れる。
# モナドをつかった、実際のプログ ラミング入門としてよい文献として
# Wadler の Monads for Functional Programming をあげておく。


In [None]:
# モナドのクラス
# Prelude には Haskell で使うモナドを定義したクラスがいくつもある。
# これらのクラスは圏論 category theory におけるモナドの構成を基礎としている。
# 圏論の用語はモナドのクラスや演算にその名前を残しているが、
# モナドのクラスの使い方を直観的に理解するにはこういった抽象数学に通じてい る必要はない。

# モナドは IO のような多相型の上に構成される。
# モナド自身はインスタンス宣言によって定義される。
# このインスタンス宣言には、Functor、Monad および MonadPlus というモナド のクラスの一部
# あるいは全部の型に対するものである。
# モナドのクラスはどれも導出されることはない。
# IO のほかに、リスト ([]) と Maybe というモナドクラスの型が Prelude に定義されている。

# 数学的にはモナドは、モナドの演算に対する一連の法則により支配されている。
# この法則の概念はなにもモナドに限ったことではない。
# Haskell ではほか にも、すくなくとも非公式には、法則に支配されている演算がある。
# 例をあ げると x /= y と not (x == y) とは比較されるあらゆる型の値に対して同じでなければならない。
# しかし、こ れを保証するものはなにもない。
# == と /= とは Eq クラスのなかでは別のメソッドである。
# しかも、== と =/ とが関連をもつものであることを保証する手段はない。
# おなじように、ここで示すモナドの法則は、Haskell では保証できない。
# しかし、モナドのクラスのインスタンスであれば、どれも満すべき法則である。
# モナドの法則はモナドの構造の底流にあるものへの洞察をあたえるものである。
# これらの法則を検証しながら、モナドをどのように使うかの感覚を覚える。


In [None]:
# Functor クラスはすでに 5 章で述べた。
# このクラスは 1つの演算 fmap のみを定義している。
# このマップ関数はひと つの演算をコンテナ内のオブジェクトに適用し、
# (多相型は別の型の値のコ ンテナとして考えることが可能である) 同じ形のコンテナを返す。
# つぎの法則 は Functor クラスの map に適用される。
%%script false

fmap id	=	id
fmap (f . g)	=	fmap f . fmap g

# これらの法則は、コンテナの形は map によって変更されないということと、
# コンテナの中身がマップの演算によってならび変えられことはないということを保証するものである。

# Monad クラスは 2つの基本演算を定義している。
# それは、>>= (bind) と return である。

infixl 1  >>, >>=
class  Monad m  where
    (>>=)            :: m a -> (a -> m b) -> m b
    (>>)             :: m a -> m b -> m b
    return           :: a -> m a
    fail             :: String -> m a

    m >> k           =  m >>= \_ -> k

# この bind 演算、>> と >>= はふたつのモナドの値を合成し、return 演算は値をモナド (コンテナ) の中へ投入する。
# >>= のシグネチャ Monad m => m a -> (a -> m b) -> m b をみれば、この演算を理解するのに役立つ。
# ma >>= \v -> mb は a 型の 値を含むモナドの値 ma と、型 a の値 v をとり、モナドの値 mb を返す関数とを合成する。
# その結果、ma と mb は合成されて、b 型の値を含むモナドの値となる。
# >> は第二引数の関数が最初のモナド演算の結果生成されて値を必要としない場合に用いられる。

# bind の正確な意味は、もちろん、そのモナドに依存する。
# たとえば、IO モナドでは x >>= y はふたつのアクションを順に実行する。
# 最初のアクションの結果は2つ目のアクションに渡される。
# 別の組み 込みのモナド、リストと Maybe について見てみる。
# これらのモナド演算は、ゼロ個あるいはそれ以上を値を 1つの計算から次の計算へ渡すということで理解できる。
# この例を簡単にみていく。

# do 構文を使うとモナド演算の鎖を簡単に表記できる。
# do の基本的な変換は以下のふたつのルールでとらえることができる。

do e1 ; e2      =        e1 >> e2
do p <- e1; e2  =        e1 >>= \p -> e2

# do の2つ目の形式におけるパターンは反駁可能で、パターンマッチ が失敗すると fail 演算が呼ばれる。
# これが呼ばれると ( IO モナドのときと同様に)エラーが発生するか、
# あるいは、(リスト モナドのときと同様に)「zero」が返される。


In [None]:
# 次のものはもっと複雑な変換である。

do p <- e1; e2  =   e1 >>= (\v -> case v of p -> e2; _ -> fail "s")    

# ここで、"s" は do 文の位置を同定する文字列で、これは エラーメッセージのなかで使われるかもしれないものである。
# たとえば、I/O モナドのなかで、'a' <- getChar のようなアクションは、
# もし、型付けされた文字が 'a' ではなかった場合、fail を呼ぶ。
# 次に、I/O モナドの fail はプログラムを停止し、error を呼ぶ。

# >>= および return を支配している法則は以下の通り である。

return a >>= k	=	k a
m >>= return	=	m
xs >>= return . f	=	fmap f xs
m >>= (\x -> k x >>= h)	=	(m >>= k) >>= h

# クラス MonadZero は zero 要素および plus 演算を もつモナドに対して定義されている。

class  (Monad m) => MonadZero m  where
mzero             :: m a
mplus             :: m a -> m a -> m a

# zero 要素は次の法則に従わなければならない。

m >>= \x -> mzero	=	mzero
mzero >>= m	=	mzero

# リストについていえば、zero 値は []、つまり空リストである。
# I/O モナドは zero 要素を持たない。
# つまり、このクラスには属さない。

# mplus 演算を支配している法則は以下のようになっている。

m `mplus` mzero	=	m
mzero `mplus` m	=	m

# この mplus 演算はリストモナドではふつうの連結演算である。


In [None]:
# 9.2  組み込みモナド
# モナド演算とそれらを支配する法則があるとなにが構築することができるか。
# I/O モナドについてはすでに詳しくしらべたので、あとのふたつのモナドからはじめる。

# リストのモナド bind はリスト中のそれぞれの値にたいしての一連の計算を結合する。
# リストを使う場合は、>>= のシグネチャは以下のようになる。

# (>>=)                   :: [a] -> (a -> [b]) -> [b] 

# これは、a のリストと a を bのリストへ写像する 関数が与えられたとき、
# bind が、この関数を、入力それぞれの a に 適用して、生成したすべての b のリストを 1つのリストに連結する。
# return 関数は単一要素リストを生成する。
# これらの演算については 既になれていることと思う。
# リストの内包表記はこのリストについて定義されたモナド演算を使って簡単に表現することができる。
# 以下の 3 つの式は すべて同じ式を別の構文で表現したものである。

[(x,y) | x <- [1,2,3] , y <- [1,2,3], x /= y]

do x <- [1,2,3]
   y <- [1,2,3]
   True <- return (x /= y)
   return (x,y)

[1,2,3] >>= (\ x -> [1,2,3] >>= (\y -> return (x/=y) >>=
   (\r -> case r of True -> return (x,y)
                    _    -> fail "")))


In [None]:
# 実験
!ghc -e $'[(x,y) | x <- [1,2,3] , y <- [1,2,3], x /= y]'
!ghc -e $'[1,2,3] >>= (\x -> [1,2,3] >>= (\y -> if (x/=y) then return (x,y) else fail ""))'

[(1,2),(1,3),(2,1),(2,3),(3,1),(3,2)]
[(1,2),(1,3),(2,1),(2,3),(3,1),(3,2)]


In [None]:
# この定義は、このモナドでは fail の定義が空リストであることに依 存している。
# 基本的には、それぞれの <- は、のこりのモナド計算へつぎつぎと渡される値の集合を生成する。
# であるから、x <- [1,2,3] はのこりのモナド計算を 3 回起動することになる。
# リストの各要素について 1回ずつである。
# 戻りの式 (x,y) はそれを取り巻く bind の可能な組み合わせすべてについて評価される。
# この意味ではリストモナドは多重値の引数をとる関数を記述しているものと考えることができる。
# たとえば、つぎの関数を考えてみる。

mvLift2                :: (a -> b -> c) -> [a] -> [b] -> [c]
mvLift2 f x y          =  do    x' <- x
                                y' <- y
                                return (f x' y')

# これは、通常の 2 引数関数を多重値 (引数リスト) 上の関数に変える。
# できた関数は 2つの引数のすべての組み合わせのそれぞれに対して 1つの値を返する。

# たとえば、

mvLift2 (+) [1,3] [10,20,30]	=>	[11,21,31,13,23,33]
mvLift2 (\a b->[a,b]) "ab" "cd"	=>	["ac","ad","bc","bd"]
mvLift2 (*) [1,2,4] []	=>	[]

# この関数はモナドライブラリの関数 LiftM2 の特別版である。
# これを、関数 f をリストモナドの外から、
# 多重値上の計算をおこなうリストモナドの世界へ持ち込んだものと考えることができる。

# Maybe に対して定義されたモナドはリストモナドに類似している。
# 値 Nothing は [] の、Just x は [x] のように機能する。


In [None]:
# モナドを使う

# モナド演算子とその法則について説明するだけではモナドがなんの役に立つのかわからない。
# モナドがもたらす効用は、モジュール化 modularity である。
# すなわち、演算をモナド的に定義することで、底流にある計算機というものを隠蔽し、
# 新しい特徴をモナドに透過的に結びつけることを可能にする。
# Wadler の論文はモナドを使っていかにモジュール化プログラムを構築するかの秀逸な例である。
# この 論文から直接、例をとるところからはじめる。
# 状態モナドをもとによく似 た定義のさらに複雑なモナドを構築する。

# 簡単にいうと、状態の型 S についての状態モナドというのは次のよう なものである。

data SM a = SM (S -> (a,S))  -- The monadic type

instance Monad SM where
  -- defines state propagation
  SM c1 >>= fc2         =  SM (\s0 -> let (r,s1) = c1 s0 
                                          SM c2 = fc2 r in
                                         c2 s1)
  return k              =  SM (\s -> (k,s))

 -- extracts the state from the monad
readSM                  :: SM S
readSM                  =  SM (\s -> (s,s))

 -- updates the state of the monad
updateSM                :: (S -> S) -> SM ()  -- alters the state
updateSM f              =  SM (\s -> ((), f s)) 

-- run a computation in the SM monad
runSM                   :: S -> SM a -> (a,S)
runSM s0 (SM c)         =  c s0

# この例では新しい型 SM を定義して、型 S を暗黙に運ぶ計算を表現している。
# すなわち、SM t 型の計算は、型 t の値を定義し、一方で、型 S の状態と読み出しと書きこ みといった相互作用をする。
# SM の定義は単純で、1つの状態をとり、2 つの結果を返す関数で構成されている。
# 1つ(任意の型)は返り値で、もう  1つは更新された状態である。
# ここでは型シノニムは使えない SM という名前がインスタンス宣言で必要になるからである。
# こういった ところで newtype 宣言を data 宣言のかわりによく使いる。

# このインスタンス宣言は、モナドの「配管」を定義している。
# ふたつの 計算の直列化と空の計算の定義である。
# 直列化 ( >>= 演算子) は、(構築子 SM で表示されている) 計算を定義しており、
# この計算は初期 状態 s0 を c1 へ渡し、この計算で得られ値 r を 2つ目の計算 c2 を返す関数に渡す。
# そして、最後に、c1 で得られた状態を c2 に渡し、全体の結果を、計算 c2 の結果とする。

# return の定義はもっと簡単である。
# return は状態をまったく変更しない。
# 値をモナドに入れ込むだけである。

# >>= と return は基本的なモナドの直列化演算であるが、モナドプリミティブ ( monadic primitives ) も必要になる。
# モナドプリミティブはモナド抽象の中でもちいられる単なる演算子で、モナドが機能するよう「車輪とギア」を接続する。
# たとえば、IO モナドでは putChar のような演算子はプリミ ティブである。
# それは、これらの演算子は IO モナドの内部的な仕事をのみ取り扱うからである。
# 同様にして、状態モナドは 2 つのプリミティブ readSM と updateSM を使いる。
# これらが、このモナドの内部構造に依存していることに注目する。
# SM 型の定義を変更すると、これらのプリミティブも変更しなくてはならない。

# readSM および updateSM の定義は単純である。
# readSM は状態を観察できるようモナドの外へ状態を持ち出す。
# 一 方、updateSM はユーザがそのモナドの状態を変更することを許する。
# ( writeSM をプリミティブとすることも可能なのであるが、状態を扱う 場合
# には update の方がより自然な場合が多い )

# 最後に必要な関数はこのモナドの計算を駆動する関数 runSM である。
# この関数は初期状態と計算をとり、返り値と最終状態の両方を返す関数である。

# より大きな視点でみると、やらんとしていることは、すべての計算を一連のステッ プ( SM a 型の関数)として定義し、
# >>= と return を使って直列にならべることである。
# これらのステップは状態と ( readSM あるいは updateSM を通じて)
# やりとりするか、あるいは、状態を無視する。
# しかし、この状態の使用(不使用)は隠蔽されていて、S を使用するしないに依存して、
# 計算をべつべつに駆動あるいは 直列化することはない。

# この簡単な状態モナドの例をいくつも示すかわりに、状態モナドをつかったもっと複雑な例に進む。
# リソースを利用する計算のための、ちょっとした 埋め込み言語 ( embedded language ) を定義する。
# つまり、特別な目的のための言語を Haskell の型と関数の集合として構築する。
# このような言語は Haskell の基本ツールを使う。
# 関数と型を使って、対象分野に特化した型と演算ライブラリを構築する。

# ここでの例では、なんらかのリソースを必要とする計算を考える。
# もしリ ソースが利用可能である場合、計算が先へ進み、リソースが利用できないときには、計算が保留される。
# これから定義するモナドによって制御されているリソースを使う計算を表示するために、型 R を使う。
# R の定義は次のようになる。

data R a = R (Resource -> (Resource, Either a (R a)))

# おのおのの計算は、利用可能なリソースから、計算した後の残りに
# リソースと a 型の結果あるいは保留された計算とのペアへの関数である。
# その型は R a でこれはリソースが使い果されるところまで計算をつづける。

# R の Monad インスタンスは以下のようになる。

instance Monad R where
  R c1 >>= fc2          = R (\r -> case c1 r of
                                (r', Left v)    -> let R c2 = fc2 v in
                                                     c2 r'
                                (r', Right pc1) -> (r', Right (pc1 >>= fc2)))
  return v              = R (\r -> (r, (Left v)))

# この Resource 型は状態モナドのなかの状態と同じ扱いになる。
# この定義はこんな風に読める。
# 「リソースを消費する」ふたつの計算、c1 と( c2 を生成する) fc2 を合成するためには、初期リソースを c1 へ渡す。
# 結果は、値 v とのこりのリソースで、これらは次の計算 ( fc2 v )の呼出し)を決定するために使われる。
# さもなければ、保留された計算 pc1 とその保留の時点でのこっているリソースである。
# 計算の保留の際は、2つ目の計算を考慮にいれておかなくてはいけない。
# pc1 は最初の計算 c1 だけを保留するので、計算全体を保 留するためには c2 をこれに bind しておく必要がある。
# return の定義は、v をこのモナドへ投入するが、リソース を変更しないというものである。
# このインスタンス宣言はこのモナドの基本構造を定義しているが、リソースが どのよに使われるのかは決められていない。
# このモナドは多くの型のリソース を制御するのに使うことが可能で多くのタイプのリソース使用ポリシーを実装することができる。
# 例として、非常に単純なリソースの定義をあげる。
# Resource として Integer を選択し、これを利用可能な計算ステップ数を表現するものとする。

type Resource           =  Integer

# 次の関数は、利用可能なステップ数がなくなるまで、1ステップを消費する。

step                    :: a -> R a
step v                  =  c where
                              c = R (\r -> if r /= 0 then (r-1, Left v)
                                                     else (r, Right c))

# Left と Right 構築子は Either 型のものである。
# この関数は利用可能な計算ステップリソースが 1つでもあれば、v を返すことで R 内の計算を継続する。
# もし、利用可能なステップがなければ、step 関数は現在の計算を保留し
# (この保留は c で捕捉される)、この保留された計算をモナドへ戻す。

# これで、一連の「リソースを用いる」計算 (このモナド) を定義するツールを手に入れたので、
# step を用いてリソースの使用状況の形式を表現することができる。
# 最後に、このモナドでは計算はどのように表現されるのかに言及しておく必要がある。

# このモナド内でインクリメントを行う関数を考えてみる。

inc                     :: R Integer -> R Integer
inc i                   =  do iValue <- i
                              step (iValue+1)

# これは、計算の1ステップをインクリメントする関数を定義している。
# <- はこのモナドから引数の値を引出すのに必要なものである。
# iValue の型は R Integer ではなくて Integer である。

# しかし、この定義は一般のインクリメント関数に比べると満足のいくものではない。
# なんとか、既存の + 演算子を「ドレスアップ」して、この モナドの世界で機能するようにできないものか。
# 持ち上げ ( lifting )をおこなう関数の集りから始める。
# これらの関数は、既存の機能をモナド内へ持ち込む。
# lift1 の定義 (これはMonad ライブラリの中の liftM1 とは少し違うものである) を考察してみる。

lift1                   :: (a -> b) -> (R a -> R b)
lift1 f                 =  \ra1 -> do a1 <- ra1
                                      step (f a1)

# この関数は単一引数関数 f をとり、R 内で1ステップ消費し て持ち上げられた関数を実行する関数である。
# この lift1 を用いると inc は次のようになる。

inc                     :: R Integer -> R Integer
inc i                   =  lift1 (i+1)

# これで、ましにはなりったが、理想的というわけにはいかない。
# まず、次の lift2 を加えてみる。

lift2                   :: (a -> b -> c) -> (R a -> R b -> R c)
lift2 f                 =  \ra1 ra2 -> do a1 <- ra1
                                          a2 <- ra2
                                          step (f a1 a2)

# この関数は、持ち上げられた関数内での評価の順番を明示的に設定していることに注目する。
# a1 を生成する計算は、a2 を生成する計算より前におこなわれる。

# lift2を使うと R モナド内で新しいバージョンの == を生成することができる。

(==*)                   :: Ord a => R a -> R a -> R Bool
(==*)                   =  lift2 (==)

# この新しい関数については少しちがう名前をつかわなければならない。
# それは == はすでに使われているから当然である。
# しかし、場合によっ ては、持ち上げ前の関数と持ち上げ後の関数とでおなじ名前を用いることができる。
# 以下のインスタンス宣言は、Num のすべての演算子が R 内で使えるようにするものである。

instance Num a => Num (R a) where
  (+)                   =  lift2 (+)
  (-)                   =  lift2 (-)
  negate                =  lift1 negate
  (*)                   =  lift2 (*)
  abs                   =  lift1 abs
  fromInteger           =  return . fromInteger

# Haskell プログラムでは、fromInteger 関数が、すべての整数定数に ついて暗黙のうちに適用される。
# この定義のおかげで整数定数は型 R Integer となることができる。
# やっとこれで、自然で完全なインクリメント関数を書くことができる。

inc                     :: R Integer -> R Integer
inc x                   =  x + 1

# Eq クラスは Num クラスと同じやりかたで持ち上げることは できないことに注意する。
# ==* のシグネチャは == の多重定義でなんとかなるようなものではない。
# それは ==* の 結果が Bool ではなくて、R Bool であるからである。

# R 中で興味のわく計算を表現するためには、条件式が必要である。
# if は使えないので ( if は条件式として、R Bool ではなくて Bool 型が必要である )、ifR という名前の関数を考える。

ifR                     :: R Bool -> R a -> R a -> R a
ifR tst thn els         =  do t <- tst
                              if t then thn else els

# これで、R モナドのなかで大きなプログラムを書く準備がととのった。

fact                    :: R Integer -> R Integer
fact x                  =  ifR (x ==* 0) 1 (x * fact (x-1))

# さて、次は一般の階乗関数と全く同じものというわけにはではないが、十分に読みやすくなっている。
# + あるいは if のような既存 の演算子に新しい定義を与えると、Haskell のなかの
# 埋め込み言語の基本的な部分を作ることにほかならない。
# モナドは特に、これらの埋め込み言語の意味論をクリーンでモジュール性のある方法でカプセル化するのに便利である。

# これで、なにかプログラムを走らせる準備ができた。
# 以下の関数は、プログ ラムを、最大計算ステップ数をあたえられた M の中で動作させるもの である。

run                     :: Resource -> R a -> Maybe a
run s (R p)             =  case (p s) of 
                             (_, Left v) -> Just v
                             _           -> Nothing

# 割当てられたステップ数内に計算が終了するかどうかを Maybe 型を利用して扱う。
# それで、次のような計算が可能になる。

run 10 (fact 2)	=>	Just 2

run 10 (fact 20)	=>	Nothing


# ここにきて、このモナドにいくつかの興味深い機能を加えることができる。
# 次 の関数を考えてみる。

(|||)                   :: R a -> R a -> R a

# この関数は 2 つの計算を並列に実行し、最初に終った方の結果を返する。
# こ の関数は例えば、こんな風に定義できる。

c1 ||| c2                =  oneStep c1 (\c1' -> c2 ||| c1')
   where
        oneStep          :: R a -> (R a -> R a) -> R a
        oneStep (R c1) f =
             R (\r -> case c1 1 of
                         (r', Left v) -> (r+r'-1, Left v)
                         (r', Right c1') ->  -- r' must be 0
                          let R next = f c1' in
                            next (r+r'-1))

# これは、c1 で 1 ステップで、c1 が終了すればその 値を返すか、
# または、c1 が保留された計算( c1' )を返したときには、c2 ||| c1' を評価する、のどちらかである。
# この oneStep 関数はその引数内で単一ステップを消費し、評価された値を返すか、
# あるいは、のこりの計算を f に渡すかのどちらかである。
# oneStep の定義は単純である。
# これは c1 にリソース引数とし て 1 を与える。
# もし、それで最終の値に到達したら、その値が返る。
# 返されるステップカウント値 (計算がステップを消費せずに戻ることはありえる。
# であるからこのときリソースカウントが 0 である必要はない) も調整されている。
# この計算が保留された場合、調整されたリソースカウントが最後の計算に渡される。

# これで、run 100 (fact (-1) ||| (fact 3)) のような式をループに陥ることなしで評価することができる。
# 計算が相 互に実行されるからである。
# (先に定義した fact では -1 を 与えるとループに陥る。
# この基本構造の上にいろいろなバリエーションを考えることができる。
# たとえば、状態を拡張して計算のステップのトレースを含むようにすることも可能である。
# このモナドを IO モナドへ埋め込むことも可能である。
# そうすれば、M 内の計算は外界とやりとりすることが可能になる。
# ここでの例はこのチュートリアルの他の部分より高度なものであるが、
# システムの基本的な意味論を定義する道具としてのモナドの力をよく説明している。
# また、この例を小規模の領域限定言語 ( Domain Specific Language ) のモデルとなることを説明した。
# あるいは、Haskell がこうしたものを定義 するのに適しているということも示した。
# おおくの DSL が Haskell で開発されている。
# おおくの例が、haskell.org にあるので参照する。
# 特に興味ある例は、リアクションのあるアニメーションのための言語 Fran と
# コンピュータミュージックのための言語 Haskore である。


# Numbers

In [None]:
# 数 numbers
# Haskell にはさまざまな数値型がある。
# これらは Scheme の数値型をもとにしており、Scheme は Common Lisp をもとにしている。
# (しかし、これらの言語は動的な型付けをおこなう) 標準の型には、固定長および任意倍長の整数、
# それぞれの整数で構成された比 (分数)、単精度お よび倍精度の実数、複素数の浮動小数が含まれている。
# ここでは数値クラス構造の基本的性格の概略を説明する。

# 数値クラスの構造
# 数値型クラス (クラス Num とその下にあるクラス) は Haskell の標準クラスの多くを対象としている。
# Num は Eq のサブクラスだが、Ord のサブクラスではないこを注意しておく。
# これは、順序述語は複素数には適用できないことによる。
# しかしながら、Num クラスのサブクラス Real は Ord のサブクラスである。

# Num クラスはすべての数値型に共通するいくつかの基本演算を備えている。
# これには、加算、減算、符号反転、乗算、絶対値が含まれている。

(+), (-), (*)           :: (Num a) => a -> a -> a
negate, abs             :: (Num a) => a -> a

# [negate は Haskell では唯一採用された前置演算子 - (マイナス) を適用する関数である。
# これの呼出しを (-) と書くことはできない。
# それは、(-) と書けば、減算関数になってしまうからである。
# そこで、この nagate という名前をかわりに使う。
# たとえば、-x*y は negate (x*y) と同値である。
# (前置のマイナスは中置のマイナスとおなじ優先度をもつので、当然、乗算より優先度は低い)]

# Num には除算演算子がないことに注意する。
# 2 つの別の種類の除算演算子がオーバラップしない 2 つの Num のサ ブクラスで定義されている。
# クラス Integral では全数 整数除算演算と剰余演算子が提供されている。
# Integral の標準インスタンスは Integer (範囲制限のない整数あるいは数学で いうところの整数、一般には「bignum」としてしられているもの) と Int (範囲限定のある、計算機上の整数、範囲は最低でも 29 bit の符 号付 2 進数)である。
# 一部の Haskell ではこれらのほかに別の integral 型が提 供されている。
# Integral は Num の直接のサブクラスでは なく、Real のサブクラスであることに注目する。
# その意味す るところは、ガウス整数を提供するつもりはないということである。

# 他のすべての数値型はどれも Fractional クラスに属する。
# このク ラスは普通の除算演算子 (/) を備えている。
# そのサブクラスには、Floating があり、三角関数、対数関数、指数関数を備えている。

# Fractionnal と Real のサブクラスである RealFrac は関数 properFraction を備えている。
# この関数は数を整数部分と小数部分にわける。
# また、それぞれ別のルールで整数に丸める関数群もそなえている。

properFraction          :: (Fractional a, Integral b) => a -> (b,a)
truncate, round,
floor, ceiling:         :: (Fractional a, Integral b) => a -> b

# RealFloat は Floating と RealFrac のサブクラ スで浮動小数部への効率てきなアクセスのためにいくつかの特別な関数を備えている。
# それは、exponent と significand である。
# 標準の型 Float と Double は RealFloat クラスになる。


In [None]:
# 構造のある数値型
# 標準の型、Int、Integer、Float、Double はプリミティブである。
# その他はこれらからタイプ構築子により構築される。

# Complex ( Complex ライブラリにある) はタイプ構築子であり、RealFloat 型から 
# Floating クラスの複素数のクラスを構築する。

data (RealFloat a) => Complex a = !a :+ !a  deriving (Eq, Text)

# ! の記号は正格性フラグである。

#  引数の型を限定している文脈 (RealFloat a) => に注目する。
# つまり、標準の複素数型は Complex Float であり、Complex Double だということである。
# また、data 宣言から、複素数は x :+ y のように書くということ がわかる。
# 引数はそれぞれ、実数部と虚数部である。
# :+ はデータ構築子であるから、これをパターンマッチングに使用することができる。

conjugate               :: (RealFloat a) => Complex a -> Complex a
conjugate (x:+y)        =  x :+ (-y)


# 同様にして、型構築子 Ratio (これは、Rational ライ ブラリに含まれている) は、
# Integral のインスタンスから RealFrac クラスの分数クラスを生成する。
# ( Rational は Ratio Integer の型シノニムである) しかし、Ratio は抽象型構築子である。
# データ構築子 :+ のかわりに、分数は2つの 整数から1つの分数を形成する「%」関数を使う。
# パターンマッ チングのかわりに、構成要素を引出す関数が用意されている。

(%)                     :: (Integral a) => a -> a -> Ratio a
numerator, denominator  :: (Integral a) => Ratio a -> a


# この差の理由は何か。
# 直積形式の複素数はユニークに決定できる。
# すなわち、:+ を含む同一性は明白である。
# 一方、分数ではユニークに決定できない。
# しかし、正規(規約)形式を持つ。
# これは、この抽象データ型の実装が保持すべきものである。
# たとえば、numerator (x%y) は x に等しいとはかぎらない。
# しかし、x:+y の実数部は常 に x である。


In [None]:
# 数値型変換と多重定義されたリテラル

# 標準Prelude と標準ライブラリには明示的な型変換をおこなう多重定義関数がいくつか備わっている。

fromInteger             :: (Num a) => Integer -> a
fromRational            :: (Fractional a) => Rational -> a
toInteger               :: (Integral a) => a -> Integer
toRational              :: (RealFrac a) => a -> Rational
fromIntegral            :: (Integral a, Num b) => a -> b
fromRealFrac            :: (RealFrac a, Fractional b) => a -> b

fromIntegral            =  fromInteger . toInteger
fromRealFrac            =  fromRational . toRational

# これらのうち 2つは、多重定義数値リテラルを実現するために、暗黙のうちに 使用されている。
# (小数を含まない) 整数は実際には、Integer のような数値に fromInteger を適用したものと同等である。
# おなじように、浮動小数は Rational のような数値に fromRationa を適用 したものとみなす。
# であるから、7 の型は (Num a) => a であり、7.3 の型は (Fractional a) => a である。
# つまり、数値リテラルは、たとえば、総称数値関数で用いることができる。

halve                   :: (Fractional a) => a -> a
halve x                 =  x * 0.5

# 数値のいくぶん間接的な多重定義の方法には、数値を与えられた型の数値として解釈するためのメソッドを、
# Integral あるいは Fractional のインスタンス宣言によって指定できるという利点がある。
# (これが可能なのは、fromInteger と fromRational はそれぞれ対応するクラスの演算子であるからである) 
# たとえば、Num のインスタンスである (RealFloat a) => Complex a は次のメソッドを含んでいる。

fromInteger x           =  fromInteger x :+ 0

# これは、つまり、fromInteger の Complex 版インスタンス は、実数部が適切な fromInteger の 
# RealFloat 版インスタンスにより生成される、複素数を生成するために定義されたものである、という ことである。
# この伝でいけば、ユーザ定義の数値型(例えば、4 元数)でさえも多重定義の数を利用することができる。

# もう1つ例をあげる。
# # 2 節の inc の最初の定義を思い出す。

inc                     :: Integer -> Integer
inc n                   =  n+1

# 型シグネチャを無視すれば、もっとも一般的な inc の型は (Num a) => a->a である。
# しかし、この明示的な 型シグネチャは正当なものである。
# それは、これが主型より限定的である からに他ならない。
# (主型より一般的な型では静的エラーが発生する) 
# この型シグネチャには、inc の型を限定するという効果がある。
# そして、この場合には、inc (1::Float) のようにすると型付け不可能ということになる。


In [None]:
# デフォルトの数値型
# 以下のような関数の定義を考えてみる。

rms              :: (Floating a) => a -> a -> a
rms x y          =  sqrt ((x^2 + y^2) * 0.5)

# この指数関数 (^) (3 つある、それぞれ別の型付けがされている標準の指数関数のうちの1つ、
# これの型は (Num a, Integral b) => a -> b -> a である。
# また、2 は (Num a) => a という 型であるから、x^2 の型は (Num a, Integral b) => a となる。
# これには問題がある。
# それは、b という型変数についての多重定義を解決する方法がないということである。
# なぜなら、これは文脈のなかにあるが、しかし、型式からは消えてしまっているからである。
# 根本的には、プログラマは、x は自乗するよう指定したのであって、2 が Int の値であるか 
# Integer の値であるかを指定したわけではない。

# もちろん、この問題は解決するこができる。

rms x y          =  sqrt ((x ^ (2::Integer) + y ^ (2::Integer)) * 0.5)

# しかしながら、これは、すぐに面倒になるのは明白である。

# 実際、このての多重定義の曖昧性は数値に限ったことではない。

show (read "xyz")

# この文字列はどのような型だと仮定して読めばいいのか。
# これは指数関数の ときの曖昧性よりもさらに深刻な問題である。
# なぜなら、先程の場合では、Integral のインスタンスであればよいわけであるが、
# 今度の場合は Text のどのインスタンスがこの曖昧性の解決に用いられるかによって
# 期待できる振舞いがすっかりかわってしまうからである。

# この多重定義の曖昧性の問題は一般の場合と数値の場合では違っているので、Haskell では
# 数値に限って解決法を提供している。
# 各モジュールにはデフォルト宣言 ( default declaration ) があり、これはキーワード default とそれにつづく
# 括弧でくくられ、コンマで区切られた数値の モノタイプ (monotype) (型変数を含まない型) で構成されている。
# 曖昧な型変数がみつかった場合(たとえば、上例の b )、すくなくともクラスの 1つが数値であり、
# かつ、そのクラスのすべてが標準のものであれば、デフォルトリストが参照されて、
# 型変数の文脈を満足する最初のものが使用される。
# たとえば、もし、デフォルト宣言 default (Int, Float) があれば、上の曖昧な指数は型 Int と解決される。

# 「デフォルトのデフォルト」は (Integer, Double) であるが、(Integer, Rational, Double) でもかまわない。
#  注意深いプログラマなら、default () を好むかもしれない。
#  これは、デフォルトがないということである。


# モジュール

In [None]:
#モジュール
# Haskell のプログラムはモジュール module の集合である。
# Haskell のモジュールは名前空間の制御と抽象データ型の生成という2つの目的のためにある。

# トップレベルのモジュールはこれまで議論したさまざまな宣言をすべて含む。
# 結合性宣言、データ宣言と型宣言、クラス宣言とインスタンス宣言、型シグネチャ、
# 関数定義、それに、パターン束縛である。
# インポート宣言が最初に来なければならないことをのぞけば、宣言はどのような順序で出現してもかまわない。
# (トップレベルのスコープは相互再帰的である)

# Haskell のモジュールは比較的保守的にできている。
# モジュールの名前空間は平坦である。
# また、モジュールは「第一級」の対象ではない。
# モジュールの 名前は英数字で、最初の文字は大文字でなければならない。
# Haskell のモジュールとサポートされているファイルシステムの間には正式な結び付きはない。
# とくに、モジュール名とファイル名とは正式には結びつかない。
# また、2つ以上のモジュールを一つのファイルに含むことができる。
# (ひとつのモジュールを複数のファイルに分ることもできる) 
# もちろん、特定の実装でモジュールとファイル名が関連するような習慣を採用するのがふつうである。

# 技術的な観点では、モジュールというのは module というキーワードではじまる1つの大きな宣言ということができる。
# つぎのは Tree というモジュールの例である。

module Tree ( Tree(Leaf,Branch), fringe ) where

data Tree a                = Leaf a | Branch (Tree a) (Tree a) 

fringe :: Tree a -> [a]
fringe (Leaf x)            = [x]
fringe (Branch left right) = fringe left ++ fringe right

# この Tree 型と fringe 関数は、もうおなじみのはずである。
# [ where というキーワードがあるので、レイアウトがモジュールのトップレベルで有効になる。
# それゆえ、宣言はすべておなじカラム位置(典型的には第一カラム)に配置される。
# また、モジュール名はこの型の名前とおなじであるが、これは許されていることに注意する]

# このモジュールは明示的に Tree、Leaf、Branch、および fringe をエクスポートしている。
# もし、この module キーワードのあとに続く、エクスポートリストがなければ、
# このモジュールのトップレベルで束縛されている名前はすべてエクスポートされる。
# (上の例では、すべてが明示的にエクスポートされている。
# であるから効果 としてはエクスポートリストがない場合とおなじである) 
# 型の名前とその構築子は、Tree(Leaf,Branch) のように1つのグループにまとめられる。
# これを簡略して、Tree(..) のように書くこともできる。
# 構築子のサ ブセットをエクスポートすることも可能である。
# エクスポートリストのなかの名前 は当該のエクスポートモジュールの局所名である必要はない。
# スコープ内 の名前であればこのエクスポートリストに入れることができる。

# これで、Tree モジュールはなにか別のモジュールにインポート することができる。

module Main (main) where
import Tree ( Tree(Leaf,Branch), fringe )

main = print (fringe (Branch (Leaf 1) (Leaf 2)))

# インポートされたりエクスポートされたりするモジュールのさまざまな項目のことを エンティティ と呼ぶ。
# インポート宣言における明示的なインポートリストを省略すると 
# Tree モジュールからエクスポートされたすべてのエンティティがインポートされることに注目する。


In [None]:
# 修飾された名前
# モジュールの名前空間に直接インポートされた名前はあきらかな問題をはらんでいる。
# もし、インポートされた複数のモジュールが同じ名前の別のエンティティを含んでいたらどうなるか。
# Haskell ではこの問題を修飾された名前 ( qualified name ) を使うことで解決する。
# インポート宣言で、qualified キーワードを使い、インポートされた名前がインポートされた
# モジュール名を接頭辞として使うようにする。
# これらの接頭辞の あとに 「 . 」文字を空白をいれずに続ける。
# [接頭辞は字句構文の 一部である。
# すなわち、A.x および A . x は全く 別ものである。
# 前者は修飾された名前であり、後者は中置関数の 「 . 」である] 
# たとえば、先程の Tree モジュールを使ってみる。

module Fringe(fringe) where
import Tree(Tree(..))

fringe :: Tree a -> [a]   -- A different definition of fringe
fringe (Leaf x) = [x]
fringe (Branch x y) = fringe x

module Main where
import Tree ( Tree(Leaf,Branch), fringe )
import qualified Fringe ( fringe )  

main = do print (fringe (Branch (Leaf 1) (Leaf 2)))
          print (Fringe.fringe (Branch (Leaf 1) (Leaf 2)))

# Haskell のプログラマのなかにはすべてのインポートされた名前について、
# それぞれの由来がはっきりわかるように、修飾子を使うことを好むひともいる。
# 一方、短い名前を好むので、修飾子は必要最小限にしようとするプログラマもいる。

# 修飾子はおなじ名前をもつ別のエンティティ間の衝突を解決するために使用する。
# しかし、2つ以上のモジュールから同じエンティティがインポートされた場合どうなるか。
# 幸いこのような名前のぶつかりは許されている。

# 1つのエンティティが別の経路でインポートされても衝突は起こさない。
# コンパイラが別のモジュールからのエンティティが実際に同じものかどうかを判別する。


In [None]:
# 抽象データ型
# 名前空間の制御のほかに、モジュールは Haskell で抽象データ型 ( ADT ) を構築する唯一の方法である。
# たとえば、ADT の特徴は、表現型 ( representation type ) が隠蔽されるということであるが、
# これは ADT 上のすべての演算がその表現型には依存せずに、抽象レベルで実行されるということである。

# 例をあげる。
# Tree 型は単純なので ふつは抽象型にはしないが、これに対応する ADT は次のような演算をふくむ。

data Tree a             -- just the type name 
leaf                    :: a -> Tree a
branch                  :: Tree a -> Tree a -> Tree a
cell                    :: Tree a -> a
left, right             :: Tree a -> Tree a
isLeaf                  :: Tree a -> Bool

# モジュールはこれを支援する。

module TreeADT (Tree, leaf, branch, cell, 
                left, right, isLeaf) where

data Tree a             = Leaf a | Branch (Tree a) (Tree a) 

leaf                    = Leaf
branch                  = Branch
cell  (Leaf a)          = a
left  (Branch l r)      = l
right (Branch l r)      = r
isLeaf   (Leaf _)       = True
isLeaf   _              = False

# エクスポートリストに Tree という型名のみ (すなわち構築子がないということ) があらわれていることに注目する。
# ということは、Leaf や Branch はエクスポートされないということである。
# そして、木を構成したり、構成要素をとりだしたりする唯一の方法は、いくつかの(抽象)演算を使うことである。
# もちろん、この情報の隠蔽の利点はあとで表現型をこの型の利用者に影響をあたえることなく、変更できるというこ とである。


In [None]:
# そのほかの特徴
# ここで、このモジュールシステムのその他の側面について手短に説明する。

# import 宣言では、その宣言内で hiding 節を用いるこ とで選択的にエンティティを隠蔽できる。
# これはそのモジュールの他の名前に修飾子をつけなくてもいいので明示的に他の使いたい名前を排除するのに便利である。

# import 宣言には、as 節をおくことができる。
# これにより、インポートされるモジュールの名前とは別の修飾子を指定することができる。
# これにより、長いモジュールに由来する修飾子名を短くしたり、すべての修飾子を変更することなく、モジュール名の変更をおこなうことが簡単にできる。
# プログラムは暗黙のうちに Prelude モジュールをインポートする。
# 明示的な Prelude のインポートは、すべての Prelude 名の暗黙のインポートを上書きする。

# それゆえ、

import Prelude hiding length

# は標準プレリュードからは length をインポートせず、この length の名前は別の方法で定義することができる。
# インスタンス宣言はインポートやエクスポートリストのなかで明示的に名前がつくわけではない。
# すべてのモジュールはそれぞれ、そのなかのすべてのインスタンス宣言をエクスポートし、
# すべてのインポートはそれぞれ、すべてのインスタンス宣言をスコープないに持ち込む。
# クラスのメソッドは括弧でくくったデータ構築子のあとにクラス名をつづけるか、
# 普通の変数とおなじように名前をつけることができる。
# Haskell のモジュールシステムは比較的保守的なものであるが、値のインポートと エクスポートに関しては多くのルールがある。
# 多くは明白なものである。
# たとえば、同じ名前をもつ別のエンティティをスコープ内にインポートすることは違反である。
# いくつかのルールはこれほどは明白なものではない。
# 例をあげると、1つの型やクラスに対して、そのプログラム内のどこかで
# 型やクラスを組合せるための2つ以上のインスタンス宣言というものは存在できない。



# 型付けの落し穴 pitfalls

In [None]:
# 型付けの落し穴
# この短いセクションでは Haskell の型システムを使う際、初心者に共通の 2、3 の問題について直観的な説明する。

# let-束縛の多相性
# Hidler-Milner の型システムを使うどの言語にも let-束縛の多相性 ( let-bound polymorphism ) と呼ばれるものがある。
# これは、let あるいは where 節をもちいた束縛のない識別子はその多相性に関して制限があるからである。
# 特に、ラムダ束縛された ( lambda-bound ) 関数 (すなわち、別の関数の引数になった関数) は 
# 2つの方法ではインスタンス化できない。
# たとえば、以下のプログラムは不正 なプログラムである。

let f g  =  (g [], g 'a')                       -- ill-typed expression
in f (\x->x)

# なぜなら、主型が a-> a であるようなラムダ抽象に束縛された関数 g が f 内で
# 2つの別の方法でつかわれているからである。
# 一度は [a]->[a] という型で、そして、もう一度は Char->Char という型で使われている。


In [None]:
# 数値の多重定義
# 数が多重定義されること、数の型変換が他の言語とおなじように暗黙のうちに起こることはないことをよく忘れてしまう。
# より一般的な数値式が本当に総称的なものにはなれないこともある。
# よくある数値の型付けエラーは次のよう なものである。

average xs              =  sum xs / length xs           -- Wrong!

# (/) は分数の引数を必要とする。
# しかし、length の結果 は Int である。
# この型の不一致は明示的な型変換によって訂正しなけれ ばならない。

average                 :: (Fractional a) => [a] -> a
average xs              =  sum xs / fromIntegral (length xs)


In [None]:
# 単相性限定
# Haskell の型システムはふつうの Hidley-Milner の型システムにはない型クラスに関連した制限がある。
# これを、単相性限定 ( monomorphism restriction ) という。
# この制限がある理由は subtle 型の曖昧性に関連している。

# この単相性限定とは (単一の識別子への束縛を含む) パターン束縛により束縛をうける識別子で
# 明示的な型シグネチャをもたないものは、単相的 ( monomorphic ) でなければならない、というものである。
# 識別子は、多重定義されていないか、あるいは、多重定義されていても少くとも 
# 1つの限定的な多重定義のなかで用いられ、エクスポートされていないときには、単相的識別子である。

# この制限に違反すると、静的型エラーがおこる。
# この問題を回避するもっと も単純な方法は明示的な型シグネチャをつけることである。
# あらゆる型シグネチャで (これが正しいものであれば) この問題を回避できる。

# よくあるこの制限違反は高階関数的な手法で関数を定義する際におこる。
# 標準Prelude にある sum の定義から例をあげる。

sum                     =  foldl (+) 0

# ここにあるようにすると、静的型エラーがおこる。
# この問題は明示的な型シグネチャを付加することで解決する。

sum                     :: (Num a) => [a] -> a

# また、この問題は以下のように書けば起こらない。

sum xs                  =  foldl (+) 0 xs

# なぜなら、この制限はパターン束縛にのみ適用されるからである。

# 配列 array

In [None]:
# 配列
# 理想的には、関数型言語での配列は単にインデックスから値への関数とみなす。
# しかし、実際のところは、配列要素への効率的なアクセスを確保するために、
# これらのアクセス関数の領域の特別な性質の利点を十分活用できることを確認しておく必要がある。
# これは、連続した整数からなる整数の有限部分集合の同型性という性質である。
# Haskell では、それゆえに、配列を適用演算をする一般的な関数としては扱わず、
# サブスクリプト演算を行う抽象データ型として扱う。

# 関数的配列への2つの主要なアプローチは、インクリメンタルな定義とモノリシックな定義とに識別することができる。
# インクリメンタルなアプローチの場合は、与えられたサイズの空の配列を生成する関数と、
# もう1つ、配列と、インデックスと、値を引数としてとり、与えられたインデックスの要素だけが
# 元の配列と違う新しい配列を生成する関数となる。
# 明かに、このような配列の意味を素朴に実装するると、インクリメンタルな再定義のたびに
# 配列の新しい複製が必要になり、がまんできないくらい非効率になる。
# したがって、このアプローチをどうしても使いたい場合には、過度の複製を回避するために、
# 洗練された静的分析と巧妙な実行時の仕組を採用する。
# 一方、モノリシックなアプローチの場合には、配列全体は一度に生成される。
# 途中段階での配列の値を参照することはない。
# Haskell には、インクリメンタルな配列更新の演算子があるが、
# この配列の機能の主たる推進力はモノリシックなものである。

# 配列は標準プレリュードには含まれていない。
# この標準ライブラリには配列演算が含まれている。
# 配列を使用するモジュールでは Array モジュールをインポートしなくてはならない。


In [None]:
# インデックス型
# Ix ライブラリは配列インデックスの型クラスを定義している。

class  (Ord a) => Ix a  where
    range       :: (a,a) -> [a]
    index       :: (a,a) a -> Int
    inRange     :: (a,a) -> a -> Bool

# Int、Integer、Char、Bool および Ix の組型についてインスタンス宣言がなされている。
# さらに、列挙型やタプル型に対してはインスタンスが自動的に導出される。
# プリミティブ型を 1次元インデックスとみなし、タプルを多次元長方行列のインデックスとみなす。
# クラス Ix の各演算の第一引数はインデックスのペアであることに注目する。
# これらは典型的には配列の境界 (最初と最後のインデックス) である。
# たとえば、Int のインデックスをもつ、0-オリジンの要素数 10 の境界は (0,9) となる。
# また、1-オリジンの 100 × 100 の行列の境界は ((1,1),(100,100)) となる。
# (他の多くの言語ではこのような境界は 1:100, 1:100 のように書く。
# しかし、ここに示した形式のほうが型システムにピッタリ来る。
# なぜなら、それぞ れの境界が一般のインデックスと同じ型になるからである)

# range 演算は境界のペアを引数として、その間にあるインデックスの順序リストを生成する。
# 例を以下に示す。

range (0,4) => [0,1,2,3,4]

range ((0,0),(1,2)) => [(0,0), (0,1), (0,2), (1,0), (1,1), (1,2)]

# inRange 述語はインデックスが与えられ境界のペアの間に入っている かどうかを判定する。
# 最後に index 演算は配列の特定の要素を特定するのに必要な演算である。
# 境界のペアと範囲内にあるインデックスを与えると、この演算は、そのインデックスが 
# 0-オリジンで何番目のインデックスかを返す。
# たとえば、次のようになる。

index (1,9) 2 => 1

index ((0,0),(1,2)) (1,1) => 4



In [None]:
#  配列生成
# Haskell のモノリシックな配列生成関数は境界のペアとインデックスと値のペア (連想リスト)のリストから配列を生成する。

array                   :: (Ix a) => (a,a) -> [(a,b)] -> Array a b

# ここで、1 から 100 までの数の自乗の配列の例をあげる。

squares                 =  array (1,100) [(i, i*i) | i <- [1..100]]

# この配列の式は連想リストに対するリストの内包表記の典型的な使用例である。
# 実際、この使用例は、Id 言語の配列の内包表記にたいへんよく似ている。

# 配列のインデックスによる指定には中置演算子 ! を使う。
# また、境界は関数 bounds を使って取り出すことができる。

squares!7 => 49

bounds squares => (1,100)

# この例を、各インデックスに対して適用する関数と境界とをパラメータ化することで一般化することができる。

mkArray                 :: (Ix a) => (a -> b) -> (a,a) -> Array a b
mkArray f bnds          =  array bnds [(i, f i) | i <- range bnds]

# こうすれば、squares を mkArray (\i -> i * i) (1,100) と定義することができる。

# 多くの配列は再帰的に定義する。
# すなわち、いくつかの要素の値は別の要素の値に依存している。
# たとえば、フィボナッチ数の配列を返す関数をみる。

fibs    :: Int -> Array Int Int
fibs n  =  a  where a = array (0,n) ([(0, 1), (1, 1)] ++ 
                                     [(i, a!(i-2) + a!(i-1)) | i <- [2..n]])

# こういった再帰をもう1つあげると、n × n のウェーブフロント行列である。
# これは、その最初の行の要素と最初の列の要素がすべて 1 で、
# その他の要素はその左側と左上側と上側との和であるような行列である。

wavefront       :: Int -> Array (Int,Int) Int
wavefront n     =  a  where
                   a = array ((1,1),(n,n))
                        ([((1,j), 1) | j <- [1..n]] ++
                         [((i,1), 1) | i <- [2..n]] ++
                         [((i,j), a!(i,j-1) + a!(i-1,j-1) + a!(i-1,j))
                                     | i <- [2..n], j <- [2..n]])

# このウェーブフロント行列は並列実装がゆえに、反復命令とよばれ、
# 計算が最初の行と列から並列に始まり、左上から右下へ楔形に計算がすすむ。
# しかし、計算の順序が連想リストによって指定されているわけではないとういことに注目することが重要である。

# いまあげた例にかぎれば、対象の配列の各インデックスに対して、
# 対応する配列の境界内にあるインデックスに対してのみ、唯一の連想リストを与えた。
# 実際、一般に、配列を完全に定義するにはこのようにしなければならない。
# インデックス境界を越える連想リストはエラーを引き起こす。
# しかしながら、もしインデックスがないか、あるいは、2回以上出現する場合は即座にはエラーにはならない。
# しかし、配列の当該のインデックスの値が未定義になるので、
# そのインデックスの場所の値を参照しようとしたときにエラーとなる。


In [None]:
# 累積
# 単一のインデックスに対応する複数の値を合成する方法を指定することで、
# インデックスが連想リスト中で 1 度しか出現してはいけないという制限を緩和することができる。
# この結果のことを累積配列 ( accumulated array ) と呼ぶ。

accumArray :: (Ix a) -> (b -> c -> b) -> b -> (a,a) -> [Assoc a c] -> Array a b

# accumArray の第一引数は累積関数 ( accumulating function ) である。
# 第二引数は初期値 (配列の各引数に対して同じ値) である。
# 残りの引数は境界と連想リストで、これは array 関数と同じものである。
# 典型的な累積関数は (+) で初期値は 0 である。
# たとえば、次の関数は境界のペアと、(インデックス型の) 値のリストを引数としてとり、
# ヒストグラム、すなわち、境界内での各値の出現頻度の表を生成する。

hist            :: (Ix a, Integral b) => (a,a) -> [a] -> Array a b
hist bnds is    =  accumArray (+) 0 bnds [(i, 1) | i <- is, inRange bnds i]

# 区間 [a,b) における計数をし、10を1つにカウントすると、次のようになる。

decades         :: (RealFrac a) => a -> a -> [a] -> Array Int Int
decades a b     =  hist (0,9) . map decade
                   where decade x = floor ((x - a) * s)
                         s        = 10 / (b - a)




In [None]:
# 漸進更新
# モノリシックな配列の生成関数に加えて、Haskell では漸進的な配列の更新関数がある。
# これは中置演算子 // を書くことで実現する。
# 最も単純な場合としては、配列 a の i 番目の要素を v に更新するのは、a // [(i, v)] のように書く。
# (//) の左引数に角括弧が使用されている理由は、この引 数が連想リストであるからである。
# この連想リストは通常、この配列のインデックスの適切な部分集合を含む。

(//)            :: (Ix a) => Array a b -> [(a,b)] -> Array a b

# array 関数と同様に、値が定義されるためには、それに対応する連想 リスト中のインデックスは、唯一でなければならない。
# たとえば、次の例は、行列の2つの行を入れ替える関数である。

swapRows :: (Ix a, Ix b, Enum b) => a -> a -> Array (a,b) c -> Array (a,b) c
swapRows i i' a =  a // ([((i ,j), a!(i',j)) | j <- [jLo..jHi]] ++
                         [((i',j), a!(i ,j)) | j <- [jLo..jHi]])
                   where ((iLo,jLo),(iHi,jHi)) = bounds a

# ここでの j インデックスの同じリスト上の2つの別々のリスト内包表記の連結は少し効率の悪いものである。
# 命令型言語のループを二つ書くようなものである。
# 案ずることはない。
# Haskell ではループの融合最適化と同じこと が可能なのである。

swapRows i i' a =  a // [assoc | j <- [jLo..jHi],
                                 assoc <- [((i ,j), a!(i',j)),
                                           ((i',j), a!(i, j))] ]
                   where ((iLo,jLo),(iHi,jHi)) = bounds a


In [None]:
# 例：行列の積
# Haskell の配列の紹介をよく知られた行列の積の例でしめくくる。
# 一般的な関数を1つ定義するために多重定義の長所を利用する。
# 行列の要素の乗法と加法しか必要ではないので、あれこれやろうとしなければ、
# あらゆる数値型の行列の乗算をする関数を手にいれるだけである。
# さらに、(!) を適用し、インデックスへ Ix を作用させるときに十分注意すれば、
# インデックス型に対しても一般性を得る。
# 事実、4つの行と列のインデックス の型は同じである必要がない。
# しかしながら、話を単純にするために 左側の行列の列のインデックスの型と
# 右側の行列の行のインデックスの型は同じで、かつ、境界も同じであるとする。

matMult         :: (Ix a, Ix b, Ix c, Num d) =>
                   Array (a,b) d -> Array (b,c) d -> Array (a,c) d
matMult x y     =  array resultBounds
                         [((i,j), sum [x!(i,k) * y!(k,j) | k <- range (lj,uj)])
                                       | i <- range (li,ui),
                                         j <- range (lj',uj') ]
        where ((li,lj),(ui,uj))         =  bounds x
              ((li',lj'),(ui',uj'))     =  bounds y
              resultBounds
                | (lj,uj)==(li',ui')    =  ((li,lj'),(ui,uj'))
                | otherwise             = error "matMult: incompatible bounds"

# 余談であるが、命令型言語でふつうにつかわれる定式化により近い表現になるように 
# accumArray を用いて matMult を定義することも可能である。

matMult x y     =  accumArray (+) 0 resultBounds
                              [((i,j), x!(i,k) * y!(k,j))
                                      | i <- range (li,ui),
                                        j <- range (lj',uj')
                                        k <- range (lj,uj)  ]
        where ((li,lj),(ui,uj))         =  bounds x
              ((li',lj'),(ui',uj'))     =  bounds y
              resultBounds
                | (lj,uj)==(li',ui')    =  ((li,lj'),(ui,uj'))
                | otherwise             = error "matMult: incompatible bounds"


# この関数を sum や (*) を関数パラメータにして高階化することで、さらに一般化をはかることができる。

genMatMult      :: (Ix a, Ix b, Ix c) =>
                   ([f] -> g) -> (d -> e -> f) ->
                   Array (a,b) d -> Array (b,c) e -> Array (a,c) g
genMatMult sum' star x y  =
      array resultBounds
            [((i,j), sum' [x!(i,k) `star` y!(k,j) | k <- range (lj,uj)])
                                 | i <- range (li,ui),
                                   j <- range (lj',uj') ]
        where ((li,lj),(ui,uj))         =  bounds x
              ((li',lj'),(ui',uj'))     =  bounds y
              resultBounds
                | (lj,uj)==(li',ui')    =  ((li,lj'),(ui,uj'))
                | otherwise             = error "matMult: incompatible bounds"

# APL 好きならつぎのような関数がとても便利なことがわかる。

genMatMult maximum (-)
genMatMult and (==)

# これらのうち最初の方は、引数が数値行列である。
# そして、その結果の行列の (i,j) 番目の要素が、対応する i 番目の行と j 番目の列の要素の間の最大差異となる。
# 2つ目は、引数は同値類の型で、結果は真理値行列になる。
# この行列の (i,j) 要素は第一引数の i 番目の行と第二引数の j 番目の列が
# ベクトルとして同値であるとき、そのときに限り True になる。

# genMatMult の要素の型はすべて同一である必要はなく、単にこの関数 の引数 star として
# 適切な型であればよいだけである。
# また、1つ目の列のインデックスと2つ目の行のインデックスが同一でなければならない、
# という要請を落とせば、もっと一般化することができる。
# あきらかに、2つの行列は、はじめの行列の列数とあとの行列の行数がおなじであるかぎり、
# 適合可能であると考えることができる。
# みなさんはもっと一般性のある版を導出したいと思われるだろう。
# (ヒント：長さを決定するのに index 演算を使用すること)


# 次の段階 next stage

In [None]:
# 次の段階
# Haskell のリソースの膨大なコレクションが haskell.org のウェブサイトで利用可能である。
# このサイトでコンパイラ、デモ、論文、そして Haskell と関数プログラミングに関する
# たいへん重要な情報を見つけることができる。

# いまここ
「やさしい Haskell 入門」 とは名ばかりで、めちゃむずかしい。
ここから Haskell に入門した人は挫折ですね!!!!