<a href="https://colab.research.google.com/github/kalz2q/mycolabnotebooks/blob/master/haskell_gentle.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# メモ

a gentle introduction to haskell  
https://www.sampou.org/haskell/tutorial-j/goodies.html  
を読む。ノート。

In [None]:
# 型付け
%%script false
                         5  :: Integer
                        'a' :: Char
                        inc :: Integer -> Integer
                    [1,2,3] :: [Integer]
                    ('b',4) :: (Char,Integer)

# :: はなになにの型はなになに "has type" と読むことができる


In [None]:
# 関数定義
%%script false

inc n          = n+1

inc            :: Integer -> Integer



In [None]:
# e1 が評価され e2 になることを
# e1 => e2
# と書く。

# 例えば

inc (inc 3) => 5



In [None]:
# list とは
%%script false

length                  :: [a] -> Integer
length []               =  0
length (x:xs)           =  1 + length xs

length [1,2,3]	=>	3
length ['a','b','c']	=>	3
length [[1],[2],[3]]	=>	3

In [None]:
# head と tail
%%script false

head                    :: [a] -> a
head (x:xs)             =  x

tail                    :: [a] -> [a]
tail (x:xs)             =  xs

#  head と tail はカラのリストではエラーになる


In [None]:
# 型の定義
%%script false

data Bool               = False | True

# Bool, False, True は引数を持たないコンストラクタ nullary constructor

data Color              = Red | Green | Blue | Indigo | Violet

# Bool, Color は列挙型 enumerated type


In [None]:
# 次のは 1つだけデータコンストラクタを持つ型

data Point a            = Pt a a

# Point のような型はタプル型と呼ばれる。 なぜなら本質的に他の型のデカルト積だから。
# Bool, Color のような多コンストラクタ型は直和型((disjoint) union or sum types)と呼ばれる。

In [None]:

つぎにあげるのは、ひとつのデータ構築子のみからなる型の例

data Point a = Pt a a

単一の構築子から構成されているので、Pointのような型はしばしばタ
プル型(tuple
type)と呼ばれる。これは、本質的にはべつの型の
直積(この場合は2引数)だから(タプル型は別の言語ではレコード型と呼ば
れているものに類似している。)
一方、BoolやColorのよ
うな複数の構築子をもつ型は直和型((disjoint)
union or sum type)と呼ばれる。

しかし、重要なことはPointは多相型の例だということすべての
型 t に対して、これは t
を座標の型とする点を定義するもの
Point型はあきらかに1引数の型構築子それは、型 t
から新しい 型Point t
が生みだされているから(同様に先にでてきたリスト
の例でいうと[]も型構築子与えられたすべての型にたいして、
[]を「適用」することができて、それが新しい型
[t]となる。Haskell の構文では[t] を[]
t と書くことも許されている。同じように ->
は型構築子与えられた 2 つの型 t と u
に対して、 t->u は型 t の要素から型 u
の要素への写像をおこなう関数の型 )

2引数データ構築子Ptの型は a -> a -> Point
aであることに注
意してください。つまり次のは正しい型付け

Pt 2.0 3.0 :: Point Float
Pt 'a' 'b' :: Point Char
Pt True False :: Point Bool

一方、Pt 'a' 1のような式は正しく型付けできない。そ
れは、'a'と1は別の型だから

データ構築子を適用して値を得ることと、型構築子
を適用して型を得ることを区別することが重要前者は、実行時
に起こりHaskellのなかでどのように計算するかということであり、後者はコン
パイル時に起こり、型安全を確かめる型システムのプロセスの一部

[Pointのような型構築子とPtのようなデータ構築子は別の名
前空間にある。つまり、つぎのように、型構築子とデータ構築子に同じ名前
を使うことができるということ

data Point a = Point a a

最初はちょっとややこしく見えるかもしれないが、これで型とデータ構築子
の関連が明らかなものになる。]


2.2.1 再帰型
型は再帰的に構成することもできる。たとえば、二分木の型を考えてみよう。

data Tree a = Leaf a | Branch
(Tree a) (Tree a)

ここでは多相型の二分木を定義しました。その要素はa型の値を含む「葉」
のノードかあるいは(再帰的に)ふたつのサブツリーを含む「枝」のノード

このようなデータ宣言をよむ場合には、Treeは型構築子であり、
Branch や Leaf
はデータ構築子であることを思いだしてく
ださい。これらの構築子間の関係を理解したら、上の宣言は本質的には以下のよ
うなBranchの型やLeafの型の定義であることがわかるだろう。

Branch :: Tree a -> Tree a ->
Tree a
Leaf :: a -> Tree a


この例で表現力の豊かな型を定義したので、いくつかの興味深い(再帰)関数を定
義することができる。たとえば、fringeという、木を左から右へ
たどって「葉」にある要素のリストを返す関数を定義したいとしよう。このよう
な場合、最初に新しい関数の型を最初に書きおろしておくとあとで役にたつこと
が多いこの場合関数の型はTree a -> [a]で
なければならないことがわかる。すなわちfringeは多相関数で、
全て型 aについて、aの木をaのリストへ写像しま
す。その定義は次のようになる。

fringe :: Tree a -> [a]
fringe (Leaf x) = [x]
fringe (Branch left right) =
fringe left ++ fringe right

ここで、++は中置演算子で、2つのリストを連結する。(この演算子
の完全な定義は9.1 節で与え ます。). まえにあげた
length の例と同じように、fringe
関数は、パターンマッチを使って定義する。ちがいは、ここではユーザ定義の
構築子 Leaf と Branch
があること[仮引数は小文字
ではじまっているので、すぐにわかることに注目してください。]


2.3 型の同義名
利便性をため、Haskellでは、型の同義名(type
synonym)を定義する方法がある。すなわち、よく使う型に名前をつける
というもの型の同義名は型宣言によって作り出する(§4.2.2)。例をあげましょう。

type String = [Char]
type Person = (Name,Address)
type Name = String
data Address = None | Addr
String


型の同義名は新しい型を定義するわけではなく、単に、既存の型に新しい名前を
与えるものたとえば、Person -> Name
という型 は (String,Address) ->
String と全くおなじもの
型の同義名の新しい名前は、ふつう元の型より短いものになるが、短い名前
をつけることだけが型の同義名の目的ではない。型の同義名をニーモニッ
クとするこで、プログラムの可読性が改善されます。上はまさにその例多
相型にも新しい名前を付けることができる。

type AssocList a b = [(a,b)]

これは、型aの値と型bの値を結びつける「連想リスト
(association list)」という型


2.4 組み込みの型は特別な型ではない
これまで、リスト、タプル、整数、文字など、いくつかの「組み込み」型を紹介
しました。また、あたらしいユーザ定義の型の定義の方法も示しました。構文が
特別である以外に、組み込みの型は、ユーザ定義の型にくらべて特別なことはあ
るのだろうか？答えはノー特別な構文は利便性と歴史的な慣
習のためのもので、意味としてはなにも違いがない。

この点をさらに強調するために、組み込みの型の宣言がどのようなものになりう
るかを考えてみましょう。もし、型の宣言の構文を組み込みの型に使えるとした
ら、たとえば、Char型はこんな風に書けるだろう。

data Char = 'a' | 'b' | 'c' |
... -- This is not valid
| 'A' | 'B' | 'C' | ... --
Haskell code!
| '1' | '2' | '3' | ...
...

これらの構築子名は実際には正しいものではない。この点は次のようにし
なければならないだろう。

data Char = Ca | Cb | Cc | ...
| CA | CB | CC | ...
| C1 | C2 | C3 | ...
...

これらの構築子は簡単なものが、文字を表わすにはかなり不便なもの

いずれにせよ、このような「擬似Haskell」のコードを書くことで、特別な構文
の見通しがつけやすくなる。これで、Char型が数多くの無引数構
築子から構成されている列挙型であることがわかる。
Char
についてこのように考えていくと、たとえば、なぜ関数の定義の
なかで文字に対してパターンマッチを使うことが可能なのかが理解できると思い
ます。つまり、あらゆる型の(データ)構築子にたいしてパターンマッチを使えそ
うだということがわかる。

[この例では、Haskell
におけるコメントの使いかたも示している。
--とそれに続く行末までのすべての文字は無視されます。Haskellでは
さらに入れ子になったコメントも可能それは、
{-...-}
という形式のものでコード中のどこにでも置くこと
ができる(§2.2)。]

同様に考えれば、Int
(固定精度の整数)やIntegerの定義は

data Int = -65532 | ... | -1 |
0 | 1 | ... | 65532 -- more
pseudo-code
data Integer = ... -2 | -1 | 0
| 1 | 2 ...

のように考えることができる。ここで、-65532と65532は、
いわば、与えられた処理系における固定精度整数の最小値と最大値
IntはCharに比べればはるかに大きな列挙型が、それで
も、有限の列挙型一方、Integerに対する擬似コードでは無
限の列挙型を表現しようとしている。

タプルもこのやりかたで簡単に定義できる。

data (a,b) = (a,b) -- more
pseudo-code
data (a,b,c) = (a,b,c)
data (a,b,c,d) = (a,b,c,d)
. .
. .
. .

上の各宣言はそれぞれ、特定の長さの一つのタプルを定義している。
(...)は(データ構築子として)式の構文中と(型構築子として)型の表現式の構
文中にあらわれます。最後の宣言の後の縦につづく点はこのような宣言の無限の
列をあらわしている。これは、Haskellではあらゆる長さのタプルが許されて
いることを反映している。

リストも同様に簡単に定義できる。リストの場合は再帰的になっているのが面
白い。

data [a] = [] | a : [a] --
more pseudo-code

以前にリストについて述べたことが、これで明解になる。[]は空
リストであり、:はリストの中置構築子つまり、
[1,2,3]は1:2:3:[]と同等であるはず(:は右
結合性をもちます。) [] の型は [a] で、 : の型
は a->[a]->[a] 

[ここでの「:」の定義方法は構文的に正しい方法中置構築子を
data宣言中で使用することが許されている。また、中置構築子と中
置演算子は区別されます。(中置構築子はパターンマッチの処理で使用する。)
中置演算子の定義では、「:」が先頭にこなければならないことからも、中置構
築子と中置演算子が区別されていることがわかる。]

ここでは、タプルとリストの違いを注意深くみておく必要がある。上の定義
でその違いがハッキリわかる。注目すべき点は、リストの型は同じ型の要素
上の任意の長さの再帰的構造を持ち、一方、(特定の)タプルの型は別の型の要素
上の固定の長さの非再帰構造であることタプルとリストの型付けルールは
もう明かだろう。

(e1,e2,...,en), n>=2 に対して、もし、
ti が ei の型であるとす るならば、タプルの型は
(t1,t2,...,tn) 
[e1,e2,...,en], n>=0 に対して各 ei
が必ず同じ型 t であるなら、そのリストの 型は [t]



2.4.1 リストの内包表記と数列表記
Lisp 系の言語でもそうであるように、リストというのは
Haskell でもややこし
いものそれで、他の関数型言語と同様に、Haskell
にはリストを生成する
ための糖衣構文がある。いま議論したばかりのリストの構築子の他に、
Haskell ではリストの内包表記(list
comprehension)として知
られる表現が使えるようになっている。次の例がよい解説になる。

[ f x | x <- xs ]

この式は直観的に、「xs から順に引き出してきた x
について f x をすべて集めたリスト」("the list
of all f x such that x is
drawn from xs")と読むことができる。
集合のときの表記との類似性は偶然ではない。 x <-
xs の部分は生成部(generator)
とよばれている。生成部を複数持つこともできる。

[ (x,y) | x <- xs, y <- ys ]

このリスト内包表記は、xs と ys
の2つのリストの直積とな
ります。要素は生成部が左から右へ「入れ子」になっているかのように選ばれて
いきます。(もっとも右にある生成部がもっとも速く変化する。)
だから、 xs を [1,2] とし、ys を [3,4]
とすれ ば、その結果は
[(1,3),(1,4),(2,3),(2,4)]となる。

生成部のほかに、ガード(guard)とよばれているブール式を書
くことができる。ガードは生成される要素に制約を与える。例として、みな
さんお馴染のソーティングアルゴリズムの定義をあげておく。

quicksort [] = []
quicksort (x:xs) = quicksort
[y | y <- xs, y<x ]
++ [x]
++ quicksort [y | y <- xs,
y>=x]


さらに Haskell
はリストの数列表記という構文もサポートしている。
これも例でみていくのがいいだろう。

[1..10] =>
[1,2,3,4,5,6,7,8,9,10]
[1,3..10] => [1,3,5,7,9]
[1,3..] => [1,3,5,7,9,
...(infinite sequence)
数列表記について詳しくは 8.2 節で、「無限リスト」につ
いては 3.4 節で解説する。


2.4.2 文字列
組み込みの型の糖衣構文をもうひとつあげておきましょう。文字列リテラルの
"hello" は実際には文字のリスト
['h','e','l','l','o']
の簡略表記実際、"hello" の型は String
で、これは 定義の型の同義名になっている。

type String = [Char]

ということは、定義済のリスト上の多相関数は文字列に対しても適用できるとい
うことたとえば、

"hello" ++ " world" => "hello
world"

A Gentle Introduction to
Haskell, Version 98
back next top


In [None]:

Here is an example of a type with just one data constructor:
data Point a            = Pt a a

Because of the single constructor, a type like Point is often
called a tuple type, since it is essentially just a cartesian
product (in this case binary) of other types. (Tuples are somewhat
like records in other languages.) In contrast, multi-constructor
types, such as Bool and Color, are called (disjoint) union or
sum types.

More importantly, however, Point is an example of a polymorphic
type: for any type t, it defines the type of cartesian points
that use t as the coordinate type.
The Point type can now be
seen clearly as a unary type constructor, since from the type
t it constructs a new type Point t. (In the same sense, using
the list example given earlier, [] is also a type constructor.
Given any type t we can "apply" [] to yield a new type [t].
The Haskell syntax allows [] t to be written as [t].
Similarly,
-> is a type constructor: given two types t and u, t->u is the
type of functions mapping elements of type t to elements of
type u.)

Note that the type of the binary data constructor Pt is a ->
a -> Point a, and thus the following typings are valid:

Pt  2.0  3.0            :: Point Float
Pt  'a'  'b'            :: Point Char
Pt True False           :: Point Bool

On the other hand, an expression such as Pt 'a' 1 is ill-typed
because 'a' and 1 are of different types.

It is important to distinguish between applying a data constructor
to yield a value, and applying a type constructor to yield a
type; the former happens at run-time and is how we compute things
in Haskell, whereas the latter happens at compile-time and is
part of the type system's process of ensuring type safety.

[Type constructors such as Point and data constructors such as
Pt are in separate namespaces.
This allows the same name to
be used for both a type constructor and data constructor, as
in the following:

data Point a = Point a a

While this may seem a little confusing at first, it serves to
make the link between a type and its data constructor more obvious.]
2.2.1  Recursive Types
Types can also be recursive, as in the type of binary trees:
data Tree a             = Leaf a | Branch (Tree a) (Tree a) 
Here we have defined a polymorphic binary tree type whose elements
are either leaf nodes containing a value of type a, or internal
nodes ("branches") containing (recursively) two sub-trees.

When reading data declarations such as this, remember again that
Tree is a type constructor, whereas Branch and Leaf are data
constructors.
Aside from establishing a connection between these
constructors, the above declaration is essentially defining
the following types for Branch and Leaf:

Branch                  :: Tree a -> Tree a -> Tree a
Leaf                    :: a -> Tree a


With this example we have defined a type sufficiently rich to
allow defining some interesting (recursive) functions that use
it.
For example, suppose we wish to define a function fringe
that returns a list of all the elements in the leaves of a tree
from left to right.
It's usually helpful to write down the type
of new functions first; in this case we see that the type should
be Tree a -> [a].
That is, fringe is a polymorphic function
that, for any type a, maps trees of a into lists of a.
A suitable
definition follows:

fringe                     :: Tree a -> [a]
fringe (Leaf x)            =  [x]
fringe (Branch left right) =  fringe left ++ fringe right

Here ++ is the infix operator that concatenates two lists (its
full definition will be given in Section 9.1). As with the length
example given earlier, the fringe function is defined using
pattern matching, except that here we see patterns involving
user-defined constructors: Leaf and Branch.
[Note that the formal
parameters are easily identified as the ones beginning with
lower-case letters.]


In [None]:


2.3  Type Synonyms
For convenience, Haskell provides a way to define type synonyms
; i.e.
names for commonly used types.
Type synonyms are created
using a type declaration (§4.2.2). Here are several examples
:

type String             = [Char]
type Person             = (Name,Address)
type Name               = String
data Address            = None | Addr String


Type synonyms do not define new types, but simply give new names
for existing types.
For example, the type Person -> Name is
precisely equivalent to (String,Address) -> String.
The new
names are often shorter than the types they are synonymous with,
but this is not the only purpose of type synonyms: they can
also improve readability of programs by being more mnemonic
; indeed, the above examples highlight this.
We can even give
new names to polymorphic types:

type AssocList a b              = [(a,b)]

This is the type of "association lists" which associate values
of type a with those of type b.


2.4  Built-in Types Are Not Special
Earlier we introduced several "built-in" types such as lists,
tuples, integers, and characters.
We have also shown how new
user-defined types can be defined.
Aside from special syntax,
are the built-in types in any way more special than the user
-defined ones? The answer is no.
The special syntax is for convenience
and for consistency with historical convention, but has no semantic
consequences.

We can emphasize this point by considering what the type declarations
would look like for these built-in types if in fact we were
allowed to use the special syntax in defining them.
For example,
the Char type might be written as:

data Char       = 'a' | 'b' | 'c' | ...         -- This is not
valid
               | 'A' | 'B' | 'C' | ...         -- Haskell code
!
               | '1' | '2' | '3' | ...
               ...

These constructor names are not syntactically valid; to fix them
we would have to write something like:

data Char       = Ca | Cb | Cc | ...
               | CA | CB | CC | ...
               | C1 | C2 | C3 | ...
               ...

Even though these constructors are more concise, they are quite
unconventional for representing characters.

In any case, writing "pseudo-Haskell" code in this way helps
us to see through the special syntax.
We see now that Char is
just an enumerated type consisting of a large number of nullary
constructors.
Thinking of Char in this way makes it clear that
we can pattern-match against characters in function definitions,
just as we would expect to be able to do so for any of a type's
constructors.

[This example also demonstrates the use of comments in Haskell
; the characters -- and all subsequent characters to the end
of the line are ignored.
Haskell also permits nested comments
which have the form {-...-} and can appear anywhere (§2.2).]
Similarly, we could define Int (fixed precision integers) and
Integer by:

data Int     = -65532 | ... | -1 | 0 | 1 | ... | 65532  -- more
pseudo-code
data Integer =       ... -2 | -1 | 0 | 1 | 2 ...

where -65532 and 65532, say, are the maximum and minimum fixed
precision integers for a given implementation.
Int is a much
larger enumeration than Char, but it's still finite! In contrast,
the pseudo-code for Integer is intended to convey an infinite
enumeration.


In [None]:

Tuples are also easy to define playing this game:

data (a,b)              = (a,b)                         -- more
pseudo-code
data (a,b,c)            = (a,b,c)
data (a,b,c,d)          = (a,b,c,d)
.                         .
.                         .
.                         .

Each declaration above defines a tuple type of a particular length,
with (...) playing a role in both the expression syntax (as
data constructor) and type-expression syntax (as type constructor).
The vertical dots after the last declaration are intended to
convey an infinite number of such declarations, reflecting the
fact that tuples of all lengths are allowed in Haskell.

Lists are also easily handled, and more interestingly, they are
recursive:

data [a]               = [] | a : [a]                  -- more
pseudo-code

We can now see clearly what we described about lists earlier
: [] is the empty list, and : is the infix list constructor;
thus [1,2,3] must be equivalent to the list 1:2:3:[]. (: is
right associative.) The type of [] is [a], and the type of 
: is a->[a]->[a].

[The way ":" is defined here is actually legal syntax---infix
constructors are permitted in data declarations, and are distinguished
from infix operators (for pattern-matching purposes) by the
fact that they must begin with a ":" (a property trivially satisfied
by ":").]

At this point the reader should note carefully the differences
between tuples and lists, which the above definitions make abundantly
clear.
In particular, note the recursive nature of the list
type whose elements are homogeneous and of arbitrary length,
and the non-recursive nature of a (particular) tuple type whose
elements are heterogeneous and of fixed length.
The typing rules
for tuples and lists should now also be clear:

For (e1,e2,...,en), n>=2, if ti is the type of ei, then the type
of the tuple is (t1,t2,...,tn).

For [e1,e2,...,en], n>=0, each ei must have the same type t,
and the type of the list is [t].


2.4.1  List Comprehensions and Arithmetic Sequences
As with Lisp dialects, lists are pervasive in Haskell, and as
with other functional languages, there is yet more syntactic
sugar to aid in their creation.
Aside from the constructors
for lists just discussed, Haskell provides an expression known
as a list comprehension that is best explained by example:

[ f x | x <- xs ]


In [None]:

This expression can intuitively be read as "the list of all f
x such that x is drawn from xs." The similarity to set notation
is not a coincidence.
The phrase x <- xs is called a generator,
of which more than one is allowed, as in:

[ (x,y) | x <- xs, y <- ys ]

This list comprehension forms the cartesian product of the two
lists xs and ys.
The elements are selected as if the generators
were "nested" from left to right (with the rightmost generator
varying fastest); thus, if xs is [1,2] and ys is [3,4], the
result is [(1,3),(1,4),(2,3),(2,4)].

Besides generators, boolean expressions called guards are permitted.
Guards place constraints on the elements generated.
For example,
here is a concise definition of everybody's favorite sorting
algorithm:

quicksort  []           =  []
quicksort (x:xs)        =  quicksort [y | y <- xs, y<x ]
                       ++ [x]
                       ++ quicksort [y | y <- xs, y>=x]


To further support the use of lists, Haskell has special syntax
for arithmetic sequences, which are best explained by a series
of examples:

[1..10]	=>	[1,2,3,4,5,6,7,8,9,10]
[1,3..10]	=>	[1,3,5,7,9]
[1,3..]	=>	[1,3,5,7,9, ... (infinite sequence)
More will be said about arithmetic sequences in Section 8.2,
and "infinite lists" in Section 3.4.



In [None]:

2.4.2  Strings
As another example of syntactic sugar for built-in types, we
note that the literal string "hello" is actually shorthand for
the list of characters ['h','e','l','l','o'].
Indeed, the type
of "hello" is String, where String is a predefined type synonym
(that we gave as an earlier example):

type String             = [Char]

This means we can use predefined polymorphic list functions to
operate on strings.
For example:

"hello" ++ " world" => "hello world"



A Gentle Introduction to Haskell, Version 98
back next top

