# 새 유형 정의하기

기본 유형과 이미 선언된 유형을 이용하여 새 유형을 정의할 수 있다.
새롭게 정의될 수 있는 유형들을 다음과 같으며 적절한 도구를 사용하여 해당 유형을 새롭게 정의한다. 

* 리스트 유형 
* 튜플 유형
* 함수 유형
* 다형 유형
* 사용자 정의 유형

## 리스트 유형

리스트는 동일한 유형의 값을 갖는 유한개의 값들을 하나로 묶어 들고 다니는 값이며, 
아래 형태를 갖는다. 

```haskell
[t1, t2, ..., tn]
```

단, `n`은 임의의 자연수이고, `t1`, `t2`, ..., `tn` 모두 동일한 유형을 가져야 한다. 

`T`가 임의의 유형이고, `t1`, ..., `tn` 모두 `T` 유형을 갖는다면
다음이 성립한다. 

```haskell
[t1, t2, ..., tn] :: [T]
```

예를 들어 다음이 성립한다. 

```haskell
['a', 'b', 'c'] :: [Char]
[] :: [Char]
[] :: [[Char]]
["abc", "bc", "adegh", "zyxabc"] :: [String]
[1..10] :: [Integer]
[[1, 2], [3, 4], [5, 6], [7, 8], [9, 10]] :: [[Integer]]
[[[1, 2], [3, 4]], [[5, 6], [7, 8], [9, 10]]] :: [[[Integer]]]
```

리스트에 포함된 항목은 모두 동일한 유형을 가지며, 유형에 대한 제한은 없다. 
즉, 임의의 유형에 대한 리스트를 생성할 수 있다. 

길이가 0인 리스트, 즉 어떤 항목도 포함하지 않는 리스트를 **빈 리스트**라 부르며
`[]`로 표기한다. 
`""`와 `" "`의 경우처럼 `[]`와 `[[]]`가 다름에 주의한다. 
또한 빈 리스트의 유형은 명확하지 않을 수 있다.
따라서 아래와 같이 어떤 유형의 빈 리스트인지 지정하기도 한다. 

In [None]:
:t ([] :: [Float])

빈 리스트를 비교할 때 자료형이 동일하면 `True` 를 계산한다.

In [None]:
([] :: [Int]) == ([] :: [Int])

하지만 자료형이 다르면 서로 자료형이 다르다면서 오류를 발생시킨다. 

In [None]:
([] :: [Int]) == ([] :: [Integer])

### 주의사항

1. 문자열 유형 `String`은 문자들의 리스트 유형인 `[Char]`를 달리 부르는 표현이다.
따라서 빈문자열은 문자들의 빈 리스트에 해당한다. 

In [None]:
([] :: String) == ""

2. 리스트의 길이에는 제한이 없다. 따라서 무한 리스트도 정의되어 활요될 수 있다. 
    예를 들어, `[0..]`는 모든 자연수를 담고 있는 정수들의 리스트이다. 
    이것이 가능한 이유는 앞서 설명한 소극적 계산법과 관련되어 있으며, 자세한 내용은 나중에 다룰 것이다.
    
    여기서는 `[0..]`이 정말로 모든 자연수들의 리스트임을 보여주는 예제만 몇 개 보여준다. 
    아래 예제들은 리스트 관련 함수들 중에서 유한 시간내에 계산을 마치는 함수만 보여준다. 
    `length` 함수의 경우처럼 계산이 멈추지 않을 수도 있음에 주의해야 한다. 
    즉, 아래와 같이 실행하면 ghci가 멈추지 않으며, 강제로 종료시켜야 한다. 
    
    ```haskell
    length [0..]
    ```
    
    위 설명에서 사용된 `[0..]` 보았듯이 리스트 자체와 리스트의 유형은 리스트의 길이에 대한 정보를 전혀 갖고 있지 않다.
    또한 `[True, False]`와 `[False, False, True]`의 경우처럼 길이가 다른 두 리스트의 유형은 
    `[Bool]`로 동일하다. 

In [None]:
head [0..]

In [None]:
[0..] !! 3

In [None]:
take 15 [0..]

## 튜플 유형

튜플은 유한개의 값들을 하나로 묶어 들고 다니는 값이며, 
아래 형태를 갖는다. 

```haskell
(t1, t2, ..., tn)
```

단, `n`은 0이거나 2보다 큰 임의의 자연수이다. 

`T1`, `T2`, ..., `Tn`이 임의의 유형이고, `ti`가 유형 `Ti`를 갖는다면
다음이 성립한다. 

```haskell
(t1, t2, ..., tn) :: (T1, T2, ..., Tn)
```

길이가 0인 튜플을 **빈 튜플**empty tuple이라 부르며 `()`로 표기한다. 

**주의:** 길이가 1인 튜플은 허용되지 않는다. 
소괄호가 연산자 우선순위와 함수의 인자를 구분하는 데에 사용되기에 잘못하면 혼란을 야기할 수 있기 때문이다.

예를 들어 다음이 성립한다. 

```haskell
('a', 'b') :: (Char, Char)
('a', "abc", True) :: (Char, String, Bool)
(('a', 'b'), True) :: ((Char, Char), Bool)
(('a', 'b'), ("abc", True), False):: ((Char, Char), ([Char], Bool), Bool)
```

튜플에 포함된 항목들 각각 서로 다른 임의의 유형을 가지며, 유형에 대한 제한은 전혀 없다.
즉, 임의의 조합으로 튜플을 생성할 수 있다. 
또한 길이에 따라 튜플의 유형도 함께 달라진다. 

빈 튜플을 제외한 나머지 튜플들의 길이는 2 이상이며,
튜플의 길이는 튜플의 유형을 보면 바로 알 수 있다. 
즉, 튜플의 유형이 길이 정보를 함께 갖고 있으며, 모든 튜플의 길이는 유한하다. 

빈 튜플은 `unit`(유닛)이라 불리는 유형을 갖는 유일한 값이다.
`unit` 유형은 빈 튜플과 동일한 방식인 `()`로 표기된다. 

In [None]:
:t ()

### 주의사항

1. 문자열 유형 `String`은 문자들의 리스트 유형인 `[Char]`를 달리 부르는 표현이다.
따라서 빈문자열은 문자들의 빈 리스트에 해당한다. 

## 함수 유형

특정 유형의 값들과 특정 유형의 값을 서로 연결시켜주는 기능을 함수라 부른다. 
유형 `T1`의 값과 유형 `T2`의 값을 연결시켜주는 함수들의 유형을 `T1 -> T2`로 표기한다. 

만약 `f :: T1 -> T2`이면, 
`f`를 `T1` 유형의 값에 **적용**하여 생성된 `T2` 유형의 값을 `f t`로 표기한다.

### 유형 적용 규칙

함수호출을 이론적으로 뒷받침하는 유형 적용 규칙은 다음과 같다. 

```haskell
 f :: T1 -> T2     t :: T1 
--------------------------- (App)
         f t :: T2
```

즉, 규칙 `(App)`가 묘사하는 함수 적용 방법은 다음과 같다.

* `f` 함수의 유형은 `T1 -> T2`이다.
* `t` 의 유형은 `T1`이다.
* 그러면 `f t`의 유형은 `T2`이다.

#### 주의사항

* 소개된 `(App)` 규칙은 하스켈에서 사용하는 **사실상 유일한** 유형 적용 규칙이다. 
* 나중에 배우는 **다형 유형**polymorphic type과 **클래스**class를 다룰 수 있으려면
    `(App)` 규칙을 일반화해야 하지만 작동 방식은 기본적으로 동일하다. 

### 유형의 우결합성

앞서 설명한 함수 유형 `T1 -> T2`는 충분히 일반화된 형태이다.
하스켈에서 사용될 수 있는 어떤 함수의 유형도 위 형태로 표기된다. 

**주의:** 다형 유형이나 클래스가 사용되는 함수라면 유형이 좀 더 일반화되기는 하지만 
형태는 기본적으로 동일하다. 

예를 들어, 정수 두 개의 합을 계산하는 함수 `add`의 유형은 `Integer -> Integer -> Integer`이다. 

In [None]:
add :: Integer -> Integer -> Integer
add x y = x + y

하지만 다음이 성립한다. 

```haskell
Integer -> Integer -> Integer = Integer -> (Integer -> Integer)
```

즉, 함수 유형 생성자 역할을 하는 `->` 기호가 **우결합성**right associativity을 갖는다.

따라서 `T1 = Integer`과 `T2 = Integer -> Integer`라 하면 다음이 성립한다.

```haskell
T1 -> T2 = Integer -> Integer -> Integer
```

우결합성의 일반적인 형태는 다음과 같다. 

```haskell
T1 -> T2 -> T3 = T1 -> (T2 -> T3)
T1 -> T2 -> T3 -> T4 = T1 -> (T2 -> (T3 -> T4))
T1 -> T2 -> T3 -> T4 -> T5 = T1 -> (T2 -> (T3 -> (T4 -> T5)))
...
```

#### 주의사항

함수 유형을 정의할 때 결합성을 지정하기 위해 소괄호를 사용할 수 있다.
경우에 따라 전혀 다른 역할의 유형을 선언할 수 있음에 주의해야 한다. 

예를 들어, `(Integer -> Integer) -> Integer` 유형의 다음 함수는 
`Intege -> Integer` 유형의 함수 하나와 함께 적용되는 함수이다. 

In [None]:
app0 :: (Integer -> Integer) -> Integer
app0 f = f 0

`app0` 함수는 `Integer -> Integer` 유형의 함수 `f`를 인자와 함께 적용하면
`f 0`를 계산한다. 

### 함수의 부분 적용과 좌결합성

`add` 함수의 유형을 괄호를 사용하여 다시 정의하면 다음과 같다. 

In [None]:
add :: Integer -> (Integer -> Integer)
add x y = x + y

`add` 함수는 정수 하나와 함께 적용되면 `Integer -> Integer` 유형의 값,
즉, 하나의 함수를 생성해야 한다.

예를 들어, `add 3`에 의해 생성된 함수를 `add3`라 한 후에 유형을 확인하면 다음과 같다. 

In [None]:
add3 = add 3
:t add3

그리고 `add3`를 정수 `n`과 함께 적용하면 `3 + n`을 계산한다. 

In [None]:
add3 5

In [None]:
add3 20

물론 처음부터 `add` 함수를 두 개의 정수와 함께 호출하면 두 정수의 합을 계산한다.

In [None]:
add 3 5

In [None]:
add 3 20

이렇게 여러 개의 인자를 사용하는 함수들을 특정 인자 몇 개에만
부분적으로 적용할 수 있다.

앞서 보았듯이 다음 결과가 성립한다. 

```haskell
add3 5 = (add 3) 5 = add 3 5
```

이렇게 함수의 **부분 적용**partial application이 허용되는 이유는
앞서 설명한 대로 유형의 우결합성에 근거한다. 
또한 함수의 부분 적용은 `add3`의 경우에서 보았듯이 **좌결합성**left associativity을 갖는다.

`f`가 함수 유형을 갖는다고 하자. 
그러면 다음이 성립한다. 

* `f :: T1 -> T2 -> T3` 인 경우

    ```haskell
    f t1 t2 = (f t1) t2
    ```

* `f :: T1 -> T2 -> T3 -> T4` 인 경우

    ```haskell
    f t1 t2 t3 = ((f t1) t2) t3
    ```

* `f :: T1 -> T2 -> T3 -> T4 -> T5` 인 경우

    ```haskell
    f t1 t2 t3 t4 = (((f t1) t2) t3) t4
    ```

* ...

### 부분 함수

하스켈에서는 부분함수partial function도 허용된다. 
예를 들어, 리스트의 첫째 항목을 계산하는 `head`, 
첫째 항목을 제외한 나머지 항목들의 리스트를 계산하는 `tail` 등은 빈 리스트에 대애서는 정의되어 있지 않으며,
빈 리스트와 함께 적용할 경우 빈 리스트라고 경고문이 뜬다. 

In [None]:
head []

In [None]:
tail []

### 함수의 커리화/언커리화

`add` 함수를 두 개의 인자 대신 튜플로 하나를 사용하도록 수정해보자. 

In [None]:
addTuple :: (Integer, Integer) -> Integer
addTuple (n, m) = n + m

그러면 `add`와 `addTuple` 사실상 동일한 기능을 수행한다. 
즉, 임의의 정수 `n, m`에 대해 다음이 성립한다. 

```haskell
add n m = addTuple (n, m)
```

이와같이 튜플 유형의 인자를 여러 개 값들의 연속적인 적용으로 다루는 함수로 항상 바꿀 수 있으며,
이런 과정을 논리학자 Haskell Curry(하스켈 커리)의 이름을 따서 **커리화**,
역과정은 **언커리화**라고 부른다. 
예를 들어, `add`는 `addTuple`을 커리화한 함수이며, 
역으로 `addTuple`은 `add`를 역커리화한 함수이다. 

커리화/언커리화의 일반적인 형태는 다음과 같다. 
단, `fCu`는 커리화된 함수, `fUn`눈 언커리화된 함수를 가리킨다.

* `fUn :: (T1, T2) -> T3` 인 경우
    ```haskell
    fCu :: T1 -> T2 -> T3
    fCu t1 t2 = fUn (t1, t2)
    ```
    
* `fUn :: (T1, T2, T3) -> T4` 인 경우
    ```haskell
    fCu :: T1 -> T2 -> T3 -> T4
    fCu t1 t2 t3 = fUn (t1, t2, t3)
    ```
    
* `fUn :: (T1, T2, T3, T4) -> T5` 인 경우
    ```haskell
    fCu :: T1 -> T2 -> T3 -> T4 -> T5
    fCu t1 t2 t3 t4 = fUn (t1, t2, t3, t4)
    ```

* ...

## 다형 유형

리스트 저체는 길이에 대한 정보를 포함하지 않는다. 
따라서 리스트의 길이를 재는 도구가 따로 있으며 `length`라고 불린다.

In [None]:
length ['a', 'b', 'c']

In [None]:
length [1..10]

In [None]:
length ["hello", "world!"]

### `length` 함수의 유형

`length` 함수는 임의의 리스트의 길이를 계산한다.
하지만 리스트는 항목들의 유형에 따라 다른 유형을 갖는다.
예를 들어,

```haskell
length ['a', 'b', 'c']
```

와 

```haskell
length [1..10]
```

에서 사용되는 `length` 함수 인자의 유형이 다르다.
`lengt`는 이것을 어떻게 처리할까?

`length` 함수는 **임의의 유형의 값들로 구성된 리스트**를 인자의 유형으로 사용해야 한다.
따라서 '임의의 유형의 값들로 구성된 리스트'들의 유형이 필요하며,
하스켈에서 제공하는 그런 유형은 

```haskell
[a] 
```

이다. 여기서 `a`는 임의의 유형을 가리키는 **유형 변수**type variable이다.
즉, 유형 변수는 임의의 유형을 가리키는 변수이다. 

**주의:** 유형 변수로 사용된 변수는 함수 이름으로 사용될 수 없다. 

이제 `[a]`를 이용하면 `length`의 유형을 다음과 같다고 말해도 된다. 

```haskell
length :: forall a. [a] -> Int
```

`f :: forall a. [a] -> Int`의 의미는 다음과 같다.

* 임의의 유형 `a`에 대해, `t`가 `a` 유형의 원소들로 이루어진 리스트이면, `f t`는 정수를 계산한다. 

따라서, `length`는 임의의 리스트에 대해 정수를 하나 계산하는데 그 정수는 리스트의 길이인 것이다. 

### 주의사항

애석하게도 `length` 함수의 유형은 좀 더 복잡하다. 

In [None]:
:t length

하지만 여기서는 일단 `length :: [a] -> a` 정도만 기억하고 넘어가도 된다.
`length` 함수의 진짜 유형을 이해하려면 먼저 클래스를 이해해야 하는데 이후에 다룰 것이다. 

### `head` 함수의 유형

빈 리스트가 아닌 리스트의 첫재 항목을 계산하는 함수 `head` 함수도 임의의 유형의 리스트에 대해 작동한다.

In [1]:
head ['a', 'b', 'c']

'a'

In [2]:
head [1..10]

1

`head` 역시 다형 유형을 사용하며 실제 유형은 다음과 같다.

In [3]:
:t head

`f :: forall a. [a] -> a`의 의미는 다음과 같다.

* 임의의 유형 `a`에 대해, `t`가 `a` 유형의 원소들로 이루어진 리스트이면, `f t`는 정수를 계산한다. 

따라서, `head`는 임의의 유형의 리스트에 대해 해당 유형의 값을 계산하는데 그 값은 리스트의 첫째 항목인 것이다.

### 주의사항

`head`는 빈 리스트인 경우에는 오류가 발생한다. 
하지만 **빈 리스트가 아닌 경우에만 작동한다**를 하스켈 자체에서 표현할 수는 없으며, 
프로그램 작성자가 부분함수를 정의할 때 적절한 오류처리에 대해 항상 신경써야 한다.

## 내장 유형과 기본 유형

하스켈에서 사용할 수 있는 유형을 일반적으로 두 부류로 나눈다. 

### 내장 유형과 사용자 정의 유형

1. 내장 유형built-in types: 하스켈에서 기본적으로 제공하는 유형
    * 정수 유형: `Int`와 `Integer`
    * 실수 유형: `Float`와 `Double`
    * 진리값 유형: `Bool`
    * 문자 유형: `Char`
    * 문자열 유형: `String`

    * 리스트 유형: `[Char]`, `[(Integer, Float)]`
    * 튜플 유형: `([Int], Double)`, `(Double, String, Int)`, ...
    * 함수 유형: `Integer -> Bool`
    * 다형 유형: `[a]`, `(a, b)`, ...


2. 사용자 정의 유형: 사용자가 임의로 정의한 유형

    * `data` 키워드로 정의된 유형(재귀적 유형 포함)

### 기본 유형과 새 유형 정의

하지만 여기서는 기본 유형과 새롭게 정의될 수 있는 유형으로 구분한다. 

1. 기본 유형: 말 그대로 기본으로 주어진 유형

    * 정수 유형: `Int`와 `Integer`
    * 실수 유형: `Float`와 `Double`
    * 진리값 유형: `Bool`
    * 문자 유형: `Char`
    * 문자열 유형: `String`


2. 새롭게 정의될 수 있는 유형: 사용자가 임의로 정의한 유형

    * 리스트 유형: `[Char]`, `[(Integer, Float)]`
    * 튜플 유형: `([Int], Double)`, `(Double, String, Int)`, ...
    * 함수 유형: `Integer -> Bool`
    * 다형 유형: `[a]`, `(a, b)`, `a -> b`, ...
    * 사용자 정의 유형: `data` 키워드로 정의된 유형(재귀적 유형 포함)

### 주의사항

엄밀히 따지면 다음 세 가지 유형 생성 방식만 있으면 기본 유형과, 리스트, 튜플 유형을 모두 정의할 수 있다. 
하지만 이에 대한 자세한 설명은 이 강의의 범위를 벗어난다. 

* 함수 유형: `Integer -> Bool`
* 다형 유형: `[a]`, `(a, b)`, `a -> b`, ...
* 사용자 정의 유형: `data` 키워드로 정의된 유형(재귀적 유형 포함)