# 순서쌍, 리스트, 집합, 함수

다음을 하스켈에서 다루는 방법에 대해 알아보자.

 * 순서쌍 타입
 * 리스트를 이용한 집합 표현
 * 함수에 대응되는 순서쌍의 집합

## 하스켈에서 순서쌍

In [1]:
x, y, z  :: Int
x = 3
y = 7
z = 16

:type (x,y)
:type (x,y,z)
:type ((x,y),z)
:type (x,(y,z))

수학에서는 순서쌍의 집합을 나타낼 때 $\times$라는 기호를 사용하여 카테시안곱(Cartesian product)으로 나타낸다.

예컨대 $x,y,z \in \mathbb{Z}$일 때
 * $(x,y)\in\mathbb{Z}\times\mathbb{Z}$
 * $(x,y,z)\in\mathbb{Z}\times\mathbb{Z}\times\mathbb{Z}$

하스켈에서는 순서쌍의 값을 표현할 때 쓰는 괄호와 컴마를 그대로 타입에도 사용하는 점이 보통 수학에서 많이 쓰는 표기법과 차이점이다.
또한 수학에서는 자연스런 일대일대응임이 명확한 집합을 동치로 보고 처리하는 경우가 많기 때문에
$\mathbb{Z}\times\mathbb{Z}\times\mathbb{Z} \equiv \mathbb{Z}\times(\mathbb{Z}\times\mathbb{Z}) \equiv (\mathbb{Z}\times\mathbb{Z})\times\mathbb{Z}$
이렇게 셋을 본질적으로 같은 집합으로 생각하는 경우가 많지만
하스켈을 포함한 대부분의 많은 언어에서는 이를 구분하여
즉 `(Int, Int, Int)`, `(Int, (Int, Int))`, `((Int, Int), Int)` 이 셋을 서로 다른 별개의 타입으로 취급한다.
그러므로 서로 다른 타입을 비교하려고 하거나 하면 타입 오류가 난다.

In [2]:
(x,y,z) == (x,y,z)
(x,y,z) == (z,x,y)

True

False

In [3]:
(x,y,z) == ((x,y),z)

In [4]:
(x,y,z) == (x,(y,z))

In [5]:
(x,(y,z)) == ((x,y),z)

수학에서와 마찬가지로 서로 다른 타입의 값들끼리도 순서쌍으로 구성 가능하다.
리스트가 하나로 정해진 타입의 길이가 다양한 값들로 이루어진 집합이라면
순서쌍은 길이는 고정되어 있지만 각 위치의 원소로 서로 다른 타입의 값이 오도록 정할 수 있는 집합으로 생각할 수 있다.

In [2]:
b1, b2 :: Bool
b1 = True
b2 = False
b3 = False

:type (x,b1)
:type ((x,y),(b1,b2))
:type ((x,b1),(y,b2))
:type (x, b1, y, b2)

하스켈 기본 라이브러리에서는 원소가 2개인 순서쌍에 대해 다음과 같은 함수를 제공한다.

In [3]:
p1 :: (Int, Bool)
p1 = (4,True)

:type p1

fst p1
snd p1

fst' (a,b) = a
snd' (a,b) = b

fst' p1
snd' p1


:type fst
:type snd

4

True

4

True

## 리스트로 집합 표현하기

같은 값의 원소가 중복되지 않는 리스트를 이용해 집합을 표현할 수 있다.

기본적으로 기본라이브러리에서는 리스트에 어떤 원소가 존재하는지 검사하는 `elem` 함수를 제공한다.
예를 들면 다음과 같은 집합 원소 포함 검사를 하스켈로 옮기면 아래와 같다.
 * $3\in\{1,3,5,7\}$
 * $6\notin\{1,3,5,7\}$

In [5]:
elem 3 [1,3,5,7]

3 `elem` [1,3,5,7]
6 `elem` [1,3,5,7]

:type elem

True

True

False

추가로 하스켈 컴파일러와 함께 제공되는 표준라이브러리의 `Data.List` 모듈에서는
다음과 같이 리스트를 이용한 합집합, 교집합, 차집합 연산을 수행할 수 있는 함수들을 제공한다

In [6]:
import Data.List

[1,3,5,7,9,11,13,15,17,19] `union` [3,6,9,12,15,18]
[1,3,5,7,9,11,13,15,17,19] `intersect` [3,6,9,12,15,18]
[1,3,5,7,9,11,13,15,17,19] \\ [3,6,9,12,15,18]

:type union
:type intersect
:type (\\)

[1,3,5,7,9,11,13,15,17,19,6,12,18]

[3,9,15]

[1,5,7,11,13,17,19]

유의할 점은 리스트 표현은 비교연산자가 순서에 민감하다는 점이다. 예를 들어 아래는 집합으로서는 같은 의미이지만 리스트 비교연산을 하면 같지 않다. 집합은 순서를 고려하지 않으므로 리스트를 집합으로써 비교하려면 비교연산자와는 별도의 함수를 사용하거나 리스트를 항상 정렬해 놓는 둥 추가적인 제약조건이 필요하다.

In [10]:
[1,2,3] == [3,1,2]

False

## 순서쌍 집합으로 나타낸 함수

In [7]:
f :: Int -> Int
f x = x^2

함수를 위와 같이 정의역(domain)에서 공역(codomain)으로 가는 함수 타입으로 표시하고 등식으로 정의하는 대신 아래와 같이 순서쌍 집합으로 생각해볼 수도 있다. 위의 함수는 음수를 포함하는 정수이지만 논의의 편이상 음수는 고려하지 않고 자연수에 대해서 정의된 함수라고 생각하자. 이 때 제곱을 돌려주는 함수의 좌표로 이루어진 집합은 다음과 같다.
 * $\{ (0,0), (1,1), (2,4), (3,9), (4,16), ... \}$ (원소나열법)
 * $\{ (x,x^2) \mid x \in \mathbb{N}\} $ (조건제시법)

조건제시법 집합 표현방식을 하스켈에서 리스트 조건제시식(list comprehension)으로 표현하면 다음과 같다.

In [8]:
nats :: [Int]
nats = [0 ..]

fcoords = [(x,x^2) | x <- nats]

:type fcoords

하스켈은 필요한 부분이 있을 때 계산하는 게으른 계산법에 기반하기 때문에 위와 같은 무한한 구조의 값을 자연스럽게 정의할 수 있다.
단 무한한 리스트 전체를 다 출력하려거나 하면 출력이 끝나지 않으므로 저러한 값을 다룰 때는 필요한 부분만큼만 떼어서 살펴본다.
예를 들면 리스트의 경우 `take` 함수를 활용하면 된다. 물론 `take`를 유한한 리스트에도 적용할 수 있다.

In [13]:
take 10 nats
take 10 fcoords

take 5 [1,3,5,7,9,13,15,17,19]

:type take

[0,1,2,3,4,5,6,7,8,9]

[(0,0),(1,1),(2,4),(3,9),(4,16),(5,25),(6,36),(7,49),(8,64),(9,81)]

[1,3,5,7,9]

연습문제: 하스켈 표준 문서나 기본 라이브러리의 소스코드를 찾아보지 않고 `take` 함수를 직접 작성해 보라.

In [9]:
take' _ [] = []
take' 0 xs = []
take' n (x:xs) = if n<=0
                    then error "negative number"
                    else x : take' (n-1) xs

take' 10 nats
take' 10 fcoords

take' 5 [1,3,5,7,9,13,15,17,19]

[0,1,2,3,4,5,6,7,8,9]

[(0,0),(1,1),(2,4),(3,9),(4,16),(5,25),(6,36),(7,49),(8,64),(9,81)]

[1,3,5,7,9]

순서쌍 집합 `fcoords`부터 하스켈 함수를 정의할 수도 있다. 물론 그냥 앞서 정의된 `f` 처럼 정의하는 것보다 대개는 더 비효율적이겠지만 (음이 아닌 정수, 즉 자연수 정의역만 고려할 경우) 같은 값을 구하는 함수를 작성할 수도 있다. 일단 함수를 작성하기에 앞서 이러한 순서쌍 리스트를 다루는 데 유용한 함수를 하나 소개하겠다. `lookup`이라는 함수인데 유한한 리스트에 적용할 경우 다음과 같이 동작한다.

In [11]:
:type lookup

lookup 1 [(1,"hello"), (2,"world"), (3,"bye"), (2,"sky")]
lookup 2 [(1,"hello"), (2,"world"), (3,"bye"), (2,"sky")]
lookup 4 [(1,"hello"), (2,"world"), (3,"bye"), (2,"sky")]
lookup 0 [(1,"hello"), (2,"world"), (3,"bye"), (2,"sky")]

Just "hello"

Just "world"

Nothing

Nothing

In [12]:
:info Maybe

In [15]:
(a1,b1,c1) = (1,2,3)

a1
b1
c1

x1 : x2 : x3 : [] = [1,2,3]

x1
x2
x3

Just y = Just "hello"

y

1

2

3

1

2

3

"hello"

In [16]:
Just n1 = Just 3

n1

3

In [17]:
:info Maybe

In [16]:
lookup 0 fcoords
lookup 3 fcoords
lookup 7 fcoords
lookup 12 fcoords

Just 0

Just 9

Just 49

Just 144

In [19]:
:info Maybe

In [17]:
Just y0 = lookup 0 fcoords
Just y3 = lookup 3 fcoords
Just y7 = lookup 7 fcoords
Just y12 = lookup 12 fcoords

y0
y3
y7
y12

0

9

49

144

연습문제: `lookup` 함수를 직접 작성해 보라

In [21]:
:info String

In [18]:
myf x = if x < 0
          then error("not defined for negative domain: "++show x)
          else result
      where
        Just result = lookup x fcoords

:type myf

In [19]:
myf x  | x < 0     = error("not defined for negative domain: "++show x)
       | otherwise = result
       where 
         Just result = lookup x fcoords

In [24]:
let x = 3 in x + 1

4

In [20]:
f 0 == myf 0
f 3 == myf 3
f 7 == myf 7
f 12 == myf 12

myf (-1)

True

True

True

True

생각해 볼 문제
  1. 만약에 `myf` 함수에서 `if` 문이나 `|` 가드(guard)를 사용해서 `x`가 음수인 경우를 에러처리하지 않고 정의한 다음 음수에 적용한다면 어떤 문제가 발생할까?
  2. 이런 문제가 애초에 없게 `fcoords` 집합을 음수까지 포함해서 "잘" 동작하게 정의할 수는 없을까?

In [27]:
merge []     ys     = ys
merge xs     []     = xs
merge (x:xs) (y:ys) = x:y: merge xs ys

merge [1,3,5,7,9,11] [2,4,6]


ints :: [Int]
ints = merge [0,1..] [-1,-2..]

fcoords' = [(x,x^2) | x <- ints]

take 10 ints
take 10 fcoords

myf' x = result
      where
        Just result = lookup x fcoords'
        
myf' 0
myf' 3
myf' 7
myf' (-1)
myf' (-10)

[1,2,3,4,5,6,7,9,11]

[0,-1,1,-2,2,-3,3,-4,4,-5]

[(0,0),(1,1),(2,4),(3,9),(4,16),(5,25),(6,36),(7,49),(8,64),(9,81)]

0

9

49

1

100

In [31]:
c :: Int
c = 3

:type \x -> \ y -> x + y + c

In [32]:
(\x -> \ y -> x + y + c) 1 2

6

In [1]:
f 0 = 1
f 2 = 3

g x = case x of
        0 -> 1
        2 -> 3

g' x = case x of
      { 0 -> 1;
        2 -> 3
       }

f 0
g 0
g' 0
f 2
g 2
g' 2

1

1

1

3

3

3