In [1]:
:opt no-lint

# Haskell Basics
(하스켈 기초)

앞서 소개한 것처럼 하스켈과 같은 함수형 프로그래밍 언어를 이런 수업에서 사용하는 이유는
프로그래밍 언어의 문법구조와 같은 나무구조로 된 심볼릭 데이타를 처리하기에 특히 편하기 때문이다.

주교재(Programming in Haskell, 2nd ed.) 앞부분을 따라 준비학습/복습용으로 정리된
[동영상 자료](https://loom.com/share/folder/3be2bf727d6c4c0e85d35f6c81db7dbb)를
함께 살펴보면 도움이 될 수 있다.

이 수업은 하스켈 프로그래밍만을 배우려는 과목은 아니지만
프로그래밍 언어의 개념과 관련된 하스켈로 작성된 예제를 이해하고
또 과제도 해야 하므로 기본적인 하스켈 프로그래밍을 할 줄 알아야 한다.
두 개 이상의 언어를 이미 1,2학년 전공과목을 통해 습득한 3학년 대상의 과목이므로
이제 과목에 필요한 새로운 언어 정도는 스스로 학습할 능력을 갖춰야 한다.
그렇지만 너무 아무 소개도 하지 않고 혼자 자습하라고 하면 막막하고 동기부여가
되지 않는 학생들도 간혹 있을 수 있으므로 조금 도움을 주고자 
여기서는 위 내용 중에서 기본적인 것만 빠르게 둘러볼 것이다.


* [Infix operators over integers](#Infix-operators-over-integers)
* [Ordering and Boolean operators](#Ordering-and-Boolean-operators)
* [Characters and Strings](#Characters-and-Strings)
* [Definitions and Pattern matching](#Definitions-and-Pattern-matching)
* [Pairs and Lists](#Pairs-and-Lists)
* [Pattern matching on pairs](#Pattern-matching-on-pairs)
* [Pattern matching on lists](#Pattern-matching-on-lists)

----
## Infix operators over integers
(정수에 대한 중위 연산)

대부분의 다른 프로그래밍 언어와 마찬기자로 정수에 대한 덧셈(`+`), 뺄셈(`-`), 곱셈(`*`) 연산을 할 수 있다.

연산의 대상이 되는 두 정수 사이에 가운데다 연산자(operator)를 표기하므로 중위(infix) 연산자라 일컫는다.

In [2]:
7 + 2 * 3 - 4

9

In [3]:
div 22 5
mod 22 5
12.5 / 5.0

4

2

2.5

정수의 나눗셈은 `div` 함수로 하고 나머지는 `mod` 함수로 구한다.
C나 JavaScript처럼 좀더 대중적인 언어와 함수 호출 문법에서 차이는 괄호를 쓰지 않아도 된다는 점.
그러니까 $f(x)$라는 함수 호출을 하스켈에서는 `f x`의 형태로 쓴다.

In [4]:
div 25 7
mod 25 7
7 * div 25 7 + mod 25 7 -- 7 * 25 ÷ 7 + 25 % 7  (%는 나머지 연산)

3

4

25

참고로 역따옴표(<code>`</code>)로 보통의 함수를 감싸면 중위 연산자처럼 사용 가능하다.
역따옴표는 작은따옴표(<code>'</code>)와는 다른 문자로 영어/한국어 키보드에서 보통 물결(~)모양과 같은 키에
물결모양 아래에 인쇄되어 있다. 즉 물결모양을 칠 때 shift를 같이 눌러줘야 하는데 shift없이 그 키를 누르면 역따옴표를 입력할 수 있다는 이야기다.

In [5]:
25 `div` 7 -- div 25 7 
25 `mod` 7 -- mod 25 7

3

4

음이 아닌 정수에서는 `div`와 `mod` 함수와 같은 동작을 하는 `quot`과 `rem` 함수도 있다.
음수에서는 조금 다르게 동작함하므로 `div`와 `mod`를 쌍으로 쓰고 `quot`와 `rem`을 쌍으로 써야 함.

In [6]:
div (-25) 7 
rem (-25) 7
7 * div (-25) 7 + mod (-25) 7

-4

-4

-25

In [7]:
quot (-25) 7 
rem (-25) 7
7 * quot (-25) 7 + rem (-25) 7

-3

-4

-25

정수 나눗셈이 아닌 분수나 부동소수점 수의 결과를 내는 나눗셈은 `/` 연산자로 한다.

In [8]:
25 `div` 7
25 / 7

3

3.5714285714285716

중위 연산자를 보통의 함수처럼 쓰려면 빈칸 없이 괄호로 감싼다.

In [9]:
2 * 3
(*) 2 3

6

6

In [10]:
7 + 2 * 3 - 4
(-) ((+) 7 ((*) 2 3)) 4

9

9

중위 연산자를 괄호로 감싸는 문법은 잘 모르는 중위 연산자의 타입을 알아볼 때도 도움이 된다.
하스켈은 타입 검사를 굉장히 열심히 하는 언어지만 타입을 프로그램 도중에 타입을 자주 적지 않아도 된다.
왜냐하면 타입을 프로그래머가 지정해 주지 않아도 굉장히 열심히 유추하는 언어이기도 하기 때문.

아래에서 `Num a => ...`이나 `Fractional a => ...`라는 게 무엇인지는 주교재를 찾아보고 동영상 자료의 도움을 받아 무엇인지 알아보도록.
일단 그것은 몰라도 수업 내용을 따라오는 데 당장은 문제가 없다. 대강 개념을 설명하자면 `Num`과 `Fractional`은 타입의 부류(type class)로
타입들의 모임 혹은 집합 정도로 이해해도 된다. `Num`은 `Int`, `Integer`, `Float`, `Double` 등과 같이 덧셈, 뺄셈, 곱셈 연산을 지원하는
여러가지 수 타입이 속하는 부류이다. `Fractional`은 그 중에서 분수나 부동소수점 수 결과값이 될 수 있는 나눗셈(`/`)연산도 추가로 지원하는
타입들이 속하는 부류로 `Float`, `Double` 등이 속하는 부류이며, `Int`, `Integer` 등은 속하지 않는다.



In [11]:
:type 2
:type 3
:type (*)
:type (/)
:type 2 * 3
:type 2 / 3

----
## Ordering and Boolean operators
(비교 및 논리 연산)

In [12]:
1 < 1
1 < 2
1 <= 1
1 <= 2
1 == 2
1 == 1
1 /= 2

False

True

True

True

False

True

True

In [13]:
True == True
False == False
False < True

True

True

True

In [14]:
if True then 111 else -111
if False then 111 else -111

111

-111

In [15]:
True && True
False && True
False || False
False || True
not True
not False

True

False

False

True

False

True

----
## Characters and Strings
(문자와 문자열)

ASCII 영역 밖의 유니코드도 지원하지만 아래와 같이 이스케이프 시퀀스로 변환해 나타낸다.

In [16]:
'a'
'안'
"abcd"
"안녕하세요"

'a'

'\50504'

"abcd"

"\50504\45397\54616\49464\50836"

In [17]:
:type putChar -- 주어진 글자(Char)를 출력하는 동작
:type putStr  -- 주어진 문자열(String)을 출력하는 동작

물론 출력하면 제대로 보일 것이다.

In [18]:
putChar 'a'
putChar '안'
putStr "abcd"
putStr "안녕하세요"

a

안

abcd

안녕하세요

참고로 `String`은 `[Char]` 즉 문자 리스트를 나타내는 타입 대신에
한 단어의 타입 이름으로 줄여서 쓰기 위위한 별명 타입일 뿐이다.

그래서 함수 `putStr :: String -> IO ()`를 `"abcd" :: [Char]`에 적용해 출력할 수 있었던 것이다.
`IO`라는 것이 무엇인지는 주교재를 찾아보라.

In [19]:
:type 'a'
:type "abcd"

In [20]:
:info String

----
## Definitions and Pattern matching
(이름 정의 및 패턴 매칭)

하스켈에서 계산되는 값들로는 정수와 같은 기본타입, 함수, 그리고 데이타 타입과 같은 사용자 정의 타입의 값들이 있다.
이러한 값을 계산하는 하스켈 표현식(expression)에 대해 소문자(또는 밑줄도 가능)로 시작는 이름을 붙여 정의할 수 있다.

In [21]:
x1 = 7
x2 = 4
y1 = 2
y2 = 3

x1 + y1 * y2 - x2

9

In [22]:
f x y = x^2 + y^2

f 4 5
f 3.9 5.1

41

41.22

참고로

In [23]:
:type (^)
:type f

하스켈이 보통은 타입을 열심히 잘 유추해 주기 때문에 이름을 붙일 때 타입을 지정해 줄 필요가 없는 경우가 많다.
하지만 지나치게 일반적인 타입을 피하고 싶거나 문서화를 위해 타입을 명시적으로 지정해 줄 수도 있다.

In [24]:
f1 :: Int -> Int -> Int
f1 x y = x^2 + y^2

f1 4 5
f1 3.9 5.1 -- Int가 아닌 인자로 호출하려 하므로 타입 에러가 난다

41

: 

하스켈에서 타입의 이름이나 상수의 이름은 대문자로 시작한다.
`Red`, `Green`, `Blue`라는 세 가지 중 하나의 데이타 상수값을
갖는 `Color`라는 데이타 타입의 정의이다.
`... deriving (Show, Eq)`가 무엇인지는 주교재를 찾아보도록.

In [25]:
data Color = Red | Green | Blue  deriving Show

위와 같이 여러가지 경우의 상수로 나누어진 타입의 경우 어느 값의 패턴에 해당하는가에 따라 다르게 계산하기 위한 표현이 패턴 매칭이다. 참고로 위와 같이 단순한 상수로 이루어전 데이타 타입은 단순히 상수의 개수만큼 경우의 수만 나열하지만 앞으로 수업시간에 다룰 좀더 복잡한 구조의 데이타 타입에는 다양한 패턴을 활용해 유용한 함수를 작성할 수 있다. `case ... of ...`문을 활용하여 하나의 패턴을 매칭할 수 있다.

In [26]:
한국어로 :: Color -> String
한국어로 c = case c of
              Red -> "빨강"
              Green -> "초록"
              Blue -> "파랑"

In [27]:
Red
한국어로 Red
putStr (한국어로 Red)

Red

"\48744\44053"

빨강

위와 같이 어떤 인자값 $v$에 $f_1$을 적용한 결과에 $f_2$를 적용한 보통 수식에서는 $f_2(f_1(v))$로 표현하는 것을
하스켈에서는 `f2 (f1 v)`로 표현한다. 만약에 `f2 f1 v`라고 하면 전혀 다른 의미이다. `f2 f1 v`는 f2에 두 개의 인자를 적용하는 `f x y`와 같은 구조이다. 참고로 위에서 괄호를 없앴다면 타입 에러가 난다.

In [28]:
putStr 한국어로 Red

: 

`case ... of ...`문을 직접 쓰지 않고도 패턴 매칭을 활용할 다음과 같이 활용할 수 있다.
`한국어이름함수`와 같은 `toKor` 함수를 다음과 같이 작성할 수도 있다.

In [29]:
toKor Red   = "빨강"
toKor Green = "초록"
toKor Blue  = "파랑"

Blue
toKor Blue
putStr (toKor Blue)

Blue

"\54028\46993"

파랑

위와 같은 방법으로 여러 개의 패턴도 한꺼번에 매칭할 수 있다.

In [30]:
-- 모든 구체적인 경우의 패턴을 각각 등식으로 함수 정의
sameColor Red   Red   = True
sameColor Red   Green = False
sameColor Red   Blue  = False
sameColor Green Green = True
sameColor Green Red   = False
sameColor Green Blue  = False
sameColor Blue  Blue  = True
sameColor Blue  Red   = False
sameColor Blue  Green = False

In [31]:
:type sameColor

In [32]:
sameColor Red Green
sameColor Blue Blue

False

True

이렇게 너무 많은 경우의 수를 나열하는 것을 피하기 위해 이미 나열된 것 이외의
아무거나 다 매칭되는 와일드카드 패턴을 밑줄(`_`)로 나타낸다.

In [33]:
-- 두 색깔이 같은 경우들만 구체적 패턴의 등식으로 나열하고
-- 그 외의 모든 경우를 와일드카드 패턴을 활용한 등식 하나로 처리한 함수 정의
sameCol Red   Red   = True
sameCol Green Green = True
sameCol Blue  Blue  = True
sameCol _     _     = False

In [34]:
sameCol Red Green
sameCol Blue Blue

False

True

참고로 하스켈 표준라이브러리에서 기본적으로 제공하는 `Bool` 타입과
그 값인 `True`와 `False`도 아래와 같은 방식으로 정의되어 있다.
```haskell
data Bool = False | True
```

---
## Pairs and Lists
(순서쌍과 리스트)

리스트부터 먼저 알아보고 순서쌍에 대해 알아보겠다.

문자열 타입 `String`이 문자의 리스트인 `[Char]`의 별명이라는 언급을 했다.
즉 문자열이란 문자를 여러 개 일렬로 나열한 구조이다.
문자 뿐 아니라 다른 어떤 타입으로도 같은 타입의 값들 여럿을 일렬로 나열한 리스트를 만들 수 있는데 이는
리스트가 특정한 타입이 아닌 모든 타입에 적용 가능한 다형 데이타 타입으로 정의되어 있기 때문이다.
심지어 함수 타입의 리스트도 만들 수 있고, 리스트의 리스트와 같은 여러 겹의 다중 리스트도 만들 수 있다.

In [35]:
:type []     -- 아무것도 들어있지 않은 길이 0인 빈 리스트
:type [True] -- 한개의 원소로만 이루어진 리스트 
:type ['a','b','c']
:type [1,2,3]
:type [1.1,2.2,3.3]

In [36]:
:type [True,False,True]
:type [Red,Green,Blue]
:type [(+),(-),(*),div,mod]        -- 같은 타입의 함수들로 이루어진 리스트
:type [ [True], [True,False,True], [], [False,True] ] -- 리스트의 리스트

순서쌍은 같은 타입의 원소가 여럿 나열된 리스트와는 달리 다른 타입의 요소로 구성하는 것이 가능하다.
하지만 길이가 정해져 있지 않아 몇개의 원소로 이루어지든 관계없는 리스트와는 달리
순서쌍은 구성 요소의 개수가 고정되어 있다는 차이점이 있다.
그리고 구성요소가 0개인 순서쌍에 해당하는 `()` 타입의 `()` 값도 존재한다.
그러나 구성요소가 1개인 순서쌍은 하스켈에 없는데 이는 애초에 1개만 있다면 굳이 순서쌍으로 감쌀 필요가 없이 단독으로 값의 타입으로 계산하는 것과 다를 바가 없기 때문이다. 
리스트의 원소가 리스트일 수 있는 것과 마찬가지로 순서쌍의 요소로 순서쌍일 수 있다.
또한 리스트를 구성 요소로 취하는 순서쌍이나 순서쌍을 원소로 취하는 리스트도 얼마든지 만들 수 있다.

In [37]:
:type ()         -- 구성요소가 없는 크기 0인 순서쌍
:type (1,2)      -- 같은 타입의 순서쌍
:type (1,2,3)    -- 같은 타입으로만 이루어진 세순서쌍
:type (True,'a') -- 다른 타입으로 이루어진 순서쌍
:type ( ('a','b'), (True, False) )
:type [(Red,"빨강"), (Green,"초록"), (Blue,"파랑")]
:type ( putChar, putStr )

문자열 타입인 `String`은 `[Char]`과 같다고 했으므로 문자열에만 특별히 제공하는 쌍따옴표 문자열 상수 표현 대신에 더 일반적인 리스트 표현으로 바꿔 쓸 수 있다. 

In [38]:
"abcd"
['a','b','c','d']
"abcd" == ['a','b','c','d']

"abcd"

"abcd"

True

In [39]:
[1,2,3,4] < [1,3,2]
(1,2,3,4) < (1,3,2,4)
(1,2,3,4) < (1,3,2) -- 타입 에러! 네순서쌍과 세순써쌍은 같은 타입일 수 없다!!!

True

True

: 

----
## Pattern matching on pairs
(순서쌍에 대한 패턴 매칭)

순서쌍에 대한 패턴 매칭은 다음과 같이 사용할 수 있다.
하스켈 코드 안에서 한 줄 주석은 `--` 로 시작하며 여러 줄 주석은 `{-`로 시작해서 `-}`로 끝난다.
다시 한번 이야기하자면 하스켈에서 구체적인 타입이나 데이타 상수는 대문자로 시작하고
어떤 값(또는 타입)을 대표하는 이름은 소문자로 시작한다.
그래서 패턴 매칭할 때 사용되는 패턴에서도 `(Blue, _)`에서처럼 대문자로 시작하는 `Blue`는
패턴의 해다 부분이 `Blue`라는 상수와 일치할 때만 매칭이 되고 `(x, _)`와 같이 소문자로
시작하는 이름에는 그 부분에 해당하는 값이 무엇이든 간에 매칭된다. 물론 밑줄도 아무 값이나 매칭된는
것은 소문자로 시작하는 이름과 마찬가지이지만 밑줄은 그 값에 굳이 이름을 붙여 다시 사용할 필요가 없어
무시해도 될 경우에 사용한다.

In [40]:
p = (Blue,Green)

-- p의 첫번째 원소가 Blue인지 검사
case p of  
  (Blue, _) -> True
  _         -> False
  
{- 아래는 
   p의 첫번째 원소만 골라낸다 -}
case p of
  (x, _) -> x

True

Blue

두 개의 요소로 이루어진 순서쌍에서 첫번째와 두번째를 골라내는 함수들인 `fst`와 `snd`가 있다.
패턴 매칭을 활용해서 이와 똑같은 함수를 정의해볼 수 있다.

In [41]:
:type fst
:type snd
fst (1,'z')
snd (1,'z')

1

'z'

In [42]:
myfst p = case p of (x,_) -> x
mysnd p = case p of (_,y) -> y

myfst (1,'z')
mysnd (1,'z')

1

'z'

패턴은 여러 겹으로 겹쳐서 쓸 수도 있으므로 이를 활용하면
패턴 매칭으로 조금 복잡한 구조의 여러 겹 안쪽에 있는 값도
간편하게 뽑아낼 수 있다.

In [43]:
p2 = ( (1,'z'), (True,3) )

-- 두번째 요소 안에 있는 첫번째 요소를 뽑아내기
case p2 of
  (_ , (b,_)) -> b
  
-- 첫번째 요소 안에 있는 두번째 요소와
-- 두번째 요소 안에 있는 첫번째 요소를 뽑아내
-- 이들로 이루어진 순서쌍 만들기
case p2 of
  ((_,c), (b,_)) -> (c,b)

True

('z',True)

패턴을 활용해 여러 이름(변수)을 한꺼번에 정의할 수도 있다.

In [44]:
((a1,a2),(b1,b2)) = ((1,'a'),(False,"hello"))

a1 -- 1
a2 -- 'z'
b1 -- False
b2 -- "hello"

1

'a'

False

"hello"

----
연습문제 01-01

`fst`, `snd`와 같은 일을 하는 함수 `myfst'`, `mysnd'`을
이번에는 `case ... of ...`를 사용하지 말고 정의해 보라. (매우 쉬움)

In [45]:
-- myfst'  ...  =  ...
-- mysed'  ...  =  ...

-- -- 테스트
-- myfst' (1,'z')
-- mysnd' (1,'z')

----
## Pattern matching on lists
(리스트에 대한 패턴 매칭)

요소의 개수가 정해져 있는 순서쌍과 달리 리스트는 개수가 정해져 있지 않기 때문에 조금 다른 방식으로 패턴 매칭을 해야 한다. 참고로 리스트는 재귀적 데이터 타입으로 정의되어 있다.

리스트는 길이를 모르기 때문에 순서쌍처럼 패턴 매칭을 해서는 한계가 있다.

In [46]:
l4 = [1,2,3,4]
l3 = [1,2,3]
l2 = [1,2]

case l4 of 
  [a,b,c]   -> a + b + c
  [a,b,c,d] -> a + b + c + d  -- 여기서 처리됨
  _         -> error "list length is not 3 or 4"

case l3 of 
  [a,b,c]   -> a + b + c      -- 여기서 처리됨
  [a,b,c,d] -> a + b + c + d
  _         -> error "list length is not 3 or 4"
  
case l2 of 
  [a,b,c]   -> a + b + c
  [a,b,c,d] -> a + b + c + d
  _         -> error "list length is not 3 or 4"

10

6

: 

지금까지 살펴본 리스트 표현은 프로그래머 편의를 위한 문법이고 실제 구조는 데이타구조 수업에서 배운 연결리스트라고 생각하면 된다. 비어 있지 않은 리스트는 맨 앞의 한 원소와 나머지 리스트로 나눌 수 있고 이를 더이상 원소를 포함하지 않는 빈 리스트 `[]`가 나올 때까지 반복할 수 있다.

In [47]:
[1,2,3,4] == 1 : [2,3,4]
[2,3,4] == 2 : [3,4]
[3,4] == 3 : [4]
[4] == 4 : []

[1,2,3,4] == 1 : (2 : (3 : (4 : [])))
[1,2,3,4] == 1 : 2 : 3 : 4 : [] -- (:)는 오른쪽으로 묶이기 때문에 괄호 생략 가능

True

True

True

True

True

True

비어 있지 않은 리스트 맨 앞의 원소를 얻어오는 `head`와 맨 앞의 원소를 제외한 나머지 리스트를 얻어오는 `tail`함수가 표준라이브러리에서 기본적으로 제공되는데 이와 같은 일을 하는 함수를 패턴매칭을 활용해 아래와 같이 정의할 수 있다.

In [48]:
:type head
:type tail
head [1,2,3,4] -- head (1 : (2 : (3 : (4 : []))))
tail [1,2,3,4] -- tail (1 : (2 : (3 : (4 : []))))

1

[2,3,4]

In [49]:
myhead l = case l of x:_  -> x
mytail l = case l of _:xs -> xs

myhead [1,2,3,4]
mytail [1,2,3,4]

1

[2,3,4]

리스트는 빈 리스트가 나올 때까지 맨 앞의 원소와 나머지 리스트로 를 분리할 수 있는 이러한 구조가 반복되는 재귀적 데이타 타입인 것이다. 재귀적 데이테 타입과 재귀함수에 대해서는 다음 시간에 다시 한번 복습하고 넘어가겠지만 일단은 리스트에 대해서만 살펴보자. 아래는 리스트의 길이를 구하는 재귀함수를 앞에서 살펴본 두 가지 방법, 즉 `case ... of ...`를 이용하는 방법과 등식으로만 정의하는 방법으로 정의한 함수들이다. 
이러한 재귀함수에 대해서는 이어서 조금 더 자세히 알아보기로 하자.

In [50]:
sumlist l = case l of 
              []   -> 0
              x:xs -> x + sumlist xs

sumlist' []     = 0
sumlist' (x:xs) = x + sumlist xs

sumlist [1,2]
sumlist [1,2,3,4]
sumlist [1,2,3,4,5,6,7]

sumlist' [1,2]
sumlist' [1,2,3,4]
sumlist' [1,2,3,4,5,6,7]

3

10

28

3

10

28