In [1]:
:opt no-lint

# Untyped 𝜆-calculus

람다계산법(𝜆-calculus)을 공부하는 이유.
* 람다계산법의 창시자 알론조 처치(Alonzo Church)는
  앨런 튜링(Alan Turing)의 박사 지도교수인데,
   - 튜링이 *튜링 머신*을 고안하기 직전에 *람다계산법*이라는 것을 고안하여
   - 튜링이 풀이하고자 하는 문제를 또다른 방식으로 풀이 <br> 
     (이걸 바다 건너 영국에서 알게 되고 박사 학위를 하러 미국에 있는 처치 교수에게 유학)
   - 이들이 고안한 두 가지 방법의 **계산**이라는 개념을 표현하는 능력이 정확히 일치
   
  그래서 오늘날까지 이것을 컴퓨터를 다루는 학문에서 **계산**의 정의로 받아들이고 있으며
  유식한 말로 **처치 튜링 명제**(Church-Turing thesis)라고 한다.
* 많은 함수형 프로그래밍 언어들이 람다계산법을 기반으로 설계되었다.
  그러니까 처치 튜링 명제와 같은 기초 이론적 업적으로만 중요한 것이 아니라
  프로그래밍에 직접 활용되므로 실용적으로도 이해하고 있어야만 하는 지식.


이 노트에서는 타입없는 람다계산법의 문법과 줄일 수 있는 식(reducible expression)의 개념 등에 대해 알아본다.

"줄일 수 있는 식"이라는 말이 너무 길기 때문에 '주는식'(redex)과 같은 줄임말을 보통 더 많이 사용한다.

## 문법
$  x \in \textsf{Nm} = \textsf{String}$

$ e \in \textsf{Tm} $ <br> 
$ e ::=~ x ~\mid~ (\lambda x.e) ~\mid~ (e_1~e_2) $


$1, 2, 3$의 합을 구하려고 할 때
$x_1 = 1 + 2$라고 $1+2$라는 식에 이름을 $x_1$이라는 붙인 다음 $x_1 + 3$을 계산할 수도 있다.
근데 보통 그렇게 안하고 $(1 + 2) + 3$ 그냥 진행합니다.

보통 수학에서 $f(x) = x^2$과 같이 정의하는 함수 $f$를 람다계산법에서는 아래와 같은 방식으로 표현한다.

$(\lambda x.x^2)$

그리고 보통 수학에서 정의된 함수를 호출하는 $f(3)$과 같은 표현은 람다계산법에서는 괄호 없이 함수와 인자를 나열하여 아래와 같은 방식으로 표현한다.

$((\lambda x.x^2)~3)$

수학에서도 그렇듯 람다계산법에서도 어떤 함수가 다른 함수를 받아 또 다른 함수를 만들어낼 수 있다.
가장 대표적인 예로 '미분'이라는 개념을 함수를 받아 함수를 돌려주는 함수로 이해할 수도 있다.

$((미분~(\lambda x.x^2))~3) \longrightarrow\cdots\longrightarrow ((\lambda x.\,2\times x)~3) \longrightarrow 2\times 3 \longrightarrow 6$

물론 순수한 람다계산법에는 미분이나, 제곱, 곱하기, 등의 개념을 기본적으로 제공하지는 않으며 심지어 자연수도 기본 구성요소로 제공되지 않는다. 위에 예제는 개념적인 이해를 돕기 위한 설명이다. 참고로 Alonzo Church의 람다계산법은 Alan Turing의 튜링머신과 마찬가지로 괴델이 "수학명제 자동판별 문제"가 해결 불가능함을 증명한 불완전성 정리를 그들 나름의 방식으로 좀더 직접적으로 간략하게 증명하기 위한 이론적 도구 혹은 소품으로 만들어진 것이다. 가정하는 것이 아니라 하지만 이후 이런 소품들의 이론적 계산능력이 동일하다는 것이 밝혀지면서 오늘날 우리가 이해하는 컴퓨터로 할 수 있는 모든 계산의 이론적 범위를 발견한 것으로 받아들여지고 있는데 이를 처치-튜링 논제(Church-Turing thesis)라고 한다. 이와 관련한 역사적 배경 및 좀더 자세한 내용이 궁금한 사람들은 다음 온라인에 공개된 [컴퓨터과학이 여는 세계](https://www.youtube.com/watch?v=HTWSPoDLmHI&list=PL0Nf1KJu6Ui7yoc9RQ2TiiYL9Z0MKoggH) 강의 시리즈의 1.4, 1.5, 1.6 내용 영상 등이 참고가 될 것이다.

## 간단히 쓰기
괄호나 람다 기호가 너무 많이 나타나는 경우 오히려 읽기가 힘들어 보통은 이렇게 간단히 쓰는 경우가 많다.

* $((\cdots((e_1~e_2)~e_3)~\cdots)~e_n)$를 간단히 쓰면 $e_1~e_2~\cdots~e_n$
* $(\lambda x_1.(\lambda x_2.(\lambda x_3.(\cdots.(\lambda x_n.e))\cdots)))$를 간단히 쓰면 $(\lambda x_1.\lambda x_2.\cdots.\lambda x_n.e)$
* $(\lambda x_1.\lambda x_2.\cdots.\lambda x_n.e)$을 더 간단히 쓰면 $(\lambda x_1~x_2\;\cdots\;x_n.e)$
* 다른 식에 적용하지 않고 함수 정의식 자체로 이루어진 경우 가장 바깥의 괄호도 생략 가능
    - 예컨대, $(\lambda x.e)$를 간단히 쓰면 $\lambda x.e$
    - 그러나 $(\lambda x.e)~e_2$는 $\lambda x.e~e_2$로 간단히 쓰지 못함<br>
      참고로 $(\lambda x.(e~e_2))$를 간단히 쓰면 $\lambda x.e~e_2$
      
## 람다식 계산기
https://projectultimatum.org/cgi-bin/lambda

위 웹사이트처럼 웹에서 클릭으로 람다식 계산을 진행해 볼 수 있는 계산기들이 몇 군데 공개되어 있다.



In [2]:
-- 변수 이름은 문자열로 나타낸다
type Nm = String

-- 람다식 문법 구조
data Tm = Var Nm       -- x
        | Lam Nm Tm    -- (λx.e)
        | App Tm Tm    -- (e1 e2)
        deriving (Show, Eq)

In [3]:
Lam "x" (Var "x") -- (λx.x)

Lam "x" (Var "x")

In [4]:
-- 람다식을 보기좋게 문자열로 변환해주는 함수
ppTm :: Tm -> String
ppTm (Var x) = x
ppTm (Lam x e) = "\\" ++ x ++ " -> " ++ ppTm e
ppTm (App e1 e2) = pp1 e1 ++ " " ++ pp2 e2
  where
  pp1 e@(Lam{}) = paren (ppTm e)
  pp1 e         = ppTm e
  pp2 e@(Var{}) = ppTm e
  pp2 e         = paren (ppTm e)

paren s = "(" ++ s ++ ")"
brack s = "[" ++ s ++ "]"
latex s = "$" ++ s ++ "$"

-- 람다식을 보기좋게 TeX 코드로 변환해주는 함수
texTm (Var x) = x
texTm (Lam x e) = "\\lambda " ++ x ++ "." ++ texTm e
texTm (App e1 e2) = tex1 e1 ++ "~" ++ tex2 e2
  where
  tex1 e@(Lam{}) = paren (texTm e)
  tex1 t         = texTm t
  tex2 s@(Var{}) = texTm s
  tex2 s         = paren (texTm s)

In [5]:
idTm = Lam "x" (Var "x")
ttTm = Lam "x" (Lam "y" (Var "x")) 
ffTm = Lam "x" (Lam "y" (Var "y")) 

In [6]:
-- ppTm은 텍스트로 Haskell에서 람다식 표현과 같은 방식으로 출력을 도와줌
idTm
putStr $ ppTm idTm
ttTm
putStr $ ppTm ttTm
ffTm
putStr $ ppTm ffTm

Lam "x" (Var "x")

\x -> x

Lam "x" (Lam "y" (Var "x"))

\x -> \y -> x

Lam "x" (Lam "y" (Var "y"))

\x -> \y -> y

In [7]:
import IHaskell.Display
-- texTm은 수식 조판 언어를 이용해서 종이에 쓰는 좀더 예쁜 방식으로 람다식을 표시해줌
html . latex $ texTm idTm
html . latex $ texTm ttTm
html . latex $ texTm ffTm
html . latex $ texTm (App (App (Var "x") (Var "y")) (Var "z"))
html . latex $ texTm (App (Var "x") (App (Var "y") (Var "z")))
html . latex $ texTm (App (App ffTm idTm) ttTm)
html . latex $ texTm (App ffTm (App idTm ttTm))

## 부분식(sub-expression)
람다식의 부분식은 그 식의 일부로 나타나는 람다식이다. 전체 식 자체도 자기 자신의 부분식이라고 하자.

하스켈 데이타 타입 `Tm`으로 표현된 어떤 람다식의 부분식을 모두 나열하는 리스트를 구하는 함수를 다음과 같이 작성할 수 있다.

In [8]:
[2,3,4] ++ [7,8]

[2,3,4,7,8]

In [9]:
subTm :: Tm -> [Tm]
subTm (Var x) = [ Var x ] -- (Var x) : []   -- x의 부분식은 x 하나밖에 없다
subTm (Lam x e1) = (Lam x e1) : subTm e1    -- (λx.e1)의 부분식은 자기 자신과 e1의 모든 부분식들
subTm (App e1 e2) = (App e1 e2) : subTm e1 ++ subTm e2
    -- (e1 e2)의 부분식은 자기 자신과 e1의 모든 부분식들과 e2의 모든 부분식들

In [10]:
e = App (Lam "x" (Var "x")) (Lam "y" (Var "y"))

html . latex . texTm $ e

subTm e

map (html . latex . texTm) (subTm e)

[App (Lam "x" (Var "x")) (Lam "y" (Var "y")),Lam "x" (Var "x"),Var "x",Lam "y" (Var "y"),Var "y"]

패턴매칭에서 부분별로 이름을 붙임과 동시에 구조 전체에도 이름을 붙여주려면 `@`을 활용한다.
예컨대 위의 `subTm`과 같은 함수를 다음과 `@`패턴을 활용하면 더 간결하게 정의되며,
컴파일러가 구조 전체를 함수 결과에서 그대로 참조할 수 있는 추가 정보가 돌 수 있으므로
컴파일된 코드의 성능이 개선될 가능성도 있다.

In [11]:
subTm' :: Tm -> [Tm]
subTm' e@(Var _) = [e]
subTm' e@(Lam _ e1) = e : subTm' e1
subTm' e@(App e1 e2) = e : subTm' e1 ++ subTm' e2

In [12]:
e = App (Lam "x" (Var "x")) (Lam "y" (Var "y"))

subTm' e

map (html . latex . texTm) (subTm' e)

[App (Lam "x" (Var "x")) (Lam "y" (Var "y")),Lam "x" (Var "x"),Var "x",Lam "y" (Var "y"),Var "y"]

## 주는식(redex)
람다계산법의 실행의미는 그 문법만큼이나 매우 단순하다.
함수정의식 $(\lambda x.e)$를 인자 $e_2$에 적용한
함수적용식 $((\lambda x.e)~e_2)$는 곧바로 줄일 수 있는
주는식(redex)이며 그것을 한 걸음 줄인 결과는
$e$에 나타나는 $x$를 $e_2$로 치환한 식,
즉 $x$의 자리에 $x$대신 $e_2$로 끼워넣은 식이 된다.
달리 말하지면 주는식이란 즉시 함수 호출을 할 수 있는 형태의 함수적용식을 말하는 것이다.
왜냐하면 즉시 함수 호출이 가능하려면 왼쪽에 오는 함수 부분이 람다로 시작하는 함수정의식이어야 하니까.
이러한 계산 규칙을 $\beta$-줄이기($\beta$-reduction)이라고 하며
아래와 같이 나타낸다. 참고로 줄이는 방법이 한 가지가 아니라 여러 가지 규칙이 포함된
람다계산법의 변이들도 가능한데 그런 경우 특정 규칙에 따라 주는식임을 표현하기 위해
$\beta$-주는식($\beta$-redex)이라고 줄이는 규칙의 이름을 앞에 붙여서 말하기도 한다.

$((\lambda x. e)~e_2) \longrightarrow \{x\mapsto e_2\}e$

여기에서 $\{x\mapsto e_2\}e$는 바로 $e$에서 $x$를 $e_2$로 치환한 식을 의미하는 표기법이다.
예컨대 $\big(\big(\lambda x.(\lambda y.(y~x)~x)\big)~z\big)$를
줄이면 $\{x\mapsto z\}(\lambda y.(y~x)~x)$ 그러니까 $(\lambda y.(y~z)~z)$가 된다.

참고로 위의 $\beta$-줄이기 규칙을 핵심으로 하되, 어떤 식이 그 자체로는 $\beta$-줄이기 규칙의
적용 대상이 아니더라도 규칙이 적용되는 부분을 찾아 그 부분의 식에 $\beta$-줄이기를 적용하는
규칙들을 추가로 정의할 수 있다. 예컨대, $\big(\big((\lambda x.x)~(\lambda y.y)\big)~(\lambda z.z)\big)$는
그 자체로는 식 전체에 $\beta$-줄이기 규칙을 적용할 수 없지만
그 부분식인 $\big((\lambda x.x)~(\lambda y.y)\big)$에는 $\beta$-줄이기 규칙을 적용할 수 있다.
사실 부분식에 $\beta$-줄이기를 어떻게 적용할지는 여러 가지
방법 혹은 전략이 가능한데 지금은 일단 적당히 아무 곳에나 적용한다고 하고 넘어가기로 하고 이후에
다시 이에 대해 생각해 보겠다.

하스켈 데이타 타입 `Tm`으로 표현된 어떤 람다식이
그 자체로 $\beta$-줄이기 규칙을 바로 적용할 수 있는 주는식(redex)인지
검사하는 함수를 다음과 같이 작성할 수 있다.

In [13]:
isRedEx :: Tm -> Bool
isRedEx (App (Lam _ _) _) = True
isRedEx _                 = False

In [14]:
e1 = idTm
e2 = App idTm idTm
e3 = (Lam "x" e2)

html . latex $ texTm e1
isRedEx e1
html . latex $ texTm e2
isRedEx e2
html . latex $ texTm e3
isRedEx e3

False

True

False

주어진 식 자체로는 주는식(redex)이 아니더라도 어떤 부분의 부분식에 주는식을 포함하고 있을 수도 있다.
그 자체로 주는 식인 경우 뿐만 아니라 부분식으로 주는식을 포함하는 식인지까지 검사하는 `hasRedEx` 함수를
다음과 같이 작성할 수 있다.

In [15]:
hasRedEx :: Tm -> Bool
hasRedEx (Var _) = False
hasRedEx (Lam _ e1) = hasRedEx e1
hasRedEx e@(App e1 e2) = isRedEx e || hasRedEx e1 || hasRedEx e2

In [16]:
e1 = idTm
e2 = App idTm idTm
e3 = (Lam "x" e2)

html . latex $ texTm e1
hasRedEx e1
html . latex $ texTm e2
hasRedEx e2
html . latex $ texTm e3
hasRedEx e3

False

True

True

참고로 위와 같은 일을 하는 다른 방법으로도 정의할 수 있다.
앞서 정의한 `subTm` 함수로 부분식을 모두 나열하여
그 중 하나라도 주는 식이 있는지 검사하는 `isRedEx` 함수와 함께
표준라이브러리 고차함수 `any`를 활용하면 알아볼 수 있으므로
똑같은 일을 하는 함수를 다음과 같이 정의할 수도 있다.

In [17]:
even 1
even 2
even 3
even 4

False

True

False

True

In [18]:
any even [1,3,5,7]
any even [1,3,4,7]
any even [1,2,4,7]
any even [2,4,6,8]

False

True

True

True

In [19]:
hasRedEx' = any isRedEx . subTm

In [20]:
e1 = idTm
e2 = App idTm idTm
e3 = (Lam "x" e2)

html . latex $ texTm e1
hasRedEx' e1
html . latex $ texTm e2
hasRedEx' e2
html . latex $ texTm e3
hasRedEx' e3

False

True

True

----
연습문제 05-01

식에 포함된 주는식(redex)의 개수를 세는 함수 `countRedEx :: Tm -> Int`의 정의를 완성하고
이 함수를 활용하는 테스트를 아래 주어진 테스트 외에 자신이 직접 3개 이상 작성하라.
단, 주어진 테스트를 포함하여 테스트의 결과값은 서로 모두 달라야 한다.
함수를 맞게 작성했더라도 이 조건을 만족하는 테스트를 작성하지 않으면 0점이다.

또 다른 방법으로 같은 일을 하는 함수 `countRedEx' :: Tm -> Int`를 작성해 보고,
앞서 작성한 같은 테스트를 새로 다른 방법으로 작성한 함수로도 실행해 보라.

In [21]:
-- countRedEx :: Tm -> Int

In [22]:
-- 테스트 0
e1 =  Lam "f" (App idTm (App idTm (Var "f" `App` Var "f"))) `App` App idTm idTm
html . latex $ texTm e1
countRedEx e1 -- 제대로 완성하면 결과가 4가 나올 것이다

: 

In [23]:
-- 테스트 1

In [24]:
-- 테스트 2

In [25]:
-- 테스트 3

----

In [26]:
-- texTm을 적절히 변경하여 함수적용식 (e1 e2)에서
-- 함수 부분인 e1에 빨강 인자 부분인 e2에 파랑 사각형 테두리 추가
texTmColor (Var x) = x
texTmColor (Lam x e) = "\\lambda " ++ x ++ "." ++ texTmColor e
texTmColor (App e1 e2) = box1(tex1 e1) ++ "~" ++ box2(tex2 e2)
  where
  tex1 e@(Lam{}) = paren (texTmColor e)
  tex1 t         = texTmColor t
  tex2 s@(Var{}) = texTmColor s
  tex2 s         = paren (texTmColor s)
  box1 = red  . boxed . black
  box2 = blue . boxed . black

color c s = "\\color{"++c++"}{"++s++"}"
boxed s = "\\boxed{"++s++"}"

black = color "black"
red = color "red"
blue = color "blue"

In [27]:
e1 = Lam "f" (App idTm (App idTm (Var "f" `App` Var "f"))) `App` App idTm idTm
html . latex $ texTm e1
putStr $ texTmColor e1
html . latex $ texTmColor e1

\color{red}{\boxed{\color{black}{(\lambda f.\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(\color{red}{\boxed{\color{black}{f}}}~\color{blue}{\boxed{\color{black}{f}}})}}})}}})}}}~\color{blue}{\boxed{\color{black}{(\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(\lambda x.x)}}})}}}

----
연습문제 05-02

`texTmColor`처럼 모든 함수적용식 $(e_1~e_2)$에 빨강/파랑 사각형 테두리를 표시하는 것이 아니라
주는식(redex)인 경우에만, 즉 $((\lambda x.e)~e_2)$ 형태인 경우에만,
빨강/파랑 사각형 테두리로 표시하는 `texTmRedEx` 함수를 정의하라.
(힌트: 일단 `texTmColor`의 정의를 복사/붙여넣기 해서 `texTmColor`를 모두 `texTmRedEx`로 바꿔주고 난 다음 어느 부분을 고쳐야 할지 잘 생각해 보라.)

예컨대, 앞서 본 같은 예제를 `texTmRedEx`으로 실행한 결과는 다음과 같아야 한다.
```haskell
e1 = Lam "f" (App idTm (App idTm (Var "f" `App` Var "f"))) `App` App idTm idTm
putStr(texTmRedEx e1)
html(latex(texTmRedEx e1))
```
`\color{red}{\boxed{\color{black}{(\lambda f.\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(f~f)}}})}}})}}}~\color{blue}{\boxed{\color{black}{(\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(\lambda x.x)}}})}}}`

$\color{red}{\boxed{\color{black}{(\lambda f.\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(f~f)}}})}}})}}}~\color{blue}{\boxed{\color{black}{(\color{red}{\boxed{\color{black}{(\lambda x.x)}}}~\color{blue}{\boxed{\color{black}{(\lambda x.x)}}})}}}$



In [28]:
-- texTmRedEx :: Tm -> String

In [29]:
-- 테스트 0
{-
e1 = Lam "f" (App idTm (App idTm (Var "f" `App` Var "f"))) `App` App idTm idTm
putStr $ texTmRedEx e1
html. latex $ texTmRedEx e1
-}

In [30]:
-- 테스트 1

In [31]:
-- 테스트 2

In [32]:
-- 테스트 3

----

## 표준형(normal form)

표준형은 규칙에 따라 더 이상 줄일 수 있는 부분식을 포함하지 않는 형태의 람다식을 말한다.
구체적으로 $\beta$-줄이기로 더 이상 줄일 수 있는 부분식이 전혀 포함하지 않는 람다식을 $\beta$-표준형이라 일컫는다.

주어진 람다식 $e$에 $\beta$-줄이기를 반복적으로 적용해 얻을 수 있는 $\beta$-표준형을
$e$의 $\beta$-표준형이라 말하는데, 타입없는 람다계산법에서는
주어진 람다식의 $\beta$-표준형이 존재한다면 유일하다는
**처치-로서 정리(Church-Rosser theorem)**가 성립힌다.

람다계산법의 처치-로서 정리를 직접 설명하기보다는
우선 직관적으로 처치-로서 정리가 어떤 성질을 의미하는지 덧셈식을 통해 간단히 개념만 알아보자.
 
예를 들어 (1 + 2) + (4 + 5) 라는 덧셈식이 있다면 어떤 덧셈을 먼저 하든 관계없이 항상 같은 결과값을 얻는다.
즉 덧셈식에서는 덧셈을 줄여나가는 것에 대한 처치-로서 정리의 성질이 성립한다고 말할 수 있다.

$(1 + 2) + (4 + 5) ~\longrightarrow~ 3 + (4 + 5) ~\longrightarrow~ 3 + 9 ~\longrightarrow~ 12$

$(1 + 2) + (4 + 5) ~\longrightarrow~ (1 + 2) + 9 ~\longrightarrow~ 3 + 9 ~\longrightarrow~ 12$

하지만 타입없는 람다계산법의 경우 계산이 일반적으로 항상 끝난다는 보장이 없다.
즉 어떤 람다식은 표준형이 아예 존재하지 않을 수도 있으며
표준형이 존재하더라도 어떤 주는식을 먼저 계산하는가에 따라
계산이 끝날 수도 있고 끝나지 않을 수도 있다. 그래서 타입없는
람다계산법에서의 처치-로서 정리는 표준형이 존재하는 식의 경우
표준형에 도달할 수 있는 모든 계산 경로 끝에 있는 표준형이 모두 "같다"는 의미이다.

참고로 표준형이 없는 끝나지 않는 계산을 하는 대표적인 예가 바로 다음과 같은 람다식이다.

$
\big((\lambda x.x~x)~(\lambda x.x~x)\big)
\longrightarrow
\big((\lambda x.x~x)~(\lambda x.x~x)\big)
\longrightarrow
~~\cdots$

## $\alpha$-변환 ($\alpha$-conversion), $\alpha$-동치 ($\alpha$-equivalence)

잠깐, 근데 "같다"는 게 무엇인지 우리가 아직 정확히 정의하지 않았다.

일단 확실한 것은 글자 하나도 틀리지 않고 똑같으면 분명히 같은 것이다.
하지만 이것은 너무나 협소한 같음의 정의다.
왜냐하면 $\lambda x.x$와 $\lambda y.y$의 경우
비록 글자 하나하나를 비교하면 다른 점이 있기는 하지만
분명히 똑같은 식이라고 볼 수 있기 때문이다.
$\lambda x.x$에서 함수 인자의 이름을 $x$대신 $y$로 바꾼 함수가 $\lambda y.y$이다.
이렇게 함수 인자의 이름을 일괄적으로 바꿔놓는 것을 $\alpha$-변환이라고 하며,
함수 인자 이름만 바꿔나가면 똑같아지는 관계에 있는 람다식들을 $\alpha$-동치 관계에 있다고 하며 아래와 같은 기호로 표시한다.


$\displaystyle\large \lambda x.x\stackrel{\alpha}{\equiv}\lambda y.y$

## $\beta$-동치 ($\beta$-equivalence)
$(\lambda x.x)~(\lambda y.y)$와 $((\lambda y.(\lambda x.x))~z)$는 $\alpha$-동치가 아니다.
하지만 이를 $\beta$-줄이기로 한단계만 계산하면 계산 결과로 나오는 식들이 $\alpha$-동치임을 알 수 있다.

$((\lambda x.x)~(\lambda y.y)) \stackrel{\beta}{\longrightarrow} (\lambda y.y)$

$((\lambda y.(\lambda x.x))~z) \stackrel{\beta}{\longrightarrow} (\lambda x.x)$

$\beta$-동치를 아래와 같은 기호로 표시한다.

$\displaystyle\large ((\lambda x.x)~(\lambda y.y)) \stackrel{\beta}{\equiv} ((\lambda y.(\lambda x.x))~z)$


이와 같이 $\beta$-줄이기를 (일반적으로는 한 걸음만 아니라 여러 걸음으로) 적용해서 같아지는
관계를 $\beta$-동치라고 한다. 덧셈식으로 비유하자면 ((3+4)+5)와 (2+(5+6))처럼 구조나 생김새가
설령 다르더라도 계산 결과가 같은 관계에 해당한다. 표준형이 있는 람다식끼리 비교하는 경우라면 처치-로서 정리의 성질에
의거해 서로의 표준형을 구해 같은지($\alpha$-동치인지) 알아봄으로써 $\beta$-동치 관계인지 검사가 가능하다.

----
## 자유로운 이름과 묶인 이름

프로그래밍 언어에서 어떤 이름(또는 변수)이 자유롭다(free)거나 묶였다(bound)고 말하는데 이것이 무슨 의미일까?
람다계산법을 통해 이에 대해 알아보겠다.

<br>

연습문제 05-03

$\displaystyle\Large ((\lambda x.\stackrel{①_{\phantom{j}\!}}{x}~\stackrel{②}{y})~(\lambda y.\stackrel{③_{\phantom{j}\!}}{x}~\stackrel{④_{\phantom{.}}}{y}))$

위 식에 나타난 각각의 변수 ①,②,③,④ 중에서 자유이름과 묶인이름은?

<br>

연습문제 05-04

 * $\displaystyle\Large ((\lambda x.(\lambda x.x))~y) \stackrel{\beta}{\longrightarrow} (\lambda x.y)$

   위 계산의 문제점은 무엇인가?
   
 * $\displaystyle\Large ((\lambda x.(\lambda y.x~y))~y) \stackrel{\beta}{\longrightarrow} (\lambda y.y~y)$

   위 계산의 문제점은 무엇인가?

---
## Capture avoiding substitution
(잘못된 속박이 일어나지 않도록 치환)

$((\lambda x.e)~e_2) \stackrel{\beta}{\longrightarrow} \{x\mapsto e_2\}\,e$

$\beta$-줄이기 규칙을 위와 같이 나타내며, 줄인 결과식인 $\{x\mapsto e_2\}\,e$의
의미는 대략 람다식의 몸체 $e$에 나타나는
인자 $x$를 함수 적용 대상인 $e_2$으로 바꿔치기하는 것으로 이해할 수 있다.
이렇게 '대략' 이야기해서는 바로 앞의 연습문제와 같이 잘못된 계산을 하게 될
소지가 있으므로 그러므로 정확히 어떤 방식으로 바꿔치는지 $\{x\mapsto e_2\}\,e$가
의미하는 바를 좀더 명확히 할 필요가 있다. 위의 연습문제에서 발생했던 두 가지 문제를
발생시키지 않으려면 아래의 두 가지 조건을 만족할 때만 치환을  필요하다.

 1. $e$ 안의 자유로운 $x$만 $e_2$로 치환(바꿔치기)하고 묶인 $x$는 그대로 둔다. <br>
    (*묶인 이름은 묶여있는 채로 두고 건드리지마* )
 2. $e$ 안의 자유로운 $x$ 각각의 위치에서 묶인이름과<br> 
    $e_2$의 자유이름 사이에 겹치는 이름이 하나도 없어야 한다.<br>
    (*자유롭던 이름이 치환한다고 묶이면 안됨* )

다음과 같이 1번 조건을 따르지 않고 묶인 $x$까지 치환하면 올바른 $\beta$-줄이기가 아니다.

$\displaystyle (\lambda x.x~(\lambda x.x))~(\lambda z.z)
 \stackrel{\beta}{~\not\!\!\!\longrightarrow}
 (\lambda z.z)~(\lambda x.\lambda z.z)
 \stackrel{\beta}{\longrightarrow} 
 \lambda x.\lambda z.z$
 
아래와 같이 자유로운 자유로운 $x$만 치환하고 묶인 $x$는 그대로 두어야 올바른 $\beta$-줄이기다.

$\displaystyle (\lambda x.x~(\lambda x.x))~(\lambda z.z)
 \stackrel{\beta}{\longrightarrow}
 (\lambda z.z)~(\lambda x.x)
 \stackrel{\beta}{\longrightarrow}
 \lambda x.x$

1번 조건을 잘 지켜 자유로운 이름만 치환하더라도 $e_2$에서 자유로웠던 이름이
$\{x\mapsto e_2\}\,e$의 결과로 묶여버리는 원치 않는 속박(capture)이 일어나는 경우,
즉 2번 조건을 만족하지 못하는 아래와 같은 경우도 올바른 $\beta$-줄임이 아니다.

$\displaystyle (\lambda x~y.\,x~y)~y~z \stackrel{\beta}{~\not\!\!\!\longrightarrow} (\lambda y.y~y)~z \stackrel{\beta}{\longrightarrow} z~z$

넘기는 이름이 달라진다고 다른 결과를 계산한다면 우리가 상식적으로 아는 함수가 아니다.

$\displaystyle (\lambda x~y.\,x~y)~w~z \stackrel{\beta}{\longrightarrow} (\lambda y.w~y)~z   \stackrel{\beta}{\longrightarrow} w~z$

이름에 관계없이 같은 값을 넘기면 똑같이 동작해야 하는 것이 함수이다.
예컨대, $f$가 함수라면 $f(x)$를 계산하든 $f(y)$를 계산하든 $x$와 $y$라는 이름이
대표하는 값이 같다면 ($x\equiv y$) 함수를 적용해 계산한 결과도 같아야 ($f(x)\equiv f(y)$) 한다.
속박을 피하는 치환(capture avoiding substitution)을 해야만 람다식 계산이 이를 만족한다.
$\alpha$-동치를 이용해 적용하려는 함수 안의 묶인이름을 적절히 바꿔준 다음 $\beta$-줄임의 결과 계산을 위한 치환을 진행하면 속박을 피하며 올바른 $\beta$-줄이기를 할 수 있다. 

$\displaystyle (\lambda x~y.\,x~y)~y~z \stackrel{\alpha}{\equiv}
  (\lambda x~y'.\,x~y')~y~z \stackrel{\beta}{\longrightarrow}
  (\lambda y'.y~y')~z \stackrel{\beta}{\longrightarrow} y~z$

---
### Capture avoiding substitition을 정의해 보는 연습문제 05-05

$\{x\mapsto e\}e_0$를 하스켈 코드 `subst x e e0`로 나타내려 한다.
`e0`의 자유로운 이름 `x`를 `e`로 치환한 식을 계산하라는 의미이다.


아래에 주어진 `dumbSubst` 구현은 람다식에 대한 잘못된 속박이 일어날 수 있다.

`dumbSubst`의 문제점이 무엇인지 분석하여 확인해 보라. 힌트는 바로 위에서 설명한 예제를 하스켈 정의로 옮겨 시험해 보면 된다.

이렇게 문제점을 분석해 보고 예제를 통해 잘못된 속박이 일어나는 경우를 확인해 본 뒤, 이러한 문제가 없이 잘못된 속박을 피하는 치환 함수 `subst`를 정의하라.

In [33]:
dumbSubst :: Nm -> Tm -> Tm -> Tm
dumbSubst x e (Var y)
              | x == y    = e
              | otherwise = Var y
dumbSubst x e (Lam y e0)  = Lam y (dumbSubst x e e0)
dumbSubst x e (App e1 e2) = App (dumbSubst x e e1) (dumbSubst x e e2)

In [34]:
-- 일단 임시로 subst를 그냥 dumbSubst로 정의하고 진행하겠다 
subst = dumbSubst

----

`subst`가 제대로 완성이 되었다고 가정하고 $\beta$-줄이기를 한 단계 진행하는 `step` 함수를 정의하자.

지금은 `dumbSubst`로도 잘못된 속박이 일어나지 않는 예제들로만 구성해서 진행하겠다.

여러분들이 연습문제로 제대로 작성하고 나면 잘못된 속박이 일어날 가능성이 있는 예제도 잘 다룰 수 있게 될 것이다.

앞서 하나의 람다식에 주는식(redex) 여러 개 있을 수 있다는 점에서 $\beta$-줄이기로 한 단계 진행한 결과가 여러 개 있을 수 있다는 것을 알 수 있다.

그러므로 `step`은 하나의 람다식(`Tm`)을 받아 여러 개의 람다식으로 이루어진 리스트(`[Tm]`)를 계산하는 함수이다. 즉 모든 가능한 다음 단계를 다 나열하는 함수라 볼 수 있다.

우리가 지금 작성하려 하는 `step` 함수는 아래와 같은 작은걸음 동작방식 의미론을 구현하고자 하는 것이다.

$\displaystyle
 \frac{e \longrightarrow e'}{\lambda x.e \longrightarrow \lambda x.e'}$

$\displaystyle
 \frac{}{(\lambda x.e_0)~e \longrightarrow \{x\mapsto e\}e_0}
 \qquad 
 \frac{e_1 \longrightarrow e_1'}{e_1~e_2 \longrightarrow e_1'~e_2}
 \qquad 
 \frac{e_2 \longrightarrow e_2'}{e_1~e_2 \longrightarrow e_1~e_2'}$

In [35]:
step :: Tm -> [Tm]
step (Var x)     = []
step (Lam x e)   = [Lam x e' | e' <- step e]
step (App e1 e2) = beta (App e1 e2)
                ++ [App e1' e2 | e1' <- step e1]
                ++ [App e1 e2' | e2' <- step e2]

beta :: Tm -> [Tm]
beta (App (Lam x e0) e) = [subst x e e0]
beta _                  = []

In [36]:
e11 = App (Lam "x" $ Var "x" `App` Var "x") (App (Lam "y" $ Var "y") (Lam "z" $ Var "z"))

html . latex . texTm $ e11

In [37]:
step e11

map (html . latex . texTm) (step e11)

[App (App (Lam "y" (Var "y")) (Lam "z" (Var "z"))) (App (Lam "y" (Var "y")) (Lam "z" (Var "z"))),App (Lam "x" (App (Var "x") (Var "x"))) (Lam "z" (Var "z"))]

In [38]:
[e11_1,e11_2] = step e11

-- html . latex . texTm $ e11_1
-- html . latex . texTm $ e11_2

In [39]:
map (html . latex . texTm) (step e11_1)

In [40]:
[e11_1_1,e11_1_2] = step e11_1

-- html . latex . texTm $ e11_1_1
-- html . latex . texTm $ e11_1_2

In [41]:
map (html . latex . texTm) (step e11_1_1)

In [42]:
[e11_1_1_1, e11_1_1_2] = step e11_1_1

-- html . latex . texTm $ e11_1_1_1
-- html . latex . texTm $ e11_1_1_2

In [43]:
map (html . latex . texTm) (step e11_1_1_1)

In [44]:
map (html . latex . texTm) (step e11_1_1_2)

In [45]:
map (html . latex . texTm) (step e11_1_2)

In [46]:
[e11_1_2_1] = step e11_1_2

In [47]:
map (html . latex . texTm) (step e11_2_1)

: 

In [48]:
map (html . latex . texTm) (step e11_2)

In [49]:
[e11_2_1] = step e11_2

In [50]:
map (html . latex . texTm) (step e11_2_1)

In [51]:
[ezz] = step e11_2_1

html . latex. texTm $ ezz

<br>

위에서 살펴본 람다식 `e11`의 베타 줄이기 과정은 처치-로서 정리(Church-Rosser theorem)가 성립함을 한번 연습삼아 확인해 보는 예제였다.

그런데 이렇게 죽 나열된 코드로 설명하는 것보다 그림을 그려서 보면 이해하기 편하므로 결과를 아래와 같은 트리 구조로 나타내 보자.

```
(\x -> x x) ((\y -> y) (\z -> z))
|
+- (\y -> y) (\z -> z) ((\y -> y) (\z -> z))
|  |
|  +- (\z -> z) ((\y -> y) (\z -> z))
|  |  |
|  |  +- (\y -> y) (\z -> z)
|  |  |  |
|  |  |  `- \z -> z
|  |  |
|  |  `- (\z -> z) (\z -> z)
|  |     |
|  |     `- \z -> z
|  |
|  `- (\y -> y) (\z -> z) (\z -> z)
|     |
|     `- (\z -> z) (\z -> z)
|        |
|        `- \z -> z
|
`- (\x -> x x) (\z -> z)
   |
   `- (\z -> z) (\z -> z)
      |
      `- \z -> z
```

앞서 다른 강의 노트에도 활용한 `Data.Tree` 라이브러리의 rose tree를 활용해 `e11`을 나무의 뿌리(root)로 시작해 한 단계씩 뻗어나가는 그림을 그려보자.

`Data.Tree`에서는 대략 다음과 같은 하스켈 데이터 타입으로 tose tree 데이터 구조를 정의하고 있다.
```haskell
data Tree a = Node a [Tree a]
```

아래의 `treeByStep` 함수는 우리가 원하는 람다식(`Tm`)을 담고 있는 나무(`Tree Tm`)를 자동으로 만들어낸다.
그러니까 주어진 람다식을 한단계씩 줄이는 모든 가능한 경우의 나무구조를 만들어내는 함수이다.

In [52]:
import Data.Tree

treeByStep :: Tm -> Tree Tm
treeByStep e = Node e [treeByStep e' | e' <- step e]

In [53]:
-- 손으로 작성한 트리와 프로그램으로 만들어낸 트리가 같은지 확인해 보았다
treeByStep e11 == Node e11
                    [ Node e11_1
                        [ Node e11_1_1
                            [ Node e11_1_1_1
                                [ Node ezz [] ]
                            , Node e11_1_1_2
                                [ Node ezz [] ]
                            ]
                        , Node e11_1_2
                            [ Node e11_1_2_1
                                [ Node ezz [] ]
                            ]
                        ]
                    , Node e11_2
                        [ Node e11_2_1
                            [ Node ezz [] ]
                        ]
                    ]

True

In [54]:
e11                 -- 그냥 이렇게 보면 너무 장황하니까
putStrLn $ ppTm e11 -- 텍스트로 좀 간략하게 보여주는 함수 ppTm으로 출력

App (Lam "x" (App (Var "x") (Var "x"))) (App (Lam "y" (Var "y")) (Lam "z" (Var "z")))

(\x -> x x) ((\y -> y) (\z -> z))

In [55]:
:type ppTm

`Data.Tree` 에는 `String`을 원소로 하는 rose tree 즉 `Tree String`을 옆으로 누운 나무 모양으로 출력하는 것을 돕는 함수를 제공한다.

In [56]:
:type drawTree

In [57]:
tree12 = Node "a1"
           [ Node "b2"
              [ Node "e3" []
              , Node "f3" []
              ]
           , Node "c2"
              [ Node "g3" []
              , Node "h3"
                  [ Node "j4" []
                  , Node "k4" []
                  ]
              , Node "i3" []
              ]
           , Node "d2" []
           ]

In [58]:
drawTree tree12

"a1\n|\n+- b2\n|  |\n|  +- e3\n|  |\n|  `- f3\n|\n+- c2\n|  |\n|  +- g3\n|  |\n|  +- h3\n|  |  |\n|  |  +- j4\n|  |  |\n|  |  `- k4\n|  |\n|  `- i3\n|\n`- d2\n"

In [59]:
putStr $ drawTree tree12

a1
|
+- b2
|  |
|  +- e3
|  |
|  `- f3
|
+- c2
|  |
|  +- g3
|  |
|  +- h3
|  |  |
|  |  +- j4
|  |  |
|  |  `- k4
|  |
|  `- i3
|
`- d2

In [60]:
putStr $ drawTree (treeByStep e11) -- 하지만 이건 안된다! 왜 안되는지 에러 메시지를 보고 이유를 파악해 보라.

: 

In [61]:
:type drawTree
:type treeByStep e11
:type ppTm

#### 연습문제 05-06

`ppTm` 함수를 이용해 `Tree Tm`을 `Tree String`으로 변환하는 함수가 있다면 `treeByStep`의 결과를 `drawTree`에 맞는 타입의 트리로 바꿔줄 수 있다.

이러한 함수 `ppTree :: Tree Tm -> Tree String`을 정의하고 이를 이용해 `treeByStep e11`의 결과를 변환해 `drawTree`로 그려보라.

In [62]:
ppTree :: Tree Tm -> Tree String
ppTree (Node e ts) = undefined -- 여기에 작성

In [63]:
-- e11이 step으로 진행하는 모든 가능한 경로를 보여주는 트리를 ppTree 함수를 활용해 그려보라.