# 01 준비(Preleminaries)

----
## 1.1 표기관례(Notational Conventions)
* 기호(symbol)는 알파벳 앞쪽 글자로: $a$, $b$, $c$, $d$, $\ldots$
* 문자열(string)은 알파벳 뒤쪽 글자로: $\ldots$, $u$, $v$, $w$, $x$, $y$, $z$
* 집합(set)은 알파벳 대문자 및 $\Sigma$, $\Gamma$로
* 문자열 $x$의 길이는 $|x|$로
* $\epsilon$은 빈 문자열(null string)을 나타낸다
* $x^i$는 문자열 $x$가 $i$번 반복된 문자열을 나타낸다
* $x^R$은 문자열 $x$의 역순 문자열을 나타낸다

보기(example): $(ab)^1 = ab$, $(ab)^0 = \varepsilon$, $(ab)^3 = ababab$, $(abcd)^R = dcba$

위 보기의 내용을 하스켈(Haskell) 프로그램으로 작성해서 아래와 같이 실행해 볼 수 있다.
아래 하스켈 프로그램이 정확히 무슨 의미인지는 나중에 차차 설명하기로 하자.

In [1]:
ε = ""
s .^ n = concat (replicate n s)

x = "ab"
y = "abcd"

In [2]:
ε
x.^0
x.^1
x.^2
x.^3
reverse x

""

""

"ab"

"abab"

"ababab"

"ba"

----
###### 복합기호(composite symbols)
알파벳 개수가 한정되어 있기도 하므로 계속 새로운 알파벳 글자를 쓸 수만은 없다.
또한 너무 여러 종류의 알파벳 글자를 쓰는 것이 혼란스럽고 비슷한 성질의 관련된 여러 대상을 한 알파벳에 첨자나 기호를 덧붙여 나타내기도 한다.
또 여러 개의 기호를 일렬로 나열하여 묶어 하나의 기호처럼 사용하기도 한다.

Example: $q'$, $q_0$, $q_1$, $q_2$, $q_{ab}$, $A_5$, $[a, b]$, $[1, 5, 3]$

----
##### 집합을 명시하기(set specification)
* 원소나열법 (sets defined by enumeration)
    * $A = \{2,8\}$
    * $\mathbb{N} = \{0,1,2,3,\ldots\}$
    * $B = \{0,2,4,6,\ldots\}$
    * $\Sigma = \{a,b,c\}$
    * $\varnothing=\{\}$
* 조건제시법 (sets defined by a predicate):
    * $B = \{n \mid n\in\mathbb{N},~ \text{$n$은 짝수}\} = \{2\times n \mid n\in\mathbb{N}\}$
    * $C = \left\{xx^R \mid \text{$x$는 0과 1로만 이루어진 문자열},~|x|>0\right\}
         = \left\{xx^R \mid x\in\{0,1\}^{*}, |x|>0 \right\}
         = \left\{xx^R \mid x\in\{0,1\}^{+} \right\}$
    * $D = \{a^n b^n c^n \mid n\in\mathbb{N}, n\ge 0\} = \{a^n b^n c^n \mid n\ge 0\}$

하스켈(Haskell)로 $n$이 1,2,3인 경우에 대해 $a^nb^nc^n$을 아래와 같이 계산해 볼 수 있다.

In [4]:
"a".^1 ++ "b".^1 ++ "c".^1
"a".^2 ++ "b".^2 ++ "c".^2
"a".^3 ++ "b".^3 ++ "c".^3

"abc"

"aabbcc"

"aaabbbccc"

하스켈로 집합 $D$를 조건제시법으로 다음과 같이 정의할 수 있다.
집합 $D$를 정의하기에 앞서 하스켈로 $\mathbb{N}$을 원소나열법으로 정의하였다.

In [5]:
_N = [0,1..]
_D = ["a".^n ++ "b".^n ++ "c".^n | n <- _N, n >= 0]

하스켈로 $\mathbb{N}$이나 $D$같은 무한집합 전체를 다 계산해 내려면 계산이 끝나지 않는다. 그래서 맨 앞의 원소 몇개만 살펴보는 하스켈 프로그램을 다음과 같이 작성할 수 있다.

In [6]:
take 3 _N
take 5 _N
take 3 _D
take 5 _D

[0,1,2]

[0,1,2,3,4]

["","abc","aabbcc"]

["","abc","aabbcc","aaabbbccc","aaaabbbbcccc"]

----
##### 문자열 집합 연산(operations on sets of strings)
$A = \{aa, ab, abc\}$, $B = \{aa, bc\}$에 대한 집합연산(set operations)으로 다음과 같은 것들이 있다.
* 합집합(union): $A \cup B = \{aa, ab, bc, abc\}$
* 교집합(intersection): $A \cap B = \{aa\}$
* 차집합(subtraction):
    * $A - B = \{aa, abc\}$, $B - A = \{bc\}$
    * $A \setminus B = \{aa, abc\}$, $B \setminus A = \{bc\}$
* 배타적 합집합(exclusive union) 또는 대칭적 차집합(symmetric difference)
    * $A \oplus B = \{aa, abc\}$
    * $A \mathop{\triangle} B = \{aa, abc\}$
* 곱집합(product):
  $A \cdot \textcolor{red}{B}
    = A \, \textcolor{red}{B}
    = \{aa\textcolor{red}{aa}, aa\textcolor{red}{bc},
        ab\textcolor{red}{aa}, ab\textcolor{red}{bc},
        abc\textcolor{red}{aa}, abc\textcolor{red}{bc}\}$
* 여집합(complement):
  $\Sigma$는 사용 가능한 모든 기호(symbol)의 집합을 나타낸다.
  $\Sigma = \{a,b,c\}$라 할 때, $A$의 여집합 $\overline{A} = \Sigma^{*} - A = \{a,b,c\}^{*} - \{aa,ab,abc\}$

하스켈로 합집합, 교집합, 차집합을 다음과 같이 계산한다.

In [10]:
import Data.List

_A = ["aa","ab","abc"]
_B = ["aa","bc"]

_A `union` _B
_A `intersect` _B
_A \\ _B
_B \\ _A

["aa","ab","abc","bc"]

["aa"]

["ab","abc"]

["bc"]

하스켈로 배타적 합집합(대칭적 차집합)을 다음과 같이 두 가지 방식으로 계산해 볼 수 있다.

In [11]:
(_A `union` _B) \\ (_A `intersect` _B)
(_A \\ _B) `union` (_B \\ _A)

["ab","abc","bc"]

["ab","abc","bc"]

하스켈로 곱집합을 다음과 같이 계산해 볼 수 있다.

In [12]:
[x ++ y | x <- _A, y <- _B]

["aaaa","aabc","abaa","abbc","abcaa","abcbc"]

아래와 같이 하스켈로 $A$의 여집합(complement) 앞부분 일부, 좀더 자세히는 $A$의 여집합 중 길이 3이하인 문자열로 이루어진 집합을 계산해 볼 수 있다.

In [13]:
_Σ = ["a","b","c"]

_Σ0 = [ε]
_Σ1 = _Σ
_Σ2 = [x ++ y | x <- _Σ, y <- _Σ1]
_Σ3 = [x ++ y | x <- _Σ, y <- _Σ2]

In [14]:
_Σ0
_Σ1
_Σ2
_Σ3

[""]

["a","b","c"]

["aa","ab","ac","ba","bb","bc","ca","cb","cc"]

["aaa","aab","aac","aba","abb","abc","aca","acb","acc","baa","bab","bac","bba","bbb","bbc","bca","bcb","bcc","caa","cab","cac","cba","cbb","cbc","cca","ccb","ccc"]

In [64]:
(_Σ0 `union` _Σ1 `union` _Σ2 `union` _Σ3) \\ _A

["","a","b","c","ac","ba","bb","bc","ca","cb","cc","aaa","aab","aac","aba","abb","aca","acb","acc","baa","bab","bac","bba","bbb","bbc","bca","bcb","bcc","caa","cab","cac","cba","cbb","cbc","cca","ccb","ccc"]

위에서 계산된 집합에 $\Sigma$로부터 만들어낼 수 있는 길이 4이상의 모든 문자열을 추가한 집합이 바로 $\overline{A}$이다.

추가로 두 가지 닫힘(closure) 연산에 대해 알아보자.

* 클리니 닫힘(Kleene closure) 혹은 반사 전이 닫힘(reflexive transitive closure):
  $A$의 클리니 닫힘 $A^*$는 $A$에 속한 문자열을 임의의 회수(0회 포함)만큼 선택하여 (같은 문자열 여러 번 선택 가능) 이어붙여(concatenate) 만들 수 있는 모든 문자열의 집합을 나타낸다.
* 전이 닫힘(transitive closure)
  $A$의 전이 닫힘 $A^+$는 $A$에 속한 문자열을 1회 이상 임의의 회수만큼 선택하여 (같은 문자열 여러 번 선택 가능) 이어붙여(concatenate) 만들 수 있는 모든 문자열의 집합을 나타낸다. 즉, $A^+ = A^* - \{\varepsilon\}$

마지막으로 멱집합에 대해 알아보자.
* 멱집합(powerset) 혹은 지수집합: $2^A$는 $A$의 모든 부분집합으로 이루어진 집합이다.

보기(example): $2^{\{a,b,c\}} = \{\varnothing, \{a\}, \{b\}, \{a,b\}, \{a,c\}, \{b,c\}, \{a,b,c\}\}$

In [15]:
-- 멱집합을 계산하는 하스켈 프로그램도 작성해 볼 수 있지만 그것은 조금 더 많은 함수형 프로그래밍 배경지식이 필요하므로 기회가 되면 다시 해보겠습니다.

## 1.2 증명법(Proof Techniques)
책에 있는 내용을 따라가도록 하겠습니다.