# 줄리아를 생각하다(Think Julia)

## Chapter 9. 사례 연구: 단어로 놀기

### 9.1 단어 목록 읽기

* 그레이디 워드(grady word): 모비 어휘 목록 프로젝트의 일환으로 퍼블릭 도메인으로 배포한 단어 목록 중 하나

    * 113,809개 공식 십자말풀이 단어로서 십자말풀이 퍼즐이나 기타 다른 단어 게임의 유요한 답으로 사용할 수 있다고 인정되는 단어들
    
    * 원저자의 깃허브에서 간단한 txt 파일로 준비된 words.txt 파일을 다운로드 할 수 있음(https://github.com/BenLauwens/ThinkJulia.jl)

**(open)** 줄리아의 내장 함수 ```open``` 함수를 이용하여 데이터 불러오기

    (내장 항수 open은 파일명을 매개변수로 받아 파일 스트림(file stream)을 반환함)

In [1]:
fin = open("./data/words.txt")

IOStream(<file ./data/words.txt>)

**fin** 은 입력을 받기 위해 사용하는 파일 스트림임. 더 이상 필요하지 않으며, **close(fin)** 을 호출해서 닫아주어야 함

**(readline)** 개행문자(newline)가 나올때까지 문자들을 읽어 문자열로 반환하는 readline 함수 이용

In [2]:
readline(fin)

"aa"

In [3]:
readline(fin)

"aah"

words.txt 파일 내 단어를 확인하고자 한다면

```julia
for line in eachline("./data/words.txt")
    println(line)
end
```

for문을 실행하여 113,809개의 단어를 확인할 수 있음 -> REPL 또는 VScode에서 실행하기를 권장함

![image.png](capture_and_drawing/test3.png)

#### 연습 9-1
**words.txt 파일을 읽어서 길이가 20글자 이상인 단어만 출력하는 프로그램을 작성하시오.**

```julia

    i = 1 # 초기화

    for line in eachline("./data/words.txt")
        if length(line) >= 20
            println(i,": ", line)
        end
        i = i + 1
    end
    
```



In [5]:
i = 0 # 초기화

 for line in eachline("./data/words.txt")
    i = i + 1
    if length(line) >= 20
        println(i,": ", line)
    end
end

21685: counterdemonstration
21686: counterdemonstrations
21688: counterdemonstrators
47409: hyperaggressivenesses
47440: hypersensitivenesses
60406: microminiaturization
60407: microminiaturizations
83488: representativenesses


#### 연습 9-2

**주어진 단어에 글자 e가 없으면 true를 반환하는 hasno_e 함수를 작성하고 e가 없는 단어만 출력하시오.**
             (e가 없는 단어의 비율도 함께 구하시오.)


 *_약 3만개 이상의 단어가 출력되므로 REPL 내지 VS 코드에서 실행하는 것을 권장함_

```julia

# 연습 9-2

function hasno_e(word)
    for letter in word
        if letter == 'e'
            return false
        end
    end
    true
end

i = 0
j = 0

for line in eachline("./data/words.txt")
    i = i + 1
    if hasno_e(line)
        println(i,": ", line)
        j = j + 1
    end
end

println("The ratio of hasno_e is ", round(j/i; digits = 3)*100, "%")
    
```

![image.png](./capture_and_drawing/chapter9_2.png)

#### 연습 9-3

**어떤 단어와 금지 문자로 구성된 문자열을 받아서, 그 단어가 금지 문자를 포함하지 않으면 true를 반환하는 avoids 함수 작성**
         
  (금지 문자로 구성된 문자열을 입력받고 금지 문자를 포함하지 않는 단어의 개수를 출력)
              

In [7]:
# 연습 9-3

function avoids(word, forbidden)
    for letter in word
        if letter ∈ forbidden
            return false
        end
    end
    true
end

# 초기화
i = 0
j = 0
str_forbid = "aeiou"

for line in eachline("./data/words.txt")
    i = i + 1
    if avoids(line, str_forbid )
        println(i,": ", line)
        j = j + 1
    end
end

println("The ratio of 'avoids' : ", round(j/i; digits = 3)*100, "%")
println("The counts of 'avoids' : ", j, "")

13350: by
13378: byrl
13381: byrls
13386: bys
22927: crwth
22928: crwths
22929: cry
22946: crypt
22954: crypts
23606: cwm
23607: cwms
23750: cyst
23762: cysts
29670: dry
29682: dryly
29687: drys
37430: fly
37443: flyby
37444: flybys
37459: flysch
39066: fry
40825: ghyll
40826: ghylls
41566: glycyl
41567: glycyls
41568: glyph
41570: glyphs
43392: gym
43402: gyms
43424: gyp
43429: gyps
43436: gypsy
47377: hymn
47392: hymns
47399: hyp
47535: hyps
57627: lymph
57635: lymphs
57637: lynch
57644: lynx
63829: my
63922: myrrh
63924: myrrhs
63950: myth
63960: myths
65918: nth
66164: nymph
66176: nymphs
73159: phpht
73178: pht
74720: ply
77981: pry
78029: psst
78030: psych
78072: psychs
78742: pygmy
78840: pyx
84994: rhythm
84999: rhythms
86553: rynd
86554: rynds
89774: sh
90250: shh
90865: shy
90874: shyly
91868: sky
92463: sly
92467: slyly
94961: spry
94964: spryly
95039: spy
96951: sty
96997: stymy
98920: sylph
98925: sylphs
98926: sylphy
98989: syn
99000: sync
99006: synch
99017: synchs
99033

#### 연습 9-4

**어떤 단어와 금지 문자로 구성된 문자열을 입력 받아서, 단어가 문자열에 있는 글자로만 이루어져 있으면 true를 반환하는 useonly 함수 작성**

**
         
  (허용된 글자 acefhlo, 단, "Hoe alfalfa"는 제외)


In [8]:
# 연습 9-4

function useonly(word, available)
    for letter in word
        if letter ∉ available
            return false
        end
    end
    true
end

i = 0
j = 0
str_accept = "acefhlo"

for line in eachline("./data/words.txt")
    i = i + 1
    if useonly(line, str_accept )
        if line != "Hoe alfalfa"
            # println(i,": ", line)
            j = j + 1
        end
    end
end

println("The ratio of 'useonly' : ", round(j/i; digits = 3)*100, "%")
println("The counts of 'useonly' : ", j, "")

The ratio of 'useonly' : 0.2%
The counts of 'useonly' : 188


#### 연습 9-5

**어떤 단어와 금지 문자로 구성된 문자열을 입력 받아서, 단어가 문자열에 있는 모든 글자를 한 번 이상 사용하면 true를 반환하는 useall 함수 작성**
         
  (모든 모음 aeiou를 사용하는 단어는 몇 개 인가?)


In [9]:
# 연습 9-5 

function useall(word, required)
    for letter in required
        if letter ∉ word
            return false
        end
    end
    true
end

i = 1
j = 0
str_required = "aeiou"

for line in eachline("./data/words.txt")
    if useall(line, str_required )
        # println(i,": ", line)
        j = j + 1
    end
    i = i + 1
end

println("The ratio of 'useall' : ", round(j/i; digits = 3)*100, "%")
println("The counts of 'useall' : ", j, "")

The ratio of 'useall' : 0.5%
The counts of 'useall' : 598


---

**기해결 문제로의 환원(reduction to a previously solved problem)**

useall 함수가 직전에 풀었던 문제의 한 가지 경우라고 눈치챌 경우, 아래와 같이 useonly 함수를 이용할 수 있음 

해결하고자 하는 문제가 이미 해결한 문제의 한 경우임을 인식하고, 존재하는 해법을 적용하는 것을 

**'기해결 문제로의 환원'** 이라고 함

```julia

# 연습 9-4 useonly 함수를 이용해 연습 9-5를 해결할 경우

function useall(word, required)
    useonly(required, word)
end
```
---


#### 연습 9-6

**단어의 글자들이 알파벳 순서로 되어 있으면 true를 반환하는 isabecedarian 함수의 작성**
         
  (같은 글자가 연달아 있는 것도 허용함. 글자가 알파벳 순서인 단어의 개수는?)


In [11]:
# 연습 9-6

# for문을 이용할 경우
function isabecedarian_for(word)
    i = firstindex(word)
    previous = word[i]
    j = nextind(word,i)
    for c in word[j:end]
        if c < previous
            return false
        end
        previous = c
    end
    true
end

# 재귀문을 이용할 경우
function isabecedarian_recur(word)
    if length(word) <= 1
        return true
    end
    i = firstindex(word)
    j = nextind(word, i)

    if word[i] > word[j]
        return false
    end
    isabecedarian_recur(word[j:end])
end

# while문을 이용할 경우
function isabecedarian_while(word)
    i = firstindex(word)
    j = nextind(word, 1)

    while j <= sizeof(word)
        if word[i] > word[j]
            return false
        end

        i = j
        j = nextind(word, i)
    end
    true
end

# while문을 이용한 checking

i = 0
j = 0

for line in eachline("./data/words.txt")
    
    i = i + 1

    if isabecedarian_while(line)
        # println(i,": ", line)
        j = j + 1
    end

end

println("The ratio of 'abecedarian' : ", round(j/i; digits = 3)*100, "%")
println("The counts of 'abecedarian' : ", j, "")
println(isabecedarian_while("flossy"))

The ratio of 'abecedarian' : 0.5%
The counts of 'abecedarian' : 596
true


### 9.6 용어집

* **파일 스트림(file stream)**

    * 열린 파일을 표시하는 값


* **기해결 문제로의 환원(reduction to a previously solved problem)**

    * 문제를 기존에 해결된 문제의 한 경우로 표현해서 해결하는 풀이 방법


* **특이사례(special case)**

    * 평범하지 않거나, 비자명한(그래서 제대로 처리되지 않기 쉬운) 시험 사례