# Ch04. 조건문

ㅤ   
## 4.1 **중첩조건문** (Nested Conditional)

- 조건문 속에 또 다른 조건문이 존재한다. (if 블록)  

- 조건문끼리의 관계(논리)를 구분시킬 때 들여쓰기를 사용한다.

- 중첩 조건문이 많아질수록 가독성이 떨어지므로 더 나은 방법이 있다면 지양한다.

In [10]:
x = 3
y = 4

# 깔끔하지 않다.
if x == y:
    print("Bloack A")
else:
    if x < y:
        print("Block B")
    else:
        print("Block C")

        
# 깔끔하다!
if x == y:
    print("Block A")
elif x < y:
    print("Block B")
else:
    print("Block C")


Block B
Block B


- 0 < x < 10 조건을 이용해서 경우에 따른 코드 작성:

In [12]:
# 중첩 조건문 이용, 상대적으로 깔끔하지는 않다.
if x > 0:
    if x < 10:
          print('Satisfied')
    else:
          print('Nope')
else:
    print('Nope')

Satisfied


In [14]:
# 논리 연산자 이용, 상대적으로 깔끔하다.

# 방법 1.
if (x > 0) and (x < 10):
    print('Satisfied')
else:
    print('Nope')
          

# 방법 2. 파이썬만 가능.
if 0 < x < 10: 
    print('Satisfied')
else:
    print('Nope')


Satisfied
Satisfied


<br><br>
## 4.2 **논리연산자**

### **# 비교연산자와의 사용**

- 비교 연산자가 여러 번 사용될 때 편리하다.  
ex) **and, or, not**

    0 < x, x < 10 ㅤ  →ㅤ     0 < x and x < 10

    - A and B == A & B  
        A, B 모두 참이면 최종 결과는 참.    
    ㅤ    
    - A or B == A | B  
        A, B 둘 중 하나가 참이면 최종 결과는 참.  
    ㅤ   
        
    - not A  
        A가 참이면 최종 결과는 거짓. 반대로도 성립.  
              ㅤ  

- 비교 연산자를 사용할 때 가독성을 위해서 **괄호**를 쓰기도 한다.  
ex) (0 < x) and (x < 10)

In [26]:
A = True
B = False

print(f'"True" and "False" : {A & B}', end='\n\n')
print(f'"True" or "False" : {A | B}', end='\n\n')
print(f'not "True": {not A}')


"True" and "False" : False

"True" or "False" : True

not "True": False


<br><br>
## 4.3 **True / False**

- 참인지 확인하고 싶을 때,  
== 비교연산자는 비교하는 값 그 자체와 비교를 한다.

In [50]:
a = 10

# WRONG
if a == True:
    print('This will not be printed.')

    
# CORRECT
if bool(a) == True:
    print('Yes!')

if a:
    print('Yup!')

print()

Yes!
Yup!



In [57]:
print(10 == True)

print(1 == True)
print(0 == False)

False
True
True


<br><br>
## 4.4 **키워드 in**


- *membership operator*

- 요소가 포함되어 있는지 확인하고 싶을 때 사용한다.  
ex) A in B == A가 B에 포함되어 있는가?

- 비슷한 조건이 여러 번 반복될 때 사용 가능하다.  

### **# 모음, 자음 구분**

In [74]:
letter = 'z'

# if letter == 'a' or letter == 'e' , ... 비슷한 조건이 반복되고 있다.

if letter in ['a','e','i','o','u']:
    print("모음")
else:
    print("자음")

print()

자음



### **# 모음이 있는지 판별**

In [82]:
# 괄호를 안 씌울 시
word = 'vv'
if 'a' or 'e' or 'i' or 'o' or 'u' in word:
    print('ok')
else:
    print('false')

    
# 괄호를 씌우자!
word = 'vv'
if ('a' or 'e' or 'i' or 'o' or 'u') in word:
    print('ok')
else:
    print('false')


ok
false


<br><br>
## 4.5 **Walrus 연산자 :=**

- 할당과 테스트를 동시에 할 수 있게 도와주는 연산자이다.

In [10]:
diskDrive = [0,1,1,1]
totalSpace = 5

# 일반적인 방법
leftSpace = totalSpace - len(diskDrive)
if leftSpace > 0:
    print(f'You have {leftSpace} space left.')
else:
    print('Space is full!')


# Walrus :=
if (leftSpace := totalSpace - len(diskDrive)) > 0:  # 괄호를 씌워야지 leftSpace에 값(숫자)가 할당된다. 
    print(f'You have {leftSpace} space left.')      # 괄호를 안 씌우면 True가 담긴다.
else:
    print('Space is full!')


You have 1 space left.
You have 1 space left.


<br><br>
# Ch05. String

## 5.1 **문자열의 특성**

- 시스템에서 가장 작은 단위  

- **불변적**인 성격을 가진다.

In [12]:
# IMMUTABLE
movieName = 'Sord of the Rings'
movieName[0] = 'L'
print(movieName)

TypeError: 'str' object does not support item assignment

ㅤ     
- ''' 또는 """ 로 감싸면 주석 처리가 된다.

In [14]:
'''
This will not be shown.
'''
print('Hello!')

Hello!


ㅤ     
- ' ' 또는 " "로 감싸면 문자열로 인식을 한다.  

- str()로 형 변환을 할 수 있다.

In [16]:
a = 10
b = '10'
print(type(a), type(b))

a = str(a)
print(type(a))

<class 'int'> <class 'str'>
<class 'str'>


<br><br>
## 5.2 **Escape Sequence**

- 특수한 형태의 문자열.  
  눈에 보이는 대로 인식되지 않는다.  

- 형태: \문자  
    - `\n` : 다음 줄바꿈 (enter)  

    - `\t` : 탭
      
    - `\b` : 백스페이스 
      
    - `\'` : 따옴표 출력


- 이스케이프 문자를 있는 그대로 출력하고 싶을 때:  
  **raw string** 을 사용하자.

In [24]:
# PRINT ESCAPE SEQUENCE
# 1. Without raw string
sent = 'ice\\ncream'
print(sent)

# 2. With raw string
sent = r'pop\ncorn'
print(sent)

print()

# WITHOUT ANYTHING
sent = 'next\nsentence'
print(sent)


ice\ncream
pop\ncorn

next
sentence


<br><br>
## 5.3 **문자열 연산**

- String Concatenation
    - "+" => 공백 없이 결합하는 방법  
ㅤ   
- 곱하기
    - "*5 => 복제 ( + 연산을 연속으로 해준다.)


In [31]:
sound = 'clap'
print(sound + sound + sound)   # 공백없이 모두 달라붙는다.
print(sound * 3)

print()

print(sound * 3 + 'cough')    # 곱하기 연산은 + 연산보다 우선순위가 높아 먼저 적용된다.

clapclapclap
clapclapclap

clapclapclapcough


<br><br>
## 5.4 **Slicing**

: 추출하는 것과 유사
- 문자열의 일부분을 떼어내는 작업  

- [ 대괄호 ] 사용, 그 안에 offset 지정
- offset은 0부터 시작한다. 음수도 가능하다.  
    0 1 2 3  
    j a c k  
\-4ㅤ -1
- 형식: [시작:끝:스텝]
- 시작은 포함, 끝은 포함하지 않음 (이상 - 미만)
    - 시작이 0일 경우 0을 표시 안해도 된다.  
    ex) [ :3]  

    - 2칸씩 건너뛰고 싶을 경우:  
    ex) [ : :2]
    
    - 거꾸로 출력하고 싶을 경우:  
    ex) [ : :-1]

In [60]:
movie = 'Lord of the Rings'
string_length = len(movie)

# 공백도 문자로 판단한다.
print(movie)
print(f'Total characters: {string_length}', end='\n\n')  

# 1. 일부분 떼어내기:
print(movie[8:])

# 2. 
print(movie[::2])

# 3. 음수 인덱스는 문자열 끝에서부터 접근.
print(movie[-1])

# 4. 거꾸로 출력
print(movie[::-1])

Lord of the Rings
Total characters: 17

the Rings
Lr fteRns
s
sgniR eht fo droL


<br><br>
## 5.5 **NLTK (Natural Language ToolKit)**

- 자연어 분석을 위한 자연어처리 패키지  

- 자연어 처리를 위한 내장 함수, 기능들이 포함되어 있다.  
    ex) 토크나이즈, 파싱, 태킹, ...



- 토큰: 프로그래밍의 단어 단위
## I'm not a coward.
   - I'm / I, 'm / I, am  
   → 단어 구분이 애매하진다.  

   - 프로그램이 자연어를 어떻게 처리할 것인지 프로그래머가 정의

ㅤ  
### **# NLTK 설치 방법**

### 1 )

In [61]:
# !pip install nltk

### 2 )

In [None]:
import nltk                           # 가져오기
nltk.download('book', quiet = True)   # 부분적으로 다운받기

ㅤ    
### 3 ) 이제 import가 가능해집니다!

In [63]:
from nltk import book

*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908


ㅤ  
### **# 토큰 접근방법**

In [122]:
genesis = book.text3  # 변수에 따로 담아주고
genesis.tokens[:10]   # 10 단어들만 출력

['In',
 'the',
 'beginning',
 'God',
 'created',
 'the',
 'heaven',
 'and',
 'the',
 'earth']

ㅤ  
### **# 총 단어 개수 구하기**

In [72]:
len(genesis)

44764

ㅤ  
### **# 중복 없이 단어 개수 구하기**

In [111]:
len(set(genesis))   # list를 set으로 형 변환을 하게 되면 중복을 없애준다.

2789

ㅤ  
### **# Lexical Diversity**

In [112]:
len(set(genesis)) / len(genesis)   # 순수 단어들의 개수 / 총 단어 개수

0.06230453042623537

<br><br>
## 5.6 **List와 Set**

- list
    - ex) ['string', a, False]  

    - 순서가 존재한다.
    - 중복이 허용된다.
    - 리스트로 형 변환을 하기 위해서는 list()를 사용한다.
- set
    - ex) {'a', 2, True}  

    - 순서가 없다.
    - 중복이 허용되지 않는다.
    - 세트로 형 변환을 하기 위해서는 set()를 사용한다.
    - 수학의 집합 개념과 유사하다.
    - 인덱싱이 불가하다.
    

ㅤ  
### **# 순서의 존재**

In [101]:
# LIST
icecream = ['mint', 'choco', 'berry']                  # 출력 결과와 순서가 동일하다.
print(icecream)

print()

# SET
mixer = {'oreo', 'milk', 'ice', 'vanilla', 'cream'}    # 출력 결과와 순서가 다르다.
print(mixer)


['mint', 'choco', 'berry']

{'ice', 'milk', 'vanilla', 'oreo', 'cream'}


ㅤ  
### **# 중복의 허용**

In [104]:
# LIST
icecream = ['mint', 'choco', 'choco', 'berry']          # 중복 허용
print(icecream)

print()

# SET
mixer = {'oreo', 'ice', 'ice', 'ice', 'cream'}          # 중복 허용 X
print(mixer)

['mint', 'choco', 'choco', 'berry']

{'ice', 'cream', 'oreo'}


ㅤ  
### **# 형 변환**

In [108]:
icecream = ['mint', 'choco', 'choco', 'berry']          # choco가 2개였는데 1개로 줄어든다.
print(set(icecream))

{'berry', 'mint', 'choco'}


ㅤ  
### **# 오름차순, 내림차순 정렬**

In [134]:
mixer = {'oreo', 'milk', 'ice', 'vanilla', 'cream'}

print(sorted(mixer))                                    # 오름차순 정렬
print(sorted(mixer, reverse = True))                    # 내림차순 정렬

['cream', 'ice', 'milk', 'oreo', 'vanilla']
['vanilla', 'oreo', 'milk', 'ice', 'cream']


ㅤ  
### **# NLTK에서의 정렬**

- 아스키코드표를 보면  
문장부호 -> 숫자 -> 대문자 -> 소문자 순으로 정렬되어 있다.  

- 정렬을 시키고, 10개를 추출하는 방식:

In [137]:
# from nltk import book

genesis = book.text3
sorted(set(genesis))[:10]   # genesis에서 중복 단어들을 제거한 후, 정렬을 시킨 후 슬라이싱

print()




In [135]:
sorted(set(genesis), reverse = True)[:10]   # reverse를 넣으면 소문자부터 출력이 되는 것을 확인할 수 있다.

['youth',
 'yourselves',
 'your',
 'youngest',
 'younger',
 'younge',
 'young',
 'you',
 'yonder',
 'yoke']

ㅤ    
- 원본에서 먼저 10개를 추출하고, 정렬을 시킬 수 있다.

In [136]:
sorted(genesis[:10])

['God',
 'In',
 'and',
 'beginning',
 'created',
 'earth',
 'heaven',
 'the',
 'the',
 'the']

ㅤ 
## 5.7 *Review*

### # Quiz 1
- 윤년을 구해봅시다. 

    - 연도 입력받는다
    - 4로 나눠지면 윤년
    - 100으로 나눠지면 안된다.
    - 400으로 나눠지면 윤년  


- 출력: {}년은 윤년입니다. / '-아닙니다.'

In [139]:
year = int(input("연도:"))

if (year % 4 == 0) and ((year % 100 != 0) or (year % 400 == 0)):
        print(f'{year}년은 윤년입니다.')
else:
    print(f'{year}년은 윤년이 아닙니다.')

연도: 2020


2020년은 윤년입니다.


ㅤ   
### # Quiz 2
- text6 가져와서 토큰을 변수에 담고  

- 중복 없는 셋으로 저장하고 내림차순
    - 앞에서 10개 단어 출력
    - 단어에 z가 있으면 대문자로 바꾸시오
    - z가 없는데 4자 이상이면 끝 글자를 대문자로 바꾸라.

In [143]:
# from nltk import book
book_python = sorted(set(book.text6.tokens))[::-1]
book_python = book_python[:10]

for word in book_python:
    wordList = list(word)
    
    if 'z' not in wordList and len(wordList) >= 4:
        wordList[-1] = chr(ord(wordList[-1]) - 32)
    else:
        for i in range(len(wordList)):
            if wordList[i] == 'z':
                wordList[i] = 'Z'

    print(*wordList, sep='')

Zoosh
Zoop
Zoo
Zone
Zhiv
yourselF
yourS
youR
younG
you


ㅤ   
### # Quiz 3
- 주민번호, 휴대폰 번호, 이메일 주소 입력 받는다.  

- 주민번호, 휴대폰 번호는 숫자만 입력받는다. (-없이)
- 이메일 주소는 아이디만 입력받는다.  
    -1. "당신은 {}년 {}월 {}일 출생의 {남성/여성} 입니다."  
    -2. 휴대폰 번호: 000-0000-0000  
    -3 이메일 주소: xxxx@gmail.com  

In [148]:
registerNum = input('주민번호를 입력하세요:')
phoneNum = input('휴대폰 번호를 입력하세요:')
email = input('이메일 주소를 입력하세요:')

birthYear = registerNum[:2]
birthMonth = int(registerNum[2:4])
birthDate = int(registerNum[4:6])

if int(registerNum[6]) % 2 == 0:
    gender = '여성'
else:
    gender = '남성'

print(f'''
당신은 {birthYear}년 {birthMonth}월 {birthDate}일 출생의 {gender} 입니다.
휴대폰 번호: {phoneNum[:3]}-{phoneNum[3:7]}-{phoneNum[7:]}
이메일 주소: {email}@gmail.com
''')

주민번호를 입력하세요: 9811112111111
휴대폰 번호를 입력하세요: 01012345678
이메일 주소를 입력하세요: frodo



당신은 98년 11월 11일 출생의 여성 입니다.
휴대폰 번호: 010-1234-5678
이메일 주소: frodo@gmail.com

