## 논리연산자
- 비교연산자가 여러 번 사용될 때 사용
- 종류
    - `(A) and (B)`: A도 참이고, B도 참일 때 True
    - `(A) or (B)`: A나 B, 둘 중 하나만 참이어도 True
    - `not (A)`: A의 반대의 논리값
- 비교연산자를 이용한 식에서 괄호는 가독성을 높임 (optional)

## 중첩조건문
- nested conditional
- if 실행 코드 부분에 또다른 if
- 들여쓰기 주의하기

### 중첩조건문 피하기
- 중첩조건문은 복잡해지기 쉽기 때문에 가능한 피하는 것이 좋음
- 논리연산자(and, or 등) 사용
- 부등호 사이에 넣기

In [2]:
# 중첩조건문 1
x = 0
y = 1

if x == y:
    print("Block A")
else:
    if x < y:
        print("Block B")
    else:
        print("Block C")

# 단순조건문으로 수정
x = 0
y = 1

if x == y:
    print("Block A")
elif x < y:
    print("Block B")
else:
    print("Block C")

Block B
Block B


In [11]:
# 중첩조건문 2
x = 3

if x < 10:
    if 5 <= x:
        print("Block A")
    else:
        print("Block B")
else: print("Block B")

# 단순조건문으로 수정: 방법 1
x = 3

if (x >= 5) and (x < 10):
    print("Block A")
else:
    print("Block B")
    
# 단순조건문으로 수정: 방법 2
x = 3

if 5 <= x < 10:
    print("Block A")
else:
    print("Block B")

Block B
Block B
Block B


### True / False
- 만약 a가 참이라면
--> `a = True`

In [29]:
a = 10

if a:
    print('True')

"""
if a == True:
    print('True')
처럼 쓰지 말기
"""

True


"\nif a == True:\n    print('True')\n처럼 쓰지 말기\n"

### in
- membership operator
- 어떤 요소가 그 안에 있는지 확인하고 싶을 때
- 비슷한 조건이 여러 번 반복될 때

#### 예시: 어떤 letter가 모음인지 확인하고 싶을 때
- 논리연산자를 사용한 코드를 `in`을 사용하여 수정해보자

In [33]:
# 논리연산자 사용
letter = 'k'

if letter == 'a' or letter == 'e' or letter == 'i' or letter == 'o' or letter == 'u':
    print("Yes")
else:
    print("No")

# `in` 사용
letter = 'k'

if letter in ['a', 'e', 'i', 'o', 'u']: # 리스트 요소에 letter와 일치하는 것이 있는가
    print("Yes")
else:
    print("No")

No
No


어떤 문자열에 모음이 있는지 확인하는 코드를 `in`을 사용하여 짜기

In [45]:
string_1 = 'abcd'

if ('a' or 'e' or 'i' or 'o' or 'u') in string_1:
    print("Yes")
else: print("No")

Yes


### 바다코끼리 연산자
- walrus operator
- 할당과 테스트를 동시에 하는 기능
- 길이를 줄이기 좋음
- `:=`

예시:

In [46]:
tweet_limit = 200
tweet_string = 'blah' * 50
tweet_string

'blahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblahblah'

바다코끼리 연산자를 쓰지 않았을 때

In [48]:
diff = tweet_limit - len(tweet_string)
if diff > 0:
    print("가능")
else: print("불가능")

불가능


바다코끼리 연산자를 썼을 때

In [52]:
if diff := tweet_limit - len(tweet_string) > 0:
    print("가능")
else: print("불가능")

불가능


### Quiz
- 윤년을 구하는 코드를 짜보자
    - 연도가 4로 나눠떨어지면 윤년
    - 100으로 나눠떨어지면 안된다
    - 400으로 나눠떨어지면 된다
- year를 입력받는다.
- '{}년은 윤년입니다.' / "{}년은 윤년이 아닙니다."

In [61]:
year = int(input('연도를 입력하세요:'))

연도를 입력하세요: 4800


In [62]:
if (year % 4 == 0) and ((year % 100 != 0) or (year % 400 == 0)):
    print(f'{year}년은 윤년입니다.')
else: print(f'{year}년은 윤년이 아닙니다.')

4800년은 윤년입니다.


## String \ 문자열
- str type
- 시스템에서 가장 작은 단위
- 불변적인 성격 (immutable)
    - 'abce'가 있을 때, b를 a로 바꿀 수 없음
- 문법: `'`이나 `"`으로 감싸기
    - 예: '24'
- `'''` or `"""`으로 주석 가능
- 형 변환은 `str()`

### 문자열의 연산
- `+`: 붙이기
    - 공백 없음
- `*`: 복제하기

### Slicing
- 지정 범위의 문자열을 추출하는 것
- 문법: `[offset]`
    - `[start:end:step]`
- 오프셋은 0부터 시작
    - 역순일 경우 -1부터 시작
- start는 포함(크거나 같다), end는 불포함(작다)
- 0일 경우 생략한다
    - ~4까지 출력 --> [:5]
    - 처음부터 끝까지 2스텝씩 --> [::2]
    - 처음부터 끝까지 역순 --> [::-1]

In [85]:
sent = 'Hello there!'
print(sent)

# 2번 글자 출력
print(sent[1])

# 3번 글자 출력(end 포함)
print(sent[3:4])

# 1번 글자부터 4번 글자까지 출력
print(sent[:4])

# 첫 글자부터 마지막 글자까지 2스텝으로 출력
print(sent[::2])

# 첫 글자부터 마지막 글자까지 역순으로 출력
print(sent[::-1])

Hello there!
e
l
Hell
Hlotee
!ereht olleH


#### 참고: `set`과 `list`
- `set`
    - `{a, b, c, ...}`
    - 중복 불가능
    - 집합의 개념
    - 순서 없음 -> 슬라이싱 불가
- `list`
    - `[a, b, c, ...]`
    - 중복 가능
    - 순서 있음 -> 슬라이싱 가능

### length
- 길이를 세는 함수
- 문법: `len()`
- 공백까지 포함

## Escape character \ 이스케이프 문자
- 눈에 보이는 대로 인식되지 않는 문자열
- 문법: `\<character>`
- 종류
    - `\n`: new line
    - `\t`: tap
    - `\b`: back space
    - `\'`: single quote을 문자열 그대로 인식하게 해줌
- print 함수를 쓰지 않으면 형태가 출력은 된다.
- `\n`을 그대로 출력하려면?
    - \\n
    - r'\n' (raw string: 원시 문자를 반환)
- 문자열을 바꾸는 것이 아니라 표면 상의 형태를 바꾸는 것

In [75]:
sent = 'Hello world, Im Haechan.'
print(sent)

sent = 'Hello world, \nIm Haechan.'
print(sent)

sent = 'Hello world,\b Im Haechan.'
print(sent)

sent = 'Hello world, I\'m Haechan.'
print(sent)

Hello world, Im Haechan.
Hello world, 
Im Haechan.
Hello world Im Haechan.
Hello world, I'm Haechan.


## NLTK
- Natural Language Toolkit
- 교육용으로 개발된 자연어처리 패키지
- 분석된 코퍼스 제공
    - 토크나이즈, 파싱, 테깅, ...

In [87]:
# 설치하기
!pip install nltk



In [89]:
# 가져오기
import nltk
nltk.download('book', quiet=True)

True

In [92]:
# book 가져오기
from nltk import book

In [93]:
# text 접근하기
moby = book.text1

In [95]:
# text1의 토큰에 접근하기
moby.tokens

['[',
 'Moby',
 'Dick',
 'by',
 'Herman',
 'Melville',
 '1851',
 ']',
 'ETYMOLOGY',
 '.',
 '(',
 'Supplied',
 'by',
 'a',
 'Late',
 'Consumptive',
 'Usher',
 'to',
 'a',
 'Grammar',
 'School',
 ')',
 'The',
 'pale',
 'Usher',
 '--',
 'threadbare',
 'in',
 'coat',
 ',',
 'heart',
 ',',
 'body',
 ',',
 'and',
 'brain',
 ';',
 'I',
 'see',
 'him',
 'now',
 '.',
 'He',
 'was',
 'ever',
 'dusting',
 'his',
 'old',
 'lexicons',
 'and',
 'grammars',
 ',',
 'with',
 'a',
 'queer',
 'handkerchief',
 ',',
 'mockingly',
 'embellished',
 'with',
 'all',
 'the',
 'gay',
 'flags',
 'of',
 'all',
 'the',
 'known',
 'nations',
 'of',
 'the',
 'world',
 '.',
 'He',
 'loved',
 'to',
 'dust',
 'his',
 'old',
 'grammars',
 ';',
 'it',
 'somehow',
 'mildly',
 'reminded',
 'him',
 'of',
 'his',
 'mortality',
 '.',
 '"',
 'While',
 'you',
 'take',
 'in',
 'hand',
 'to',
 'school',
 'others',
 ',',
 'and',
 'to',
 'teach',
 'them',
 'by',
 'what',
 'name',
 'a',
 'whale',
 '-',
 'fish',
 'is',
 'to',
 'be',
 

In [101]:
# 중복 단어 제거 후 나열하기 (`set`이 중복 불가능함을 이용)
print(set(moby.tokens))



In [109]:
# 오름차순 정렬하기
print(sorted(set(moby.tokens)))



In [110]:
# 내림차순 정렬하기
print(sorted(set(moby.tokens), reverse=True))



In [112]:
# 내림차순 정렬 후 상위 10개만 추출하기
print(sorted(set(moby.tokens), reverse=True)[:10])

['zoology', 'zones', 'zoned', 'zone', 'zodiac', 'zig', 'zephyr', 'zeal', 'zay', 'zag']


In [106]:
# 총 길이 구하기
print(len(moby.tokens))

# 중복 제거한 총 길이 구하기
print(len(set(moby.tokens)))

260819
19317


In [107]:
# lexical diversity(어휘의 다양성) 구하기
print(len(set(moby.tokens)) / len(moby.tokens))

0.07406285585022564


## Quiz 1.
- text9에서 lexical diversity 계산하기
- text6에서 중복없이 내림차순 정렬하기
    - a. 앞에서 단어 10개 추출하기
    - b. 'z'가 있으면 대문자로 바꾸기, 'z'가 없는데 4자 이상이면 끝 글자 대문자로 바꾸기 (조건문 연습)

In [33]:
!pip install nltk
import nltk
nltk.download('book', quiet=True)
from nltk import book



In [34]:
# Quiz 1-1
text9 = book.text9
text9.tokens

print(len(set(text9.tokens)) / len(text9.tokens))

0.0983485761345412


In [36]:
# Quiz 1-2
text6 = book.text6
text6.tokens

# a
print(sorted(set(text6.tokens), reverse=True)[:10])

# b
text6_rev_top10 = sorted(set(text6.tokens), reverse=True)[:10]

for i in text6_rev_top10:
    if 'z' in i:
        print(i.replace('z', 'Z'))
    elif ('z' not in i) and (len(i) >= 4):
        print(i.replace(i[-1:], i[-1:].upper()))

['zoosh', 'zoop', 'zoo', 'zone', 'zhiv', 'yourself', 'yours', 'your', 'young', 'you']
Zoosh
Zoop
Zoo
Zone
Zhiv
yourselF
yourS
youR
younG


## Quiz 2.
- 입력: 주민등록번호, 휴대폰번호, 이메일
    - 주민번호, 휴대폰번호는 숫자만 입력 (`-` 없이)
    - 이메일은 아이디만 입력 ('@의 뒷부분' 없이)
- 출력:
    - "당신은 {}년 {}월 {}일 출생의 {남성/여성}입니다."
    - 휴대폰번호: {}
        - 하이픈으로 연결하기
    - 이메일: {아이디}@gmail.com

In [12]:
id_number = str(input('주민등록번호를 입력하세요(하이픈 제외): '))
phone_number = str(input('휴대폰번호를 입력하세요(하이픈 제외): '))
email = str(input('이메일을 입력하세요(도메인 제외): '))

주민등록번호를 입력하세요(하이픈 제외):  0206173000000
휴대폰번호를 입력하세요(하이픈 제외):  01012341234
이메일을 입력하세요(도메인 제외):  hufs1954


In [13]:
if (id_number[6:7] == '1') or (id_number[6:7] == '3'):
    gender = '남성'
else: gender = '여성'

if id_number[6:7] == '1':
    birth_year = int('19'+id_number[:2])
else: birth_year = int('20'+id_number[:2])

birth_month = int(id_number[2:4])
birth_day = int(id_number[4:6])

print(f"당신은 {birth_year}년 {birth_month}월 {birth_day}일 출생의 {gender}입니다.")

당신은 2002년 6월 17일 출생의 남성입니다.


In [14]:
phone_number_hyphen = phone_number[:3]+'-'+phone_number[3:7]+'-'+phone_number[7:11]
print(f'휴대폰 번호: {phone_number_hyphen}')

휴대폰 번호: 010-1234-1234


In [15]:
print(f'이메일: {email}@gmail.com')

이메일: hufs1954@gmail.com
