## 중첩조건문 | nested conditional
- if 블록 안에 또 if 블록이 만들어지는 경우
    - ex) if ...
            if ...
                if ...
    - 구분은 들여쓰기로 함
    - 조건이 여러 개일 경우 사용
    - 지양할 뿐

In [1]:
x = 0
y = 4

if x == y:
    print("Block A")
else:
    if x < y:
        print("Block B")
    else:
        print("Block C")

Block B


In [None]:
# 방법 1
if x == y:
    # Block A
elif x < y:
    # Block B
else:
    # Block C

In [2]:
# 0 < x < 10
if x > 0:
    if x < 10:
        print("Blcok A")
    else:
        print("Block B")
else:
    print("Block B")

Block B


In [None]:
# 방법 1
if (x > 0) and (x < 10): # 논리연산자를 사용하는 방법
    # Block A
else:
    # Block B
    
# 방법 2
if 0 < x < 10: # 파이썬에서만 가능한 방법
    # Block A
else:
    # Block B

### 논리연산자
- 비교연산 조건을 여러 번 사용하는 경우
    - x > 0, x < 10
- and, or, not
    - A and B: A 그리고 B, A와 B 둘 다 참일때 True(&)
    - A or B: A 혹은 B. 둘 중 하나만 참이면 True(|)
    - not A: A 참이면 False, 거짓이면 True(~)

### True/False
- A = True
- "만약 A가 참이라면, ..."

In [3]:
a = True

# 비추천
if a == True:
    print("True")
    
# 추천
if a:
    print("True")

True
True


### in
- membership operator
- 요소가 안에 포함되어 있는지 or 비슷한 조건문이 여럿일 때
- A in B = A가 B에 포함되어 있는지

In [4]:
# ex1. 모음인지 아닌지 판별 (a, e, i, o, u)
letter = "k"

# if letter == "a" or letter == "e", ... >> 비추천
if letter in ['a', 'e', 'i', 'o', 'u']:
    print("모음")
else:
    print("자음")

자음


In [5]:
# 단어에 모음이 있는지 확인
word = 'apple'

if 'a' or 'e' or 'i' or 'o' or 'u' in word:
    print("Yes")

Yes


### 코끼리연산자
- walrus operator
- := 와 같이 사용
- 할당 + 테스트를 동시에 하는 기능

In [6]:
tweet_limit = 200
tweet_sting = 'blah' * 50 # 4 * 50 = 200

len(tweet_sting) # len() 함수 >> 길이 확인

200

In [7]:
diff = tweet_limit - len(tweet_sting)

if diff > 0:
    print("Yes")
else:
    print("No")

No


In [8]:
# 코끼리연산자 사용 예시
if diff := tweet_limit - len(tweet_sting) > 0:
    print("Yes")
else:
    print("No")

No


### 퀴즈 1
- 윤년 구하기
    - 연도 입력받기
    - 4로 나눠지면 윤년
    - 100으로 나눠지면 안됨
    - 400으로 나눠지면 윤년
- 출력: '{}년은 윤년입니다. '/' 윤년이 아닙니다'

In [9]:
year = int(input("연도: "))

if (year % 4 == 0) and (year % 100 != 0) or (year % 400 == 0):
    print(f"{year}년은 윤년입니다.")
else:
    print(f"{year}년은 윤년이 아닙니다.")

연도:  2022


2022년은 윤년이 아닙니다.


## String | 문자열
- 시스템에서 가장 작은 단위
- 불변적인 성격을 가짐(immutable)
    - ex) jack >> jeck
- ', "으로 선언함
    - ex) "25.5"
    - ''', """ 주석
- 형 변환은 str()

### escape character | 이스케이프 문자
- 특수한 형태의 문자열 / 눈에 보이는 대로 인식되지 않는 문자
- \ + ch
- ex) \n, \t, \b, \', \", ...
    - \n 그대로 출력하고 싶으면 '\'하나 더 사용 or r'' 사용
- 다른 스트링을 만드는 것이 아님

In [10]:
sent = "hello\nworld"

print(sent)

hello
world


In [11]:
sent = "hello\tworld"

print(sent)

hello	world


In [12]:
sent = "hello\bworld"

print(sent)

hellworld


In [13]:
# \n 그대로 출력
sent = "hello\\nworld"

print(sent)

# raw string 사용
sent = r"hello\nworld"

print(sent)

hello\nworld
hello\nworld


In [14]:
'I\'m a student'

"I'm a student"

### 연산
- concatenatation
    - "" + "" >> 공백 없이 결합하는 방법
- 곱하기
    - "" * 5 >> 복제

In [15]:
name = 'jack'

name + name

'jackjack'

In [16]:
name * 4

'jackjackjackjack'

In [17]:
# immutable(불변적인 성격)
name[1] = 'e'

TypeError: 'str' object does not support item assignment

### 슬라이싱, 추출
- 문자열의 일부분을 떼어내는 작업
- 대괄호 사용, 그 안에 오프셋을 지정
- 오프셋은 0부터 시작함(맨 첫 글자)
    - 0123
    - jack
    - -4 -3 -2 -1
- 음수도 가능함 but -1부터 시작
- 오프셋은 [시작:끝:스텝] # step = 1
- 시작은 포함, 끝은 포함하지 않음(이상 : 미만)

In [18]:
name = 'jack'

name[-1]

'k'

In [19]:
sent

'hello\\nworld'

In [20]:
# l 추출
sent[3:4]

'l'

In [21]:
# 처음부터 5까지 출력
sent[:6]

'hello\\'

In [22]:
# 처음부터 끝까지 2스텝씩 출력
sent[::2]

'hlonol'

In [23]:
# 모든 글자를 거꾸로 출력
sent[::-1]

'dlrown\\olleh'

## NLTK

- natural language toolkit
- 자연어 분석을 위해 교육용으로 배포된 패키지
- 내장함수, 기능들이 추가됨
    - 토크나이즈, 파싱, 태깅, ...

In [24]:
# !pip install nltk # 설치

In [25]:
import nltk # 가져오기
nltk.download('book', quiet = True) # 부분적으로 다운받기

True

In [26]:
from nltk import book # 가져오기

*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908


In [27]:
moby = book.text1 # book에 접근하는 방법
moby.tokens[:10] # 토큰에 접근하는 방법
# 토큰: 프로그래밍에서 사용하는 단어의 단위
# ex1) hello world >> hello, world 
# ex2) I'm not a coward >> I'm / I, 'm / I, am

['[',
 'Moby',
 'Dick',
 'by',
 'Herman',
 'Melville',
 '1851',
 ']',
 'ETYMOLOGY',
 '.']

In [28]:
# 1. 길이 세기 길이
len(moby) # 26만자

260819

In [29]:
# 2. 중복 없이 단어 몇 개? 집합 함수 set()
len(set(moby)) # 1.9만자

19317

- list
    - ['a', a, True]
    - 순서가 있음
    - 중복 허용
    - list()
- set
    - {'a', 2, True}
    - 순서 없음
    - 중복 허용 안됨
    - set()
    - 수학의 집합 개념

In [30]:
cars = ['kia', 'hyundai', 'renault', 'benz', 'benz', 'kia']

cars

['kia', 'hyundai', 'renault', 'benz', 'benz', 'kia']

In [31]:
set(cars)

{'benz', 'hyundai', 'kia', 'renault'}

In [32]:
# lexical diversity(얼마나 다양한 언어를 썼는지 확인 가능)
len(set(moby)) / len(moby)

0.07406285585022564

In [33]:
# 정렬
sorted(cars)

['benz', 'benz', 'hyundai', 'kia', 'kia', 'renault']

In [34]:
# 역순으로 정렬
sorted(cars, reverse = True)

['renault', 'kia', 'kia', 'hyundai', 'benz', 'benz']

In [35]:
# 처음부터 10개까지 추출하여 정렬
sorted(moby[:10])

['.',
 '1851',
 'Dick',
 'ETYMOLOGY',
 'Herman',
 'Melville',
 'Moby',
 '[',
 ']',
 'by']

In [36]:
# 정렬하고 처음부터 10개까지 추출
sorted(moby)[:10]

['!', '!', '!', '!', '!', '!', '!', '!', '!', '!']

#### Quiz 1
- text6 가져와서 토큰을 변수에 담고
- 중복없는 셋으로 저장하고 내림차순
    - 앞에서 10개 단어 출력
    - 단어에 z가 있으면 z를 대문자로 바꾸시오
    - z가 없는데 4자 이상이면 끝 글자를 대문자로 바꾸라

In [37]:
words = book.text6
words = sorted(set(words), reverse = True)[:10]

print(words)

for word in words:
    if "z" in word:
        words = word.replace("z", "Z")
    elif len(word) >= 4:
        words = word.replace(word[-1], word[-1].upper())
        
    print(words)

['zoosh', 'zoop', 'zoo', 'zone', 'zhiv', 'yourself', 'yours', 'your', 'young', 'you']
Zoosh
Zoop
Zoo
Zone
Zhiv
yourselF
yourS
youR
younG
younG


#### Quiz 2
- 주민번호, 휴대폰 번호, 이메일 주소 입력받는다
- 주민번호, 휴대폰 번호는 숫자만 입력받는다(- 없이)
- 이메일주소는 아이디만 입력받음(@xx 없이)
    - 1. "당신은 {}년 {}월 {}일 출생의 {남성/여성}입니다."
    - 2. 휴대폰 번호: 000-0000-0000
    - 3. 이메일주소: xxxx@gmail.com

In [38]:
idNum = input("주민번호: ")
phoneNum = input("전화번호: ")
email = input("이메일: ")

month = idNum[2:4]
day = idNum[4:6]

firstNum = "010"
frontNum = phoneNum[3:7]
backNum = phoneNum[7:]

emailId = email[:]

if idNum[6] == "1" or idNum == "2":
    year = "19" + idNum[:2]
elif idNum[6] == "3" or idNum == "4":
    year = "20" + idNum[:2]
else:
    print("다시 입력해주세요.")
    
if idNum[6] == "1" or idNum == "3":
    gender = "남성"
elif idNum[6] == "2" or idNum == "4":
    gender = "여성"
    
print(f"당신은 {year}년 {month}월 {day}일 출생의 {gender}입니다.")
print(f"휴대폰 번호: {firstNum}-{frontNum}-{backNum}")
print(f"이메일 주소: {emailId}@gmail.com")

주민번호:  9701271000000
전화번호:  01091502793
이메일:  mincho


당신은 1997년 01월 27일 출생의 남성입니다.
휴대폰 번호: 010-9150-2793
이메일 주소: mincho@gmail.com
