# **Week 03**

## **중첩조건문 (Nested Conditional) - 지양하기**
- 조건이 여러 개일 때 들여쓰기로 구분해서 if 블록 안에 또 if 블록 만드는 경우

    - 예: if ...
            if ....
                if ...

- 가독성이 떨어짐.

In [16]:
x = 0
y = 4

if x == y:
    print("Block A")
else:
    if x < y:
        print("Block B")
    else:
        print("Block C")

Block B


### **깔끔한 방법 1 : elif 사용**

In [17]:
if x == y:
    # A
elif x < y:
    # B
else:
    # C

IndentationError: expected an indented block (Temp/ipykernel_10012/608132131.py, line 3)

### **깔끔한 방법 2 : 논리연산자 사용**

In [19]:
if x > 0 and x < 10:
    # A
else:
    # B

IndentationError: expected an indented block (Temp/ipykernel_10012/1359329803.py, line 3)

### **파이썬만 가능한 방법**
- 연산자 한꺼번에 쓰기

In [21]:
if 0 < x < 10:
    # block A
else:
    # block B

IndentationError: expected an indented block (Temp/ipykernel_10012/3985380326.py, line 3)

## **논리연산자**
- 비교연산 조건 여러 번 사용
    - 예 : x > 0, x < 10
    
- 종류 : **and, or, not**
    - A **and** B: A 그리고 B. A, B **둘 다 참일 때** True
    - A **or** B: A 혹은 B. A, B **둘 중 하나만 참이면** True
    - **not** A: A가 **참이면 False. 거짓이면 True** (~)

## **True/False**
- 표기 : **A = True (A가 참이면..)**
- 아무것도 안쓰면 True 의미

In [22]:
if a == True: #(X)
    print()

NameError: name 'a' is not defined

In [23]:
if a: # (O)
    print()

NameError: name 'a' is not defined

## **In - 포함 여부**
- memgership operator, 요소가 안에 포함되어 있는지 확인
- 형식 : **A in B = A가 B에 포함되어 있나**

In [24]:
# ex1. 모음인지 아닌지 판단하라 (a, e, i, o, u)
letter = 'k'

#if letter == 'a' or letter == 'e' ... 대신

if letter in ['a', 'e', 'i', 'o', 'u']:
    print("모음")
else: print("자음")

자음


In [27]:
# ex2. 단어에 모음 있나 없나

#틀린 내 풀이
word = 'apple'
if word in ['a', 'e', 'i', 'o', 'u']: # 반대로 써야 함. 그런데 리스트를 그대로 왼쪽에 쓰면 하나씩이 아니라 리스트 전체가 string에 있는지 찾아보므로 틀림.
    print("모음 있음")
else:
    print("모음 없음")
    
# 맞는 풀이
if 'a' or 'e' 'i' 'o' 'u' in word:
    print("yes")

모음 없음
yes


## **코끼리 연산자 (Walrus Operator)**
- 형식 : **:=**
- **할당 + 테스트 동시에** 하는 기능

- 예시🔽

In [32]:
tweet_limit = 200
tweet_string = 'blah' * 50

In [39]:
diff = tweet_limit - len(tweet_string)
if diff > 0:
    print("가능하다")
else:
    print("불가능하다")

불가능하다


In [40]:
if diff := tweet_limit - len(tweet_string) > 0:
    print("yes")
else: print('no')

no


## **QUIZ 1**
- 윤년을 구해보자.
    - 연도 입력받는다.
    - 해당 연도가 4로 나눠지면 윤년
    - 100으로 나눠지면 안 된다.
    - 400으로 나눠지면 윤년
- 출력: {}년은 윤년입니다. / ~ 아닙니다.

In [35]:
# 내 답안
year = int(input("연도를 입력하세요."))

if year % 4 == 0 and year % 400 == 0:
    print(f"{year}년은 윤년입니다.")
else:
    print(f"{year}년은 윤년이 아닙니다.")

연도를 입력하세요. 2018


2018년은 윤년이 아닙니다.


In [42]:
#다른 풀이
year = int(input("연도를 입력하세요."))

if ((year % 4 == 0) and (year % 100 != 0)) or (year % 400 == 0):
    print(f"{year}년은 윤년입니다.")
else:
    print(f"{year}년은 윤년이 아닙니다.")

연도를 입력하세요. 2018


2018년은 윤년이 아닙니다.


------------


## **String 문자열**

1. 불변적(immutable) : 변경 불가(잘라내서 더하거나 복제하는 건 가능)
2. 따옴표로 선언(' or ")
3. 주석 쓸 때는 ''' or """
4. 형변환 string으로 할 때 : str()

### **Escape Character**
- 있는 그대로 인식되지 않는 특수한 문자열에 대해 **그대로 인식하라**는 의미
- '\\'(역슬래시)를 문자열 앞에 붙여준다.

- \n : 개행
- \t : tab
- \b : backspace
- \', \" : 따옴표를 문자 그대로 인식
...

### **문자열의 연산**
1. 더하기("+") concatenation : 공백 없이 문자열 붙여줌
2. 곱셈("* ") : 복제

### **문자열 추출 Slicing**

- 추출 : 문자열 일부 떼어내기
- 추출 방법 : **[오프셋 지정]**
- **오프셋**
    - 형식 **[시작:끝:스텝]**
    - 0부터 세기 시작!
    - 스텝(얼마나 건너뛰는지) 기본값은 1
    - **0부터** 시작!
    - 예: 0123
          jack
         -4 -1
    - 음수표현 가능. 뒤에서부터 세어서 -1부터 시작.
    - 시작은 포함, 끝은 미포함. (**시작 이상 - 끝 미만**)

### **Slicing 문법**

- **[: n] or [0 : n]**: 처음부터 n - 1 까지
- **[:]** : 처음부터 끝까지
- **[::-1]** : 모든 글자 거꾸로 출력

#### NLTK(Natural Language Toolkit)
- 자연어 분석용 패키지(교육용) : 이걸 활용해 
- 내장함수, 기능들이 들어가 있음.
    - 예: 토크나이즈, 파싱, 태깅, ...

In [2]:
#!pip install nltk : nltk 설치

In [3]:
import nltk # nltk 가져오기
nltk.download('book', quiet=True) # nltk에 접근하려면 점(.) 사용, 부분다운 받으려면 괄호 안에 따로 다운받을 부분 적기
#quiet=True는 복잡하게 뜨는 애들 안 뜨게 해줌


True

In [4]:
#from nltk import book # nltk에서 book을 가져온다

In [7]:
from nltk import book

*** Introductory Examples for the NLTK Book ***
Loading text1, ..., text9 and sent1, ..., sent9
Type the name of the text or sentence to view it.
Type: 'texts()' or 'sents()' to list the materials.
text1: Moby Dick by Herman Melville 1851
text2: Sense and Sensibility by Jane Austen 1811
text3: The Book of Genesis
text4: Inaugural Address Corpus
text5: Chat Corpus
text6: Monty Python and the Holy Grail
text7: Wall Street Journal
text8: Personals Corpus
text9: The Man Who Was Thursday by G . K . Chesterton 1908


- **토큰** : 프로그래밍에서 단어 단위.
    - 예:  hello world에서 hello와 world
    - I'm not a coward. 에서 단어를 I'm / I, 'm / I, am 등으로 나눌 수 있는데 이걸 어떻게 나눌 건지 정한 게 토큰.

In [8]:
moby = book.text1
moby.tokens[:10] # 토큰 10개만 가져오기

['[',
 'Moby',
 'Dick',
 'by',
 'Herman',
 'Melville',
 '1851',
 ']',
 'ETYMOLOGY',
 '.']

- **len()** : 길이 재기
- **set()** : 중복 사라짐. 함수가 아닌 자료형을 변환한 것.
- **len(set())** : 중복 없이 몇 단어인지 길이 재기

## **list**
    - 형태: ['a', a, True]
    - 순서 O, 중복 허용
    - 형변환 방법 : list()

## **set**
    -형태: {'a', 2, True}
    - 순서 X(인덱싱 안됨), 중복 불가
    - 형변환 방법: set()
    - 수학의 집합 개념과 비슷

In [10]:
cars = ['kia', 'hyundai', 'renault', 'benz', 'benz', 'kia']
cars

['kia', 'hyundai', 'renault', 'benz', 'benz', 'kia']

In [11]:
set(cars) # 중복 사라짐

{'benz', 'hyundai', 'kia', 'renault'}

#### **Lexical Diversity**
- 얼마나 다양한 걸 썼는지
- **len(set()) / len()**

### **정렬**

- **sorted()** : 오름차순
- **sorted(정렬할 거, reverse=True)** : 내림차순
- 정렬 순서 : 문장 부호 - 숫자 - 대문자 - 소문자

In [13]:
sorted(cars, reverse=True)

['renault', 'kia', 'kia', 'hyundai', 'benz', 'benz']

In [14]:
sorted(moby)[:10]

['!', '!', '!', '!', '!', '!', '!', '!', '!', '!']

## **Quiz 2**
- text6 가져와서 토큰을 변수에 담는다.
- 중복 없는 단어 셋으로 저장하고 내림차순으로 정렬하라.
    -(조건문)앞에서 10개 단어 출력
    -단어에 z가 있으면 대문자로 바꾸시오
    -z가 없는데 길이가 4개 이상이면 끝 글자를 대문자로 바꾸기
    
## **Quiz 3(스트링 관련)**
- 주민번호, 휴대폰번호, 이메일 주소 입력 받는다.
- 주민번호, 휴대폰번호는 숫잠나 입력받는다(하이픈 없이)
- 이메일주소는 아이디만 입력받는다.(@~~ 없이)
    - 1. "당신은 {}년 {}월 {}일 출생의 {남성/여성}입니다."
    - 2. 휴대폰 번호: 하이픈으로 연결하기(000-0000-0000)
    - 3. 이메일주소: 뒤에 @gmail.com 붙여주기