## 함수 definition
1. 정의
2. 인수
3. 호출 방식

### 1. 정의
- 코드의 덩어리, 코드의 묶음
    - ex) 구구단 프로그램
- 간편한 재사용을 위해.
    - 한 줄로 재사용 가능하다.
- 정의 부분(define) + 호출 부분(call)
    - 정의하기
        
        def 함수이름(매개변수1, 2, 3, ...):
            수행문1 (매개변수를 이용)
            수행문2
            ....
            return 반환값
    - 호출하기
        함수이름(인수1, 2, 3, ...)
- 매개변수와 반환값이 있어도 되고, 없어도 된다. (2 * 2 = 4)
    1. 둘 다 없는
    2. 둘 다 있는
    3. 매개변수만 있는
    4. 반환값만 있는

In [2]:
def ex(x):   # x: 매개변수
    y = x + 1   # x+1: 수행문
    return y   # y: 반환값

ex(1)  # 함수 호출, 매개변수 = 1

2

In [4]:
#1.  매개변수와 반환값 둘 다 없는 경우
def make_a_sound():
    print('quack')

make_a_sound()

quack


In [3]:
#2. 매개변수와 반환값 모두 있는 경우
def ex(x):
    return x + 1

ex(1)

2

In [5]:
#3.  매개변수만 있고 반환값은 없는 경우
def make_a_sound(sound):
    print(sound)

make_a_sound('yay')

yay


In [7]:
#4.  매개변수는 없고 반환값만 있는 경우
def agree():
    return True

if agree():  # 조건문으로 활용, if True 라는 뜻
    print('Splendid')
else:
    print('Unexpected!')

Splendid


### 함수 이름 짓기
- 소문자만 사용한다
    - splitWord보단 split_word 선호
- 동작과 관련되어 있기 때문에 "동사 + 명사"의 형태 주로 씀
    - def split_word(): (O)
    - def.word(): (X)
- i.e., 클래스는 주로 명사

- 줄임말 쓰지 말 것
    - calculate -> calc처럼 자주 쓰이는 줄임말은 예외
    - splt_word (X)

### 2. 인수
- 매개변수 vs. 인수
    - 매개변수: 함수 내(interface)에서 유효한 변수 / 함수를 빠져나오면 유효하지 않다
    - 인수: 실제 매개변수에 대입되는 변수 / 함수 외부에서 입력 받음
    - "호출 시에 인수가 매개변수에 복제된다" 
        - 위의 make_a_sound 예시의 경우 yay가 sound에 대입된다.
- 위치 인수
    - positional argument
    - 매개변수를 값에 순서에 상응하게 복제한다
- 키워드 인수
    - keyword argument
    - 매개변수를 키워드에 맞는 인수로 지정 => 위치 달라도 됨
- 디폴트 인수 ***중요
    - default argument
    - 매개변수를 정의할 때 미리 지정해 놓는 것
    - 호출 시에 값이 입력되지 않으면 디폴트를 사용한다.
    - 디폴트 값이 언디폴트값 앞에 위치할 수는 없음

In [117]:
# 매개변수 vs 인수

def make_a_sound(sound):  # sound = 매개변수
    print(sound)

yay = 'yay'   # yay = 인수, 함수 외부에서 입력받음
make_a_sound(yay)

yay


In [119]:
def commentary(color):
    if color == 'r':
        return 'red'
    else:
        return 'white'

color = 'blue'   # 매개변수와 인수 변수명은 같아도 상관 없음
commentary(color)

'white'

In [120]:
colors = ['r', 'g', 'b']

for color in colors:
    print(commentary(color))

red
white
white


In [121]:
# 위치 인수 (positional argument)

def menu(cafe, coffee, dessert):
    return {'cafe':cafe, 'coffee':coffee, 'dessert':dessert}  # 딕셔너리

menu('a', 'b', 'c')  # a,b,c의 위치를 미리 지정

{'cafe': 'a', 'coffee': 'b', 'dessert': 'c'}

In [123]:
# 키워드 인수 (keyword argument)

def menu(cafe, coffee, dessert):
    return {'cafe':cafe, 'coffee':coffee, 'dessert':dessert}

menu(coffee = 'a', dessert = 'b', cafe = 'c')  # 인수에 키워드를 지정

{'cafe': 'c', 'coffee': 'a', 'dessert': 'b'}

In [124]:
# 디폴트 인수 (default argument)

def menu2(cafe, coffee, dessert = 'cookie'):  # menu2(cafe = 'starbucks', coffee, dessert)  이렇게는 안됨
    return {'cafe':cafe, 'coffee':coffee, 'dessert':dessert}

menu2('starbucks', 'espresso')  # dessert의 값이 없을 경우, 디폴트인 cookie 사용

{'cafe': 'starbucks', 'coffee': 'espresso', 'dessert': 'cookie'}

In [125]:
menu2('starbucks', 'espresso', 'croissant')  # dessert의 값이 있으므로 croissant 반환

{'cafe': 'starbucks', 'coffee': 'espresso', 'dessert': 'croissant'}

### 3. 호출 방식
- 정의 부분은 호출 시 실행된다.
- 메모리에 저장되어 있다가 호출 시에 실행
- 매개변수 vs. 인수
    - 참조에 의한 호출(call by reference)
    - shallow copy
        - "매개변수 = 인수" shallow copy되기 때문에 나타나는 문제점:
            - 리스트처럼 가변 객체일 때 주소값을 공유하므로 값이 변함

In [17]:
# 함수 호출 순서

def multiply(x, y):
    print('1')   # 메모리에 저장되어 있다가 호출 시에 실행
    return x * y

print('2')
i = 2   # 인수 지정
j = 4

print('3')    # 호출되는 시점에서 '1'번코드 실행
multiply(i, j)   #  i = 2, j = 4 -> x = i, y = j  => shallow copy
 
print('4')

2
3
1
4


In [126]:
# shallow copy로 인한 문제점

def buggy(arg, result = []):  # 빈 객체 설정
    result.append(arg)
    print(result)

a, b = 'a', 'b' 
buggy(a) # ['a']
buggy(b) # ['b']일 것 같으나, id를 공유하고 있기 때문에 ['a', 'b']로 출력됨

['a']
['a', 'b']


In [132]:
# 둘 다 조건식으로 포함하는 함수로 변경하기

def nonbuggy(arg, result = None):
    # 리스트가 없으면 빈 리스트 생성하고, 있으면 그거 써라.
    if result is None: # ==(value) vs. is(id)
        result = []
    result.append(arg)
    print(result)

a, b = 'a', 'b' 
nonbuggy(a)
nonbuggy(b)
    
# "없는 값, 아무것도 없다": None

['a']
['b']


In [134]:
def nonbuggy(arg, result = None): # default
    if result is None: 
        result = []
    result.append(arg)
    print(result)

empty = ['c']
nonbuggy(a, empty)  # result의 디폴트값 None 대신에 인수 empty가 들어감
nonbuggy(b, empty)

['c', 'a']
['c', 'a', 'b']


In [135]:
thing = None  # 값이 할당된 상태가 아님. 진짜 아무 값도 없다는 뜻
if thing:  # True
    print('True')
elif thing == False:  # False
    print('False')
else:
    print('None')

None


In [28]:
def fx():
    global city  # 전역변수 설정: 함수 밖에서도 쓰겠다
    city = 'london' # 지역변수: 함수 내부에서만 유효한 변수
    print(city)
    
city = 'paris'  # 변수
fx()
print(city)

london
london


In [136]:
def fx():
    global city  # 전역변수 설정: 함수 밖에서도 쓰겠다
    city = 'london' # 지역변수: 함수 내부에서만 유효한 변수
    print(city)
    
city = 'paris'  # 변수
print(city)  # 함수 호출 전에(전역변수 값 변경하기 전에) print(city)하면 paris 출력
fx()

paris
london


### doc string
- 함수 설명
- 매개변수의 타입, 의미, 함수의 기능을 설명
- '''
  
  독 스트링

  '''


In [138]:
'''arg: str, 꽃 이름
   result: list, xxxxx
   꽃 이름을 리스트에 추가한다.
   '''
def flower(arg, result = []):   
    if result is None:
        result = []
    result.append(arg)
    print(result)

flower('rose')

['rose']


In [139]:
# 독스트링 확인
help(flower)
buggy.__doc__

Help on function flower in module __main__:

flower(arg, result=['rose'])



### Quiz

- 나이 -> 연도
- 함수: 
    - 입력값 = 나이
    - 반환 = 연도
- 나이 = input 받기

In [140]:
def age_to_year():
    this_year = 2022
    return this_year - age + 1

age = int(input('현재 나이를 입력하세요>>> '))
age_to_year()

현재 나이를 입력하세요>>> 23


2000

## 브라운 정제하기


In [42]:
import string
import nltk
nltk.download('brown')
brown = nltk.corpus.brown
romance = brown.raw(categories = 'romance')[:5000]
romance

[nltk_data] Downloading package brown to
[nltk_data]     C:\Users\kupa1\AppData\Roaming\nltk_data...
[nltk_data]   Package brown is already up-to-date!


"\n\n\tThey/ppss neither/cc liked/vbd nor/cc disliked/vbd the/at Old/jj-tl Man/nn-tl ./.\nTo/in them/ppo he/pps could/md have/hv been/ben the/at broken/vbn bell/nn in/in the/at church/nn tower/nn which/wdt rang/vbd before/in and/cc after/in Mass/nn-tl ,/, and/cc at/in noon/nn ,/, and/cc at/in six/cd each/dt evening/nn --/-- its/pp$ tone/nn ,/, repetitive/jj ,/, monotonous/jj ,/, never/rb breaking/vbg the/at boredom/nn of/in the/at streets/nns ./.\nThe/at Old/jj-tl Man/nn-tl was/bedz unimportant/jj ./.\n\n\n\tYet/rb if/cs he/pps were/bed not/* there/rb ,/, they/ppss would/md have/hv missed/vbn him/ppo ,/, as/cs they/ppss would/md have/hv missed/vbn the/at sounds/nns of/in bees/nns buzzing/vbg against/in the/at screen/nn door/nn in/in early/jj June/np ;/. ;/.\nor/cc the/at smell/nn of/in thick/jj tomato/nn paste/nn --/-- the/at ripe/jj smell/nn that/wps was/bedz both/abx sweet/jj and/cc sour/jj --/-- rising/vbg up/rp from/in aluminum/nn trays/nns wrapped/vbn in/in fly-dotted/jj cheeseclo

In [106]:
# 문장 분절
sentences = [sent.strip() for sent in romance.split('/.')]
sentences = [s for s in sentences if s != '!'] # ! 문장에서 제외
sentences

['They/ppss neither/cc liked/vbd nor/cc disliked/vbd the/at Old/jj-tl Man/nn-tl .',
 'To/in them/ppo he/pps could/md have/hv been/ben the/at broken/vbn bell/nn in/in the/at church/nn tower/nn which/wdt rang/vbd before/in and/cc after/in Mass/nn-tl ,/, and/cc at/in noon/nn ,/, and/cc at/in six/cd each/dt evening/nn --/-- its/pp$ tone/nn ,/, repetitive/jj ,/, monotonous/jj ,/, never/rb breaking/vbg the/at boredom/nn of/in the/at streets/nns .',
 'The/at Old/jj-tl Man/nn-tl was/bedz unimportant/jj .',
 'Yet/rb if/cs he/pps were/bed not/* there/rb ,/, they/ppss would/md have/hv missed/vbn him/ppo ,/, as/cs they/ppss would/md have/hv missed/vbn the/at sounds/nns of/in bees/nns buzzing/vbg against/in the/at screen/nn door/nn in/in early/jj June/np ;',
 ';',
 'or/cc the/at smell/nn of/in thick/jj tomato/nn paste/nn --/-- the/at ripe/jj smell/nn that/wps was/bedz both/abx sweet/jj and/cc sour/jj --/-- rising/vbg up/rp from/in aluminum/nn trays/nns wrapped/vbn in/in fly-dotted/jj cheesecloth/nn

#### 단어 분절
- sentences -> POS 제거, 단어 분절

In [80]:
SLASH = '/'

In [109]:
# 단어 분절
example = sentences[0]
[word[:word.find(SLASH)] for word in example.split() if SLASH in word]  # if문으로 없는 단어는 삭제
[word[:word.find(SLASH)] if word[:word.find(SLASH)] else word for word in example.split()]

['They', 'neither', 'liked', 'nor', 'disliked', 'the', 'Old', 'Man', '.']

In [145]:
sentence_tokens = [[word[:word.find(SLASH)] \
                    if word[:word.find(SLASH)] else word \
                    for word in example.split()] for example in sentences]

In [146]:
# text 내에 있는 문장부호들
punct = list(string.punctuation)  

In [148]:
# punctuation 제거하기
no_punct_tokens = [[word for word in sent if word not in punct] for sent in sentence_tokens]

In [98]:
my_punct = set([word for sent in sentence_tokens for word in sent if not word[0].isalnum()])

{'!', "''", ',', '--', '.', ';', '``'}

In [100]:
# 하이픈 fly-dotted
'fly-dotted'.split('-') 
# split 하고 extend 시키기
# or
# replace('-',' ')하기

# apostrophe
word = 'she\'s'
index = word.find('\'')
word[:index], word[index:] # 위의 SLASH와 동일한 방법으로 제거해주기

# word'word 의 경우
    # 's, 'nt, 'd -> 조건 달아서 따로 분절해주기
    # 나머지 word'word의 경우는 그냥 붙인다

('she', "'s")

In [157]:
# 단어 분절하는 함수
# 문장이 들어왔을 때 POS 제거하고, punct 제거하고, 토큰 리스트로 변환한다.

def tokenize_word(text):
    token_list = text
    word_tokens = [word[:word.find(SLASH)] for word in text.split() if word not in punct]
    return word_tokens

tokenize_word(example)

['They', 'neither', 'liked', 'nor', 'disliked', 'the', 'Old', 'Man']