## 함수
1. 정의
2. 인수
3. 호출방식

### 1. 정의
- 함수는 코드의 덩어리, 코드의 묶음
- 코드를 한 줄로 간편하게 재사용하기 위해서 함수를 사용한다.


- 함수는 정의하는 부분(define)과 호출하는 부분(call)이 있다.
    - 정의
    
          def 함수이름(매개변수1, 2, 3, ...):
              수행문1
              수행문2
              ....
              return 반환값
    - 호출
    
          함수이름(인수1, 2, 3, ...)
    
    
- 함수의 4가지 케이스
    1. 매개변수, 반환값 둘다 없는 경우
    2. 매개변수, 반환값 둘다 있는 경우
    3. 매개변수만 있고 반환값은 없는 경우
    4. 매개변수는 없고 반환값만 있는 경우


In [1]:
# case 1.
# print는 되지만, 어떤 변수로 받아서 사용 할수는 없다.

def make_a_sound():
    print('quack')

# 반환값이 없을 때는 return None이 생략된 것

make_a_sound()

quack


In [2]:
# case 2.
# 'y = x + 1'을 함수로 짜보기
# x -> 매개변수, y -> 반환값, x + 1 -> 수행문

def f(x):  # 매개변수 x
    y = x + 1  # 수행문
    return y  # 반환값

# 수행문이 간단한 경우는 바로 return 
def f(x):
    return x + 1

# 호출
f(4)

5

In [4]:
# case 3.
# 매개변수만 있는 경우

def make_a_sound(sound):
    print(sound)

make_a_sound('yay')

yay


In [6]:
# case 4.
# 반환값만 있는 경우

def agree():
    return True

agree()  # True

if agree():
    print('Splendid')
else:
    print('unexpected!')

Splendid


### 함수 이름 짓기
- 소문자만 사용한다.
    - splitWord (x)
    - split_word (o)
- 동작과 관련되어 있기 때문에 '동사 + 명사'의 형태를 주로 사용한다.
- 클래스는 주로 명사로 짓기 때문에, 함수는 명사로만 짓지 않는다.
    - def word(): (x)
    - def find_word(): (o)
- 띄어쓰기가 필요할 땐 언더바를 사용한다.
- 줄임말은 되도록 사용하지 않는다.
    - 마음대로 줄이지 않는다. 
        - split -> splt (x)
    - 코더들이 보통 줄이는 방법은 괜찮다.
        - calculate -> calc (o)

### 2. 인수
- 매개변수와 인수
    - 매개변수는 함수 내부(인터페이스)에서 유효한 변수
    - 인수는 실제 매개변수에 대입되는 변수
    - 함수 호출 시에 인수가 매개변수에 복제된다.

In [8]:
# sound는 매개변수, yay는 인수

def make_a_sound(sound):  # 매개변수
    print(sound)
    
make_a_sound('yay')  # 인수

yay


In [9]:
# 매개변수는 함수를 빠져나오면 유효하지 않다

sound

NameError: name 'sound' is not defined

In [11]:
# 함수 안에는 if 조건문이 올 수도 있다
# 들여쓰기에 주의!

def commentary(color):
    if color == 'g':
        return 'green'
    else:
        return 'black'
    
color = 'white'
print(commentary(color))

black


In [12]:
# 함수의 실제적인 사용 예시
colors = ['g', 'b', 't']

for color in colors:
    print(commentary(color))

green
black
black


### 인수의 타입
- 위치 인수 (positional argument)
    - 매개변수를 값의 순서에 따라 복제한다.
- 키워드 인수 (keyword argument)
    - 매개변수 키워드에 맞는 인수로 지정한다. 
    - 인수의 위치가 달라도 된다.
- 디폴트 인수 (default argument)
    - 매개변수를 정의할 때 값을 미리 지정한다.
    - 만약, 함수 호출 시에 값이 입력되지 않으면 디폴트 값을 사용한다.
    - 단, 디폴트 값이 언디폴트 값보다 뒤에 위치해야 한다.

In [15]:
def menu(wine, entree, dessert):
    return {'wine': wine, 'entree': entree, 'dessert': dessert}

# 위치 인수
# 순차적으로 매개변수에 값이 복제된다
print(menu('a', 'b', 'c'))

# 키워드 인수
# 순서가 달라도 상관없다
menu(entree='c', wine='b', dessert='a')

{'wine': 'a', 'entree': 'b', 'dessert': 'c'}


{'wine': 'b', 'entree': 'c', 'dessert': 'a'}

In [18]:
# 디폴트 인수
# 디폴트 값이 언디폴트 값보다 뒤에 위치해야 한다

def default_menu(wine, entree, dessert='strawberry'):
    return {'wine': wine, 'entree': entree, 'dessert': dessert}

# 인자를 넣지 않으면 디폴트 값이 나오고 (strawberry)
print(default_menu('rioja', 'egg'))

# 인자를 넣으면 바뀌어서 나온다 (kiwi)
default_menu('rioja', 'egg', 'kiwi')

{'wine': 'rioja', 'entree': 'egg', 'dessert': 'strawberry'}


{'wine': 'rioja', 'entree': 'egg', 'dessert': 'kiwi'}

In [19]:
# 디폴트 값이 언디폴트 값보다 앞에 있으면
# 에러가 발생한다

def default_error(wine='rioja', entree, dessert):
    return {'wine': wine, 'entree': entree, 'dessert': dessert}

SyntaxError: non-default argument follows default argument (641269704.py, line 4)

### 3. 호출방식
- 정의 부분은 호출 시 실행된다.
- 메모리에 저장되어 있다가 호출 시에 사용되는 방식

In [20]:
# 어떤 순서로 코드가 실행되는지 확인

def multiply(x, y):
    print('1')  # 3번째
    return x + y

print('2')  # 1번째
i = 2
j = 4

print('3')  # 2번째
multiply(i, j)

print('4')  # 4번째

2
3
1
4


### 매개변수와 인수
- 참조에 의한 호출 (call by reference)
- 매개변수 = 인수 
    - copy되기 때문에 나타나는 문제점
    - 리스트처럼 가변 객체일 때 주소값을 공유하므로 같이 변한다.

In [22]:
def buggy(arg, result=[]):
    result.append(arg)
    print(result)
    
a, b = 'a', 'b'
buggy(a)
buggy(b)  # 예상 값: ['b'], 실제 값: ['a', 'b']

['a']
['a', 'b']


In [24]:
# 위와 같은 상황을 피하려면
# 빈 객체를 설정하여 reset이 되도록

def buggy(arg):
    result = []
    result.append(arg)
    print(result)
    
a, b = 'a', 'b'
buggy(a)
buggy(b)  # 리스트가 초기화되어 원하는 값이 나옴

['a']
['b']


In [27]:
# None은 True도 False도 아니다

thing = None

if thing:
    print('True')
elif thing == False:
    print('False')
else:
    print('None')

None


In [29]:
# 조건식을 포함하는 함수로 변경하기

def nonbuggy(arg, result=[]):
    # 리스트가 없으면 빈 리스트를 생성하고
    # 리스트가 있다면 그대로 사용
    
    # ==는 value만 같은 것
    # is는 value + id까지 같은 것
    if result is None:
        result = []
    
    result.append(arg)
    print(result)
    
nonbuggy('a')
nonbuggy('b')  # 리스트가 있어서 기존의 리스트를 그대로 사용
nonbuggy('b', None)  # 리스트가 없어서 빈 리스트를 생성함

['a']
['a', 'b']
['b']


In [32]:
# result를 처음부터 None으로 설정하면 더 편함

def nonbuggy(arg, result=None):
    if result is None:
        result = []
    
    result.append(arg)
    print(result)
    
# 리스트의 default값이 None이라 쌓이지 않는다
nonbuggy('a')
nonbuggy('b')

# 리스트를 설정하면 쌓이기 시작
_list = ['c']
nonbuggy('a', _list)
nonbuggy('b', _list)

['a']
['b']
['c', 'a']
['c', 'a', 'b']


### 지역변수와 전역변수
- 지역변수: 함수 내부에서만 유효하다.
- 전역변수: 함수 내부 뿐만 아니라 외부에서도 유효하다.

In [34]:
def fx():
    # 지역변수 city (london)
    city = 'london'
    print(city)
    
city = 'paris'  # 전역변수 city (paris)
fx()  # 함수 내에서 city를 london으로 선언해도
print(city, '== london?')  # 함수 밖에서 city는 paris 

london
paris == london?


In [36]:
# 전역변수를 사용하고 싶다면 global

def fx():
    # 전역변수 city (london)
    global city
    city = 'london'
    print(city)
    
city = 'paris'  # city = 'paris' -fx()> city = 'london'
fx()  # 함수 내에서 전역변수로 city를 london으로 선언했으므로
print(city, '== london?')  # 함수 밖에서도 city는 london

london
london == london?


### doc string
- 함수를 설명하는 부분
- 매개변수 타입, 의미, 함수의 역할, 기능 등을 설명한다.
- 사용형식은 빈 주석처리 하는 방식 

    """
    
    독스트링 작성
    
    """

In [39]:
def buggy(arg):
    """
    arg의 타입: str
    꽃 이름을 받는다.
    result의 타입은 list
    이 함수는 꽃 이름을 리스트에 추가한다.
    """
    result = []
    result.append(arg)
    print(result)
    
a, b = 'a', 'b'
buggy(a)
buggy(b)

['a']
['b']


In [41]:
# 함수를 사용할 때는 doc string이 나오지 않는다
# doc string을 확인하는 방법  
# help(function)
# 함수 뒤의 매개변수는 쓰지 않는다

help(buggy)

Help on function buggy in module __main__:

buggy(arg)
    arg의 타입: str
    꽃 이름을 받는다.
    result의 타입은 list
    이 함수는 꽃 이름을 리스트에 추가한다.



In [43]:
# 또 다른 방법 
# 던더바 (__, 더블 언더바) 사용
# function.__doc__

buggy.__doc__

'\n    arg의 타입: str\n    꽃 이름을 받는다.\n    result의 타입은 list\n    이 함수는 꽃 이름을 리스트에 추가한다.\n    '

### 함수 실습1
- 나이를 입력받아 태어난 연도로 바꾸기
- 함수에서 정의할 것
    - 입력값 -> 나이
    - 반환값 -> 연도 (2022 - 나이 + 1)
- 호출할 때 나이를 input으로 받기

In [44]:
def age_to_year(age):
    this_year = 2022
    return this_year - age + 1

age = int(input('나이를 입력하세요: '))
print(f'태어난 연도: {age_to_year(age)}')

나이를 입력하세요: 25
태어난 연도: 1998


## 브라운 정제하기
### 해야할 것
1. 문장 분절
2. 단어 분절
3. 문장부호 제거
4. 하이픈, 's, 'nt, 'd, ... 제거
5. 위의 기능을 함수로 만들기

In [45]:
import string
import nltk

nltk.download('brown')
brown = nltk.corpus.brown
romance = brown.raw(categories='romance')[:5000]

[nltk_data] Downloading package brown to /Users/yong/nltk_data...
[nltk_data]   Package brown is already up-to-date!


### 문장 분절

In [52]:
# 문장을 분절하는 단위
# ./.
# \n
# /. (!와 ?를 처리할 수 있기 때문에 추천)

sentences = [sent.strip() for sent in romance.split('/.')]
sentences = [s for s in sentences if s != '!']  # ! 삭제
sentences[0]

'They/ppss neither/cc liked/vbd nor/cc disliked/vbd the/at Old/jj-tl Man/nn-tl .'

### 단어 분절
- sentences에서 POS 제거하고, 단어 분절하기

In [53]:
# 자주쓰는 기호를 전체에서 쓰려면 대문자로 가져가기

SLASH = '/'

In [57]:
example = sentences[0]
[word[:word.find(SLASH)] if SLASH in word else word for word in example.split()]

['They', 'neither', 'liked', 'nor', 'disliked', 'the', 'Old', 'Man', '.']

In [59]:
# 전체 문장에 적용하기

sentences_tokens = [[word[:word.find(SLASH)]
                   if SLASH in word else word
                   for word in sent.split()] for sent in sentences]  
# list comprehension안에 별도로 list를 생성하여 문장을 각각의 리스트에 append

print(sentences_tokens[:10])

[['They', 'neither', 'liked', 'nor', 'disliked', 'the', 'Old', 'Man', '.'], ['To', 'them', 'he', 'could', 'have', 'been', 'the', 'broken', 'bell', 'in', 'the', 'church', 'tower', 'which', 'rang', 'before', 'and', 'after', 'Mass', ',', 'and', 'at', 'noon', ',', 'and', 'at', 'six', 'each', 'evening', '--', 'its', 'tone', ',', 'repetitive', ',', 'monotonous', ',', 'never', 'breaking', 'the', 'boredom', 'of', 'the', 'streets', '.'], ['The', 'Old', 'Man', 'was', 'unimportant', '.'], ['Yet', 'if', 'he', 'were', 'not', 'there', ',', 'they', 'would', 'have', 'missed', 'him', ',', 'as', 'they', 'would', 'have', 'missed', 'the', 'sounds', 'of', 'bees', 'buzzing', 'against', 'the', 'screen', 'door', 'in', 'early', 'June', ';'], [';'], ['or', 'the', 'smell', 'of', 'thick', 'tomato', 'paste', '--', 'the', 'ripe', 'smell', 'that', 'was', 'both', 'sweet', 'and', 'sour', '--', 'rising', 'up', 'from', 'aluminum', 'trays', 'wrapped', 'in', 'fly-dotted', 'cheesecloth', '.'], ['Or', 'the', 'surging', 'whi

### punctuations

In [60]:
# 특수기호 리스트화 하기

punct = list(string.punctuation)
print(punct)

['!', '"', '#', '$', '%', '&', "'", '(', ')', '*', '+', ',', '-', '.', '/', ':', ';', '<', '=', '>', '?', '@', '[', '\\', ']', '^', '_', '`', '{', '|', '}', '~']


In [68]:
# punctuation 골라내는 방법
# fly-dotted의 '-', didn't의 '\'' 살리면서 골라내기, 아직 분리는 x
# word[0].isalnum() 사용

[[word for word in sent
 if word[0].isalnum() and word not in punct]
for sent in sentences_tokens][0]

['They', 'neither', 'liked', 'nor', 'disliked', 'the', 'Old', 'Man']

In [70]:
# punctuation에 없는 punctuation을 찾아서
# my_punct로 저장한 뒤 punct에 extend하기

my_punct = set([word
               for sent in sentences_tokens
               for word in sent
               if (not word[0].isalnum()) and (word not in punct)])
print(my_punct)

punct.extend(list(my_punct))
print(punct)

{'--', '``', "''"}
['!', '"', '#', '$', '%', '&', "'", '(', ')', '*', '+', ',', '-', '.', '/', ':', ';', '<', '=', '>', '?', '@', '[', '\\', ']', '^', '_', '`', '{', '|', '}', '~', '--', '``', "''"]


### 하이픈 분리
- 하이픈을 기준으로 split한 뒤에 extend
    - 'fur-piece'.split('-')

### apostrophe 's 분리
- split을 사용하지 않는다.
- index로 가져간 뒤에 extend
    - word = 'she\'s'
    
      index = word.find('\'')
      
      word[:index], word[index:]
      
      결과: ('she', "'s")
      
### 해리포터에서 단어 중간에 '이 오는 경우
- 예: myst'ry
- 생각해보고 정의하기
    - 's, 'nt, 'd는 처리하고
    - 나머지는 그냥 붙인다.

### 함수 실습2
example = sentences[0]

[word[:word.find(SLASH)] if SLASH in word else word for word in example.split()]

- 단어 분절하는 부분을 함수로 만들어보기
- 어떤 문장이 들어왔을 때 품사 제거하고, punct 제거하고, 토큰 리스트로 반환하기

In [75]:
def tokenize_word(sent):
    token_list = [word[:word.find(SLASH)]
                 for word in sent.split()
                 if (word[0].isalnum()) and (word not in punct)]
    return token_list
                  
print(tokenize_word(sentences[3]))

['Yet', 'if', 'he', 'were', 'not', 'there', 'they', 'would', 'have', 'missed', 'him', 'as', 'they', 'would', 'have', 'missed', 'the', 'sounds', 'of', 'bees', 'buzzing', 'against', 'the', 'screen', 'door', 'in', 'early', 'June']
