# 프로그래밍 기초 추가사항

모든 프로그래밍언어가 공통적으로 갖고 있는 몇 가지 특징을 살펴본다.

* 변수
* 변수들 간의 동일성(identity)과 동치성(equality)의 차이점
* 함수의 부작용(side effect)이란?
* `print`와 `return` 사이의 선택

## 변수란 무엇인가?

변수는 모든 프로그래밍언어의 기본요소 중 하나이다. 변수는 특정 객체(object)를 대신하는 역할을 수행한다. 

    In [2]: a = 2
            b = a + 3
            b
    Out[2]: 5

위 코드에서 `a`는 숫자 `2`를 대신하는 역할을 수행하며, 따라서 `b`는 숫자 `5`를 대신하게 된다. 

하지만 프로그래밍언어에 따라 변수와 특정 값을 연결하는 방식은 조금씩 다르다. 예를 들어 C 언어의 경우는 일반 변수와 포인터 변수 등 두 종류의 변수를 사용한다. 두 종류의 변수의 차이점을 이해하는 것이 C 언어를 잘 아는가의 척도일 정도로 매우 중요하다.

반면에 파이썬의 경우는 한 종류의 변수만 사용하며, 파이썬의 경우 모든 변수는 포인터 변수이다. 따라서 변수와 특정 값을 연결하는 것을 C 언어의 포인터처럼 "특정 값을 가리킨다"라고 말하는 것이 정확하다. 영어로 하면 reference to objects 이다. 하지만 일반적으로 포인터에 대해 신경쓸 필요가 거의 없다.

예제들을 통해 파이썬에서 "변수의 값 할당"이 어떻게 작동하는지를 살펴본다.

In [1]:
a = [0, 2, 4, 6]

In [2]:
a

[0, 2, 4, 6]

In [3]:
b = a

In [4]:
b

[0, 2, 4, 6]

In [5]:
b[1]

2

In [6]:
c = [0, 2, 4, 6]

In [7]:
c

[0, 2, 4, 6]

`b`는 리스트이기에 원소들의 값을 변경할 수 있다.

In [8]:
b[1] = 10

In [9]:
b

[0, 10, 4, 6]

그런데 `b` 뿐만 아니라 `a`도 변경됨을 알 수 있다.

In [10]:
a

[0, 10, 4, 6]

In [11]:
c

[0, 2, 4, 6]

### `id` 함수와  `==` 함수,  그리고 `is` 함수의 차이점

그렇다면 `a`와 `b`는 동일한 객체를 가리키고 있음을 알 수 있다.
따라서 `a`와 `b`의 동일성 여부를 물으면 True라고 되돌려 준다.

In [12]:
a is b

True

In [13]:
a is c

False

두 변수의 동일성 여부는 각 변수가 가리키는 메모리주소를 확인하면 된다. `id` 함수를 이용한다. 

In [14]:
id(a)

4386557320

In [15]:
id(b)

4386557320

In [16]:
id(c)

4397204256

`a`와 `b`가 가리키는 주소가 동일함이 확인되었다. 이 경우 `a`와 `b`가 가리키는 주소의 값 또한 동일하므로 `a == b`의 값도 `True`이다. 

In [17]:
a == b

True

In [18]:
d = [0, 10, 4, 6]

In [19]:
a == d

True

반면에 두 변수가 가리키는 주소가 다른 경우에는 약간이 혼돈이 발생할 수 있다.

In [20]:
c = 1
d = 1.0

In [21]:
id(c)

4300236008

In [22]:
id(d)

4299843152

In [23]:
c == d

True

`c`와 `d`는 서로 다른 메모리 주소를 가리키고 있다. 따라서 `c`와 `d`는 동일하지 않다. 즉

In [24]:
c is d

False

반면에 `c`와 `d`에 할당된 값은 동일하다. 즉

In [25]:
c == d

True

파이썬 내부에서 변수의 이름, 메모리 상태 등이 어떻게 변하는지를 확인하고자 하면 아래 사이트를 이용할 수 있다. 
파이썬 뿐만아니라 자바 코드도 실행할 수 있다.

http://pythontutor.com/

위 사이트에서 에를 들어 아래 코드를 입력하고 "Visualize Execution" 버튼을 눌러보도록 하자.

    a = [1, 2, 3]
    b = a
    c = [1, 2, 3]
    print(a is b)
    print(a is c)
    print(a == b)
    print(a == c)
    print(b is c)
    print(b == c)
    
"Visualize Execution" 버턴을 누룬 후 "Forward" 버튼을 연속적으로 누르면서 화면 오른쪽에서 그림이 어떻게 변하는지 살펴보아야 한다.

파이썬에는 포인터 변수만 있다는 사실을 이제 어렴풋이 이해할 수 있어야 한다.

위 예제를 파이썬튜토어에서 사용하면 아래와 같이 작동한다.

In [2]:
%load_ext tutormagic

In [3]:
%%tutor

a = [1, 2, 3]
b = a
c = [1, 2, 3]
print(a is b)
print(a is c)
print(a == b)
print(a == c)
print(b is c)
print(b == c)

## 함수의 부작용(side effect)

리스트 관련 메소드인 `pop()` 함수의 경우 특정값을 리턴하는 것과 더불어 리턴하는 값을 해당 리스트에서 삭제하는 부가 기능을 수행한다. 즉 메모리 상태가 변경된다. 이와같이 함수가 값을 리턴하는 것 이외에 메모리 상태를 변경한다면 이를 함수의 부작용이라 부른다. 

예제: 

    In [25]: L = [1, 2, 3]
    In [26]: L.pop()
    Out[26]: 3
    In [27]: L
    Out[27]: [1, 2]
    
즉, `pop()` 메소드를 호출할 때 마다 메모리에 저장된 `L`의 값 또한 변한다. 파이썬튜토어를 이용하면 아래와 같다.

In [28]:
%%tutor
L = [1, 2, 3]
a = L.pop()
L

### `sum` 함수 구현하기

파이썬에 기본적으로 내장된 함수들이 여럿 있다. 지금까지 살펴본 내장함수로 `abs`, `dir`, `float`, `format`, `help`, `id`, `int`, `len`, `min`, `max`, `range`, `type` 등이 있다. 보다 자세한 내용은 아래 사이트를 참조하면 된다.

https://docs.python.org/2/library/functions.html

이번엔 `sum` 이라는 내장함수를 살펴보고자 한다. `sum` 함수는 리스트 또는 튜플 자료형을 입력받으면 각 항목들의 값의 합을 리턴해준다. 대신에 숫자들로만 구성된 시퀀스에 대해서만 작동한다.

    In [25]: sum([1, 2, 3])
    Out[25]: 6

In [29]:
sum((1, 2, 3))

6

`sum` 내장함수와 동일한 값을 리턴하는 함수를 두 가지 방식으로 직접 구현해보도록 하자.

아래 정의에서 `sum1` 함수는 부작용이 없도록 구현한 반면에 `sum2` 함수는 부작용이 있도록 구현하였다. 두 함수의 차이점을 파이썬튜토어를 이용하여 확인할 수 있다. 

In [30]:
%%tutor

def sum1(xs):
    s = 0
    for i in xs:
        s = s + i
    return s

a = sum1([1,2,3])

In [31]:
%%tutor

def sum2(xs):
    s = 0
    for i in range(len(xs)):
        s = s + xs.pop()
    return s

a = sum2([1,2,3])

#### 부작용 사용 여부

함수를 정의할 때 부작용이 있도록 코딩할지 여부를 판단해야 하지만, 부작용이 필요한 이유가 명확하지 않다면 부작용이 없도록 함수를 코딩해야 한다. 하지만 부작용이 필요한 경우가 존재한다. 리스트의 `pop()` 메소드가 대표적인 경우이다.

#### 내장함수 활용

특정 기능을 수행하는 함수를 작성하기 전에 동일한 기능을 수행하는 내장함수가 이미 존재하는지 확인하는 것이 좋다. `sum` 함수의 경우 많이 사용되기에 이미 구현되어있음. 

## `return` 대 `print` 비교

파이썬의 모든 함수는 리턴값을 갖고 있다. 함수를 정의할 때 `return`값을 명시하지 않아도 자동으로 `return None`을 추가해서 처리한다.
`print` 함수가 대표적으로 `None`을 리턴값으로 갖고 있는 함수이다. 

리턴값이 `None`이면 재활용을 할 수 없다. `print` 함수가 대표적이다. 함수를 정의할 때 가능하면 `print` 문은 사용하지 않도록 한다. 어차피 재활용되지 않는 결과만 보여주기 때문이다. 

하지만 디버깅 등 위해 일부러 코드 중간중간에 `print`문을 사용하곤 한다. 기능이 제대로 작동하는지 확인하기 위한 용도로 사용한다.