![15_lib](https://user-images.githubusercontent.com/10287629/144736792-3b81f44c-4801-4c98-9866-1c392aefb85a.png)


<div style="page-break-after: always;"></div> 

<h1>학습 목표<span class="tocSkip"></span></h1>


- 코드 작성 스타일의 중요성을 설명할 수 있다.
- `flake8`과 같은 린터와 `black`과 같은 자동 포맷터의 용도 차이를 설명할 수 있다. 
- 명령줄, 주피터 및 기타 통합개발환경에서 린팅과 포맷팅을 처리할 수 있다. 
- VSCode 및 기타 통합개발환경에서 파이썬 모듈을 (`.py` 파일로) 작성할 수 있다. 
- `import` 명령으로 설치되었거나 스스로 작성한 패키지를 수입할 수 있다. 
- 파이썬에서 참조의 개념을 설명할 수 있다.
- 파이썬에서 범위의 개념을 설명할 수 있다. 
- 파이썬에서 변수를 수정하면, 다른 변수도 수정될 것인지 예측할 수 있다.
- 파이썬에서 함수가 호출하는 쪽의 매개 변수를 수정할 것인지 예측할 수 있다. 
- 파이썬에서 `==`와 `is` 중에서 적절하게 선택할 수 있다.

<div style="page-break-after: always;"></div> 

## 1. 스타일 지침

|![그림 1. 초보자의 코드를 검토해주는 실력자](https://user-images.githubusercontent.com/10287629/144739565-4d6303e0-6a87-42fb-bdf8-848b0c393368.png)<br>그림 1. 초보자의 코드를 검토해주는 실력자 <br>출처: [xkcd.com](https://imgs.xkcd.com/comics/code_quality.png)|
|:---|

- 코드가 동작한다고 해서, 일이 끝났다고 생각하면 안된다. 
  - 코드의 사용자는 두 그룹이다. 
    - 컴퓨터 (이 기계가 당신의 코드를 기계어로 번역한다.)
    - 인간   (동료와 후배가 당신의 코드를 읽고, 수정한다.) 
  - 여기에서는 인간을 위해서 코드를 어떻게 작성해야 하는지에 대하여 공부하자. 

- 스타일 적용은 중요하다. 
  - 당신의 코드를 (미래의 자신을 포함해서)  
    다른 사람과 공유해야 하는 상황에서는 특히 중요하다. 
  - "코드는 짧은 시간동안에 작성되겠지만, 아주 오랫동안 읽힌다!"
  - 일관성이 무엇보다도 중요하다.  
    "전문가도 실수할 수 있지만, 일관성은 지킨다!"  

- `PEP 8`은 파이썬 코드에 대한 스타일 지침이다.  
  여기서는 `PEP 8`에 대하여 아주 간략하게 소개한다. 

1. 들여쓰기는 공백 문자 4개로 처리하라. 

2. 연산자 주변에는 공백문자(whitespace)를 두라.  
      예를 들어서, `x=1`이 아니라, `x = 1`로 작성하라. 

3. 그렇지만 공백문자를 남용하지는 말라.  
      예를 들어서, `func (1)`이 아니라, `func(1)`로 작성하라. 

4. 문자열을 감쌀 때, 홑 따옴표인지 쌍 따옴표인지는 문제되지 않는다.  
      다만, `docstring`은 '''세겹 홑 따옴표'''가 아니라, """세겹 쌍 따옴표"""로 작성하라.     

5. 변수와 함수 이름은 단어 사이에 언더스코어 문자를 써서  
  `underscores_between_words`처럼 작성하라.

- [한글로 짧게 요약된 `PEP 8`](https://wayhome25.github.io/python/2017/05/04/pep8/)을 꼭 읽어보라.
- [`PEP 8`에 관한 영문 원문](https://www.python.org/dev/peps/pep-0008/)도 참고하라. 
- 기억할 것이 많아 보이지만,  
  다행스럽게도 <b>린터(linter)</b>와 <b>포맷터(formatter)</b>가 있어서  
  우리가 코드를 통일된 스타일로 작성하도록 도와줄 것이다.
  
  <div style="page-break-after: always;"></div>

### 1.1 린터(linter)

- 린팅(linting)은 파이썬 소스 코드에서  
  프로그래밍과 스타일에 관련된 문제를 부각시키는 표시(flag)를  
  달아주는 도구이다. 
  [한글 위키백과의 린트](https://ko.wikipedia.org/wiki/%EB%A6%B0%ED%8A%B8_(%EC%86%8C%ED%94%84%ED%8A%B8%EC%9B%A8%EC%96%B4))에 대한 설명을 참고하라.  
- 린터(linter)를 문서편집용 소프트웨어에서 제공되는 "철자 검사" 기능과 유사하다고 생각하라. 
  - `pycodestyle`, `pylint`, `pyflakes`, `flake8` 등의 린터가 유명하다.  
  - 여기에서는 [flake8](https://flake8.pycqa.org/en/latest/)를 사용한다.  
    커맨드 창 명령행에서 다음과 같이 설치할 수 있다:

    ```shell
    conda install -c anaconda flake8
    ```

- `flake8`은 커맨드 창 명령행에서 실행 가능하다:

    ```shell
    flake8 경로/검토할_파이썬_코드_파일.py
    ```

- 쉘(shell) 명령을 주피터에서 직접 실행할 수도 있는데,  
  쉘 명령 앞에 느낌표 `!`를 붙여서 입력하면 된다. 
- [`bad_style.py`](https://github.com/TomasBeuzen/python-programming-for-data-science/blob/main/chapters/data/bad_style.py) 링크를 클릭하여 열리는 코드 창에서  
  오른쪽 상단에 보이는 `Raw` 단추를 클릭한 후,  
  코드의 아무 곳이나 오른쪽 마우스로 눌러서 보이는  
  `다른 이름으로 저장...` 메뉴 항목을 이용하여  
  현행 폴더에 이 파일을 저장하라.    


- 원본 소스 파일은 다음과 같다:  
  (포맷은 형편 없지만, 오류는 없다.) 

In [4]:
"""bad_style.py"""

x = {  'a':37,'b':42,
'c':927}
very_long_variable_name = {'field': 1,
                        'is_debug': True}
this=True

if very_long_variable_name is not None and very_long_variable_name["field"] > 0 or very_long_variable_name['is_debug']:
 z = 'hello '+'world'
else:
 world = 'world'
 a = 'hello {}'.format(world)
 f = rf'hello {world}'
if (this): y = 'hello ''world'#FIXME: https://github.com/python/black/issues/26
class Foo  (     object  ):
  def f    (self   ):
    return       37*-2
  def g(self, x,y=42):
      return y
# fmt: off
custom_formatting = [
    0,  1,  2,
    3,  4,  5
]
# fmt: on
regular_formatting = [
    0,  1,  2,
    3,  4,  5
]

In [5]:
!flake8 bad_style.py

bad_style.py:4:45: W291 trailing whitespace
bad_style.py:5:5: E129 visually indented line with same indent as next logical line
bad_style.py:6:2: E111 indentation is not a multiple of four
bad_style.py:8:2: E111 indentation is not a multiple of four
bad_style.py:8:16: F821 undefined name 'world'
bad_style.py:9:10: E701 multiple statements on one line (colon)
bad_style.py:9:31: E261 at least two spaces before inline comment
bad_style.py:9:31: E262 inline comment should start with '# '
bad_style.py:10:1: E302 expected 2 blank lines, found 0
bad_style.py:10:13: E201 whitespace after '('
bad_style.py:10:25: E202 whitespace before ')'
bad_style.py:11:3: E111 indentation is not a multiple of four
bad_style.py:11:8: E211 whitespace before '('
bad_style.py:11:19: E202 whitespace before ')'
bad_style.py:12:11: E271 multiple spaces after keyword
bad_style.py:13:3: E301 expected 1 blank line, found 0
bad_style.py:13:3: E111 indentation is not a multiple of four
bad_style.py:13:16: E231 missing wh

- `bad_style.py` 파일의 소스 코드를 수정하여,  
  `flake8`이 아무런 지적도 하지 않도록 만들어 보자. 

In [6]:
"""good_style.py"""

x = {"a": 37, "b": 42, "c": 927}
very_long_variable_name = {"field": 1, "is_debug": True}
this = True

if (
    very_long_variable_name is not None
    and very_long_variable_name["field"] > 0
    or very_long_variable_name["is_debug"]
):
    z = "hello " + "world"
else:
    world = "world"
    a = "hello {}".format(world)
    f = rf"hello {world}"

if this:
    y = "hello world"  # FIXME: https://github.com/python/black/issues/26


class Foo(object):
    def f(self):
        return 37 * -2

    def g(self, x, y=42):
        return y


# fmt: off
custom_formatting = [
    0,  1,  2,
    3,  4,  5
]
# fmt: on
regular_formatting = [0, 1, 2, 3, 4, 5]


- 린터를 공부했다. 이제 포맷터를 공부하자. 
<div style="page-break-after: always;"></div>

### 1.2 포맷터(formatter)

- 포맷팅(formatting)이란  
  코드에 포함된 공백 문자, 들여쓰기, 한 행의 길이 등을 수정하여 
  코드 구조를 개선하는 작업이다. 
- `autopep8`, `black`, `yapf` 등의 포맷터가 유명하다. 
- 여기서는 [black](https://black.readthedocs.io/en/stable/?badge=stable)을 사용한다. 
  다음과 같이 설치할 수 있다:

  ```shell
  conda install -c conda-forge black
  ```

- `black`은 명령행에서 실행 가능하다:

  ```shell
  black path/file_to_check.py --check
  ```

- `--check` 옵션을 지정하면, 당신의 코드가 `black style`에 적합한지를 검사만 할뿐 포맷을 수정하지는 않는다.  
  포맷 수정을 원한다면 이 옵션을 제거하라. 

- 원본 소스 파일은 다음과 같다:  
  (포맷은 형편 없지만, 오류는 없다.) 

In [7]:
"""bad_style.py"""

x = {  'a':37,'b':42,
'c':927}
very_long_variable_name = {'field': 1,
                        'is_debug': True}
this=True

if very_long_variable_name is not None and very_long_variable_name["field"] > 0 or very_long_variable_name['is_debug']:
 z = 'hello '+'world'
else:
 world = 'world'
 a = 'hello {}'.format(world)
 f = rf'hello {world}'
if (this): y = 'hello ''world'#FIXME: https://github.com/python/black/issues/26
class Foo  (     object  ):
  def f    (self   ):
    return       37*-2
  def g(self, x,y=42):
      return y
# fmt: off
custom_formatting = [
    0,  1,  2,
    3,  4,  5
]
# fmt: on
regular_formatting = [
    0,  1,  2,
    3,  4,  5
]

In [8]:
!black bad_style.py --check

All done! \u2728 \U0001f370 \u2728
1 file would be left unchanged.


In [9]:
!black bad_style.py

All done! \u2728 \U0001f370 \u2728
1 file left unchanged.


- `balck`을 써서 포맷을 수정한 코드는 아래와 같다:  
  (`# fmt: off` 또는 `# fmt: on`으로 포맷팅을 켜거나 끄는 방법을 눈여겨 보라.)

In [10]:
"""good_style.py"""

x = {"a": 37, "b": 42, "c": 927}
very_long_variable_name = {"field": 1, "is_debug": True}
this = True

if (
    very_long_variable_name is not None
    and very_long_variable_name["field"] > 0
    or very_long_variable_name["is_debug"]
):
    z = "hello " + "world"
else:
    world = "world"
    a = "hello {}".format(world)
    f = rf"hello {world}"
if this:
    y = "hello " "world"  # FIXME: https://github.com/python/black/issues/26


class Foo(object):
    def f(self):
        return 37 * -2

    def g(self, x, y=42):
        return y


# fmt: off
custom_formatting = [
    0,  1,  2,
    3,  4,  5
]
# fmt: on
regular_formatting = [0, 1, 2, 3, 4, 5]

- 린터와 포맷터를 공부했다. 이제 주석을 공부하자. 
<div style="page-break-after: always;"></div>

### 1.3 주석(comment)

- 코드를 이해하려면 주석이 중요하다.
  - `docstring`이 함수가 <i>무엇</i>을 수행하는지 알려주기는 한다. 
  - 주석은 함수가 <i>어떻게</i> 작동하는지 알려주어야 한다. 
- 다음은 주석에 관한 PEP 8 지침이다. 
  - **인라인 주석**: (명령행과 같은 행에 쓰는) 인라인 주석에서는  
               명령 뒤에 최소한 공백문자 2개를 두고 `#`을 시작하고, 
               `#` 뒤에는 공백 문자 1개를 두고 내용을 쓰라.  
  - **블럭 주석**:   여러 행으로 연속되는 블럭 주석에서는  
                매 행마다 `#`로 시작해서 이어지는 공백 문자 1개 뒤에 내용을 쓰되,  
                선행 코드 행에 적합한 수준으로 들여쓰기를 하라. 
  - 주석은 너무 장황하지도, 너무 함축적이지도 말아야 한다.  
    적절하게 주석을 다는 것은 쉽지 않다. 
- 다음은 적절한 주석의 예이다:  

In [11]:
def random_walker(T):
    x = 0
    y = 0

    for i in range(T): 
        
        # 0과 1 범위에서 난수를 생성한다. 생성된 난수가 
        # [0,0.25), [0.25,0.5), [0.5,0.75) 및 [0.75,1) 
        # 중의 어느 구간에 해당하느냐에 따라서 
        # 우향, 좌향, 상향, 하향으로 이동한다.
        # (이것은 블럭 주석이다.) 
        
        r = random() 
        if r < 0.25:
            x += 1      # 우향 이동
        elif r < 0.5:
            x -= 1      # 좌향 이동
        elif r < 0.75:
            y += 1      # 상향 이동
        else:
            y -= 1      # 하향 이동 (이것은 인라인 주석이다.)

        print((x,y))

    return x**2 + y**2

- 다음은 **나쁜 주석**의 예이다.  
  내용이 과하거나, 포맷이 적절하지 못하다. 

In [12]:
def random_walker(T):
    # 좌표 초기화
    x = 0
    y = 0

    for i in range(T):# T 회 반복
        r = random()
        if r < 0.25:
            x += 1  # 우향 이동
        elif r < 0.5:
            x -= 1  # 좌향 이동
        elif r < 0.75:
            y += 1       # 위로 간다
        else:
            y -= 1

        # 좌표를 출력한다.
        print((x, y))

    # 파이썬에서, ** 연산자는 제곱을 의미한다. 
    return x ** 2 + y ** 2

- 린터, 포맷터 및 주석을 공부했다. 이제 파이썬 스크립트를 공부하자.
<div style="page-break-after: always;"></div> 

## 2. 파이썬 스크립트

- 주피터는 멋진 데이터 과학 도구이다.  
  주피터를 쓰면, 텍스트와 이미지로 설명하면서 코딩과 시각화를 함께 할 수 있다. 
- 개발 작업에서 주피터는 시험적 또는 탐색적 코딩 도구로 적합하다.  
- 그렇지만 프로젝트가 커지면,  
  파이썬 스크립트를 `.py` 파일 형태로 작성하게 된다. 
- `.py` 파일은 파이썬에서 "모듈(module)"이라 부르는데,  
  여기에는 함수, 클래스, 변수 등의 코드가 작성된다. 
- 프로젝트 시작 단계에서는 주피터로 작업을 시작하고,  
  점진적으로 완성된 함수, 클래스, 스크립트 등을 `.py` 파일로 옮기는 것을 추천한다. 

- 파이썬 모듈을 작성하는데 특별한 소프트웨어가 필요한 것은 아니다.  
  - 어떤 텍스트 편집기로도 코드를 작성할 수 있다. 
  - 단지 파일 확장자를 `.py`로 지정하여 저장하면 된다. 
  - 하지만 이 모든 작업을 더 쉽게 할 수 있는 소프트웨어가 존재한다. 
- 통합개발환경(IDE)는 "Integrated Development Environment"의 줄임말이다.
  - IDE는 코드 개발을 위한 포괄적 기능을 제공한다.  
    (예를 들어, 컴파일, 디버깅, 포맷팅, 테스팅, 린팅, ...)  
  - 가장 유명한 파이썬 IDE는 [젯브레인 파이참(PyCharm)](https://www.jetbrains.com/pycharm/) 및 [아나콘다 스파이더(Spyder)](https://www.spyder-ide.org/)이다. 
  - 확장 기능을 써서 파이썬 IDE로 쓸 수 있는 것으로는 [마이크로소프트 Visual Studio Code](https://code.visualstudio.com), [Atom](https://atom.io/), [Sublime Text](https://www.sublimetext.com/) 등이다.
  - VSCode도 인기가 큰데, [great Python tutorial online](https://code.visualstudio.com/docs/languages/python)이란 파이썬 튜토리얼을 제공하고 있으며, 강력하게 추천한다. 
  - 본 교재에서는 맞춤형 `.py` 파일을 수입(import)하는 방법에 대해서  
    다음 절에서 다룰 예정이지만, IDE 작업을 소개하지는 않는다.  

- 파이썬 스크립트를 공부했다. 이제 라이브러리 수입을 공부하자.
<div style="page-break-after: always;"></div> 

## 3. 라이브러리 수입

- 파아썬에서는 다른 모듈의 코드에 접근하기 위하여,  
  수입한다는 의미의 `import` 명령을 사용한다.
  이 명령을 이미 써본 경험이 있을 것이다. 
- [수입에 관한 파이썬 한글 공식 문서](https://docs.python.org/ko/3/reference/import.html)를 참고하라. 
- 여기에서는 일단 경험을 통해 배우자.

### 3.1 수입 방법

- 모듈(module) 및 패키지(package)
  - 모듈은 확장자가 `.py`인 파이썬 코드 파일에 저장된 내용(이 메모리에 적재된 것)을 의미한다.   
    - 확장자를 제외한 파일 이름 부분이 모듈 이름이다.
    - 모듈은 파이썬 코드가 저장된(, 확장자가 `.py`로 지정된) 파일이라고 생각해도 좋다.  
  - 패키지는 파이썬 모듈( 파일)이 저장된 디렉토리이다. 
    - 패키지 (폴더)에는 여러 파이썬 모듈( 파일)과 함께 `__init__.py` 파일이 저장되어야 한다(설사 빈 파일이더라도!). 
    - 패키지 내부에는 서브 패키지(하위 디렉토리) 또는 모듈( 파일)이 저장된다.   
- 미리 작성한 [`wallet.py`](https://raw.githubusercontent.com/TomasBeuzen/python-programming-for-data-science/main/chapters/wallet.py) 모듈을 다운로드받아서 공부하자.  
  - 링크를 클릭하면 열리는 코드에서 우측 마우스로 `다른 이름으로 저장...` 메뉴를 클릭하여  
  이 파일을 본 노트북 파일과 같은 폴더에 저장하라.  
- 이 코드에는 (지갑이라는 뜻으로) `Wallet` 클래스가 작성되어 있는데,  
  물건을 사고 팔면서 발생하는 현급의 수입과 지출을 관리한다. 

In [13]:
# This module contains a class Wallet that can be used to store, spend, and earn cash.


class Wallet:
    """A wallet that can store, spend, and earn cash.

    Parameters
    ----------
    balance : number
        Amount of starting cash.

    Attributes
    ----------
    item : str
        The type of item, a "Wallet"
    balance : float
        The amount of money currently in the wallet.
    """

    item = "Wallet"

    def __init__(self, balance):
        """See help(Wallet)"""
        self.balance = balance

    def buy_item(self, cost, number=1):
        """Spend money and reduce your balance.

        Parameters
        ----------
        cost : number
            cost of the item to buy.
        number : int
            number of items to buy.

        Raises
        ------
        InsufficientCashError
            If you do not have enough money to spend.
        """
        if cost * number <= self.balance:
            self.balance -= cost * number
        else:
            raise InsufficientCashError(
                f"You can't spend ${cost * number} as you only have ${self.balance}."
            )

    def sell_item(self, cost, number=1):
        """Sell items and increase your balance.

        Parameters
        ----------
        cost : number
            cost of the item to buy.
        number : int
            number of items to buy.

        """
        self.balance += cost * number


class InsufficientCashError(Exception):
    """Custom error used when there is insufficient cash for a transaction."""

    pass


- 이 코드를 우리가 작성할 코드에서 활용하려면,  
  아래와 같이 `wallet.py` 파일에서 확장자를 제외한 파일 이름만 지정하여 수입한다: 

In [14]:
import wallet  # `wallet.py` 파일에서 `wallet` 모듈을 수입

- `dir(wallet)`를 써서 수입한 모듈에서 제공되는 모든 내용을 확인할 수 있다: 

In [15]:
dir(wallet)

['InsufficientCashError',
 'Wallet',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__']

- `as` 예약어로 `import` 명령으로 수입하는 패키지의 별칭을 부여할 수 있다: 

In [16]:
import wallet as w  # wallet 모듈에 대하여 w라는 별칭 부여

In [17]:
w.Wallet(100)  # 별칭을 이용하여 모듈 내부 클래스에 접근 

<wallet.Wallet at 0x1c0e76dceb0>

In [18]:
w.InsufficientCashError()  # 별칭을 이용하여 모듈 내부 클래스에 접근

wallet.InsufficientCashError()

- 앞에서는 모듈 전체를 수입했다. 
- 다음과 같이 모듈에서 특정 함수/클래스/변수를 선택적으로 수입할 수도 있다:

In [19]:
from wallet import Wallet  # 모듈의 특정 클래스만 수입

In [20]:
Wallet(100) # 수입된 내용은 모듈 이름 접두어 없이 접근 가능

<wallet.Wallet at 0x1c0e76fd460>

- 이상의 방법을 혼용할 수도 있다:

In [21]:
from wallet import Wallet as w  # 모듈에서 특정 클래스에 별칭을 부여하여 수입

In [22]:
w(100)  # 별칭으로 클래스에 접근

<wallet.Wallet at 0x1c0e75f63d0>

- 모듈에서 제공되는 모든 자원을 한꺼번에 수입할 수도 있지만, 권장하는 방법은 아니다: 

In [23]:
from wallet import *  # 모듈의 모든 자원을 한꺼번에 수입

In [24]:
Wallet(100)  # 모듈 내부의 모든 자원에 접근 가능함

<wallet.Wallet at 0x1c0e76e8b50>

In [25]:
InsufficientCashError()  # 모듈 내부의 모든 자원에 접근 가능함

wallet.InsufficientCashError()

- 작업 폴더 외부로부터 함수를 수입하는 방법을 공부해 보자. 
- 지금까지는 `wallet.py`가 현재 작업 중인 폴더에 저장되어 있기 때문에 `import wallet` 명령으로 수입이 가능했다.  
  - 만일 `wallet.py`가 다른 폴더에 저장되어 있었다면, 추가적인 작업이 필요했을 것이다. 
  - 이런 상황을 위하여 `hello.py` 파일을 (현행 작업 폴더와 형제 수준인) `data` 폴더에 저장해 두었다. 

- `hello.py` 파일의 내용은 다음과 같다: 

```python
PLANET = "Earth"

def hello_world():
    print(f"Hello {PLANET}!")
```

- 마법 커맨드를 `!`를 붙여서 활용하면, 쉘 명령을 노트북 코드 셀에서 직접 실행할 수 있다. 

In [26]:
!type data\hello.py

PLANET = "Earth"

def hello_world():
    print(f"Hello {PLANET}!")


- (현행 작업 폴더와 모듈이 존재하는 폴더가 다르므로) 아래와 같은 명령은 작동하지 않는다:

In [27]:
from hello import hello_world

ModuleNotFoundError: No module named 'hello'

- 파이썬이 수입 대상을 탐색하는 경로에 해당 폴더를 추가해 주어야 한다. 
- 이 작업을 하려면 `sys`라는 파이썬 내장 모듈을 활용해야 한다:

In [28]:
import sys                   # 파이썬 내장 모듈은 직접 수입 가능함
sys.path.append('../data/')  # 형제 폴더를 지정
sys.path                     # 파이썬이 모듈을 탐색할 때 사용하는 경로 리스트를 확인

['C:\\ocean\\2021\\work\\py4ds\\5_style_scripts_imports',
 'C:\\anaconda3\\envs\\vd21\\python38.zip',
 'C:\\anaconda3\\envs\\vd21\\DLLs',
 'C:\\anaconda3\\envs\\vd21\\lib',
 'C:\\anaconda3\\envs\\vd21',
 '',
 'C:\\anaconda3\\envs\\vd21\\lib\\site-packages',
 'C:\\anaconda3\\envs\\vd21\\lib\\site-packages\\win32',
 'C:\\anaconda3\\envs\\vd21\\lib\\site-packages\\win32\\lib',
 'C:\\anaconda3\\envs\\vd21\\lib\\site-packages\\Pythonwin',
 'C:\\anaconda3\\envs\\vd21\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\logis\\.ipython',
 '../data/']

- `../data/` 경로가 `sys.path`에 포함되었다.  
  이제 `hello.py` 파일로부터 수입이 가능하다:

In [29]:
from hello import hello_world, PLANET  # hello 모듈로부터 함수와 변수를 수입

In [30]:
PLANET          # 수입한 변수 확인

'Earth'

In [31]:
hello_world()   # 수입한 함수 호출

Hello Earth!


- 지금까지 라이브러리 수입 방법을 공부했고, 이제부터는 패키지에 대하여 공부하자. 
<div style="page-break-after: always;"></div>

### 3.2 패키지(package)

- 코드가 `.py` 파일로 저장되면 모듈이 되고, 이런 모듈들이 모이면 이를 파이썬 패키지로 만들 수 있다. 
- 당신만의 파이썬 패키지를 만들어 보고 싶다면,  
  [점프 투 파이썬에서 한글로 제공하는 패키지](https://wikidocs.net/1418)에 대한 강좌를 참고하라. 
- 후속되는 장에서 (다른 기관이 만들어 제공하는) 유명한 데이터 과학 패키지를 활용하는 방법을 공부할 예정이다. 
  - `NumPy`: 파이썬에서 데이터 과학 계산의 토대로 활용되는 패키지 
  - `Pandas`: 파이썬에서 데이터 분석에 가장 많이 활용되는 패키지 
- `NumPy`나 `Pandas` 패키지를 컴퓨터에 설치하면,  
  파이썬이 설치된 경로를 알고 있기 때문에,  
  그냥 수입하기만 하면 사용이 가능하다. 

- 패키지를 설치하고, 수입하여 활용하는 예제를 공부하자. 

- 넘파이 패키지는 다음 명령으로 설치한다: 

  ```shell
  conda install numpy
  ``` 

In [7]:
import numpy as np

In [8]:
np.array([1, 2, 3])

array([1, 2, 3])

In [11]:
np.random.randint(0, 10, 3)

array([0, 0, 9])

- 넘파이 패키지는 향후 데이터 분석에서 본격적으로 공부하고,  
  표준 라이브러리에서 제공되는 패키지를 활용해 보자. 

- [파이썬 표준 라이브러리](https://docs.python.org/ko/3/library/)에는 방대한 패키지가 존재한다. 
  - 파이썬 표준 라이브러리는 파이썬에 내장되어 있으므로, 별도로 설치할 필요가 없다. 
  - 앞으로 함께 공부하면서 이들과 접하게 될 것이다. 
- 프로그램 작성 과정에서 특정 기능이 필요하다면,  
  해당 기능을 제공하는 패키지가 존재하는지 먼저 확인할 필요가 있다.  
  (대부분의 경우, 원하는 기능을 제공하는 패키지가 이미 존재할 것이다.)
  - 예를 들어서, `for` 반복을 처리와 관련해서  
    진척도를 보여주는 진행 막대(progress bar)가 필요할 수 있다.  
    이런 기능을 제공하는 [tqdm package](https://github.com/tqdm/tqdm)를 사용하면 된다:

In [14]:
from tqdm import tqdm
for i in tqdm(range(int(10e6))):  # 천만회 반복
    i ** 2

100%|█████████████████████████████████████████████████████████████████| 10000000/10000000 [00:06<00:00, 1439861.64it/s]


- 위 실행 결과에서; 
  - `00:05<00:00`는 '실행_시간 < 예상_잔여_시간'을 의미한다. 
  - `it/s`는 'iterations per second'라는 의미이다. 

- 패키지 공부를 마쳤고, 값과 참조에 대하여 공부하자. 
<div style="page-break-after: always;"></div> 

## 4. 값과 참조

### 4.1 참조(reference)에 의한 처리

- 파이썬에서 모든 자료는 객체로 저장되며,  
  변수 이름은 단지 해당 객체가 저장된 메모리 위치에 대한 참조(reference)일 뿐이다.  
  - 변수는 해당 객체의 메모리 위치를 가리키고 있을 뿐이다.
  - 변수와 객체는 서로 다른 존재이며, 단지 연결되어서 참조할 뿐이다. 

- 객체는 값의 수정 가능성에 따라 두 유형으로 분류한다. 
    - 수정 불가형(immutable) 객체는 정수, 실수, 논리값, 그리고 튜플이다. 
    - 수정 가능형(mutable) 객체는 리스트, 사전, 집합이다. 

- 객체의 수정 가능성 여부에 따라서 객체 값 변경을 처리하는 방법이 달라진다.
    - 수정 불가형 객체는 객체의 값을 직접 수정할 수 없기 때문에,  
      다른 메모리 위치에 (수정된 값을 가지는) 객체를 새롭게 생성하고,  
      변수가 이 새로운 객체를 참조하도록, 변수에 저장된 참조 값을 변경하여 준다. 
    - 수정 가능형 객체는 객체가 생성되어 저장된 메모리 위치에서  
      값의 수정(뿐만 아니라, 추가 및 삭제)이 가능하므로,  
      객체가 저장된 곳에서 직접적으로 객체 값의 변경(또는 추가 및 삭제)이 이루어지고,  
      따라서 변수가 참조하는 값에 변함이 없다. 

- 이러한 상황을 파악하기 위하여 다음과 같은 함수를 활용하자:
  - 여기서 id()는 객체의 고유값이다. 
  - 객체 고유값에 대한 숫자로서의 의미는 없다. 
  - 하지만 id() 값이 다르다면 다른 장소에 생성된 서로 다른 객체라는 의미로 해석할 수 있다. 

In [94]:
def show_obj(obj, context=None):
    """obj 객체의 값과 obj 객체의 id() 값을 context 문자열과 함께 출력"""
    print(f"{context}: {obj}\t at {id(obj)}") 

- 아래 코드에서 (수정 불가형인) 수치형 객체의 값이 수정되는 과정을 파악하자:

In [95]:
x = 3
show_obj(x, "생성 직후 x")
x = 5
show_obj(x, "수정 직후 x")

생성 직후 x: 3	 at 140730265968448
수정 직후 x: 5	 at 140730265968512


- 변수 값을 수정한 직후에 변수 x의 id() 값이 변화한다.
  - 엄밀하게 말하자면,  
    '변수 값을 수정'한다고 하면 틀린 표현이고,  
    '변수가 참조하는 객체 값을 수정'한다고 해야 맞다. 
  - 수치형 객체는 수정 불가형 객체이다. 
  - 그러므로 객체가 저장된 곳에서 직접 값을 수정할 수 없다. 
  - 수정 불가형 객체의 값을 수정하려면,  
    수정할 값을 가지는 객체를 다른 곳에 생성하고,  
    변수 x가 새롭게 생성된 객체를 참조하게 된다. 
  - 따라서 수정 불가형 객체의 값을 변경하게되면,  
    참조하는 변수의 id() 값이 변화하게 된다. 
    
- 수정 가능형 객체의 경우는 어떨까?

- 아래 코드에서 (수정 가능형인) 리스트형 객체의 값이 수정되는 과정을 파악하자:

In [154]:
x = [1, 2, 3]
show_obj(x, "     생성 직후 x")
x[-1] = 0
show_obj(x, "원소 수정 직후 x")
x.append(4)
show_obj(x, "원소 추가 직후 x")
x.remove(1)
show_obj(x, "원소 삭제 직후 x")

     생성 직후 x: [1, 2, 3]	 at 1928048394304
원소 수정 직후 x: [1, 2, 0]	 at 1928048394304
원소 추가 직후 x: [1, 2, 0, 4]	 at 1928048394304
원소 삭제 직후 x: [2, 0, 4]	 at 1928048394304


In [156]:
# 원소 값을 수정하는 것과 달리, 전체 값을 재 지정하면 새로운 객체가 생성된다. 
x = [4, 5, 6]  
show_obj(x, "  재 지정 직후 x")

  재 지정 직후 x: [4, 5, 6]	 at 1928048423936


- 리스트형 객체의 원소 값을 수정/추가/삭제 하여도 변수 x의 id() 값에 변함이 없다.
  - 리스트형 객체는 수정 가능형 객체이다. 
  - 그러므로 객체가 저장된 곳에서 직접 값을 수정할 수 있다. 
  - 수정 가능형 객체의 값은 변경되어도,  
    참조하는 변수의 id() 값이 변화하지 않는다. 
- 그러나 리스트형 객체를 재 지정(re-assignment)한 이후에는 변수 x의 id() 값이 변화한다. 
  - 그러나 값을 전체적으로 재 지정하는 경우에는 새로운 객체가 생성된다.
  - 변수는 새롭게 생성된 객체를 참조하도록 참조 값이 변화된다. 

- 아래 코드의 실행 결과로 출력되는 값은 얼마일까?

In [97]:
x = 1   # 원본 생성
y = x   # 복사본 생성
x = 2   # 원본 수정
# (x, y)  # 결과를 예측해보라!

In [98]:
x = 1   # 원본 생성
y = x   # 복사본 생성
x = 2   # 원본 수정
(x, y)  # 확인 (복사본은 불변)

(2, 1)

|![10_immutable_copy](https://user-images.githubusercontent.com/10287629/130617210-3748ef0e-d871-4f36-a478-4fb9829c2152.png)<br>그림 2. 수정 불가형 객체를 복사한 후 원본을 수정하는 과정|
|:---|



- 수치형 변수의 복사본을 생성하고, 원본 객체의 값을 변경해도  
  복사본 변수의 값은 변하지 않는다. 
- 수치형 객체는 수정 불가형이므로, 값을 수정할 때 새로운 객체가 생성된다. 

- 리스트형의 경우에는 어떨까?

In [99]:
x = [1]   # 원본 생성 
y = x     # 복사본 생성
x[0] = 2  # 원본 수정
# (x, y)    # 결과를 예측해보라!

In [100]:
x = [1]   # 원본 생성 
y = x     # 복사본 생성
x[0] = 2  # 원본 수정
(x, y)    # 확인 (복사본도 수정됨)

([2], [2])

|![20_mutable_copy](https://user-images.githubusercontent.com/10287629/130619537-10596f13-365b-47f2-b213-7f474f4b7cc0.png)<br>그림 3. 수정 가능형 객체를 복사한 후 원본을 수정하는 과정|
|:---|



- 리스트형 변수의 복사본을 생성하고, 원본 객체의 값을 변경하니  
  복사본 변수의 값도 변경되었다. 
- 리스트형 객체는 수정 가능형이므로, 값을 수정할 때 기존 객체가 수정된다.

- 파이썬에서 지정(assignment) 또는 대입 연산은 **동일한 객체를 참조하게** 만드는 것이다.  
  `y = x`라는 지정 연산은  
    - x 변수에 저장된 특정 객체에 대한 참조(주소) 값을 y 변수에 복사하는 것이다. 
    - x 변수가 참조하던 객체를 y 변수도 동일하게 참조하게 만드는 것이다. 
    - 결과적으로 x 변수와 y 변수에 저장된 참조 값이 같아지고, 같은 값을 가지는 단일 객체를 함께 참조하게 된다.
- 이러한 방식을 "객체 참조를 값으로 복사"한다고 표현한다. 

In [101]:
x = 100                                   # 원본 생성
show_obj(x, "  원본 생성 후   원본 x")
y = x                                     # 복사본 생성
show_obj(y, "복사본 생성 후 복사본 y")
x = 200                                   # 원본 수정
show_obj(x, "\n  원본 수정 후   원본 x")
show_obj(y, "  원본 수정 후 복사본 y")    # (원본만 수정됨)

  원본 생성 후   원본 x: 100	 at 140730265971552
복사본 생성 후 복사본 y: 100	 at 140730265971552

  원본 수정 후   원본 x: 200	 at 140730265974752
  원본 수정 후 복사본 y: 100	 at 140730265971552


- 수정 불가형 객체의 경우 상황은 다음과 같다: 
    - 수정 전/후 값의 변화는: 
      - 원본 및 복사본 생성 직후에 원본과 복사본의 값은 동일하다.
      - 원본 수정 후에 원본만 값이 변경되고, 복사본은 변경되지 않았다.
    - 수정 전/후 id() 값의 변화는: 
      - 원본 및 복사본 생성 직후에 원본과 복사본의 id() 값은 동일하다. 
      - 원본의 값을 수정하자 id() 값이 변화했다. 
      - 복사본은 원본의 값을 수정해도 id() 값의 변화가 없다. 
    - 원본을 수정했을 때 원본의 id() 값이 달라지는 것에 주목해야 한다:  
      - 이는 정수형 객체가 수정 불가형이기 때문이다.
      - 수정 불가형이므로 새로운 값으로 수정된 새로운 객체가 생성된 것이다. 
      - 원본 변수는 새로운 객체를 참조하도록 변경되었다. 

In [102]:
x = [1]                                   # 원본 생성 
show_obj(x, "  원본 생성 후   원본 x")
y = x                                     # 복사본 생성
show_obj(y, "복사본 생성 후 복사본 y")
x[0] = 2                                  # 원본 수정
show_obj(x, "\n  원본 수정 후   원본 x")
show_obj(y, "  원본 수정 후 복사본 y")    # (복사본도 수정됨)

  원본 생성 후   원본 x: [1]	 at 1928028102464
복사본 생성 후 복사본 y: [1]	 at 1928028102464

  원본 수정 후   원본 x: [2]	 at 1928028102464
  원본 수정 후 복사본 y: [2]	 at 1928028102464


- 수정 가능형 객체의 경우 상황은 다음과 같다: 
    - 수정 전/후 값의 변화는: 
      - 원본 및 복사본 생성 직후에 원본과 복사본의 값은 동일하다.
      - 원본 수정 후에 원본과 함께 복사본 값도 변경되었다.
    - 수정 전/후 id() 값의 변화는: 
      - 원본 및 복사본 생성 직후에 원본과 복사본의 id() 값은 동일하다. 
      - 원본 값을 수정해도 원본 및 복사본 변수의 id() 값은 변함이 없다. 
    - 이는 리스트형 객체가 수정 가능형이기 때문이다.
      - 수정 가능형이므로 객체가 저장되어 있던 곳에서 직접 수정되는 것이다. 
      - 원본 변수이든 복사본 변수이든 새로운 객체를 참조할 일이 없고, 원래의 참조 값을 유지한다. 
- 앞서 원본을 수정하면 복사본도 함께 수정되었는데,  
  복사본을 수정하면 원본도 함께 수정된다. 

In [103]:
y[0] = 3                                  # 복사본 수정
show_obj(x, "\n복사본 수정 후   원본 x")
show_obj(y, "복사본 수정 후 복사본 y")    # (원본도 수정됨)


복사본 수정 후   원본 x: [3]	 at 1928028102464
복사본 수정 후 복사본 y: [3]	 at 1928028102464


- 원본과 복사본이 동일한 객체를 참조하고 있었던 것이다. 

- 정리하면 다음과 같다:
  - 변수는 객체에 대한 참조 값을 가지고 있을 뿐이다. 
  - `y = x`와 같은, 두 변수 간의 지정 연산은 객체에 대한 참조 값을 복사할 뿐이며,  
    결과적으로 두 변수가 같은 객체를 참조하게 만든다. 
    - 객체가 수정 가능형인지, 수정 불가형인지에 따라서 값의 변경 방식이 달라진다. 
        - 수정 가능형이라면,  
          객체의 고유값은 변하지 않는 상태에서 객체의 값만 변경되므로,  
          원본과 복사본은 같은 객체를 참조하는 상태가 유지된다. 
        - 수정 불가형이라면, 
          객체의 값을 변경하려면 객체의 고유값이 달라지게 되고,  
          수정되는 변수만 변경된 객체를 참조하게 된다. 
  
<div style="page-break-after: always;"></div>

### 4.2 추가적인 이상함

In [104]:
x = np.array([1, 2, 3])  # (다음 장에서 배울) 넘파이 배열, 수정 가능형
y = x
show_obj(x, "복사 후   원본 x")
show_obj(y, "복사 후 복사본 y")

x = x + 5

show_obj(x, "\n덧셈 후   원본 x")
show_obj(y, "덧셈 후 복사본 y")

복사 후   원본 x: [1 2 3]	 at 1928028123472
복사 후 복사본 y: [1 2 3]	 at 1928028123472

덧셈 후   원본 x: [6 7 8]	 at 1928028127024
덧셈 후 복사본 y: [1 2 3]	 at 1928028123472


In [105]:
x = np.array([1, 2, 3])
y = x
show_obj(x, "복사 후   원본 x")
show_obj(y, "복사 후 복사본 y")

x += 5

show_obj(x, "\n증가 후   원본 x")
show_obj(y, "증가 후 복사본 y")

복사 후   원본 x: [1 2 3]	 at 1928028125488
복사 후 복사본 y: [1 2 3]	 at 1928028125488

증가 후   원본 x: [6 7 8]	 at 1928028125488
증가 후 복사본 y: [6 7 8]	 at 1928028125488


- `x += 5`는 `x = x + 5`와 다르다.
  - `+=` 연산자는 `__iadd__` 함수를 호출하고, `+` 연산자는 `__add__` 함수를 호출한다. 
  - `+=`와 같은 연산자를 인플레이스(in-place) 연산자라고 하는데,  
    이들은 복사본을 만들지 않고 객체 값을 저장된 장소에서 직접 변경한다.
  - 반면에 `+`와 같은 연산자는 표준 연산자라고 하는데, 이들은 복사본을 만들어서 연산 결과를 처리한다.  
  - `+=`와 같은 인플레이스 연산자는 `x`가 참조하는 객체 값을 (저장된 곳에서) 수정한다. 
  - `=`과 같은 표준 연산자는 우선 `x + 5`를 메모리의 새로운 배열에서 계산한 후,  
    변수 `x`의 참조값을 이 새로운 배열에 대한 참조값으로 덮어 쓴다.
- 집합체 변수에 대한 일반적 규칙
  - 원본에 대한 수정이 아닌 경우: 메모리에서 새로운 객체를 생성한 후, 그 참조값을 `x`에 저장한다. 
    `x = ...`:  
  - 원본에 대한 수정인 경우: `x`의 참조값을 이용하여 내용을 수정한다. 
    - `x.SOMETHING = y   # x의 속성에 대한 수정` 
    - `x[SOMETHING] = y  # x의 원소에 대한 수정`   
    - `x *= y            # x의 원소에 대한 수정`

- 변경 가능한(mutable) 객체와 변경 불가한(immutable) 객체
  - 변경 가능: 리스트(list), 사전(dict), 집합(set)
  - 변경 불능: 기본 자료형(int, string, bool), 튜플(tuple)

- 변경 가능한 객체는 원본에서 직접 변경이 수행되므로,  
  내용 변경 후 `id()`값에 변화가 없다. 
- 변경 불가한 객체는 원본에서 직접 내용이 변경되지 못하므로,  
  복사본을 만들어서 변경이 수행되고, 참조값을 복사본으로 수정하게 되어, 
  변경 후 `id()`값이 바뀐다. 

- 변경 가능 객체부터 살펴보자.

In [122]:
# `list`는 변경 가능 객체이지만, 표준 연산자로 새로운 값을 지정하면 고유값이 변화한다. 
obj = [1, 2]
show_obj(obj)
obj = obj + [3]
show_obj(obj)


None: [1, 2]	 at 1928027760512
None: [1, 2, 3]	 at 1928033289152


In [147]:
# `list`는 변경 가능 객체이고, 인플레이스 연산으로 내용 수정해도 고유값은 불변이다. 
obj = [1, 2]
show_obj(obj)
obj += [3]
show_obj(obj)


None: [1, 2]	 at 1928027183488
None: [1, 2, 3]	 at 1928027183488


In [150]:
# `set`은 변경 가능 객체이고, 표준 연산자로 새로운 값을 지정하면 고유값이 변화한다. 
obj = {1, 2}
show_obj(obj)
obj = obj | {3}          # 집합 원소 추가
show_obj(obj)

None: {1, 2}	 at 1928033239552
None: {1, 2, 3}	 at 1928049006400


In [151]:
# `set`은 변경 가능 객체이고, 인플레이스 연산으로 내용 변경해도 고유값이 불변이다. 
obj = {1, 2}
show_obj(obj)
obj.add(3)          # 집합 원소 추가
show_obj(obj)

None: {1, 2}	 at 1928033239552
None: {1, 2, 3}	 at 1928033239552


- 변경 불가능 객체도 살펴보자.

In [152]:
# 기본 자료형 `int`는 변경 불가능 객체이므로, 인플레이스 연산으로 내용을 변경해도 고유값이 변한다.  
obj = 1
show_obj(obj)
obj += 1
show_obj(obj)

None: 1	 at 140730265968384
None: 2	 at 140730265968416


In [126]:
# 기본 자료형 `float`는 변경 불가능 객체이고, 인플레이스 연산으로 내용을 변경해도 고유값이 변한다.
obj = 1.
show_obj(obj)
obj += 1
show_obj(obj)

None: 1.0	 at 1928033313200
None: 2.0	 at 1928033313328


In [153]:
# `tuple`은 변경 불가능 객체이고, 인플레이스 연산으로 내용을 변경해도 고유값이 변한다.
obj = (1, 2)
show_obj(obj)
obj += (3, )
show_obj(obj)

None: (1, 2)	 at 1928062664192
None: (1, 2, 3)	 at 1928045671808


In [135]:
# `stirng`은 변경 불가능 객체이고, 인플레이스 연산으로 내용을 변경해도 고유값이 변한다.
obj = "happy"
show_obj(obj)
obj += "!"
show_obj(obj)

None: happy	 at 1928033355632
None: happy!	 at 1928033357488


- 결론적으로, 
  - 변경 가능 객체는 인플레이스 연산에서는 고유값이 불변이고, 표준 연산에서는 고유값이 변경된다.
  - 변경 불가 객체는 인플레이스 연산을 수행해도 고유값이 변한다.
  
<div style="page-break-after: always;"></div>

### 4.3 복사(copy) 및 깊은 복사(deepcopy)

- `copy` 라이브러리를 써서 복사 행위를 통제할 수 있다:
    - 일반 지정 연산으로는 참조값만 복사하고, 동일 객체를 함께 참조한다. 
    - `copy.copy()`로 복사하면 내용 복사로 처리된다. 
    - `copy.deepcopy()`로 복사하면 깊은 복사로 처리된다. 

In [138]:
import copy  # 파이썬 표준 라이브러리이므로 단순히 수입

In [139]:
x = [1]     # 리스트는 변경 가능 객체
y = x       # 단순 대입이므로, 참조값만 복사됨
x[0] = 2    # 원본 수정 (결국 복사본도 수정되는 효과)
y           # 복사본도 원본과 동일함    

[2]

In [140]:
x = [1]             # 리스트는 변경 가능 객체
y = copy.copy(x)    # 내용 복사, 복사본을 별도로 만들어서 y가 이를 참조함
x[0] = 2            # 원본만 수정
y                   # 내용 복사본이므로, 수정된 원본과 무관함

[1]

In [141]:
x = [1]             # 리스트는 변경 가능 객체
y = x[::]           # 내용 복사, 복사본을 별도로 만들어서 y가 이를 참조함
x[0] = 2            # 원본만 수정
y                   # 내용 복사본이므로, 수정된 원본과 무관함

[1]

- 아래 결과를 예측할 수 있는가?

In [144]:
x = [[1], [2, 99], [3, "hi"]]      # 리스트의 리스트

y = copy.copy(x)                   # 내용 복사
# y = x[::]                        # 내용 복사
print("After copy.copy():")
print(x)
print(y)
print("")

x[0][0] = "pikachu"                # 원본 내용을 수정
print("After modifying x[0][0]:")
print(x)
print(y)

After copy.copy():
[[1], [2, 99], [3, 'hi']]
[[1], [2, 99], [3, 'hi']]

After modifying x[0][0]:
[['pikachu'], [2, 99], [3, 'hi']]
[['pikachu'], [2, 99], [3, 'hi']]


- "헐...!!" 
  - (내용) 복사를 수행했는데도, `y`가 `x`와 같은 값을 가진다니...
  - 이 코드에서 `copy`로 내용을 복사했지만,  
    리스트의 껍데기만 복사하게 된다. 
  - 우리 리스트는 '리스트의 리스트'였으므로 바깥쪽 리스트는 내용을 복사하겠지만,  
    바깥쪽 리스트 내부의 리스트는 역시 참조값만 복사된다. 
  - `y = copy.copy(x)` 실행 과정에서 이런 일이 벌어졌던 것이다. 

|![그림 4. (내용) 복사했지만, 내부 리스트는 여전히 참조값만 복사되는 경우](https://user-images.githubusercontent.com/10287629/144739670-456bdf5c-7f81-453e-9b2b-025d60ac9295.png)<br>그림 4. (내용) 복사했지만, 내부 리스트는 여전히 참조값만 복사되는 경우 |
|:---|

- 이런 상황에서는 `is`를 써서 내부 상황을 파악할 수 있다. 
  - `is`는 두 객체가 같은 메모리(즉, 같은 객체)를 참조하고 있는지 알려준다. 
  - `==`는 두 객체의 내용이 같은지를 알려준다. 

In [114]:
x == y # 두 리스트의 내용은 같다고 확인됨

True

In [115]:
x is y # 그렇지만, 두 리스트가 참조하는 메모리(객체)는 다르다. 

False

- 이런 논리를 응용하여, `y`에만 내용을 추가할 수 있다. `x`에는 영향을 주지 않은 상태로: 

In [116]:
y.append(5)     # 서로 다른 객체이므로 y에만 항목이 추가됨

print(x)
print(y)

[['pikachu'], [2, 99], [3, 'hi']]
[['pikachu'], [2, 99], [3, 'hi'], 5]


In [117]:
x == y          # 이제 내용도 달라졌음 

False

- 기이하게 보일테지만, 말이 되는 논리이다:

|![그림 5. 내용은 같았지만, 서로 다른 객체인 두 리스트에서 한쪽에만 항목을 추가한 결과](https://user-images.githubusercontent.com/10287629/144739678-b9a9ba35-cfdf-4fcb-a323-56b79443b10f.png)<br>그림 5. 내용은 같았지만, 서로 다른 객체인 두 리스트에서 한쪽에만 항목을 추가한 결과 |
|:---|


- 요약하자면, `copy`에 의한 내용 복사는 단지 첫 단계에만 적용된다.  
- 모든 단계에서 내용을 복사하려면 `deepcopy()` 함수를 써야 한다:

|![그림 6. deepcopy](https://user-images.githubusercontent.com/10287629/144739680-78c5dde5-9289-474e-9816-f9aed223f650.png)<br>그림 6. deepcopy() 함수로 복사한 결과 |
|:---|


In [146]:
x = [[1], [2, 99], [3, "hi"]]

y = copy.deepcopy(x)            # 깊은 복사로 모든 수준에서 참조가 아닌 값을 복사

x[0][0] = "pikachu"             # 깊은 복사이므로 x와 y는 완전히 다른 객체
print(x)
print(y)

[['pikachu'], [2, 99], [3, 'hi']]
[[1], [2, 99], [3, 'hi']]


- 흥미를 느낀다면, 파이썬의 놀라운 동작 전모를 [WTF Python 한글 번역본](https://github.com/satwikkansal/wtfpython/blob/master/README.md)에서 파악할 수 있다! 
- 지금까지 `데이터 과학을 위한 파이썬 프로그래밍` 과정을 공부하였다. 
  - 실습 환경 준비
  - 파이썬 자료형
  - 제어구조와 함수
  - 문서화, 테스트 및 클래스
  - 스타일, 스크립트 및 라이브러리
- 이제 파이썬 공부를 마쳤으니, `데이터 분석` 과정으로 전진하시기 바란다. 
  - 넘파이
  - 판다스
  - 데이터 정제
  - 데이터 분석
  - 데이터 시각화
  - ...
- "배움에는 끝이 없다!"는 말로 파이썬 기초 공부를 마무리 하고 싶다.