(workflow-style)=
# 워크플로: 스타일

좋은 코딩 스타일은 올바른 구두점과 같습니다. 없어도 되지만, 확실히 읽기 쉽게 만들어줍니다. 아주 초보 프로그래머라도 코드 스타일에 신경 쓰는 것이 좋습니다. 일관된 스타일을 사용하면 다른 사람(미래의 자신 포함!)이 작업을 읽기 쉬워지고 다른 사람의 도움이 필요한 경우 특히 중요합니다.

이 장에서는 [파이썬의 깔끔한 코드](https://testdriven.io/blog/clean-code-python/), *경제학자를 위한 코딩*의 [더 나은 코딩을 위한 팁](https://aeturrell.github.io/coding-for-economists/code-best-practice.html), 영국 정부 통계청의 [분석 및 연구를 위한 코드 품질 보증](https://best-practice-and-impact.github.io/qa-of-code-guidance/intro.html) 지침, 파이썬 스타일 가이드의 바이블인 [PEP 8 — 파이썬 코드 스타일 가이드](https://peps.python.org/pep-0008/)에서 가져온 몇 가지 중요한 스타일 포인트를 소개합니다.

코드 스타일을 지정하는 것은 처음에는 약간 지루하게 느껴지겠지만 연습하면 곧 제2의 천성이 될 것입니다. 또한 [Black](https://black.readthedocs.io/) 파이썬 패키지("원하는 색상은 무엇이든 가질 수 있지만 검은색이어야 함")와 같이 기존 코드를 빠르게 다시 스타일링할 수 있는 훌륭한 도구가 있습니다.

`pip install black`을 실행하여 Black을 설치한 후에는 Visual Studio Code 내의 명령줄(터미널이라고도 함)에서 사용할 수 있습니다. '터미널 -> 새 터미널'을 클릭하여 터미널을 열고 `black *.py`를 실행하여 현재 디렉터리의 모든 파이썬 스크립트에 표준 코드 스타일을 적용합니다.

## 이름

첫째, 이름이 중요합니다. 변수, 함수 또는 이름을 지정하는 모든 것에 의미 있는 이름을 사용하십시오. *지금은* 이해하지만 다른 사람이나 미래의 자신에게는 불분명할 약어는 피하십시오. 예를 들어 `re_wg_ph` 대신 `real_wage_hourly`를 사용하십시오. `temp`를 사용하고 싶은 유혹이 있다는 것을 알지만 나중에 `temp`가 무엇을 하거나 무엇인지 도저히 기억할 수 없을 때 어리석게 느껴질 것입니다. 부울(참 또는 거짓인 변수) 이름을 지정할 때 좋은 트릭은 `is` 다음에 부울 변수가 참조하는 것을 사용하는 것입니다. 예를 들어 `is_married`입니다.

이 일반적인 팁 외에도 파이썬에는 다양한 종류의 변수 이름 지정 규칙이 있습니다. 거의 모든 객체의 명명 규칙은 밑줄로 구분된 소문자입니다(예: `a_variable=10` 또는 'this_is_a_script.py'). 이러한 명명 스타일은 스네이크 케이스라고도 합니다. 그러나 다른 명명 규칙도 있습니다. [Allison Horst](https://twitter.com/allison_horst)는 사용 중인 다양한 규칙에 대한 이 멋진 만화를 만들었습니다.

![다른 명명 규칙. @allison_horst의 작품.](https://github.com/aeturrell/coding-for-economists/raw/main/img/in_that_case.jpg) 다른 명명 규칙. @allison_horst의 작품.

스네이크 케이스 규칙에는 세 가지 예외가 있습니다. 클래스는 카멜 케이스여야 합니다(예: `ThisIsAClass`). 상수는 대문자 스네이크 케이스여야 합니다(예: `THIS_IS_A_CONSTANT`). 패키지는 일반적으로 공백이나 밑줄이 없고 소문자입니다(예: `thisisapackage`).

**pandas** 데이터 프레임 또는 기타 문자열 변수의 열 이름을 빠르게 바꾸는 몇 가지 바로 가기를 보려면 유니코드 친화적인 [**slugify**](https://github.com/un33k/python-slugify) 라이브러리 또는 [**dataprep**](https://docs.dataprep.ai/index.html) 라이브러리의 `clean_headers()` 함수를 사용해 보십시오.

변수 이름이 좋을수록 코드가 더 명확해지고 주석을 덜 작성해도 됩니다!

요약하자면 다음과 같습니다.
- 의도를 드러내는 설명적인 변수 이름을 사용합니다(예: `days_since_treatment`).
- 이름에 모호한 약어를 사용하지 마십시오(예: `rw_ph` 대신 `real_wage_hourly` 사용).
- 항상 동일한 어휘를 사용하십시오(예: `worker_type`에서 `employee_type`으로 전환하지 마십시오).
- '매직 넘버', 즉 코드에서 주요 매개변수를 설정하는 숫자를 피하십시오. 대신 명명된 상수로 설정하십시오. 다음은 예입니다.
  ```python
    import random

    # 이것은 나쁩니다.
    def roll():
        return random.randint(0, 36)  # 매직 넘버!

    # 이것은 좋습니다.
    MAX_INT_VALUE = 36

    def roll():
        return random.randint(0, MAX_INT_VALUE)
  ```
- 함수 이름에는 동사를 사용합니다(예: `get_regression()`).
- 함수 이름에는 일관된 동사를 사용하고 `get_score()`와 `grab_results()`를 함께 사용하지 마십시오(대신 둘 다 `get` 사용).
- 변수 이름은 스네이크_케이스이고 모두 소문자여야 합니다(예: `first_name`).
 - 클래스 이름은 카멜케이스여야 합니다(예: `MyClass`).
 - 함수 이름은 스네이크_케이스이고 모두 소문자여야 합니다(예: `quick_sort()`).
 - 상수는 스네이크_케이스이고 모두 대문자여야 합니다(예: `PI = 3.14159`).
 - 모듈은 짧고 스네이크_케이스 이름이어야 하며 모두 소문자여야 합니다(예: `pandas`).
 - 작은따옴표와 큰따옴표는 동일하므로 하나를 선택하고 일관성을 유지하십시오. 대부분의 자동 포맷터는 `"`를 선호합니다.

## 공백

코드 조각을 공백으로 둘러싸면 가독성을 크게 향상시킬 수 있습니다. 이러한 규칙 중 하나는 함수 뒤에 두 개의 빈 줄이 와야 한다는 것입니다. 또 다른 규칙은 할당이 공백으로 구분된다는 것입니다.

```python
this_is_a_var = 5
```

또 다른 규칙은 `,` 뒤에 공백이 온다는 것입니다. 예를 들어 목록 정의에서는 다음과 같이 됩니다.

```python
list_var = [1, 2, 3, 4]
```

다음과 같지 않습니다.

```python
list_var = [1,2,3,4]
# 또는
list_var = [1 , 2 , 3 , 4]
```

## 코드 주석

앞서 언급했듯이 파이썬은 `#` 뒤의 모든 텍스트를 무시합니다. 이를 통해 **주석**, 즉 파이썬에서는 무시되지만 다른 사람이 읽을 수 있는 텍스트를 작성할 수 있습니다. 주석은 후속 코드가 수행하는 작업을 간략하게 설명하는 데 도움이 될 수 있습니다. 함수 및 변수 이름으로 전달되지 *않는* 추가 컨텍스트 정보를 제공하는 데 사용하십시오.

실제로 잘 작성된 코드는 무슨 일이 일어나고 있는지 더 명확하기 때문에 주석이 *덜* 필요합니다. 그리고 코드가 변경되어도 주석을 업데이트하지 않으려는 유혹이 있습니다. 따라서 주석을 달되 먼저 코드가 자체적으로 이야기를 전달하도록 할 수 있는지 확인하십시오.

또한 코드를 보기만 해도 이미 알고 있는 내용을 알려주는 "잡음" 주석은 피하십시오.

![고양이라는 레이블이 붙은 고양이 사진](https://i.postimg.cc/t4SV5NQg/catto.png)

마지막으로 함수에는 독스트링이라는 특수한 유형의 주석이 함께 제공됩니다. 다음은 함수의 입력 및 출력에 대한 모든 정보(입력 및 출력 유형 포함, 여기서는 데이터 프레임, `pd.DataFrame`이라고도 함)를 알려주는 예입니다.

```python
def round_dataframe(df: pd.DataFrame) -> pd.DataFrame:
    """데이터 프레임의 숫자 열을 유효 숫자 2자리로 반올림합니다.
    Args:
        df (pd.DataFrame): 입력 데이터 프레임
    Returns:
        pd.DataFrame: 숫자가 유효 숫자 2자리로 반올림된 데이터 프레임
    """
    for col in df.select_dtypes("number"):
        df[col] = df[col].apply(lambda x: float(f'{float(f"{x:.2g}"):g}'))
    return df
```

## 줄 너비 및 줄 연속

상당히 임의적인 역사적 이유로 PEP8은 각 코드 줄에 79자를 권장합니다. 일부 사람들은 특히 더 넓은 모니터가 등장하면서 이것이 너무 제한적이라고 생각합니다. 하지만 매우 긴 줄을 나누는 것은 좋습니다. 괄호 안에 포함된 모든 것은 다음과 같이 여러 줄로 나눌 수 있습니다.

```python
def function(input_one, input_two,
             input_three, input_four):
    result = (input_one,
              + input_two,
              + input_three,
              + input_four)
    return result
```

*메서드 체이닝*([](data-transform)에서 실제로 볼 수 있는 것)을 사용할 때는 체인을 괄호 안에 넣어야 하며 모든 메서드에 새 줄을 사용하는 것이 좋습니다. 아래 코드 조각은 좋은 예입니다.

In [None]:
import pandas as pd

df = pd.DataFrame(
    data={
        "col0": [0, 0, 0, 0],
        "col1": [0, 0, 0, 0],
        "col2": [0, 0, 0, 0],
        "col3": ["a", "b", "b", "a"],
        "col4": ["alpha", "gamma", "gamma", "gamma"],
    },
    index=["row" + str(i) for i in range(4)],
)


# 괄호 안의 체이닝은 작동합니다.

results = df.groupby(["col3", "col4"]).agg({"col1": "count", "col2": "mean"})

results

그리고 이것은 *하지 말아야 할* 것입니다.

```python
results = df
    .groupby(["col3", "col4"]).agg({"col1": "count", "col2": "mean"})

```

## 깔끔한 코드의 원칙

자동화는 스타일 적용에 도움이 될 수 있지만 *깔끔한 코드*를 작성하는 데는 도움이 되지 않습니다. 깔끔한 코드는 코드를 읽기 쉽고 유지 관리 가능하며 확장 가능하게 유지하는 데 도움이 되는 일련의 규칙과 원칙입니다. 코드를 작성하는 것은 쉽지만 깔끔한 코드를 작성하는 것은 어렵습니다! 그러나 이러한 원칙을 따르면 크게 잘못되지는 않을 것입니다.

### 반복하지 마십시오 (DRY)

DRY 원칙은 '모든 지식이나 논리는 시스템 내에서 단일하고 모호하지 않은 표현을 가져야 한다'는 것입니다. 코드를 원할 때 언제 어디서나 호출할 수 있는 재사용 가능한 조각으로 나눕니다. 긴 메서드를 작성하지 말고 논리를 명확하게 구분된 청크로 나눕니다.

이렇게 하면 코드를 반복할 필요가 없고 동일한 함수의 이 버전인지 저 버전인지 알 수 없으며 디버깅 노력에 끝없이 도움이 됩니다.

실제로 DRY를 적용하는 몇 가지 실용적인 방법은 함수를 사용하고, 여러 다른 스크립트에서 여러 번 실행해야 하는 함수나 코드를 다른 스크립트(예: `utilities.py`라는 이름)에 넣은 다음 가져오고, 코드를 작성하는 다른 방법이 더 간결하면서도 여전히 읽기 쉬운지 신중하게 생각하는 것입니다.

```{admonition} 팁
:class: tip

Visual Studio Code를 사용하는 경우 코드에서 마우스 오른쪽 버튼을 클릭하고 '메서드로 추출' 옵션을 사용하여 [코드를 자동으로 함수로 보낼 수 있습니다](https://code.visualstudio.com/docs/editor/refactoring).
```

### KISS (Keep It Simple, Stupid)

대부분의 시스템은 복잡하게 만드는 것보다 단순하게 유지하는 것이 가장 잘 작동합니다. 이것은 불필요한 복잡성을 피해야 한다는 규칙입니다. 코드가 복잡하면 나중에 다시 볼 때 무엇을 했는지 이해하기가 더 어려워질 뿐입니다.

### SoC (관심사 분리) / 모듈화하기

모든 것을 수행하는 단일 파일을 갖지 마십시오. 코드를 별개의 독립적인 모듈로 분리하면 읽고, 디버그하고, 테스트하고, 사용하기가 더 쉬워집니다. 다른 스크립트에서 함수를 만들고 가져오는 방법은 코딩 기본 사항 장에서 확인할 수 있습니다. 하지만 스크립트 내에서도 명확한 입력과 출력이 있는 함수를 정의하여 코드를 모듈화할 수 있습니다.

하나의 목적을 달성하는 코드가 약 30줄보다 길면 함수로 만들어야 한다는 것이 좋은 경험 법칙입니다. 약 500줄보다 긴 스크립트도 분리하는 것이 좋습니다.

마찬가지로 모든 것을 시도하는 단일 함수를 갖지 마십시오. 함수에도 제한이 있어야 합니다. 대략 한 가지 작업을 수행해야 합니다. 함수 이름을 지정할 때 이름에 'and'를 사용해야 한다면 아마도 두 개의 함수로 분리하는 것이 좋습니다.

함수에는 '부작용'도 없어야 합니다. 즉, 값만 입력으로 받고 return 문을 통해 값만 출력해야 합니다. 전역 변수를 수정하거나 다른 변경을 해서는 안 됩니다.

또 다른 좋은 경험 법칙은 각 함수에 많은 개별 인수가 없어야 한다는 것입니다.

모듈성과 함수 생성에 대한 마지막 팁은 함수에서 '플래그'(부울 조건이라고도 함)를 사용해서는 안 된다는 것입니다. 다음은 예입니다.

```python
# 이것은 나쁩니다.
def transform(text, uppercase):
    if uppercase:
        return text.upper()
    else:
        return text.lower()

# 이것은 좋습니다.
def uppercase(text):
    return text.upper()

def lowercase(text):
    return text.lower()
```