예제 코드 : https://github.com/PacktPublishing/Clean-Code-in-Python-Second-Edition

컬러 이미지 다운로드 : https://static.packt-cdn.com/downloads/9781800560215_ColorImages.pdf

PEP 8 : https://peps.python.org/pep-0008/#overriding-principle

# 클린 코드의 의미

- 프로그래밍이란 아이디어를 다른 개발자에게 전달하는 것
- 클린코드의 판단은 다른 사람이 코드를 읽고 유지보수 가능한지 여부에 따라 결정

# 클린 코드의 중요성

- 유지보수성 향상, 기술 부채의 감소, 애자일 개발을 통한 효과적인 작업 진행, 성공적인 프로젝트 관리로 이어짐
- 기술부채
    - 나쁜 결정, 적당한 타협의 결과로 생긴 소프트웨어적 결함
    - 현재 -> 과거 : 현재 직면한 문제가 과거의 코드로 인해 발생했는가?
    - 현재 -> 미래 : 현재의 문제를 적절하게 해결하기 위해 시간을 투자하지 않고 지름길로 가기로 한다면 미래에 문제가 생길 위험은 없는가?
    - 기술부채는 이자를 유발해 추후 코드 수정은 더 큰 비용을 불러일으킴
- 소프트웨어는 쉽게 변경 가능한 수준을 유지할 때 의미가 있다

# 문서화(Documentation)

- 주석 추가와 문서화는 다름
- 코드 문서화는 Python에서 중요한 부분이다.
    - 변수의 타입이 동적이기에 변수나 객체의 값이 무엇인지 잃어버리기 쉽기 때문이다.
- 어노테이션을 사용하는 이유
    - mypy, pytype과 같은 도구를 사용해 변수 타입 힌트와 같은 자동화에 도움을 주기 때문이다.

In [7]:
# mypy를 사용한 변수 타입 검증 예시
import mypy

def myMultiply(n1: int, n2: int) -> int:
    return n1 * n2
 
print(myMultiply("1", "2"))

TypeError: can't multiply sequence by non-int of type 'str'

# 코드 주석

- 가능한 한 적은 주석을 갖는 것을 목표
- 좋은 코드는 코드 자체가 문서화됨(의미 있는 함수나 객체를 통해 책임 분리)
- 주석 처리된 코드는 바로 삭제(혼란 야기)

# Docstring

- 소스 코드에 포함된 문서
- 로직의 일부분을 무서화하기 위해 배치
- Docstring은 모듈, 클래스, 메소드, 함수에 대해 문서를 제공
- 동작방식과 입출력 정보 등을 확인할 수 있어야함
- 프로그램 디자인과 아키텍처에 대해 문서화하는 데에 유용함
- Python의 경우 동적 데이터 타입을 가져 필수적임

In [10]:
# Docstring 예시

dict.update??

"""
Docstring:
D.update([E, ]**F) -> None.  Update D from dict/iterable E and F.
If E is present and has a .keys() method, then does:  for k in E: D[k] = E[k]
If E is present and lacks a .keys() method, then does:  for k, v in E: D[k] = v
In either case, this is followed by: for k in F:  D[k] = F[k]
Type:      method_descriptor
"""

'\nDocstring:\nD.update([E, ]**F) -> None.  Update D from dict/iterable E and F.\nIf E is present and has a .keys() method, then does:  for k in E: D[k] = E[k]\nIf E is present and lacks a .keys() method, then does:  for k, v in E: D[k] = v\nIn either case, this is followed by: for k in F:  D[k] = F[k]\nType:      method_descriptor\n'

- docstring은 코드에서 분리되거나 독립된 것이 아니다.
- 객체에 docstring이 정의된 경우 __doc__ 속성을 통해 접근 가능하다.

In [18]:
def my_function():
    """임의의 계산 수행""" # docstring
    return None

# docstring 출력 1
my_function.__doc__

# docstring 출력 2
help(my_function)

Help on function my_function in module __main__:

my_function()
    임의의 계산 수행



# 어노테이션(Annotation)

- PEP-3107은 어노테이션을 소개함
- 코드 사용자에게 함수 인자로 어떤 값이 와야 하는지 힌트를 주자는 것
- 타입 힌팅(type hinting)을 활성화

- 변수의 예상 타입을 지정 가능

In [12]:
@dataclass
class Point:
    lat: float
    long: float


def locate(latitude: float, longitude: float) -> Point: # parameter에 필요한 데이터 타입과 return 타입 명시
    """Find an object in the map by its coordinates"""
    return Point(latitude, longitude)

locate??

- 위 예시에서 Point 클래스가 갖는 lat, long 속성은 float 타입을 갖지만 Python이 타입 검사를 강제하지 않는다.
- 어노테이션을 통해 변수의 의도를 설명하는 문자열, 콜백이나 유효성 검사 함수로 사용할 수 있는 callable 등 가능

어노테이션을 사용해 몇 초 후 어떤 작업을 실행하는 함수를 작성하는 경우

In [8]:
def launch_task(delay_in_seconds):
    return None

위 함수는 허용 가능한 지연시간은 몇 초인지? 분수를 입력해도 되는지? 코드 수정을 한다면 어떻게 진행할지에 대한 충분한 정보가 제공되지 못한다.

In [21]:
# 초단위는 float으로 받기로 명시
Seconds = float

# delay는 초로 받는 것으로 명시
def launch_task(delay: Seconds):
    return None

어노테이션을 사용하면 코드 스스로 자신의 기능에 대해 말을 한다고 할 수 있다. 

위 코드의 경우 시간을 어떻게 해석할지에 대해 작은 추상화를 했다고 할 수 있다.

나중에 입력 값의 형태를 변경하기로 했다면 이제 한 곳에서만 관련 내용을 변경하면 된다.

어노테이션을 사용하면 **__annotations__** 이라는 특수한 속성이 생긴다.

속성은 어노테이션의 이름과 매핑한 사전 타입의 값이다.

In [22]:
launch_task.__annotations__

{'delay': float}

In [23]:
locate.__annotations__

{'latitude': float, 'longitude': float, 'return': __main__.Point}

위 어노테이션 정보를 통해 문서 생성, 유효성 검증 또는 타입 체크를 할 수 있다.

어노테이션은 단순히 힌팅의 역할을 하는 것이 아니다. 다음과 같ㅇ티 유의미한 이름을 사용하거나 적절한 데이터 타입 추상화를 하도록 도와준다.

## 메소드 파라미터의 추상화

### typing module

In [60]:
# 함수의 파라미터의 데이터타입을 명시

def process_clients(clients: list):
    return None

In [28]:
# 세부적인 내용을 명시하는 경우

def process_clients(clients: list[tuple[int, str]]):
    return None

In [30]:
# 데이터 구조를 따로 정의하여 명시적으로 작성하는 경우

from typing import Tuple

# typing 모듈을 통해 Client는 int, str 을 갖는 튜플 데이터 타입으로 명시
Client = Tuple[int, str]
def process_clients(clients: list[Client]):
    return None

In [32]:
# clients는 int, str로 구성된 list 

process_clients.__annotations__

{'clients': list[typing.Tuple[int, str]]}

위와 같이 코드를 작성하는 것은 유의미한 문법 구조를 통해 코드의 의미나 의도를 더욱 쉽게 이해할 수 있도록 하자는 것이다.

@dataclass 데코레이터를 사용하면 별도의 __init__ 메소드에 변수를 선언하고 할당하는 작업을 하지 않아도 바로 인스턴스 속성으로 인식시킬 수 있다.

## 인스턴스 속성 인식

In [68]:
# AS-IS

class Point:
    def __init__(self, lat, long):
        self.lat = lat
        self.long = long
        
Point(1.2, 3.1)

<__main__.Point at 0x21331bba670>

In [42]:
# TO-BE

@dataclass
class Point:
    lat: float
    long: float
        
print(Point.__annotations__)
Point(1.1, 2.1)

{'lat': <class 'float'>, 'long': <class 'float'>}


Point(lat=1.1, long=2.1)

# Dataclass

- dataclasses 모듈은 __init__(), __repr__() 과 같은 특수 메소드를 사용자 정의 클래스에 자동 추가하는 데코레이터와 함수를 제공
- PEP 557 참고

In [57]:
from dataclasses import dataclass

@dataclass
class InventoryItem:
    """Class for keeping track of an item in inventory.""" # for docstring
    # set attributes with datatype
    name: str
    unit_price: float
    quantity_on_hand: int = 0
    
    # set parameters with datatype and defualt value
    def __init__(self, name: str, unit_price: float, quantity_on_hand: int = 0):
        self.name = name
        self.unit_price = unit_price
        self.quantity_on_hand = quantity_on_hand
    
    # set return datatype
    def total_cost(self) -> float:
        return self.unit_price * self.quantity_on_hand

## dataclass parameter


init: 참(기본값)이면, __init__() 메서드가 생성됩니다.

클래스가 이미 __init__() 를 정의했으면, 이 매개변수는 무시됩니다.

repr: 참(기본값)이면, __repr__() 메서드가 생성됩니다. 생성된 repr 문자열은 클래스 이름과 각 필드의 이름과 repr 을 갖습니다. 각 필드는 클래스에 정의된 순서대로 표시됩니다. repr에서 제외하도록 표시된 필드는 포함되지 않습니다. 예를 들어: 예 :InventoryItem(name='widget', unit_price=3.0, quantity_on_hand=10).

클래스가 이미 __repr__() 을 정의했으면, 이 매개변수는 무시됩니다.

eq: 참(기본값)이면, __eq__() 메서드가 생성됩니다. 이 메서드는 클래스를 필드의 튜플인 것처럼 순서대로 비교합니다. 비교되는 두 인스턴스는 같은 형이어야 합니다.

클래스가 이미 __eq__() 를 정의했으면, 이 매개변수는 무시됩니다.

order: 참이면 (기본값은 False), __lt__(), __le__(), __gt__(), __ge__() 메서드가 생성됩니다. 이것들은 클래스를 필드의 튜플인 것처럼 순서대로 비교합니다. 비교되는 두 인스턴스는 같은 형이어야 합니다. order 가 참이고 eq 가 거짓이면 ValueError 가 발생합니다.

클래스가 이미 __lt__(), __le__(), __gt__(), __ge__() 중 하나를 정의하고 있다면 TypeError 가 발생합니다.

unsafe_hash: False (기본값) 면 : eq 와 frozen 의 설정에 따라 __hash__() 메서드가 생성됩니다.

__hash__() 는 내장 hash() 에 의해 사용되며, 딕셔너리와 집합 같은 해시 컬렉션에 객체가 추가될 때 사용됩니다. __hash__() 를 갖는다는 것은 클래스의 인스턴스가 불변이라는 것을 의미합니다. 가변성은 프로그래머의 의도, __eq__() 의 존재와 행동, dataclass() 데코레이터의 eq 와 frozen 플래그의 값에 의존하는 복잡한 성질입니다.

기본적으로, dataclass() 는 안전하지 않다면 __hash__() 메서드를 묵시적으로 추가하지 않습니다. 기존에 명시적으로 정의된 __hash__() 메서드를 추가하거나 변경하지도 않습니다. __hash__() 문서에서 설명된 대로, 클래스 어트리뷰트를 __hash__ = None 로 설정하는 것은 파이썬에 특별한 의미가 있습니다.

__hash__() 가 명시적으로 정의되어 있지 않거나 None 으로 설정된 경우, dataclass() 는 묵시적 __hash__() 메서드를 추가할 수 있습니다. 권장하지는 않지만, unsafe_hash=True 로 dataclass() 가 __hash__() 메서드를 만들도록 강제할 수 있습니다. 이것은 당신의 클래스가 논리적으로 불변이지만, 그런데도 변경될 수 있는 경우 일 수 있습니다. 이는 특수한 사용 사례이므로 신중하게 고려해야 합니다.

다음은 __hash__() 메서드의 묵시적 생성을 관장하는 규칙입니다. 데이터 클래스에 명시적 __hash__() 메서드를 가지면서 unsafe_hash=True 를 설정할 수는 없습니다; 그러면 TypeError 가 발생합니다.

eq 와 frozen 이 모두 참이면, 기본적으로 dataclass() 는 __hash__() 메서드를 만듭니다. eq 가 참이고 frozen 이 거짓이면, __hash__() 가 None 으로 설정되어 해시 불가능하다고 표시됩니다(가변이기 때문입니다). 만약 eq 가 거짓이면, __hash__() 를 건드리지 않는데, 슈퍼 클래스의 __hash__() 가 사용된다는 뜻이 됩니다 (슈퍼 클래스가 object 라면, id 기반 해싱으로 돌아간다는 뜻입니다).

frozen: 참이면 (기본값은 False), 필드에 대입하면 예외를 발생시킵니다. 이것은 읽기 전용 고정 인스턴스를 흉내 냅니다. __setattr__() 또는 __delattr__() 이 클래스에 정의되어 있다면 TypeError 가 발생합니다. 아래 토론을 참조하십시오.

match_args: If true (the default is True), the __match_args__ tuple will be created from the list of parameters to the generated __init__() method (even if __init__() is not generated, see above). If false, or if __match_args__ is already defined in the class, then __match_args__ will not be generated.

버전 3.10에 추가.

kw_only: If true (the default value is False), then all fields will be marked as keyword-only. If a field is marked as keyword-only, then the only effect is that the __init__() parameter generated from a keyword-only field must be specified with a keyword when __init__() is called. There is no effect on any other aspect of dataclasses. See the parameter glossary entry for details. Also see the KW_ONLY section.

함수 혹은 메소드 호출시 parameter의 keyword를 필수로 입력하도록 지정

버전 3.10에 추가.

slots: If true (the default is False), __slots__ attribute will be generated and new class will be returned instead of the original one. If __slots__ is already defined in the class, then TypeError is raised.

버전 3.10에 추가.

버전 3.11에서 변경: If a field name is already included in the __slots__ of a base class, it will not be included in the generated __slots__ to prevent overriding them. Therefore, do not use __slots__ to retrieve the field names of a dataclass. Use fields() instead. To be able to determine inherited slots, base class __slots__ may be any iterable, but not an iterator.

weakref_slot: If true (the default is False), add a slot named “__weakref__”, which is required to make an instance weakref-able. It is an error to specify weakref_slot=True without also specifying slots=True.

In [7]:
@dataclass(init=True, repr=True, eq=True, order=False, unsafe_hash=False, frozen=False,
           match_args=True, kw_only=False, slots=False, weakref_slot=False)

SyntaxError: unexpected EOF while parsing (Temp/ipykernel_20976/3299092488.py, line 2)

# 도구 설정

- 반복적인 확인 작업을 줄이기 위해 코드 검사를 자동으로 실행하는 기본 도구 설정
- 코드는 사람이 이해하기 위한 것으로 좋은/나쁜 코드의 판단은 오직 사람이라는 것을 기억
- 다음의 질문에 답해볼 것


    - 동료 개발자가 쉽게 이해하고 따라갈 수 있는가?
    - 업무 도메인에 대해서 말하고 있는가?
    - 팀에 새로 합류하는 사람도 쉽게 이해하고 효과적으로 작업할 수 있는가?


- 코드 포매팅, 일관된 레이아웃, 적절한 들여쓰기는 당연한 것으로 이를 검사하는데 시간을 낭비하지 않고 자동화하여 확보한 시간을 이용해 레이아웃의 개념을 뛰어 넘는 그 이상의 것을 읽고 쓸 수 있어야 한다.


- **테스트와 체크리스트가 지속적으로 통합 빌드의 하나가 되도록 해야 하며 빌드 중 테스트를 통과하지 못하면 빌드 전체가 실패해야한다.**

- 이것만이 코드의 구조를 일관되게 유지할 수 있는 유일한 방법이다.
- 이러한 검사 결과를 팀에서 사용하는 객관적인 지표로 활용해야한다.
- 도구를 사용한다는 것은 특정 검사를 **반복**적으로 **자동화** 한다는 것을 의미한다.
- 즉 로컬 개발 환경에서 검사한 결과가 다른 곳에서 검사한 결과와 항상 일치해야한다.
- 이러한 도구는 CI(Continuous Integration) 빌드의 일부분으로 포함되어야 한다.

# 데이터 타입 일관성 검사

- 타입 힌트가 파이썬에 도입된 이후 데이터 타입의 일관성을 확인하기 위한 많은 도구가 개발됨
    - mypy
        - !pip install mypy
        - mypy는 프로젝트의 의존성 목록에 포함하는 것을 추천함
        - 가상 환경에 mypy를 설치하고 mypy [파일명] 명령어 실행 시 의심되는 오류들을 보고함
        - mypy 역시 완벽하지 않아 잘못된 오류 탐지는 다음과 같이 무시함
            - type_to_ignore = "something" # type : ignore
        - mypy를 유용하게 사용하려면 어노테이션 작성을 정확하게 해야한다.
        - 타입의 범위가 너무 일반적이면 정상적인 경우라고 판단하기 때문이다.

In [120]:
import logging
from typing import Iterable

logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

def broadcast_notification(message: str, relevant_user_emails: Iterable[str]):
    for email in relevant_user_emails:
        logger.info(f"{message} 메세지를 {email}에게 전달")
        
broadcast_notification("welcome", "user1@domain.com")

INFO:__main__:welcome 메세지를 u에게 전달
INFO:__main__:welcome 메세지를 s에게 전달
INFO:__main__:welcome 메세지를 e에게 전달
INFO:__main__:welcome 메세지를 r에게 전달
INFO:__main__:welcome 메세지를 1에게 전달
INFO:__main__:welcome 메세지를 @에게 전달
INFO:__main__:welcome 메세지를 d에게 전달
INFO:__main__:welcome 메세지를 o에게 전달
INFO:__main__:welcome 메세지를 m에게 전달
INFO:__main__:welcome 메세지를 a에게 전달
INFO:__main__:welcome 메세지를 i에게 전달
INFO:__main__:welcome 메세지를 n에게 전달
INFO:__main__:welcome 메세지를 .에게 전달
INFO:__main__:welcome 메세지를 c에게 전달
INFO:__main__:welcome 메세지를 o에게 전달
INFO:__main__:welcome 메세지를 m에게 전달


- 위 코드의 경우 분명 잘못된 코드이지만 mypy 검사 결과 이상이 없는 코드이다.
- 위 함수의 relevant_user_emails를 list나 tuple로 제한하면 mypy가 제대로 오류를 보고할 것이다.

In [130]:
import logging
from typing import Union, List, Tuple

logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

# 복수의 데이터 타입을 허용하는 경우 Union 사용
def broadcast_notification(message: str, relevant_user_emails: Union[List[str], Tuple[str]]):
    for email in relevant_user_emails:
        logger.info(f"{message} 메세지를 {email}에게 전달")
        
broadcast_notification("welcome", ["user1@domain.com"])

INFO:__main__:welcome 메세지를 user1@domain.com에게 전달


mypy와 pytype의 한 가지 큰 차이점은 오류를 확인하는 시점이다.

pytype의 경우 일시적으로 지정된 데이터 타입과 다른 타입을 사용하여도 최종 결과가 선언된 유형을 준수하는 한 문제로 간주되지 않는다.
이것이 좋은 특성일 수 있지만 일반적으로 코드는 항상성을 유지하는 것이 바람직하다.

## mypy와 pytype의 차이점

In [137]:
# mymy에서는 오류이지만 pytype은 오류가 아닌 경우

from typing import List
def get_list() -> List[str]: # 항상성을 List[str]으로 유지
    lst = ["Pycon"]
    lst.append(2023) # int가 추가되어 mypy에서 오류 발생
    return [str(x) for x in lst] # 결과적으로는 str 형변환이 수행되어 pytype은 오류 미발생

## black

- black은 라인 길이 제외와 같은 옵션을 허용하지 않으면서 고유하고 결정적인 방식으로 코드 형식을 지정하는 특징이 있다.
- 마치 한 사람이 작성한 코드처럼 코드를 통일된 스타일로 변경해주는 도구이다.
- https://github.com/psf/black