CLEAN CODE python

## Chapter 1.소개, 코드 포매팅과 도구

클린코드의 의미
- 프로그래밍 언어의 진정한 의미는 아이디어를 다른 개발자에게 전달하는 것
    - 우리는 코드를 작성하는 것보다 읽는데 훨씬 더 많은 시간을 소비함.
- 중요성
    - 유지보수성 향상
    - 기술 부채의 감소
    - 애자일 개발을 통한 효과적인 작업 진행
    - 성공적인 프로젝트 관리
- 좋은 코드 레이어아웃
    - 일관성 -> 가독성이 높아지고 이해하기 쉬워짐

훌륭한 코드는 그 자체로 자명하지만 문서화 또한 잘 되어 있다. 주석을 추가하는 것과는 다르다. 문서화를 통해 데이터 타입이 무엇인지를 설명하고 예제를 제공할 수 있다.
- Docstring
   - 소스 코드에 포함된 문서(documnention)이다. 기본적으로 리터럴 문자열이다.
   - 이유가 아니라 설명이다.
   - 코드의 특정 component(module, class, method or function)에 대한 문서화다. 이런 컴포넌트에 사용하는 것은 허용될 뿐 아니라 권장되는 부분이다. 가능한 많은 docstring을 추가하는 것이 좋다.
       - 동적 타이핑 언어이므로 변수가 어떤 데이터 타입인지 강요를 하지 않는다. 
       - 예상되는 함수의 입력과 출력을 문서화하면 사용자가 사용할 때 함수가 어떻게 동작하는지 이해하기 쉽다.
   - 모든 팀원이 문서화에 참여할 수 있어야 한다. 단점은 지속적인 수작업이다. 
       - 적절한 문서를 유지하는 것은 소프트웨어 엔지니어링에서 피할 수 없는 과제이다. 문서화에 수작업이 필요한 이유는 결국은 다른 사람이 읽기 때문
   - 주석의 단점
       - 코드로 아이디어를 제대로 표현하지 못했음을 나타냄.
       - 오해의 소지가 있다. 복잡한 코드를 이해하기 위해 시간을 할애하는것 보다 최악은 코드가 어떻게 동작하는지 주석을 확인한 후 실제로 동작하는 것의 다른점을 파악하는것.
       - 사람들은 코드를 변경할 때 주석 업데이트를 깜빡하는 경우가 많다. 방금 수정한 코드 근처의 주석이 현재와 일치하지 않을 경우 또 다른 위험을 초래
- Annotation
    - 기본 아이디어: 코드 사용자에게 함수 인자로 어떤 값이 와야 하는지 힌트를 주는 것. 변수의 예상 타입을 지정할 수 있다.
    - 파이썬은 동적으로 타입을 결정하기 때문에 함수를 메서드를 거치면 변수나 객체의 값이 무엇인지 알기 어려운 경우가 많음. 어노테이션을 통해 이러한 정보를 명시하면 향후 개발에 도움이 됨. (python은 타입을 강제하지 않는다.)

#### Docstring example

In [1]:
def my_function(x):
    '''3*x'''
    return 3*x

In [3]:
my_function.__doc__

'3*x'

In [9]:
class Point:
    def __init__(self, lat, long):
        self.lat = lat
        self.long = long

def locate(latitute: float, longititue: float) -> Point:
    '''맵에서 좌표에 해당하는 객체를 검색'''


In [15]:
locate.__annotations__

{'latitute': float, 'longititue': float, 'return': __main__.Point}

이 정보를 사용하여 문서 생성, 유효성 검증 또는 타입 체크를 할 수 있다.


In [16]:
#python 3.6 >
class Point:
    lat : float
    long : float
    def __init__(self, lat, long):
        self.lat = lat
        self.long = long

In [17]:
Point.__annotations__

{'lat': float, 'long': float}

#### annotation은 docstring을 대체하는 것일까?
- docstring과 annotation은 서로 보와적인 개념이다.
- 하지만, docstring을 통해 보다 나은 문서화를 위한 여지를 남겨두어야 한다.
- 특히, 동적 데이터 타입과 중첩 데이터 타입의 경우 예상 데이터의 예제를 제공하여 어떤 형태의 데이터를 다루는지 제공하는 것이 좋다.


In [18]:
def data_from_response(response: dict)->dict:
    if response["status"] != 200:
        raise ValueError
    return {"data": response['payload']}
# 명확히 알 수 없다.

In [19]:
def data_from_response(response: dict)->dict:
    '''response에 문제가 없다면 response의 payload를 반환
    
    - response 사전의 예제:
    {
        "status": 200, # <int>
        "timestamp": "...", # 현재 시간의 ISO 포맷 문자역
        "payload": {...} # 반환하려는 사전 데이터
    }
    - 반환 사전 값의 예제:
    {'data':{..}}
    - 발생 가능한 예외:
    - HTTP status가 200이 아닌 경우 ValueError 발생
    '''
    if response["status"] != 200:
        raise ValueError
    return {"data": response['payload']}


- 이 문서는 입출력 값을 더 잘 이해하기 위해서 뿐아니라 단위 테스트에서도 유용한 정보로 사용된다.
- 이러한 docstring을 사용했을 때의 이슈는 코드가 좀 더 커지게 되고, 실제 효과적인 문서가 되려면 보다 상세한 정보가 필요함.

### 기본 품질 향상을 위한 도구 설정
- 반복적인 확인 작업을 줄이기 위해 코드 검사를 자동 실행하는 기본 도구를 설정
- 코드는 사람이 이해하기 위한 것이므로 좋은 코드인지 나쁜 코드인지 판단할 수 있는 것도 오직 사람
- 개발자는 코드 리뷰에 시간을 투자하고, 훌륭한 코드가 무엇인지, 얼마나 읽기 쉽고 이해하기 쉬운 코디인지에 대해 고민해야함.
- 동료의 코드에 다음과 같은 질문을 할 수 있어야함
    - 이 코드를 동료 개발자가 쉽게 이해하고 따라갈 수 있을까?
    - 업무 도메인에 대해서 말하고 있는가?
    - 팀에 새로 합류하는 사람도 쉽게 이해하고 효과적으로 작업할 수 있을까?
- 이 모든 검사는 자동화해야 한다. 테스트 또는 체크리스트의 일부가 되어 지속적인 통합 빌드의 하나가 되어야한다. 이러한 검사에 실패하면 빌드도 실패해야 한다. 
#### 도구
- mypy를 사용한 타입 힌팅
    - mypy {파일명}을 입력하면 타입 검사 결과를 제공함.
    - 하지만 가끔 잘못된 탐지를 하는 경우
        - type_to_ignore = "something" # type: ignore
- pylint를 사용한 검사
    - 코드의 구조를 검사하는 도구.
    - .pylintrc파일을 통해 설정 값을 바꿀 수 있다.
        - 규칙 활성화 또는 비활성화 가능
- 자동 검사 설정
    - 리눅스 개발환경에서 빌드를 자동화하는 가장 일반적인 방법: makefile
    - 빌드이외에도 포매팅 검사나 코딩 컨벤션 검사를 자동화하기 위해 사용할 수 있다.
    - 테스트를 위한 각각의 target을 만들고, 이것들을 모두 실행하는 또 다른 target을 만드는 것이다.
typelint:  
mypy src/ tests/  

test:  
pytest tests/  

lint:  
pylint src/ tests/

checklist: lint typehint test  

.PHONY: typehint test lint checklist  


make chechlist는  
1. 코드 가이드라인 검사 (예를들면 PEP-8)  
2. 올바른 타입을 사용했는지 검사
3. 최종적으로 테스트 실행  

## Chapter2. Pythonic 코드

- 프로그래밍에서 관용구(idiom)은 특정 작업을 수행하기 위해 코드를 작성하는 특별한 방식임. (디자인 패턴과는 다름)
    - 차이점은 특정 작업을 할때 디자인 패턴은 고차원의 개념으로 즉시 코드로 변하지 않으나, 관용구는 즉시 코드로 변환
- 파이썬스러운 것: Pythomic
- 관용적인 방식으로 코드를 작성했을 때
    - 일반적으로 더 나은 선능
    - 코드도 더 작고 이해하기 쉽다
    - 전체 개발팀이 동일한 패턴과 구조에 익숙해지면 실수를 줄이고 문제의 본질에 보다 집중할 수 있다

#### 이장의 목표
1. 인덱스와 슬라이스를 이해하고 인덱싱 가능한 객체를 올바른 방식으로 구현
2. 시퀀스와 이터러블 구현
3. 컨텍스트 관리자를 만드는 모범 사례 연구
4. 매직 메서드를 사용해 보다 관용적이 코드 구현
5. 파이썬에서 부작용을 유발하는 흔한 실수 피하기


#### Contest manager
- 주요 동작의 전후에 작업을 실행하려고 할 때 유용하다.
    - 파일을 열면 닫어야한다. 소켓에 대해서도 (리소스 해제)
    - 예외 발생이거나 오류 처리할때는 어렵다.
 

In [None]:
fd = open(filename)
try:
    process_file(fd)
finally:
    fd.close()
###Pythonic style

with open(filename) as fd:
    process_file(fd)


- with 문(PEP-343)은 컨텍스트 관리자로 진입하게 한다. 이 경우 open 함수는 컨텍스트 관리자 프로토콜을 구현한다. 즉, 예외가 발생한 경우에도 블록이 완료되면 파일이 자동으로 닫힌다.
- 컨텍스트 관리자는 __enter__와 __exit__ 두개의 매직 메서드로 구성된다. with 문은 __enter__ 메서드를 호출하고 이 메서드가 무엇을 반환하든 as 이후에 지정된 변수에 할당된다. 사실 __enter__ 메서드가 특정한 값을 반환할 필요는 없다. 설사 값을 반환한다 하더라도 필요하지 않으면 변수에 할당하지 않아도 된다.
- 컨텍스트 관리자 블록 내에 예외 또는 오류가 있는 경우에도 __exit__메서드는 블록에서 예외가 발생한 경우 해당 예외를 파라미터로 받기 때문에 임의의 방법으로 처리할 수 있다.
- 컨텍스트 관리자가 파일이나 커넥션 등의 리소스 관리에서 매우 자주 사용되기는 하지만, 오직 이런 분야에서만 사용 가능한 것은 아니다. 블록의 전후에 필요로 하는 특정 논리를 제공하기 위해 자체 컨텍스트 관리자를 구현할 수 있다.


In [20]:
def stop_database():
    run('systemtl stop postgresql.service')

def start_database():
    run('systemtl start postgresqp.service')

class DBHandler:
    def __enter__(self):
        stop_database()
    
    def __exit__(self, exc_type, ex_value, ex_traceback):
        start_database()
def db_backup():
    run("pg_dump database")

def main():
    with DBHandeler():
        db_backup()

In [22]:
import contextlib

@contextlib.contextmanager
def db_handler():
    stop_database()
    yield
    start_database()

with db_handler():
    db_backup()

이렇게 컨텍스트 매니저를 작성하면 기존 함수를 리팩토링하기 쉬운 장점이 있다. 일반적으로 어느 특정 객체에도 속하지 않은 컨텍스트 관리자가 필요한 경우 좋은 방법이다. 매직 메서드를 추가하면 업무 도메인에 보다 얽히게 되며, 책임이 커지고. 어쩌면 하지 않아도 될 것들을 지원해야만 한다. 많은 상태를 관리할 필요가 없고 다른 클래스와 독립되어 있는 컨테스트 관리자 함수를 만드는 경우는 이렇게 하는 것이 좋은 방법이다.


In [None]:
class dbhandler__decorator(contextlib.ContextDecorator):
    def __enter__(self):
        stop_database()
    def __exit(self, ext_type, ex_value, ex_traceback):
        start_database()

@dbhandler_decorator()
def offline_backup():
    run("pg_dump database")

- 이쪽은 웹 백앤드를 할때 유용하게 사용될 것 같다.

### 프로퍼티, 속성과 객체 메서드의 다른 타입들
- 기본적으로 모두 public이다.
- 밑줄로 시작되는 속상은 해당 객체에 대해 Private을 의미함 (외부에서 호출하지 ㅇ낳기를 기대)

파이썬에서의 밑줄  
- 객체는 외부 호출 객체와 관련된 속성과 메서드만을 노출해야 한다. 즉 객체의 인터페이스로 공개하는 용도가 아니라면 모든 멤버에는 접두사로 하나의 밑줄을 사용하는 것이 좋다.
- __두개를 사용하면 private이 아니라 AttributeError가 발생한다. 프라이빗이라 접근할 수 없다가 아니라 존재하지 않는다라고 반환함. 이것은 실제로 뭔가 다른 일이 벌여졌으며 부작용에 의한 결과로 생긴 것으로 암시
- 밑줄 두개는 실제 파이썬에서 다른 이름을 만든다. name mangling이라 한다. 이것이 하는 일은 다음과 같은 이름의 속성을 만드는 것이다. 
    - "_<class_name>__<attribute-name>'의 경우 '_Connector__doubleline'이라는 속성이 만들어 지며 이러한 속성은 다음과 같이 접근하여 수정이 가능하다.
    - 즉, private의 의미로 만들어진 것이 아니다.
    - 여러 번 확장되는 클래스의 메서드를 이름 충돌 없이 오버라이드하기 위해 만들어졌다. 
    - 의도한 것이 아니라면 이중 밑줄을 사용하지 말자.

In [26]:
class Connector:
    def __init__(self, source):
        self.source = source
        self._timeout = 60
        self.__doubleline = 120
conn = Connector('test1')
print(conn.source)
print(conn._timeout)
print(conn._Connector__doubleline)
print(conn.__doubleline)

test1
60
120


AttributeError: 'Connector' object has no attribute '__doubleline'

#### 프로퍼티  
- 객체에 값을 저장해야 할 경우 일반적인 속성(attribute)을 사용할 수 있다. 때로는 객체의 상태나 다른 속성의 값을 기반으로 어떤 계산을 하려고 할 때도 있다. 이런 경우 대부분 프로퍼티를 사용하는 것이 좋은 선택이다.
- 프로퍼티는 객체의 어떤 속성에 대한 접근을 제어하려는 경우 사용함.
- 이렇게 하는 것 또한 파이썬스러운 코드다.
- 자바와 같은 다른 프로그래밍 언어에서는 접근 메서드(getter, setter)를 만들지만 파이썬에서는 property를 사용할 수 있다.


In [138]:
import re
EMAIL_FORMAT = re.compile(r"[^@]+@[^@]+[^@]+")

def is_valid_email(potentially_valid_email: str):
    return re.match(EMAIL_FORMAT, potentially_valid_email) is not None

class User:
    def __init__(self,username):
        self.username = username
        self._email = None
@property
def email(self):
    return self._email
@email.setter
def email(self, new_email):
    if not is_valid_email(new_email):
        raise ValueError(f"유효한 이메일이 아니므로 {new_email} 값을 사용할 수 없음")
    self._email = new_email

In [139]:
u1 = User('john')

In [140]:
u1.email = 'johndas'

In [142]:
u1.email

'johndas'

- 잠점: @property는 private 속성인 email값을 반환한다.
- 객체의 모든 속성에 대해 get_, set_ 메서드를 작성할 필요가 없다. 대부분의 경우 일반 속성을 사용하는 것으로 충반하다. 속성 값을 가져오거나 수정할 때 특별한 로직이 필요한 경우에만 프로퍼티를 사용하자.
- 명령-쿼리 분리 원칙 (command and query separation)을 따르기 위한 좋은 방법이다. 
    - 객체의 메서드가 무언가의 상태를 변경하는 커맨드이거나 무언가의 값을 반환하는 쿼리이거나 둘 중에 하나만 수행해야지 둘 다 동시에 수행하면 안된다는 것이다.
- @property 데코레이터는 무언가에 응답하기 위한 쿼리이고, @<property_name>.setter는 무언가를 하기 위한 커맨드이다.
- 하나의 메서드에서 한 가지 이상의 일을 하지 말아야 한다. 무언가를 할당하고 유효성 검사를 하고 싶으면 두개 이상의 문장으로 나누어야 한다.