이 장에서 살펴볼 것들은 이 책에 전반적으로 적용되는 근본적인 내용이다. 왜냐하면 파이썬 개발의 궁극적인 목적은 보다 우수하고 유지보수성이 뛰어난 소프트웨어를 작성하는 것이기 때문이다. 

단위 테스트(또는 모든 형태의 자동 테스트)는 소프트웨어 유지보수에 있어서 결정적인 역할을 하기 때문에 어떤한 품질 프로젝트에서도 빠질 수 없는 부분이다. 때문에 이 장에서는 핵심 개발 전략으로서의 자동화 테스트, 안전한 코드 수정, 점진적 기능 향상에 대한 것들에 대해 논의 한다.

이 장을 학습한 이후에는 다음 낸용에 대해 더 깊이 알게 될 것이다.

* 애자일 소프트웨어 개발 방법론에서 자동화된 테스트가 중요한 이유
* 단위 테스트가 코드 품질에 대한 거울이 되는 이유
* 자동화된 테스트와 품질 게이트를 설정하기 위한 프레임워크와 도구
* 단위 데스크가 문서화와 도메인 문제의 깊은 이해에 도움을 주는 이유
* 테스트 주도 개발(TDD - test driven development)의 개념


## 디자인 원칙과 단위 테스트

단위 테스트는 다른 코드의 일부분이 유효한지를 검사는 코드이다. 일반적으로 단위 테스트를 애플리케이션의 "핵심"을 검증하는 것이라고 생각하지만 그것은 이 책에서 정의하는 방식과 달리 단위 테스트를 보조 수단으로서만 생각하는 것이다. 단위 테스트는 소프트웨어의 핵심이 되는 필수적인 기능으로서 일반 비즈니스 로직과 동일한 수준으로 다루어져야 한다.

단위 테스트는 비즈니스 로직이 특정 조건을 보장하는지를 확인하기 위해 여러 시나리오를 검증하는 코드이다. 단위 테스트는 다음과 같은 특징이 있다.

* 격리 : 단위 테스트는 다른 외부 에이전트와 완전히 독립적이어야 하며 비즈니스 로직에만 집중해야 한다 때문에 데이터베이스에 연결하지 않아야 고 HTTP 요청도 하지 않아야 한다. 격리는 또한 테스트 자체가 독립적이라는 것을 의미한다. 테스트는 이전 상태에 관계없이 임의의 순서로 실행될 수 있어야 한다.

* 성능 : 단위 테스트는 신속하게 실행되어야 한다. 반복적으로 여러 번 실행될 수 있도록 설계해야 한다.

* 자체 검증 : 단위 테스트의 실행만으로 결과를 결정할 수 있어야 한다. 단위 테스트를 처리하기 위한 추가 단계가 없어야 한다.

단위 테스트를 좀 더 구체적으로 살펴보면 단위 테스트를 작성한 .py 파일을 만들고 이 파일을 도구에서 호출하는 것이다. 이 파일에는 비즈니스 로직에서 필요한 것을 가져오기 위한 import 구문과 비즈니스 로직을 테스트하기 위한 프로그램이 있다. 이제 도구를 사용해 단위 테스트를 하고 결과를 수집하면 된다.

여기서 마지막 부분은 자체 검증을 의미한다. 테스트 도구에서 파일의 내용을 호출하면 테스트가 실행된다. 테스트에 실패하면 프로세스는 오류 코드와 함께 종료된다. 일반적으로 테스트에서 성공하면 점(.)을 찍고 실패하면 F를 예외가 있으면 E를 출력한다.

### 자동화된 테스트의 다른 형태

단위 테스트는 함수 또는 메서드와 같은 매우 작은 단위를 확인하기 위한 것이다. 단위 테스트는 최대한 자세하게 코드를 검사하는 것이 목적이다. 클래스를 테스트하려면 단위 테스트가 아니라 단위 테스트의 집합인 테스트 스위트를 사용한다. 테스트 스위트를 구성하는 테스트들은 메서드처럼 보다 작은 것을 테스트한다.

단위 테스트는 여러 방법으로 할 수 있으며 모든 오류를 잡을 수 있는 것도 아니다. 이 책의 범위를 벗어나는 인수 테스트나 통합 테스트 같은 것도 있다.

통합 테스트에서는 한 번에 여러 컴포넌트를 테스트한다. 종합적으로 예상대로 잘 동작하는지 검증한다. 이 경우에는 부작용이나 격리를 고려하지 않은 채로, 즉 HTTP 요청을 하거나 데이터베이스에 연결하는 등의 작업을 수행하는 것이 가능하고 때로는 그렇게 하는 것이 바람직하다.

인수 테스트는 유스케이스(use case)를 활용하여 사용자의 관점에서 시스템의 유효성을 검사하는 자동화된 테스트이다. 

이 두개의 테스트를 하면 단위 테스트와 관련된 중요한 특성을 잃게 된다. 바로 속도이다. 이러한 테스트를 실행하는데 더 많은 시간이 걸리기 때문에 보다 덜 자주 실행하게 된다. 

좋은 개발 환경을 구축했다면 개발자는 전체 테스트 스위트를 만들고 코드에 수정이 생길 때마다 반복적으로 단위 테스트와 리팩토링을 할 수 있어야 한다. 코드를 수정하고 풀 요청(PULL REQUEST)이 생기면 CI(Continuouse Intergration) 서비스가 실행되어 해당 브랜치에 빌드를 실행한다. 통합 테스트나 인수 테스트가 있는 경우는 빌드 중에 단위 테스트도 함께 수행한다. 물론 병합 전에 빌드에 성공해야 한다. 하지만 중요한 것은 테스트의 차이이다. 일반적으로 단위 테스트는 항상 수행되길 원하지만 통합 테스트나 인수 테스트는 그보다 덜 자주 수행되길 바란다. 이렇게 하는 이유는 전략적으로 단위 테스트에서 작은 기능을 많이 테스트하고, 단위 테스트에서 확인할 수 없는 부분을 다른 자동화된 테스트에서 커버하려고 하기 때문이다.

마지막으로 이 책은 실용성을 추구한다는 점을 기억하자. 앞에서도 언급한 것처럼 프로젝트의 상황에 알맞게 단위 테스트를 활용해야 한다. 아무도 내가 담당하는 시스템을 나보다 잘 알수는 없다. 때문에 도커 컨테이너를 사용하여 데이터베이스를 테스트하는 단위 테스트가 있을 수도 있다. 실용성이 이상보다 우선이다.

### 단위 테스트와 애자일 소프트웨어 개발

최근의 소프트웨어 개발은 가능한 신속하고도 지속적으로 가치를 제공하려고 한다. 이렇게 하는 이유는 더 빠르게 피드백을 받을수록 더 쉽게 코드를 수정할 수 있다는 생각이 있기 때문이다. 이러한 생각은 전혀 새로운 것은 아니다. 일부는 이미 수십 년 전의 제조 원칙과 비슷한 내용이고, 어떤 부분은 성당과 시장과 같은 에세이에서 언급했던 것들로 이해 관계자에게 빠른 피드백을 받아서 수정하는 것을 반복하자는 내용이다.

따라서 변화에 효과적으로 대응할 수 있는 소프트웨어를 개발하고자 한다면 이전 장에서 언습한 것처럼 유연하며 확장 가능해야 한다.

디자인과 상관없이 코드 자체만으로는 변경에 충분히 유연하다는 보장을 할 수 없다. 솔리드 원칙을 준수하고 개방/패쇄 원칙에 따르는 컴포넌트를 만들었다고 해보자. 게다가 쉽게 리팩토링이 가능하도록 짜여서 변화에 쉽게 대응할 수 있는 상태라고 해보자. 이 상태에서 변경 작업이 아무런 버그를 만들지 않게 하려면 어떻게 해야 할까? 기존 기능이 보존되었다는 것을 어떻게 알 수 있을까? 사용자에게 배포를 해도 문제가 없다는 것을 어떻게 확실할 수 있을까? 새 버전은 예상대로 작동한다고 믿을 수 있을까?

이 모든 질문에 대한 공식적인 증거가 없다면 확신 있게 답변할 수 없을 것이다. 단위 테스트가 바로 프로그램이 명세에 따라 정확하게 동작한다는 공식적인 증거가 될 수 있다.

따라서 단위 테스트는 우리의 코드가 기대한 것처럼 동작한다는 확신을 줄 수 잇는 안전망이 될 수 있다. 이러한 도구로 무장한 코드가 있으면 보다 효율적으로 개발이 진행될 것이므로 궁극적으로 팀의 개발 속도를 향상시킬 수 있다. 좋은  테스트를 가질수록 버그에 의해 프로젝트를 중단하지 않고 신속하게 가치를 제공할 가능성이 높아진다.

### 단위 테스트와 소프트웨어 디자인

단위 테스트와 메인 코드는 동전의 양면과 같은 것이다. 이전 섹션에서 살펴본 실용적인 이유 외에도 좋은 소프트웨어는 테스트 가능한 소프트웨어라는 사실을 기억할 필요가 있다. 테스트의 용이성(소프트웨어를 얼마나 쉽게 테스트 할 수 있는지를 결정하는 품질 속성)은 단순히 있으면 좋은 것이 아니라 클린 코드의 핵심 가치이다. 

단위 테스트는 기본 코드를 보완하기 위한 것이 아니라 실제 코드의 작성 방식에 직접적인 영향을 미치는 것이다. 단위 테스트는 특정 코드에 단위 테스트를 해야겠다고 발견하는 단계에서부터 더 나은 코드를 작성하는 단계 그리고 궁극적으로 모든 코드가 테스트에 의해 작성되는 TDD(test-driven design) 단계까지 여러 단계가 있다. TDD는 이 장의 끝에서 다시 살펴본다.

간단한 예제를 통해 테스트가 어떻게 고드의 개선으로 이어질 수 있는지 살펴보자.

다음 예제는 특정 작업에서 얻은 지표를 외부 시스템에 보내는 프로세스이다. Process 객체는 도메인 문제에 대한 일부 작업을 나타내며, MetricsClient는 외부 엔터티에 실제 지표를 전송하기 위한 객체이다.

In [8]:
class MetricsClient:
    """타사 지표 전송 클라이언트"""
    def send(self, metric_name, metric_value):
        if not isinstance(metric_name, str):
            raise TypeError("metric_name으로 문자열 타입을 사용해야 함")
        
        if not isinstance(metric_value, str):
            raise TypeError("metric_value로 문자열 타입을 사용해야 함")
        
        log_info = "%s 전송 값 = %s" %(metric_nam, metric_value)
        logger.info(log_info)
        print(log_info)

class Process:
    def __init__(self):
        self.client = MetricsClient() # 타사 지표 전송 클라이언트
    
    def process_iterations(self, n_iterations):
        for i in range(n_iterations):
            result = self.run_process()
            self.client.send("iteraton." .format(i), result)

타사 지표 전송 클라이언트는 파라미터가 문자열 타입이어야 한다는 요구사항이 있다. 따라서 run_process 메서드에서 반환한 result가 문자열이 아닌 경우 전송에 실패하게 된다.


타사에서 제공하는 라이브러리는 직접 제어할 수 없으므로 반드시 실행 전에 정확한 타입을 제공해야만 한다. 이러한 버그를 발견했으므로 이제는 단위 테스트를 통해 이러한 문제가 발생하지 않는다는 것을 확실히 하고자 한다. 단위 테스트가 있으면 리팩토링을 여러 번 하더라도 이후에 재현되는 않든다는 것을 증명할 수 있다.

Process 객체의 client를 모의하여 데스트할 수도 있다. 그러나 그렇게 하려면 더 많은 코드가 필요하다. 그러나 다행히도 메서드가 상대적으로 작다. 만약 메서드가 크다면 모의 과정에서 불필요한 것들을 더 많이 실행해야하기 때문이다. 메서드가 작다는 것은 테스트 가능성과 관련해 좋은 디자인이라고 할 수 있다.

마지막으로 필요한 부분만 테스트하기 위해 main 메서드에서 client를 직접 다루지 않고 래퍼(wrapper) 메서드에 위임할 것이다. 새로운 클래스는 다음과 같다.

In [9]:
class WrappedClient:
    def __init__(self):
        self.client = MetricsClient()
    
    def send(self, metric_name, metric_value):
        return self.client.send(str(metric_name), str(metric_value))
    
class Process:
    def __init__(self):
        self.client = WrappedClient()
    def process_iterations(self, n_iterations):
        for i in range(n_iterations):
            result = self.run_process()
            self.client.send("iteraton." .format(i), result)

여기서는 타사 라이브러리를 직접 사용하는 대신 자체적으로 만든 클래스를 지표 전송 client로 사용했다. 래퍼 클래스는 동일한 인터페이스를 가지고 있다.

이러한 컴포지션 방식은 어댑터 디자인 패턴과 유사하다. 이것은 새로운 객체이므로 새로운 단위 테스트를 가질 수 있다. 이 객체는 일관된 인터페이스를 제공할 것이므로 테스트가 더 간단해질 것이다. 하지만 더 중요한 것은 이러한 방식이 애초에 작성하려던 방식이라는 것이다. 메인 코드에 대해 직접 단위 테스트를 작성하면 가장 중요한 속성 중 하나인 추상화를 하지 못하게 된다!

이제 메서드를 분리했으므로 실제 단위 테스트를 작성한다. 이 예제에서 사용된 unittest 모듈에 대한 세부사항은 테스트 도구와 라이브러리를 탐색하는 장에서 더 자세히 살펴볼 것이다. 지금은 대략적인 흐름만 살펴보면 된다.

In [11]:
import unittest
from unittest.mock import Mock

class TestWrappedClient(unittest.TestCase):
    def test_send_converts_types(self):
        wrapped_client = WrappedClient()
        wrapped_client.client = Mock()
        wrapped_client.send('value', 1)
        wrapped_client.client.send.assert_called_with("value", 1)

Mock은 unittest.mock 모듈에서 사용할 수 있는 타입으로 어떤 종류의 타입에도 사용할 수 있는 편리한 객체이다. 예를 들어 타사 라이브러리 대신 Mock 객체를 사용하면 예상대로 호출되는지 확인할 수 있다. send 메서드에서는 Process 객체에서 호출하는 것처럼 숫자 1을 입력했지만 send.assert_called_with에서는 문자열 "1"을 기대하는 것에 유의하자.

* Mock은 무엇을 흉내 낸다는 뜻으로 그대로 의존성 객체를 대신하여 시뮬레이션 하는 역할을 한다. 어떻게 시뮬레이션 할지는 런타임 중에 함수, 메서드, 속성을 직접 정의해주면 된다. 이렇게 런타임에 기능을 변경하는 것을 몽키 패치라고 한다. 이 예제에서는 wrapped_client.client로 MetricsClient를 직접 사용하지 않고 Mock 객체를 사용해 시뮬레이션 할 것이다. 그런데 wrapped_client.client에는 어떤 메서드가 있는지 어떻게 정의할까? 바로 시뮬레이션 하려는 형태 그대로 한 번 호출해주면 된다. 이 예제에서는 wrapped_client.send('value', 1)를 호출하여 WrappedClient 클래스의 send 메서드를 호출했는데 그 안에서 self.client.send는 두 개의 문자열을 받는 함수라고 정의(몽키 패치)하고 있다. 그렇기 때문에 send.assert_called_with('value', 1)를 호출하면 올바른 파라미터를 사용한 호출이므로 어설트에 성공하게 된다.

### 테스트 경계 정하기

테스트에는 노력이 필요하다. 무엇을 테스트할지 주의하지 않으면 끝없이 테스트를 해야 하고 뚜렷한 결실도 없이 시간만 낭비하게 된다.

테스트의 범위는 우리가 작성한 코드의 범위로 한정해야 한다. 외부 의존성에 대해서는 올바른 파라미터를 사용해 호출하면 정상적으로 살행된다는 것만 확인해도 충분하다. 

신중하게 지다인을 하여 시스템의 기준을 명확히 했다면 단위 테스틑 작성할 때 이러한 인터페이스를 모의하는 것이 훨씬 쉬워진다.