# 클래스를 사용하는 이유는 무엇일까?
- 현실 세계에 비유를 해보자.
- 로봇을 만드는 공장이 있는데, 로봇을 설계도면 없이 생산한다고 가정해보자.
- 동일한 동작을 수행하는 로봇을 만들려고 하지만, 설계도면 없이는 만들어지는 로봇들은 제각기이거나 미세하게 다를 것이다.
- 왜냐? 만들어지는 방법 자체가 체계화되어 있지 않기 때문이다.  

> 정리하자면, 클래스를 사용하는 이유는 다음과 같다.
> - 일관성 있는 객체 생성
> - 코드 재사용성 (re-use) 향상 & 중복 코드 제거
>   - 같은 맥락으로 함수도 정의하여 재사용한다.

- 프로그램의 규모가 커질수록 재사용성을 극대화하여 일관적인 구조를 유지해야 한다.
- 그렇지 않을 경우, 동일한 동작을 하는 모듈 혹은 컴포넌트를 여러번 정의하여 중복 코드가 발생하고, 일관적이지 못하며, 가독성이 떨어지게 된다.

# 클래스는 추상화 레벨이 중요하다.
- 클래스를 어느 수준까지 추상화 하느냐에 따라 코드의 품질이 달라진다.
- 예를 들어, 현실 세계에서 이해하기 쉬운 명시적인 객체를 클래스로 정의한다고 가정해보자.
    - 현실 세계의 쥐를 클래스로 정의하는 것은 어렵지 않게 생각할 수 있는 문제이다.
- 반면, 현실에서도 추상화가 되어있는 개념을 클래스로써 추상화하는 것은 어려운 문제이다.
    - 하지만, 추상화를 잘하는 사람이 결국에는 승리한다.
    - 예를 들면, `She's gone` 노래를 클래스로 정의한다고 생각해보자.
    - 단순히 노래 `Song`를 클래스로 정의하는 수준에 그치는 것은 섬세한 프로그래밍을 할 수 없다.
    - 대표적으로 음악에는 다음과 같은 요소가 있다.
        - `song_name` : 곡 이름
        - `artist` : 아티스트
        - `time_signature` : 박자
        - `chord_progression` : 코드 진행
- 한번에 하려하지 말고 문제를 쪼개어 추상화를 해보자.

In [2]:
class Song:
    def __init__(self) -> None:
        self.__song_name
        self.__artist
        self.__time_signature
        self.__chord_progression

- 일단 필요한 필드는 선언을 했다.
- 하지만, 필드들의 타입을 생각해야 한다.
    - `song_name` : 이름이니까 문자열이 적절할 것 같다.
    - `artist` : 아티스트는 이름으로 관리하면 문자열을 사용해도 될 것 같지만, 아티스트는 여러 곡을 부르기 때문에 매번 문자열로 관리하는 것보다는 별도의 `Artist` 클래스로 정의하여 재사용하는 것이 낫겠다.
    - `time_signature` : 박자는 경우의 수가 정해져 있기 때문에 문자열 혹은 `Enum`으로 관리해도 될 것 같다.
    - `chord_progression` : 코드 진행은 여러 코드들을 의미하는 것이므로, 리스트로 관리해야 한다.

In [3]:
# 우선 별도의 클래스를 정의한다.

class Artist:
    def __init__(self, name: str) -> None:
        self.__name = name
    
    @property
    def name(self):
        return self.__name

In [4]:
steelheart = Artist(name="steelheart")

In [5]:
class Song:
    # artist의 경우 위에서 정의한 Artist 클래스로 타입 힌트를 지정한다.
    def __init__(self, song_name: str, artist: Artist, time_signature: str, chord_progression: list) -> None:
        self.__song_name = song_name
        self.__artist = artist
        self.__time_signature = time_signature
        self.__chord_progression = chord_progression
    
    @property
    def song_name(self):
        return self.__song_name
    
    @property
    def artist(self):
        return self.__artist
    
    @property
    def time_signature(self):
        return self.__time_signature
    
    @property
    def chord_progression(self):
        return self.__chord_progression

In [6]:
shes_gone = Song(
    song_name="she's gone",
    artist=steelheart,  # 위에서 생성한 steelheart 객체를 shes_gone 객체에 주입
    time_signature='3/4',
    chord_progression=['C', 'C', 'Caug', 'F', 'Gdim']
)

In [9]:
print(shes_gone)
print(shes_gone.song_name)
print(shes_gone.artist) # steelheart 객체 (타입 : Artist)
print(shes_gone.artist.name) # steelheart 객체의 name 필드에 접근
print(shes_gone.time_signature)
print(shes_gone.chord_progression)

<__main__.Song object at 0x103b17e80>
she's gone
<__main__.Artist object at 0x1039f3610>
steelheart
3/4
['C', 'C', 'Caug', 'F', 'Gdim']


In [10]:
ill_never_let_you_go = Song(
    song_name="i'll never let you go",
    artist=steelheart, # steelheart 객체 재사용
    time_signature='4/4',
    chord_progression=['D', 'Em', 'Gb', 'Ab', 'Fm']
)

In [11]:
print(ill_never_let_you_go)
print(ill_never_let_you_go.song_name)
print(ill_never_let_you_go.artist) # steelheart 객체 (타입 : Artist)
print(ill_never_let_you_go.artist.name) # steelheart 객체의 name 필드에 접근
print(ill_never_let_you_go.time_signature)
print(ill_never_let_you_go.chord_progression)

<__main__.Song object at 0x103b74bb0>
i'll never let you go
<__main__.Artist object at 0x1039f3610>
steelheart
4/4
['D', 'Em', 'Gb', 'Ab', 'Fm']


# 머신러닝 파이프라인으로 Top-Down 설계 마인드 장착하기
- 우선, 어느 분야든 태스크든 내가 해결하고자 하는 문제의 흐름 (flow)를 명확하게 이해하는 것이 중요하다.
    - 생명 주기 (Life Cycle)을 먼저 파악하는게 인생에서 제일 중요하다!
- 이번 예시는 실제로 머신러닝을 하는 것은 아니기 때문에, Top-Down 사고 방식으로 문제를 해결하는 것을 중점적으로 본다.
- 앞서, flow를 명확하게 파악하는 것이 중요하다고 했다.
- 머신러닝의 경우, 크게 다음과 같은 흐름으로 진행된다.
    - 데이터 수집 (Data Collection)
    - 데이터 전처리 (Data Preprocessing)
    - 모델링 (Modeling)
    - 모델 학습 및 검증 (Model Training & Validation) - training set & validation set
    - 모델 평가 (Model Evaluation) - test set
    - 모델 배포 (Model Deployment)
- 그렇다면, 각각의 스텝은 행위이므로, 해당 행위를 수행하는 주체를 객체가 한다 생각하고 클래스를 정의하면 되는 것이 아닌가?

In [17]:
# 클래스는 처음부터 상세하게 구현하는 것보다 유사 코드 (pseudo code) 형태로 ..

# 물론 각 단계 안에서도 세분화될 수 있지만, 
# 현재 예시에서는 1 depth까지만 고려

class DataCollector:
    def execute(self):
        ...

class DataPreprocessor:
    def execute(self):
        ...

class Model:
    def execute(self):
        ...

class ModelTrainer:
    def execute(self):
        ...

class ModelEvaluator:
    def execute(self):
        ...

class ModelDeployer:
    def execute(self):
        ...

In [18]:
# 미리 정의해놓은 클래스 덕분에 가장 Top에 해당하는 MachineLearningFlowPipeline에서 
# 각 단계를 객체로 관리할 수 있다.

class MachineLearningFlowPipeline:
    def __init__(
            self,
            data_collector: DataCollector,
            data_preprocessor: DataPreprocessor,
            model: Model,
            model_trainer: ModelTrainer,
            model_evaluator: ModelEvaluator,
            model_deployer: ModelDeployer
    ) -> None:
        self.data_collector = data_collector
        self.data_preprocessor = data_preprocessor
        self.model = model
        self.model_trainer = model_trainer
        self.model_evaluator = model_evaluator
        self.model_deployer = model_deployer
    
    def execute(self):
        # 유사 코드 (pseudo code)
        # 각 필드 (self.data_colletor ~ self.model_deployer)들이
        # 순차적으로 수행되는 로직
        self.data_collector.execute()
        self.data_preprocessor.execute()
        self.model.execute()
        self.model_trainer.execute()
        self.model_evaluator.execute()
        self.model_deployer.execute()

In [19]:
ml_pipeline = MachineLearningFlowPipeline(
    data_collector=DataCollector(),
    data_preprocessor=DataPreprocessor(),
    model=Model(),
    model_trainer=ModelTrainer(),
    model_evaluator=ModelEvaluator(),
    model_deployer=ModelDeployer()
)

ml_pipeline.execute()

- Q1) 마케팅 프로세스를 자연어로 정의하고, 이를 클래스로 정의하기
    - 구현 조건
        - 클래스 내부의 메소드 들의 로직을 구현하지 않고 유사 코드 형태로 두기
        - 1 depth 만 고려하기 (너무 깊이 들어가지 않도록)

In [None]:
""" 
마케팅 프로세스는 크게 아래의 프로세스로 진행된다.
1. 문제 정의 (Problem Definition)
2. 목표 정의 (Goal Setting)
3. 콘텐츠 전략 (Content Strategy)
4. 콘텐츠 기획 (Content Planning)
5. 콘텐츠 제작 (Content Creation)
6. 콘텐츠 집행 (Content Execution)
7. 성과 분석 및 회고 (Performance Analysis and Retrospective)
"""
class Process:
    ...

class ProblemDefinitionProcess(Process):
    def execute(self):
        ...

class GoalSettingProcess(Process):
    def excute(self):
        ...

class ContentStrategyProcess(Process):
    def execute(self):
        ...

class ContentPlanningProcess(Process):
    def execute(self):
        ...

class ContentCreationProcess(Process):
    def executue(self):
        ...

class ContentExcutionProcess(Process):
    def execute(self):
        ...

class PerformanceAnalysisandRetrospectiveProcess(Process):
    def execute(self):
        ...

In [1]:
class Animal:
    can_talk = False

    def __init__(self, num_legs: int, howling_sound: str) -> None:
        self.num_legs = num_legs
        self.howling_sound = howling_sound
    
    def howling(self):
        print(self.howling_sound)

class KiwiBird(Animal):
    ...

class Rabbit(Animal):
    ...


kiwi_bird = KiwiBird(num_legs=2, howling_sound='kiwi')
rabbit = Rabbit(num_legs=4, howling_sound='...')

print(kiwi_bird.can_talk)
kiwi_bird.howling()

print(rabbit.can_talk)
rabbit.howling()

False
kiwi
False
...


- Q2) 신규 고객 유치 현황 데이터를 시각화하기 위해 무엇을 해야 하는지 단계별로 정의해보기
    - 구현 조건
        - 이는 코드가 아닌 자연어의 형태로 우선 정의
        - 아래의 셀에 주석으로 작성
        - 각 단계는 행위 및 동작으로 정의 (명사 형태 X)

In [None]:
"""
1. 신규 고객 유치 현황 데이터 수집 프로세스 (Collect)
2. 신규 고객 유치 현황 데이터 집계 프로세스 (편향 파악, Agregate)
3. 신규 고객 유치 현황 데이터 전처리 프로세스 (Preprocess)
4. 신규 고객 유치 현황 데이터 시각화 프로세스 (Vsulisualize)
5. 신규 고객 유치 현황 데이터 분석 및 결론 도출 프로세스 (Analysis)
"""

- Q3) 각 단계별 행위를 함수로 정의하기
    - 구현 조건
        - 유사 코드로 작성

```python
# 유사 코드 예시
def 함수명():
    ...
```

In [None]:
def collect_data():
    ...

def agredate_data():
    ...

def preprocess_data():
    ...

def visualize_data():
    ...

def analysis_data():
    ...

- Q4) 각각의 함수를 메소드로 가지고 있는 클래스 정의하기
    - 구현 조건
        - 클래스명 : `~~Pipeline`
        - 각 메소드를 순차적으로 수행하는 메소드도 정의하기
            - 메소드명 : `execute`
            - 각 메소드 유사 코드로 작성
        - e.g. `MachineLearningFlowPipeline` 클래스의 `execute`

In [2]:
class DataAnalysisPipeline:
    def collect_data(self):
        ...

    def agredate_data(self):
        ...

    def preprocess_data(self):
        ...

    def visualize_data(self):
        ...

    def analysis_data(self):
        ...
    
    def execute(self):
        self.collect_data()
        self.agredate_data()
        self.preprocess_data()
        self.visualize_data()
        self.analysis_data()

- Q5) 지표를 시각화 했더니 성장곡선을 그린 경우, 이후 해야할 작업들을 단계별로 정의 후, 각 단계를 메소드로 가지고 있는 `~~Pipeline`으로 정의하기
    - 구현 조건
        - 각 메소드 유사 코드로 작성

In [3]:
"""
마케팅 플랫폼 확장
콘텐츠 마케터 고용
콘텐츠 전략 짜기
"""

class MarketingExpansionPipeline:
    def expand_platform(self):
        ...
    
    def hire_content_marketer(self):
        ...
    
    def strategize_content(self):
        ...
    
    def execute(self):
        self.expand_platform()
        self.hire_content_marketer()
        self.strategize_content()

- Q6) 지표를 시각화 했더니 하햫곡선을 그린 경우, 이후 해야할 작업들을 단계별로 정의 후, 각 단계를 메소드로 가지고 있는 `~~Pipeline`으로 정의하기
    - 구현 조건
        - 각 메소드 유사 코드로 작성

In [4]:
"""
마케팅 플랫폼 변경
콘텐츠 마케터 고용
콘텐츠 전략 짜기
"""

class MarketingImprovementPipeline:
    def change_platform(self):
        ...
    
    def hire_content_marketer(self):
        ...

    def strategize_content(self):
        ...

    def execute(self):
        self.change_ploaform()
        self.hire_content_marketer()
        self.strategize_content()

- Q7) Q4에서 정의한 클래스의 `execute` 메소드 내부에서 `if ~ else ~`조건문 분기를 이용하여 Q5, Q6에서 정의한 파이프라인을 수행하도록 구현하기

In [7]:
class DataAnalysisPipeline:
    def collect_data(self):
        ...

    def agredate_data(self):
        ...

    def preprocess_data(self):
        ...

    def visualize_data(self):
        ...

    def analysis_data(self):
        ...
    
    def execute(self):
        self.collect_data()
        self.agredate_data()
        self.preprocess_data()
        self.visualize_data()
        result = self.analysis_data()
        
        if result == 'up':
            MarketingExpansionPipeline().execute()
        elif result == 'down':
            MarketingImprovementPipeline().execute()


DataAnalysisPipeline().execute()