<a href="https://colab.research.google.com/github/KevinTheRainmaker/MLOps/blob/main/colabs/Code_Quality_Control_1.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Automate The Research Code Quality Administration



## 1-1. Research Code Quality

### 코드 품질 문제 유형
1. 리서치 코드가 개인 로컬 환경에 저장되어 있음
2. 코드 중복이 많음
3. 연구 결과 재연 불가능
4. 코드 악취 존재
5. 낮은 코드 재사용성
6. 불필요한 전역 변수 > 환경 변수 및 파라미터 사용 권장
7. 너무 긴 코드, 명확하지 않은 변수명
8. relative import(<-> absolute import)가 너무 난잡하게 사용되는 경우

-> 매번 일일히 검사할 수 없으므로 정확한 룰과 Continuous Integration을 적용하여 지속적인 관리 자동화가 필요하다.


## 1-2. Lint, Unit Test

Lint란, 옷감의 보푸라기 등을 일컫는 말로, 코드에서는 잘못된 인덴테이션, 불필요한 변수 선언 등 코드의 가독성과 유지보수성을 떨어트리는 특징들을 말하며, 이를 제거하는 과정을 Linter, 혹은 그냥 줄여서 Lint라고 한다.


### Code Formatter: `python black`

In [1]:
!pip install black

Collecting black
  Downloading black-21.9b0-py3-none-any.whl (148 kB)
[?25l[K     |██▏                             | 10 kB 18.4 MB/s eta 0:00:01[K     |████▍                           | 20 kB 14.5 MB/s eta 0:00:01[K     |██████▋                         | 30 kB 17.8 MB/s eta 0:00:01[K     |████████▉                       | 40 kB 20.6 MB/s eta 0:00:01[K     |███████████                     | 51 kB 7.1 MB/s eta 0:00:01[K     |█████████████▎                  | 61 kB 8.2 MB/s eta 0:00:01[K     |███████████████▌                | 71 kB 4.5 MB/s eta 0:00:01[K     |█████████████████▊              | 81 kB 5.1 MB/s eta 0:00:01[K     |████████████████████            | 92 kB 5.6 MB/s eta 0:00:01[K     |██████████████████████▏         | 102 kB 6.0 MB/s eta 0:00:01[K     |████████████████████████▎       | 112 kB 6.0 MB/s eta 0:00:01[K     |██████████████████████████▌     | 122 kB 6.0 MB/s eta 0:00:01[K     |████████████████████████████▊   | 133 kB 6.0 MB/s eta 0:00:01[K  

In [7]:
# Make messy code
with open('black.py', 'w') as f:
  f.write('''
from seven_dwwarfs import Grumpy, Happy, Sleepy, Bashful, Sneezy, Dopey, Doc
x = {  'a':37,'b':42,

'c':927}

x = 123456789.123456789E123456789

if very_long_variable_name is not None and \
 very_long_variable_name.field > 0 or \
 very_long_variable_name.is_debug:
 z = 'hello '+'world'
else:
 world = 'world'
 a = 'hello {}'.format(world)
 f = rf'hello {world}'
if (this
and that): y = 'hello ''world'#FIXME: https://github.com/python/black/issues/26
class Foo  (     object  ):
  def f    (self   ):
    return       37*-2
  def g(self, x,y=42):
      return y
def f  (   a: List[ int ]) :
  return      37-a[42-u :  y**3]
def very_important_function(template: str,*variables,file: os.PathLike,debug:bool=False,):
    """Applies `variables` to the `template` and writes to `file`."""
    with open(file, "w") as f:
     ...

regular_formatting = [
    0,  1,  2,
    3,  4,  5,
    6,  7,  8,
]
''')

In [8]:
!cat black.py


from seven_dwwarfs import Grumpy, Happy, Sleepy, Bashful, Sneezy, Dopey, Doc
x = {  'a':37,'b':42,

'c':927}

x = 123456789.123456789E123456789

if very_long_variable_name is not None and  very_long_variable_name.field > 0 or  very_long_variable_name.is_debug:
 z = 'hello '+'world'
else:
 world = 'world'
 a = 'hello {}'.format(world)
 f = rf'hello {world}'
if (this
and that): y = 'hello ''world'#FIXME: https://github.com/python/black/issues/26
class Foo  (     object  ):
  def f    (self   ):
    return       37*-2
  def g(self, x,y=42):
      return y
def f  (   a: List[ int ]) :
  return      37-a[42-u :  y**3]
def very_important_function(template: str,*variables,file: os.PathLike,debug:bool=False,):
    """Applies `variables` to the `template` and writes to `file`."""
    with open(file, "w") as f:
     ...

regular_formatting = [
    0,  1,  2,
    3,  4,  5,
    6,  7,  8,
]


In [9]:
# Check with black
!black --check black.py

[1mwould reformat black.py[0m
[1mOh no! 💥 💔 💥[0m
[1m1 file would be reformatted[0m.


In [10]:
# Auto formatting
!black black.py

[1mreformatted black.py[0m
[1mAll done! ✨ 🍰 ✨[0m
[1m1 file reformatted[0m.


In [11]:
!cat black.py

from seven_dwwarfs import Grumpy, Happy, Sleepy, Bashful, Sneezy, Dopey, Doc

x = {"a": 37, "b": 42, "c": 927}

x = 123456789.123456789e123456789

if (
    very_long_variable_name is not None
    and very_long_variable_name.field > 0
    or very_long_variable_name.is_debug
):
    z = "hello " + "world"
else:
    world = "world"
    a = "hello {}".format(world)
    f = rf"hello {world}"
if this and that:
    y = "hello " "world"  # FIXME: https://github.com/python/black/issues/26


class Foo(object):
    def f(self):
        return 37 * -2

    def g(self, x, y=42):
        return y


def f(a: List[int]):
    return 37 - a[42 - u : y ** 3]


def very_important_function(
    template: str,
    *variables,
    file: os.PathLike,
    debug: bool = False,
):
    """Applies `variables` to the `template` and writes to `file`."""
    with open(file, "w") as f:
        ...


regular_formatting = [
    0,
    1,
    2,
    3,
    4,
    5,
    6,
    7,
    8,
]


black으로 포매팅이 되었다.

## 1-3. Continuous Integration (CI)

소프트웨어 공학에서, 지속적 통합(Continuous Integration, CI)은 지속적으로 퀄리티 컨트롤을 적용하는 프로세스를 실행하는 것을 의미한다.

모든 개발을 완료한 뒤에 퀄리티 컨트롤을 적용하는 고전적인 방법을 대체하는 방법으로서, 소프트웨어의 질적 향상과, 소프트웨어 배포에 걸리는 시간을 줄이는데 초점이 맞추어져 있다.


## 대표적인 CI Tool: GitHub Actions