# __패키지__
## __numpy__  
- Numerical Python의 줄임말로 고성능의 과학계산 컴퓨팅을 하는 데이터 분석에 많이 쓰임.
- Vector, matrix 등 계산에 굉장히 편함.

## __os__
- Operating System의 약자로서 운영체제에서 제공되는 여러 기능을 수행하게 해줌.
- 폴더를 만들거나, 폴더 내일 파일들의 이름을 불러오거나 등을 함.

## __cv2__
- Opencv 패키지
- 이미지 파일 읽기, 화면에 표시하기, 이미지 파일 쓰기

In [7]:
import numpy as np
import os
import cv2

## 경로 불러오기
- 경로내의 파일 이름들을 불러옴 (images).

In [8]:
path = './COVID19-DATASET/train/covid19'
images = os.listdir('./COVID19-DATASET/train/covid19')

- 기본적으로 image파일을 imread로 읽게 되면 픽셀 값이 (0,255)의 값을 가지게 됨.
- 하지만, 계산의 편의를 위해 (0,1) 사이의 값으로 받음.
- 더 구체적으로는 정수형의 픽셀들을 실수형으로 바꿔주기 위함임.
- 이후, 이것의 mean, variance를 구해 이후 transformation에서의 mean variance를 쉽게 구하려고 함.

## 함수 형태로 만들기

In [32]:
def _get_mean(path):
    tmps = os.listdir(path)
    
    R_channel = 0
    G_channel = 0
    B_channel = 0

    total_pixel = 0
    for tmp in tmps:
        PATH = os.path.join(path, tmp)
        images = os.listdir(PATH)
        for image in images:
            img = cv2.imread(os.path.join(PATH, image))
            # print (img.shape)
            img = img / 255
            total_pixel += img.shape[0] * img.shape[1]

            R_channel += np.sum(img[:, :, 0])
            G_channel += np.sum(img[:, :, 1])
            B_channel += np.sum(img[:, :, 2])

    R_mean = R_channel / total_pixel
    G_mean = G_channel / total_pixel
    B_mean = B_channel / total_pixel
    
    return R_mean, G_mean, B_mean

In [35]:
def _get_var(path):
    tmps = os.listdir(path)
    R_mean, G_mean, B_mean = _get_mean(path)
    
    R_channel = 0
    G_channel = 0
    B_channel = 0
    total_pixel = 0
    
    for tmp in tmps:
        PATH = os.path.join(path, tmp)
        images = os.listdir(PATH)
        for image in images:
            #print(image)
            img = cv2.imread(os.path.join(PATH, image))
            # print (img.shape)
            img = img / 255
            total_pixel += img.shape[0] * img.shape[1]

            R_channel += np.sum((img[:, :, 0] - R_mean) ** 2)
            G_channel += np.sum((img[:, :, 1] - G_mean) ** 2)
            B_channel += np.sum((img[:, :, 2] - B_mean) ** 2)

    R_std = np.sqrt(R_channel / total_pixel)
    G_std = np.sqrt(G_channel / total_pixel)
    B_std = np.sqrt(B_channel / total_pixel)
    
    return R_std, G_std, B_std

In [34]:
_get_mean('./COVID19-DATASET/train/')

(0.49978348833998376, 0.4986975415286573, 0.4990805965988509)