In [None]:
import cv2
import os
from matplotlib import pyplot as plt
%matplotlib inline
import numpy as np
plt.rcParams['font.family'] ='Malgun Gothic'
plt.rcParams['axes.unicode_minus'] =False

In [None]:
# 이미지 파일들이 저장된 폴더 경로 설정
folder_path = "val2017/"

# 폴더 내의 모든 파일 목록 가져오기
file_list = os.listdir(folder_path)

# 이미지 파일 확장자 (예: .jpg, .png)를 확인하여 이미지 파일만 선택
image_extensions = [".jpg", ".jpeg", ".png", ".bmp", ".gif"]

image_files = [f for f in file_list if os.path.splitext(f)[-1].lower() in image_extensions]

In [None]:
# # 이미지 불러오기 확인
# image_file = image_files[0]
# image_path = os.path.join(folder_path, image_file)
# img = cv2.imread(image_path)
# img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

# plt.imshow(img)

### case 1: 너무 밝거나 어두운 이미지

In [None]:
# 전체 이미지의 밝기 평균과 표준편차 계산
average = {}
sd = {}

for image_file in image_files:
    image_path = os.path.join(folder_path, image_file)
    
    image = cv2.imread(image_path)
    average[image_path] = np.mean(image)
    sd[image_path] = np.std(image)

average = sorted(average.items(), key= lambda item:item[1])
sd = sorted(sd.items(), key= lambda item:item[1])

In [None]:
# 이미지 평균 밝기 통계량
print("전체 평균", np.mean(list(dict(average).values())))
print(np.percentile(list(dict(average).values()), [0, 25, 50, 75, 100])) # 사분위수

In [None]:
# 전체 이미지의 평균 밝기
plt.hist(list(dict(average).values()), bins=30, color='blue', alpha=0.7)
plt.xlabel('average_values')
plt.title('이미지의 평균 밝기 분포')
plt.grid(True)
plt.show()

In [None]:
dark_images = average
bright_images = sorted(dict(average).items(), key=lambda x:x[1], reverse=True)

In [None]:
# 밝은 이미지 열어보기

n = 10 # 상위 몇 개 가져올지 지정
option = bright_images # dark_images/bright_images 지정

for image_path in dict(option[:n]):
    image = cv2.imread(image_path)
    image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)    
    # standard_deviation = round(np.std(image), 3)
    standard_deviation = round(dict(sd)[image_path],3)
    avg = round(dict(average)[image_path],3)
    txt = "average : "+str(avg)+" sd : "+str(standard_deviation)
    hist, bins = np.histogram(image.ravel(), 256, [0, 256])    

    plt.figure(figsize=(6, 3))
    plt.subplot(1, 2, 1)
    plt.axis('off')
    plt.imshow(image, cmap='gray')
    plt.subplot(1, 2, 2)
    plt.hist(image.ravel(), 256, [0, 256], color='r')
    plt.xlabel(txt)

    plt.show()
# cv2.destroyAllWindows()

In [None]:
# 밝기순 정렬된 이미지 표준편차 조회
for i in bright_images[:20]:
    print(round(dict(sd)[i[0]],3))

### 밝은 이미지 열어보기

In [None]:
# 밝은 이미지 열어보기

n = 20 # 상위 몇 개 가져올지 지정
option = bright_images # dark_images/bright_images 지정
imglist_avg = []
imglist_sd = []

for image_path in dict(option[:n]):
    image = cv2.imread(image_path)
    image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 

    plt.figure(figsize=(6, 3))
    plt.imshow(image, cmap='gray')
    image_sd = dict(sd)[image_path]
    image_avg = dict(average)[image_path]
    imglist_sd.append(image_sd)
    imglist_avg.append(image_avg)
    txt = "sd: " + str(round(image_sd, 3)) + " average: " + str(round(image_avg, 3)) 
    plt.title(txt)
    plt.axis('off')

    plt.show()

# 밝은 이미지 n개의 평균 밝기 및 표준편차
plt.figure(figsize=(12, 4))
plt.subplot(1, 3, 1)
plt.hist(imglist_avg, bins=20, color='blue', alpha=0.7)
plt.xlabel('average_values')
plt.xlim(0, 256)
plt.title('밝은 이미지 250개의 평균밝기 분포')
plt.grid(True)

plt.subplot(1, 3, 2)
plt.hist(imglist_sd, bins=20, color='blue', alpha=0.7)
plt.xlabel('sd_values')
plt.title('밝은 이미지 250개의 표준편차 분포')
plt.xlim(0, 115)
plt.grid(True)

plt.subplot(1, 3, 3)
plt.hist(list(dict(sd).values()), bins=20, color='blue', alpha=0.7)
plt.xlabel('sd_values')
plt.title('전체 이미지의 밝기 표준편차 분포')
plt.grid(True)

plt.show()

In [None]:
plt.figure(figsize=(2,4))
plt.boxplot(list(dict(sd).values()))
plt.xlabel('5000개')
# plt.title('전체 이미지의 밝기 표준편차 분포')
plt.ylim(0,115)
plt.grid(False)

plt.show()

In [None]:
# sd 분포
n = 250 # 상위 몇 개 가져올지 지정
option = bright_images # dark_images/bright_images 지정
imglist_avg = []
imglist_sd = []

for image_path in dict(option[:n]):
    image_sd = dict(sd)[image_path]
    image_avg = dict(average)[image_path]
    imglist_sd.append(image_sd)
    imglist_avg.append(image_avg)
    txt = "sd: " + str(round(image_sd, 3)) + " average: " + str(round(image_avg, 3)) 

plt.figure(figsize=(2, 4))
plt.boxplot(imglist_sd)
plt.xlabel("250개")
plt.ylim(0,115)

### 어두운 이미지 열어보기

In [None]:
# 어두운 이미지 열어보기

n = 10 # 상위 몇 개 가져올지 지정
option = dark_images # dark_images/bright_images 지정

for image_path in dict(option[:n]):
    image = cv2.imread(image_path)
    image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)    
    # standard_deviation = round(np.std(image), 3)
    standard_deviation = round(dict(sd)[image_path],3)
    avg = round(dict(average)[image_path],3)
    txt = "average : "+str(avg)+" sd : "+str(standard_deviation)
    hist, bins = np.histogram(image.ravel(), 256, [0, 256])    

    plt.figure(figsize=(6, 3))
    plt.subplot(1, 2, 1)
    plt.axis('off')
    plt.imshow(image, cmap='gray')
    plt.subplot(1, 2, 2)
    plt.hist(image.ravel(), 256, [0, 256], color='r')
    plt.xlabel(txt)

    plt.show()
# cv2.destroyAllWindows()

In [None]:
# 어두운 이미지 열어보기

n = 50 # 상위 몇 개 가져올지 지정
option = dark_images # dark_images/bright_images 지정
imglist_avg = []
imglist_sd = []

for image_path in dict(option[:n]):
    image = cv2.imread(image_path)
    image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 

    plt.figure(figsize=(6, 3))
    plt.imshow(image, cmap='gray')
    image_sd = dict(sd)[image_path]
    image_avg = dict(average)[image_path]
    imglist_sd.append(image_sd)
    imglist_avg.append(image_avg)
    txt = "sd: " + str(round(image_sd, 3)) + " average: " + str(round(image_avg, 3)) 
    plt.title(txt)
    plt.axis('off')

    plt.show()

# 어두운 이미지 n개의 평균 밝기 및 표준편차
plt.figure(figsize=(12, 4))
plt.subplot(1, 3, 1)
plt.hist(imglist_avg, bins=20, color='blue', alpha=0.7)
plt.xlabel('average_values')
plt.xlim(0, 256)
plt.title('어두운 이미지 50개의 평균밝기 분포')
plt.grid(True)

plt.subplot(1, 3, 2)
plt.hist(imglist_sd, bins=20, color='blue', alpha=0.7)
plt.xlim(0, 115)
plt.xlabel('sd_values')
plt.title('어두운 이미지 50개의 표준편차 분포')
plt.grid(True)

plt.subplot(1, 3, 3)
plt.hist(list(dict(sd).values()), bins=20, color='blue', alpha=0.7)
plt.xlabel('sd_values')
plt.title('전체 이미지의 밝기 표준편차 분포')
plt.grid(True)

plt.show()

In [None]:
# sd 분포
n = 5000 # 상위 몇 개 가져올지 지정
option = dark_images # dark_images/bright_images 지정
imglist_avg = []
imglist_sd = []

for image_path in dict(option[:n]):
    image_sd = dict(sd)[image_path]
    image_avg = dict(average)[image_path]
    imglist_sd.append(image_sd)
    imglist_avg.append(image_avg)
    txt = "sd: " + str(round(image_sd, 3)) + " average: " + str(round(image_avg, 3)) 

plt.figure(figsize=(2, 4))
plt.boxplot(imglist_sd)
plt.xlabel("5000개")
plt.ylim(0,115)

In [None]:
sd = dict(sd)
average = dict(average)

In [None]:
# 사분위수
np.percentile(list(sd.values()), [0, 25, 50, 75, 100])

In [None]:
plt.hist(list(sd.values()), bins=20, color='blue', alpha=0.7)
plt.xlabel('sd_values')
plt.title('이미지의 밝기 표준편차 분포')
plt.grid(True)
plt.show()

In [None]:
# 밝기 상위 p프로의 표준편차 분포
p = 0.1 # 5000개 중 10프로 -> 500개
option = bright_images # dark_images/bright_images 지정

top_lst = list(dict(option[:int(len(bright_images)*p)]).keys())
result_dict = {} # 밝기 상위 p프로의 표준편차를 저장하는 딕셔너리

for value in top_lst:
    result_dict[value] = sd[value]

# 히스토그램 그리기
plt.hist(result_dict.values(), bins=20, color='blue', alpha=0.7)
plt.xlabel('sd_values')
plt.title('밝기 상위 1프로의 표준편차 분포')
plt.show()

In [None]:
# 밝기 상위 p프로의 표준편차 분포
p = 0.01 # 5000개 중 1프로 -> 50개
option = bright_images # dark_images/bright_images 지정

top_lst = list(dict(option[:int(len(bright_images)*p)]).keys())
result_dict = {} # 밝기 상위 p프로의 표준편차를 저장하는 딕셔너리

for value in top_lst:
    result_dict[value] = sd[value]

# 히스토그램 그리기
plt.hist(result_dict.values(), bins=20, color='blue', alpha=0.7)
plt.xlabel('sd_values')
plt.title('밝기 상위 1프로의 표준편차 분포')
plt.show()

In [None]:
# Boxplot 그리기
plt.boxplot([list(result_dict.values()), list(sd.values())])

# X축 설정
plt.xticks([1, 2],['밝은 이미지의 표준편차 분포', '전체 이미지의 표준편차 분포'])

# Y축 설정
plt.ylabel('Value')
plt.ylim(0, 100)