In [1]:
pip install colorgram.py

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting colorgram.py
  Downloading colorgram.py-1.2.0-py2.py3-none-any.whl (6.2 kB)
Installing collected packages: colorgram.py
Successfully installed colorgram.py-1.2.0


In [2]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [3]:
import os
import re
import cv2
import pandas as pd
import colorgram
import numpy as np
from sklearn.cluster import KMeans
from skimage import io
from skimage.color import rgb2lab, deltaE_cie76

# 이미지 파일에서 채도 정보 추출하는 함수
def get_saturation(image_path):
    # 이미지 로드
    image = io.imread(image_path)
    # RGB 값을 LAB 색상 체계로 변환
    lab_image = rgb2lab(image)
    # LAB 체계에서 a, b 축의 값 추출
    a, b = lab_image[:,:,1], lab_image[:,:,2]
    # a, b 축의 값의 표준편차를 이용하여 채도 계산
    saturation = np.sqrt(np.square(a) + np.square(b)).mean()
    return saturation

# 이미지 파일 리스트를 채도 기준으로 정렬하는 함수
def sort_images_by_saturation(image_list):
    # 이미지 파일 리스트와 각 이미지 파일의 채도 값을 저장할 리스트
    saturation_list = []
    sorted_image_list = []

    # 이미지 파일 별로 채도 값 추출
    for image in image_list:
        saturation = get_saturation(os.path.join(folder_path, image))
        saturation_list.append(saturation)

    # 채도 값을 기준으로 이미지 파일 리스트를 정렬
    sorted_index = np.argsort(saturation_list)[::-1]
    for index in sorted_index:
        sorted_image_list.append(image_list[index])

    return sorted_image_list

# 이미지 파일에서 색상 정보 추출하는 함수
def get_colors(image_path):
    # 이미지에서 10개의 색상 추출
    colors = colorgram.extract(image_path, 10)
    # 추출된 색상 정보를 RGB 값으로 변환하여 리스트로 저장
    color_list = [(color.rgb.r, color.rgb.g, color.rgb.b) for color in colors]
    return color_list

# 이미지 파일 리스트를 색상 기준으로 클러스터링하는 함수
def cluster_images_by_color(image_list):
    # 이미지 파일 이름과 색상 정보 저장할 리스트
    name_list = []
    color_list = []

    # 이미지 파일 별로 색상 분석 및 정보 저장
    for image in image_list:
        # 이미지 파일 이름 저장
        name_list.append(image)
        # 색상 분석 및 정보 저장
        color = get_colors(os.path.join(folder_path, image))
        color_array = np.array(color)
        kmeans = KMeans(n_clusters=3, random_state=42).fit(color_array)
        center_colors = kmeans.cluster_centers_
        hex_colors = ['#%02x%02x%02x' % tuple(map(int, color)) for color in center_colors]
        color_list.append(hex_colors)

    # 결과를 데이터프레임으로 저장
    df = pd.DataFrame(color_list, index=name_list, columns=['Color1', 'Color2', 'Color3'])

    return df


In [8]:
# 이미지 파일이 있는 폴더 경로
folder_paths = [
    '/content/drive/MyDrive/image/Top',
    '/content/drive/MyDrive/image/jacket',
    '/content/drive/MyDrive/image/Coat',
    '/content/drive/MyDrive/image/Skirt',
    '/content/drive/MyDrive/image/Trousers',
    '/content/drive/MyDrive/image/Dress',
    '/content/drive/MyDrive/image/Hoodie',
    '/content/drive/MyDrive/image/Cardigan'
]

for folder_path in folder_paths:
    # 폴더 경로에서 일부 텍스트 추출
    folder_name = folder_path.split('/')[-1]
    # 추출한 텍스트를 사용하여 원하는 작업 수행
    print("폴더 이름:", folder_name)
    # 추가 작업 수행

    # 이미지 파일 리스트
    image_list = os.listdir(folder_path)

    # 이미지 파일 이름과 채도 정보 저장할 리스트
    name_list = []
    saturation_list = []

    # 이미지 파일 별로 채도 분석 및 정보 저장
    for image in image_list:
    # 이미지 파일 이름 저장
        name_list.append(image)
    # 이미지 파일 읽어오기
        img = cv2.imread(os.path.join(folder_path, image))
    # 이미지 채도 변환
        hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
        saturation = hsv[:, :, 1].mean()
    # 채도 정보 저장
        saturation_list.append(saturation)

    # 결과를 데이터프레임으로 저장
    df = pd.DataFrame({'Name': name_list, 'Saturation': saturation_list})

    # 채도에 따라 이미지를 클러스터링하는 함수
    def cluster_images(df, num_clusters):
    # 채도를 기준으로 클러스터링 수행
        kmeans = KMeans(n_clusters=num_clusters, random_state=42).fit(df[['Saturation']])
    # 클러스터링 결과를 데이터프레임에 추가
        df['Cluster'] = kmeans.labels_
    # 각 클러스터의 대표 이미지를 찾기 위해 채도 값이 가장 큰 이미지를 선택
        df = df.sort_values(by=['Cluster', 'Saturation'], ascending=[True, False])
        df = df.groupby('Cluster').head(1)
        df = df.sort_values(by='Cluster')
        return df

    # 클러스터링 결과 출력
    df_result = cluster_images(df,4)
    print(df_result)

    for i in range(4):
      print("cluster:", i)
      cluster_num = i
      cluster_df = df[df['Cluster'] == cluster_num]
      for name in cluster_df['Name']:
        print(name)
      print(" ")

폴더 이름: Top




          Name  Saturation  Cluster
69  t (70).jpg   14.089783        0
3    t (5).jpg  139.546875        1
38  t (39).jpg   62.766174        2
58  t (60).jpg   33.061829        3
cluster: 0
t (6).jpg
t (15).jpg
t (17).jpg
t (11).jpg
t (10).jpg
t (16).jpg
t (19).jpg
t (22).jpg
t (25).jpg
t (26).jpg
t (28).jpg
t (23).jpg
t (33).jpg
t (36).jpg
t (41).jpg
t (38).jpg
t (45).jpg
t (44).jpg
t (43).jpg
t (46).jpg
t (50).jpg
t (49).jpg
t (51).jpg
t (52).jpg
t (47).jpg
t (53).jpg
t (55).jpg
t (56).jpg
t (59).jpg
t (61).jpg
t (62).jpg
t (63).jpg
t (64).jpg
t (65).jpg
t (66).jpg
t (67).jpg
t (70).jpg
t (72).jpg
t (74).jpg
t (75).jpg
t (76).jpg
t (77).jpg
t (79).jpg
t (80).jpg
t (83).jpg
t (82).jpg
t (85).jpg
t (86).jpg
t (87).jpg
t (90).jpg
t (92).jpg
t (91).jpg
t (89).jpg
t (96).jpg
t (93).jpg
t (97).jpg
t (98).jpg
 
cluster: 1
t (2).jpg
t (3).jpg
t (5).jpg
t (8).jpg
t (13).jpg
t (21).jpg
t (18).jpg
t (9).jpg
t (68).jpg
t (69).jpg
t (71).jpg
 
cluster: 2
t (4).jpg
t (7).jpg
t (14).jpg
t (35).jpg



              Name  Saturation  Cluster
18  skirt (19).jpg   41.540283        0
38  skirt (39).jpg  152.121277        1
32  skirt (34).jpg   95.398621        2
6    skirt (5).jpg   19.028015        3
cluster: 0
skirt (3).jpg
skirt (4).jpg
skirt (6).jpg
skirt (15).jpg
skirt (11).jpg
skirt (19).jpg
skirt (22).jpg
skirt (28).jpg
skirt (27).jpg
skirt (35).jpg
 
cluster: 1
skirt (2).jpg
skirt (14).jpg
skirt (18).jpg
skirt (38).jpg
skirt (39).jpg
 
cluster: 2
skirt (10).jpg
skirt (16).jpg
skirt (20).jpg
skirt (23).jpg
skirt (26).jpg
skirt (34).jpg
skirt (33).jpg
 
cluster: 3
skirt (1).jpg
skirt (7).jpg
skirt (8).jpg
skirt (5).jpg
skirt (13).jpg
skirt (17).jpg
skirt (12).jpg
skirt (9).jpg
skirt (21).jpg
skirt (24).jpg
skirt (25).jpg
skirt (29).jpg
skirt (30).jpg
skirt (31).jpg
skirt (32).jpg
skirt (36).jpg
skirt (37).jpg
skirt (40).jpg
 
폴더 이름: Trousers




                 Name  Saturation  Cluster
23  Trousers (34).jpg   13.859131        0
27  Trousers (28).jpg   42.656616        1
17  Trousers (18).jpg   81.836426        2
35  Trousers (37).jpg   27.694641        3
cluster: 0
Trousers (3).jpg
Trousers (4).jpg
Trousers (5).jpg
Trousers (6).jpg
Trousers (7).jpg
Trousers (10).jpg
Trousers (9).jpg
Trousers (16).jpg
Trousers (17).jpg
Trousers (22).jpg
Trousers (34).jpg
Trousers (27).jpg
Trousers (35).jpg
Trousers (25).jpg
Trousers (30).jpg
Trousers (32).jpg
Trousers (36).jpg
Trousers (55).jpg
Trousers (43).jpg
Trousers (50).jpg
Trousers (52).jpg
Trousers (45).jpg
Trousers (48).jpg
Trousers (42).jpg
Trousers (44).jpg
Trousers (60).jpg
Trousers (59).jpg
 
cluster: 1
Trousers (1).jpg
Trousers (12).jpg
Trousers (14).jpg
Trousers (20).jpg
Trousers (21).jpg
Trousers (26).jpg
Trousers (29).jpg
Trousers (33).jpg
Trousers (28).jpg
Trousers (41).jpg
Trousers (39).jpg
Trousers (58).jpg
Trousers (47).jpg
Trousers (56).jpg
Trousers (53).jpg
Trousers (49



               Name  Saturation  Cluster
1    Hoodie (2).jpg   29.102478        0
4    Hoodie (6).jpg   94.459351        1
13  Hoodie (15).jpg  123.104858        2
17  Hoodie (18).jpg   76.577515        3
cluster: 0
Hoodie (2).jpg
Hoodie (3).jpg
Hoodie (4).jpg
Hoodie (7).jpg
Hoodie (8).jpg
Hoodie (13).jpg
Hoodie (11).jpg
Hoodie (14).jpg
Hoodie (17).jpg
Hoodie (16).jpg
Hoodie (19).jpg
 
cluster: 1
Hoodie (1).jpg
Hoodie (6).jpg
Hoodie (12).jpg
 
cluster: 2
Hoodie (5).jpg
Hoodie (15).jpg
 
cluster: 3
Hoodie (9).jpg
Hoodie (10).jpg
Hoodie (18).jpg
 
폴더 이름: Cardigan
                 Name  Saturation  Cluster
8    cardigan (6).jpg   14.281921        0
28  cardigan (28).jpg   84.344421        1
27  cardigan (30).jpg   47.244324        2
9   cardigan (11).jpg  114.997681        3
cluster: 0
cardigan (1).jpg
cardigan (2).jpg
cardigan (7).jpg
cardigan (6).jpg
cardigan (15).jpg
cardigan (20).jpg
cardigan (18).jpg
cardigan (21).jpg
cardigan (17).jpg
cardigan (27).jpg
cardigan (29).jpg
cardigan (23

