The following code was created by the author to investigate the ImageNet dataset structure.  
These codes are entirely unnecessary for the implementation of zero initialization.  
Although the comments are written in Korean, they can be easily translated into English using GPT or other translation tools.  

Email sjw007s@korea.ac.kr

In [None]:
from PIL import Image
import os
from tqdm import tqdm
import numpy as np
from concurrent.futures import ThreadPoolExecutor

# 이미지넷 데이터셋 경로
dataset_dir = r"C:\Users\sjw00\OneDrive\Desktop\dataset\imagenet\ILSVRC2012_img_train"  # 이미지 폴더 경로 (train, val 등)

# 이미지 크기 저장 리스트
widths = []
heights = []

def process_image(root, file):
    if file.endswith(('.jpg', '.JPEG', '.png')):  # 이미지 파일만 처리
        img_path = os.path.join(root, file)
        try:
            with Image.open(img_path) as img:
                width, height = img.size
                return width, height
        except Exception as e:
            print(f"Error loading {img_path}: {e}")
    return None

# 이미지 크기 조사
with ThreadPoolExecutor(max_workers=40) as executor:
    futures = []
    for root, dirs, files in os.walk(dataset_dir):
        futures.extend(executor.submit(process_image, root, file) for file in files)
    for future in tqdm(futures, desc="Processing"):
        result = future.result()
        if result:
            width, height = result
            widths.append(width)
            heights.append(height)

# 통계 계산
widths = np.array(widths)
heights = np.array(heights)

print("\n--- 이미지 크기 통계 ---")
print(f"이미지 개수: {len(widths)}")
print(f"가로 길이 (width) - 평균: {np.mean(widths):.2f}, 최솟값: {np.min(widths)}, 최댓값: {np.max(widths)}")
print(f"세로 길이 (height) - 평균: {np.mean(heights):.2f}, 최솟값: {np.min(heights)}, 최댓값: {np.max(heights)}")


In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(10, 5))
plt.hist(widths, bins=50, alpha=0.7, label='Width')
plt.hist(heights, bins=50, alpha=0.7, label='Height')
plt.xlabel('Pixels')
plt.ylabel('Number of Images')
plt.title('Distribution of Image Sizes (Width and Height)')
plt.legend()
plt.show()

In [None]:
import os

from collections import defaultdict

# 조사할 디렉터리 경로
dataset_dir = r"C:\Users\sjw00\OneDrive\Desktop\dataset\imagenet\ILSVRC2012_img_train"

# 폴더별 파일 개수를 저장할 딕셔너리
folder_file_count = defaultdict(int)

# 폴더 순회 및 파일 개수 집계
for root, dirs, files in os.walk(dataset_dir):
    folder_name = os.path.basename(root)  # 현재 폴더 이름
    folder_file_count[folder_name] += len(files)  # 해당 폴더의 파일 개수 추가

# 결과 출력
print("\n--- 폴더별 파일 개수 ---")
for folder, count in folder_file_count.items():
    if count != 1300:
        print(f"{folder}: {count}개")

In [None]:
from PIL import Image
import os
from tqdm import tqdm
import numpy as np
from concurrent.futures import ThreadPoolExecutor

# 이미지넷 데이터셋 경로
dataset_dir = r"C:\Users\sjw00\OneDrive\Desktop\dataset\imagenet\ILSVRC2012_img_train"  # 이미지 폴더 경로 (train, val 등)

# 이미지 크기 저장 리스트
widths = []
heights = []

def process_image(root, file):
    if file.endswith(('.jpg', '.JPEG', '.png')):  # 이미지 파일만 처리
        img_path = os.path.join(root, file)
        try:
            with Image.open(img_path) as img:
                width, height = img.size
                if width < 20 or height < 20:
                    print(os.path.join(root,file))
                
                return width, height
        except Exception as e:
            print(f"Error loading {img_path}: {e}")
    return None

# 이미지 크기 조사
with ThreadPoolExecutor(max_workers=40) as executor:
    futures = []
    for root, dirs, files in os.walk(dataset_dir):
        futures.extend(executor.submit(process_image, root, file) for file in files)
    for future in tqdm(futures, desc="Processing"):
        result = future.result()
        if result:
            width, height = result
            widths.append(width)
            heights.append(height)

# 통계 계산
widths = np.array(widths)
heights = np.array(heights)

print("\n--- 이미지 크기 통계 ---")
print(f"이미지 개수: {len(widths)}")
print(f"가로 길이 (width) - 평균: {np.mean(widths):.2f}, 최솟값: {np.min(widths)}, 최댓값: {np.max(widths)}")
print(f"세로 길이 (height) - 평균: {np.mean(heights):.2f}, 최솟값: {np.min(heights)}, 최댓값: {np.max(heights)}")


In [None]:
from PIL import Image
import os
from tqdm import tqdm
import numpy as np
from concurrent.futures import ThreadPoolExecutor

# 이미지넷 데이터셋 경로
dataset_dir = r"C:\Users\sjw00\OneDrive\Desktop\dataset\imagenet\ILSVRC2012_img_val"  # 이미지 폴더 경로 (train, val 등)

# 이미지 크기 저장 리스트
widths = []
heights = []

def process_image(root, file):
    if file.endswith(('.jpg', '.JPEG', '.png')):  # 이미지 파일만 처리
        img_path = os.path.join(root, file)
        try:
            with Image.open(img_path) as img:
                width, height = img.size
                return width, height
        except Exception as e:
            print(f"Error loading {img_path}: {e}")
    return None

# 이미지 크기 조사
with ThreadPoolExecutor(max_workers=40) as executor:
    futures = []
    for root, dirs, files in os.walk(dataset_dir):
        futures.extend(executor.submit(process_image, root, file) for file in files)
    for future in tqdm(futures, desc="Processing"):
        result = future.result()
        if result:
            width, height = result
            widths.append(width)
            heights.append(height)

# 통계 계산
widths = np.array(widths)
heights = np.array(heights)

print("\n--- 이미지 크기 통계 ---")
print(f"이미지 개수: {len(widths)}")
print(f"가로 길이 (width) - 평균: {np.mean(widths):.2f}, 최솟값: {np.min(widths)}, 최댓값: {np.max(widths)}")
print(f"세로 길이 (height) - 평균: {np.mean(heights):.2f}, 최솟값: {np.min(heights)}, 최댓값: {np.max(heights)}")


In [None]:
from PIL import Image
import os
from tqdm import tqdm
import numpy as np
from concurrent.futures import ThreadPoolExecutor

# 이미지넷 데이터셋 경로
dataset_dir = r"C:\Users\sjw00\OneDrive\Desktop\dataset\imagenet\ILSVRC2012_img_train"

# 각 채널별 합과 제곱합을 저장할 배열
sum_rgb = np.zeros(3)
sum_sq_rgb = np.zeros(3)
num_pixels = 0


# 이미지 처리 함수
def process_image(root, file):
    if file.endswith(('.jpg', '.JPEG', '.png')):
        img_path = os.path.join(root, file)
        try:
            with Image.open(img_path) as img:
                img = img.convert("RGB")  # 이미지 RGB로 변환 (채널이 다를 경우 방지)
                img = np.array(img).astype(np.float32) / 255.0  # 0~1 범위로 정규화
                
                # 각 채널별 합과 제곱합 바로 계산
                sum_rgb_local = np.sum(img, axis=(0, 1))  # 채널별 합
                sum_sq_rgb_local = np.sum(np.square(img), axis=(0, 1))  # 채널별 제곱합
                
                # 픽셀 수 계산
                h, w, _ = img.shape
                return sum_rgb_local, sum_sq_rgb_local, h * w
        except Exception as e:
            print(f"Error loading {img_path}: {e}")
    return None


# 스레드를 사용해 병렬 처리
with ThreadPoolExecutor(max_workers=40) as executor:
    futures = []
    for root, dirs, files in os.walk(dataset_dir):
        for file in files:
            futures.append(executor.submit(process_image, root, file))
    
    # 결과 수집 (메모리에 전체 이미지를 올리지 않음)
    for future in tqdm(futures, desc="Processing"):
        result = future.result()
        if result:
            sum_rgb_local, sum_sq_rgb_local, pixels = result
            sum_rgb += sum_rgb_local
            sum_sq_rgb += sum_sq_rgb_local
            num_pixels += pixels

# RGB 평균 및 표준편차 계산
mean = sum_rgb / num_pixels
std = np.sqrt((sum_sq_rgb / num_pixels) - np.square(mean))

# 결과 출력
print("\n--- ImageNet Mean and Std ---")
print(f"Mean (R, G, B): {mean}")
print(f"Std (R, G, B): {std}")


In [None]:
from PIL import Image
import os
from tqdm import tqdm
import numpy as np
from concurrent.futures import ThreadPoolExecutor
from collections import defaultdict

# 이미지넷 데이터셋 경로
dataset_dir = r"C:\Users\sjw00\OneDrive\Desktop\dataset\imagenet\ILSVRC2012_img_train"

# 이미지 크기 저장 리스트 및 카운트 딕셔너리 초기화
widths = []
heights = []
format_counts = defaultdict(int)  # 이미지 형식별 카운트

def process_image(root, file):
    if file.lower().endswith(('.jpg', '.jpeg', '.png', '.gif', '.bmp', '.tiff', '.tif', '.webp', '.heif', '.heic')):  
        img_path = os.path.join(root, file)
        try:
            with Image.open(img_path) as img:
                width, height = img.size
                format_counts[file.split('.')[-1].lower()] += 1  # 확장자별 카운트
                return width, height
        except Exception as e:
            print(f"Error loading {img_path}: {e}")
    return None

# 이미지 크기 조사
with ThreadPoolExecutor(max_workers=40) as executor:
    futures = []
    for root, dirs, files in os.walk(dataset_dir):
        futures.extend(executor.submit(process_image, root, file) for file in files)
    for future in tqdm(futures, desc="Processing"):
        result = future.result()
        if result:
            width, height = result
            widths.append(width)
            heights.append(height)

# 통계 계산
widths = np.array(widths)
heights = np.array(heights)

print("\n--- 이미지 크기 통계 ---")
print(f"이미지 개수: {len(widths)}")
print(f"가로 길이 (width) - 평균: {np.mean(widths):.2f}, 최솟값: {np.min(widths)}, 최댓값: {np.max(widths)}")
print(f"세로 길이 (height) - 평균: {np.mean(heights):.2f}, 최솟값: {np.min(heights)}, 최댓값: {np.max(heights)}")

# 이미지 형식별 카운트 출력
print("\n--- 이미지 형식별 개수 ---")
for ext, count in format_counts.items():
    print(f"{ext.upper()}: {count}개")
