# * GNSS/GPS Homework 5
#  SVD (Singular Value Decomposition and Image Reduction) 

In [None]:
from matplotlib.image import imread
import matplotlib.pyplot as plt
import numpy as np

# 이미지 파일을 읽고 numpy 배열 형태로 변환
A = imread('yonsei.jpeg')

# 각 RGB 채널에 대해 SVD를 수행하기 전에 시각화를 위한 figure 설정
plt.figure(figsize=(16, 8))

U,S,VT = np.linalg.svd(A,full_matrices=False)
# 빨간색 채널에 대한 SVD 수행
U_r, S_r, VT_r = np.linalg.svd(A[:, :, 0], full_matrices=False)
# 초록색 채널에 대한 SVD 수행
U_g, S_g, VT_g = np.linalg.svd(A[:, :, 1], full_matrices=False)
# 파란색 채널에 대한 SVD 수행
U_b, S_b, VT_b = np.linalg.svd(A[:, :, 2], full_matrices=False)

### 특이값 분해를 위한 이미지 재구성 시 반복 작업을 줄이기 위한 함수 정의

In [None]:
# 주어진 수의 특이값을 사용하여 채널을 재구성하는 함수
def reconstruct_channel(U, S, VT, r):
    S_reduced = np.diag(S[:r])  # 대각 행렬로 변환
    return U[:, :r] @ S_reduced @ VT[:r, :]  # 재구성된 채널 반환

#### r값에 따른 압축률을 확인하기 위해 시각화

In [None]:


plt.figure(1,dpi = 1000)

plt.semilogy(np.diag(S_r))
plt.semilogy(np.diag(S_g))
plt.semilogy(np.diag(S_b))
plt.title('Singular Values')
plt.show()




# <font color=red>R 채널에 대한 특이값 분해 시 r 값에 따른 채널 별 시각화</font>

In [None]:
# 다양한 'r' 값에 대해 빨간색 채널의 근사 이미지를 생성하고 시각화
for i in (10, 100, 600, 700):
    # 빨간색 채널의 근사화 실행
    S_reduced = np.diag(S_r[:i])  # 대각 행렬 생성
    Rapprox = U_r[:, :i] @ S_reduced @ VT_r[:i, :]  # 근사 이미지 생성

    # 빨간색 채널 이외를 0으로 설정하여 새로운 RGB 이미지 생성
    approx_img = np.zeros_like(A)
    approx_img[:, :, 0] = Rapprox  # 빨간색 채널에만 근사값 할당

    plt.figure(dpi = 1000)  # 새 figure 생성
    plt.imshow(np.clip(approx_img, 0, 255).astype('uint8'))  # RGB 색상으로 이미지 표시
    plt.axis('off')  # 축 표시 제거
    plt.title(f'Red Channel, r = {i}')  # 제목 설정
    plt.show()  # 이미지 표시


# <font color=green>G 채널에 대한 특이값 분해 시 r 값에 따른 채널 별 시각화</font>

In [None]:
# 다양한 'r' 값에 대해 초록색 채널의 근사 이미지를 생성하고 시각화
for i in (10, 100, 600, 700):
    # 초록색 채널의 근사화 실행
    S_reduced = np.diag(S_g[:i])  # 대각 행렬 생성
    Gapprox = U_g[:, :i] @ S_reduced @ VT_g[:i, :]  # 근사 이미지 생성

    # 초록색 채널 이외를 0으로 설정하여 새로운 RGB 이미지 생성
    approx_img = np.zeros_like(A)
    approx_img[:, :, 1] = Gapprox  # 초록색 채널에만 근사값 할당

    plt.figure(dpi = 1000)  # 새 figure 생성
    plt.imshow(np.clip(approx_img, 0, 255).astype('uint8'))  # RGB 색상으로 이미지 표시
    plt.axis('off')  # 축 표시 제거
    plt.title(f'Green Channel, r = {i}')  # 제목 설정
    plt.show()  # 이미지 표시


# <font color=blue>B 채널에 대한 특이값 분해 시 r 값에 따른 채널 별 시각화</font>

In [None]:
# 다양한 'r' 값에 대해 파란색 채널의 근사 이미지를 생성하고 시각화
for i in (10, 100, 600, 700):
    # 파란색 채널의 근사화 실행
    B_reduced = np.diag(S_b[:i])  # 대각 행렬 생성
    Bapprox = U_b[:, :i] @ B_reduced @ VT_b[:i, :]  # 근사 이미지 생성

    # 파란색 채널 이외를 0으로 설정하여 새로운 RGB 이미지 생성
    approx_img = np.zeros_like(A)
    approx_img[:, :, 2] = Bapprox  # 파란색 채널에만 근사값 할당

    plt.figure(dpi = 1000)  # 새 figure 생성
    plt.imshow(np.clip(approx_img, 0, 255).astype('uint8'))  # RGB 색상으로 이미지 표시
    plt.axis('off')  # 축 표시 제거
    plt.title(f'Blue Channel, r = {i}')  # 제목 설정
    plt.show()  # 이미지 표시

# 채널 별 분해된 R,G,B 값을 다시 한 배열로 모아 r값에 따른 이미지 재구성 

In [None]:
# r_values는 사용할 특이값의 개수를 정의한 배열입니다.
r_values = [10, 100, 600, 700]
for i, r in enumerate(r_values, start=1):
    # 각 채널에 대해 r 개의 특이값으로 이미지를 재구성합니다.
    Rapprox = reconstruct_channel(U_r, S_r, VT_r, r)  # 빨간색 채널 재구성
    Gapprox = reconstruct_channel(U_g, S_g, VT_g, r)  # 초록색 채널 재구성
    Bapprox = reconstruct_channel(U_b, S_b, VT_b, r)  # 파란색 채널 재구성
    
    # np.stack을 이용하여 3개의 근사 채널을 합쳐 하나의 RGB 이미지로 만듬
    img_approx = np.stack((Rapprox, Gapprox, Bapprox), axis=2)
    
    # 픽셀 범위 고정
    img_approx = np.clip(img_approx, 0, 255).astype('uint8')
    
    # 이미지 출력
    plt.figure(i, dpi = 1000)  # 새로운 그림(figure)을 만듭니다. i는 그림 번호입니다.
    plt.imshow(img_approx)  
    plt.axis('off')  
    plt.title(f'r = {r}')  
    plt.show()  


# r값에 따른 이미지 압축 시 데이터 크기 계산

In [None]:
# r 값 배열 정의
r_values = [10, 100, 600, 700]

# 데이터 크기 계산을 위한 U와 VT의 가정된 크기
U_r_shape = (724, 1086)  # U의 형태, 이미지가 724 x 1086 픽셀임.
VT_r_shape = (1086, 724)  # VT의 형태

# 데이터 크기 계산
data_sizes = []
for r in r_values:
    # U와 VT는 r에 따라 크기가 변함. S는 r x r 크기의 대각행렬.
    U_size = U_r_shape[0] * r  # U의 사용된 크기
    VT_size = VT_r_shape[0] * r  # VT의 사용된 크기
    S_size = r * r  # S가 대각행렬로 변환된 크기
    
    # 총 데이터 크기 계산 (단위: 개수)
    total_size = U_size + VT_size + S_size
    
    # 결과 저장
    data_sizes.append(total_size)

# 결과 출력
for i, j in zip(r_values, data_sizes):
    print(f"r 값이 {i} 일 때 데이터 크기: {j}")


# r 값에 따른 데이터 크기 시각화를 위한 부분, 10, 100, 600, 700 이 아닌 전체 r 범위 부분에 대해 수행

In [None]:



U_r_shape = (724, 1086)  # U의 형태
VT_r_shape = (1086, 724)  # VT의 형태

# k 배열을 np.arange를 사용해 생성
k = np.arange(1, 700, 30)

# 데이터 크기 계산
data_sizes = []
for r in k:
    U_size = U_r_shape[0] * r  # U의 사용된 크기
    VT_size = VT_r_shape[0] * r  # VT의 사용된 크기
    S_size = r * r  # S가 대각행렬로 변환된 크기
    
    # 총 데이터 크기 계산 (단위: 개수)
    total_size = U_size + VT_size + S_size
    
    # 결과 저장
    data_sizes.append(total_size)



# r 값에 따른 데이터 크기 시각화

In [None]:
plt.figure(3, dpi = 1000)

x = k
y = data_sizes
plt.plot(x,y,'o')
plt.yscale('log')
plt.show