In [None]:
"""
    Pruning : 가중치의중요도를판단하는기준을이해하고 
                이를통해불필요한연산을제거하는과정을이해하고있나
###

In [None]:
[실습 1] Fine-grained Pruning 구현
Fine-grained Pruning은 신경망의 가중치를 개별적으로 제거하는 기법입니다. 
각 가중치의 크기(Magnitude)를 기준으로 중요도를 평가하고, 
지정된 희소도(sparsity)에 따라 중요도가 낮은 가중치들을 0으로 만듭니다. 
이를 통해 모델의 크기를 줄이고 연산량을 감소시킬 수 있습니다.

In [None]:
""" 요약 """
### CNN
def prune_weight_fine_grained(weight: torch.Tensor, sparsity: float) -> None:
    # 신경망의 가중치를 개별적으로 제거
    importance = torch.abs(weight)
    threshold = torch.kthvalue(importance.flatten(), num_pruned_elements)[0]
#############################################################################    
def prune_weight_vector_level(weight: torch.Tensor, sparsity: float) -> None:
    # 가중치 벡터 단위로 Pruning을 수행
    importance = weight.abs().sum(dim=(3,), keepdim=True)
    threshold = torch.kthvalue(importance.flatten(), num_pruned_vectors)[0]
    ...
    mask = mask.expand_as(weight)
#############################################################################
def prune_weight_kernel_level(weight: torch.Tensor, sparsity: float) -> None:
    importance = weight.abs().sum(dim=(2, 3), keepdim=True)
    threshold = torch.kthvalue(importance.flatten(), num_pruned_kernels)[0]
    ...
    mask = mask.expand_as(weight)
#############################################################################  
def prune_weight_channel_level(weight: torch.Tensor, sparsity: float) -> None:
    importance = weight.abs().sum(dim=(0, 2, 3), keepdim=True)
    threshold = torch.kthvalue(importance.flatten(), num_pruned_channels)[0]
    ...
    mask = mask.expand_as(weight)
#############################################################################
class FineGrainedPrunerV2:
    importance = torch.abs(all_weights)
    threshold = torch.kthvalue(importance, num_zeros)[0]
    ...
                    mask = torch.abs(param.data) > threshold
#############################################################################
## LLM
def prune_magnitude_opt(model, sparsity):
    importance = torch.abs(W)
    threshold = torch.kthvalue(importance.flatten(), num_zeros)[0]
#############################################################################
def prune_wanda_opt(model, sparsity, input_feat):
    row, col = W.shape
    num_zeros_per_row = round(col * sparsity)
    importance = torch.abs(W) * input_feat[n]
    threshold = torch.kthvalue(importance, num_zeros_per_row, dim=1)[0]
    mask = importance > threshold.reshape(row, 1)
#############################################################################


In [None]:
def prune_weight_fine_grained(weight: torch.Tensor, sparsity: float) -> None:
    """가중치 텐서에 대해 fine-grained pruning을 수행하는 함수

    Args:
        weight: pruning할 가중치 텐서
        sparsity: pruning할 비율 (0~1 사이 값)

    Returns:
        pruning mask 텐서
    """
    # sparsity 값을 0~1 사이로 제한
    sparsity = min(1.0, max(0.0, sparsity))

    # 특수한 경우 처리
    if sparsity == 1.0:  # 모든 가중치를 제거
        weight.zero_()
        return torch.zeros_like(weight)
    elif sparsity == 0.0:  # 모든 가중치를 유지
        return torch.ones_like(weight)

    ##################### YOUR CODE STARTS HERE #####################
    # 제거할 원소 개수를 계산하세요.
    # hint: round() 함수를 사용하세요.
    num_pruned_elements = round(weight.numel() * sparsity)

    # 가중치의 중요도를 절댓값으로 importance 계산
    # hint: torch.abs() 함수를 사용하세요.
    importance = torch.abs(weight)

    # pruning trheshold를 계산하세요.
    # hint: torch.kthvalue() 함수를 사용하세요.
    # kthvalue의 결과를 (값, 인덱스) 인데 그 중 값만 가져오겠다는 의미
    threshold = torch.kthvalue(importance.flatten(), num_pruned_elements)[0]
    #threshold, my_idx = torch.kthvalue(importance.flatten(), num_pruned_elements)


    # threshold보다 큰 값들은 유지(1), 작은 값들은 제거(0)하는 마스크 생성
    # hint: 부등호를 사용하세요.
    mask = importance > threshold
    ##################### YOUR CODE ENDS HERE #######################

    # 마스크를 적용하여 pruning 수행
    weight.mul_(mask)

    return mask

# 마스크 생성 및 시각화
mask_fine_grained = prune_weight_fine_grained(weight.clone(), prune_sparsity)
draw_weight_distribution(mask_fine_grained, title="Fine-grained Pruning Mask")

In [None]:
def prune_weight_vector_level(weight: torch.Tensor, sparsity: float) -> None:
    """벡터 단위로 가중치를 프루닝하는 함수입니다.

    Args:
        weight: 프루닝할 가중치 텐서
        sparsity: 프루닝할 비율 (0~1 사이 값)

    Returns:
        프루닝 마스크 텐서
    """
    # sparsity 값을 0~1 사이로 제한
    sparsity = min(1.0, max(0.0, sparsity))

    # 특수한 경우 처리
    if sparsity == 1.0:  # 모든 가중치를 제거
        weight.zero_()
        return torch.zeros_like(weight)
    elif sparsity == 0.0:  # 모든 가중치를 유지
        return torch.ones_like(weight)

    # 제거할 벡터의 개수 계산
    num_vectors = weight.shape[0] * weight.shape[1] * weight.shape[2]
    num_pruned_vectors = round(num_vectors * sparsity)

    # 각 벡터의 중요도를 절댓값 합으로 계산
    importance = weight.abs().sum(dim=(3,), keepdim=True)

    # pruning trheshold를 계산
    threshold = torch.kthvalue(importance.flatten(), num_pruned_vectors)[0]

    # threshold보다 큰 벡터는 유지(1), 작은 벡터는 제거(0)
    mask = importance > threshold

    # 마스크를 가중치와 동일한 크기로 확장
    mask = mask.expand_as(weight)

    # 마스크를 적용하여 프루닝 수행
    weight.mul_(mask)

    return mask

mask_vector_level = prune_weight_vector_level(weight.clone(), prune_sparsity)
draw_weight_distribution(mask_vector_level, title="Vector-level Pruning Mask")

In [None]:
def prune_weight_kernel_level(weight: torch.Tensor, sparsity: float) -> None:
    """커널 단위로 가중치를 프루닝하는 함수

    Args:
        weight: 프루닝할 가중치 텐서 (out_channels, in_channels, kernel_h, kernel_w)
        sparsity: 프루닝할 비율 (0~1 사이 값)

    Returns:
        프루닝 마스크 텐서
    """
    sparsity = min(1.0, max(0.0, sparsity))
    if sparsity == 1.0:
        weight.zero_()
        return torch.zeros_like(weight)
    elif sparsity == 0.0:
        return torch.ones_like(weight)

    # 프루닝할 커널 수 계산
    num_kernels = weight.shape[0] * weight.shape[1]
    num_pruned_kernels = round(num_kernels * sparsity)

    # 각 커널의 중요도를 절댓값 합으로 계산 (커널 크기에 대해 합산)
    importance = weight.abs().sum(dim=(2, 3), keepdim=True)

    # pruning trheshold를 계산
    threshold = torch.kthvalue(importance.flatten(), num_pruned_kernels)[0]

    # threshold보다 큰 커널은 유지(1), 작은 커널은 제거(0)
    mask = importance > threshold

    # 마스크를 가중치와 동일한 크기로 확장
    mask = mask.expand_as(weight)

    # 마스크를 적용하여 프루닝 수행
    weight.mul_(mask)

    return mask

mask_kernel_level = prune_weight_kernel_level(weight.clone(), prune_sparsity)
draw_weight_distribution(mask_kernel_level, title="Kernel-level Pruning Mask")

In [None]:
def prune_weight_channel_level(weight: torch.Tensor, sparsity: float) -> None:
    """채널 단위 프루닝을 수행하는 함수

    Args:
        weight: 프루닝할 가중치 텐서 (out_channels, in_channels, kernel_h, kernel_w)
        sparsity: 프루닝할 비율 (0~1 사이 값)

    Returns:
        프루닝 마스크 텐서
    """
    sparsity = min(1.0, max(0.0, sparsity))
    if sparsity == 1.0:
        weight.zero_()
        return torch.zeros_like(weight)
    elif sparsity == 0.0:
        return torch.ones_like(weight)

    # 프루닝할 채널 수 계산
    num_channels = weight.shape[1]
    num_pruned_channels = round(num_channels * sparsity)

    # 각 채널의 중요도를 절댓값 합으로 계산
    # (출력 채널, 커널 높이, 커널 너비에 대해 합산)
    importance = weight.abs().sum(dim=(0, 2, 3), keepdim=True)

    # pruning threshold를 계산
    threshold = torch.kthvalue(importance.flatten(), num_pruned_channels)[0]

    # threshold보다 큰 채널은 유지(1), 작은 채널은 제거(0)
    mask = importance > threshold

    # 마스크를 가중치와 동일한 크기로 확장
    mask = mask.expand_as(weight)

    # 마스크를 적용하여 프루닝 수행
    weight.mul_(mask)

    return mask

mask_channel_level = prune_weight_channel_level(weight.clone(), prune_sparsity)
draw_weight_distribution(mask_channel_level, title="Channel-level Pruning Mask")

In [None]:
class FineGrainedPrunerV2:
    def __init__(self, model, sparsity, global_prune=False):
        """
        전역 또는 레이어별 프루닝을 위한 프루너 클래스

        Args:
            model: 프루닝할 모델
            sparsity: 프루닝 비율 (0~1)
            global_prune: 전역 프루닝 여부
        """
        self.masks = FineGrainedPrunerV2.prune(model, sparsity, global_prune)

    @torch.no_grad()
    def apply(self, model):
        """프루닝 마스크를 모델에 적용"""
        for name, param in model.named_parameters():
            if name in self.masks:
                param *= self.masks[name]

    @staticmethod
    @torch.no_grad()
    def prune(model, sparsity, global_prune):
        """
        전역 또는 레이어별 프루닝 수행

        Args:
            model: 프루닝할 모델
            sparsity: 프루닝 비율 (0~1)
            global_prune: 전역 프루닝 여부

        Returns:
            masks: 프루닝 마스크 딕셔너리
        """
        masks = dict()
        if global_prune:
            # 모든 2D 이상의 파라미터를 1차원으로 변환하여 수집
            parameters_to_prune = []
            for name, param in model.named_parameters():
                if param.dim() > 1:  # conv, fc 레이어만 프루닝
                    parameters_to_prune.append(param.view(-1))

            ##################### YOUR CODE STARTS HERE #####################
            # 모든 weight를 하나의 텐서로 결합해주세요..model.recover_model()
            # hint: torch.cat()을 사용하세요.
            all_weights = torch.cat(parameters_to_prune)

            # all_weights를 대상으로 global threshold를 구해주세요.
            num_elements = all_weights.numel()
            num_zeros = round(num_elements * sparsity)
            importance = torch.abs(all_weights)
            threshold = torch.kthvalue(importance, num_zeros)[0]
            ##################### YOUR CODE ENDS HERE #######################

            # threshold 기반 마스크 생성
            for name, param in model.named_parameters():
                if param.dim() > 1:
                    mask = torch.abs(param.data) > threshold
                    masks[name] = mask
        else:
            # 레이어별 프루닝 수행
            for name, param in model.named_parameters():
                if param.dim() > 1: # we only prune conv and fc weights
                    masks[name] = prune_weight_fine_grained(param, sparsity)
        return masks

In [None]:
## LLM ##

In [None]:
@torch.no_grad()
def prune_magnitude_opt(model, sparsity):
    for n, m in model.named_modules():
        if isinstance(m, nn.Linear) and "lm_head" not in n:
            W = m.weight.data
            ##################### YOUR CODE STARTS HERE #####################
            num_elements = W.numel()
            num_zeros = round(num_elements * sparsity)
            importance = torch.abs(W)
            threshold = torch.kthvalue(importance.flatten(), num_zeros)[0]
            mask = importance > threshold
            ##################### YOUR CODE ENDS HERE #######################
            W.mul_(mask)

In [None]:
@torch.no_grad()
def prune_wanda_opt(model, sparsity, input_feat):
    for n, m in model.named_modules():
        if isinstance(m, nn.Linear) and "lm_head" not in n:
            W = m.weight.data
            ##################### YOUR CODE STARTS HERE #####################
            row, col = W.shape
            num_zeros_per_row = round(col * sparsity)
            importance = torch.abs(W) * input_feat[n]
            threshold = torch.kthvalue(importance, num_zeros_per_row, dim=1)[0]
            mask = importance > threshold.reshape(row, 1)
            ##################### YOUR CODE ENDS HERE #######################
            W.mul_(mask)