jacobgil · jacobgil · May 28, 2024 · Nov 15, 2023 · Dec 28, 2023 · Dec 28, 2023
diff --git a/pytorch_grad_cam/base_cam.py b/pytorch_grad_cam/base_cam.py
@@ -1,11 +1,13 @@
+from typing import Callable, List, Tuple
+
 import numpy as np
 import torch
 import ttach as tta
-from typing import Callable, List, Tuple
+
 from pytorch_grad_cam.activations_and_gradients import ActivationsAndGradients
-from pytorch_grad_cam.utils.svd_on_activations import get_2d_projection
 from pytorch_grad_cam.utils.image import scale_cam_image
 from pytorch_grad_cam.utils.model_targets import ClassifierOutputTarget
+from pytorch_grad_cam.utils.svd_on_activations import get_2d_projection
 
 
 class BaseCAM:
@@ -47,12 +49,14 @@ def get_cam_image(self,
                       grads: torch.Tensor,
                       eigen_smooth: bool = False) -> np.ndarray:
 
+
         weights = self.get_cam_weights(input_tensor,
                                        target_layer,
                                        targets,
                                        activations,
                                        grads)
-        weighted_activations = weights[:, :, None, None] * activations
+        w_shape = (slice(None), slice(None)) + (None,) * (len(activations.shape)-2)
+        weighted_activations = weights[w_shape] * activations
         if eigen_smooth:
             cam = get_2d_projection(weighted_activations)
         else:
@@ -99,8 +103,14 @@ def forward(self,
 
     def get_target_width_height(self,
                                 input_tensor: torch.Tensor) -> Tuple[int, int]:
-        width, height = input_tensor.size(-1), input_tensor.size(-2)
-        return width, height
+        if len(input_tensor.shape) == 4:
+            width, height = input_tensor.size(-1), input_tensor.size(-2)
+            return width, height
+        elif len(input_tensor.shape) == 5:
+            depth, width, height = input_tensor.size(-1), input_tensor.size(-2), input_tensor.size(-3)
+            return depth, width, height
+        else:
+            raise ValueError("Invalid input_tensor shape. Only 2D or 3D images are supported.")
 
     def compute_cam_per_layer(
             self,

diff --git a/pytorch_grad_cam/grad_cam.py b/pytorch_grad_cam/grad_cam.py
@@ -1,4 +1,5 @@
 import numpy as np
+
 from pytorch_grad_cam.base_cam import BaseCAM
 
 
@@ -19,4 +20,14 @@ def get_cam_weights(self,
                         target_category,
                         activations,
                         grads):
-        return np.mean(grads, axis=(2, 3))
+        # 2D image
+        if len(grads.shape) == 4:
+            return np.mean(grads, axis=(2, 3))
+
+        # 3D image
+        elif len(grads.shape) == 5:
+            return np.mean(grads, axis=(2, 3, 4))
+
+        else:
+            raise ValueError("Invalid grads shape." 
+                             "Shape of grads should be 4 (2D image) or 5 (3D image).")
diff --git a/pytorch_grad_cam/utils/image.py b/pytorch_grad_cam/utils/image.py
@@ -1,12 +1,14 @@
-import matplotlib
-from matplotlib import pyplot as plt
-from matplotlib.lines import Line2D
+import math
+from typing import Dict, List
+
 import cv2
+import matplotlib
 import numpy as np
 import torch
+from matplotlib import pyplot as plt
+from matplotlib.lines import Line2D
+from scipy.ndimage import zoom
 from torchvision.transforms import Compose, Normalize, ToTensor
-from typing import List, Dict
-import math
 
 
 def preprocess_image(
@@ -163,7 +165,7 @@ def scale_cam_image(cam, target_size=None):
         img = img - np.min(img)
         img = img / (1e-7 + np.max(img))
         if target_size is not None:
-            img = cv2.resize(img, target_size)
+            img = zoom(img, [(t_s/i_s) for i_s, t_s in zip(img.shape, target_size[::-1])])
         result.append(img)
     result = np.float32(result)