Refactoring

kazuto1011 · Jan 21, 2020 · e8c6abe · e8c6abe
1 parent 6c34b77
commit e8c6abe
Show file tree

Hide file tree

Showing 3 changed files with 79 additions and 210 deletions.
diff --git a/README.md b/README.md
@@ -1,22 +1,30 @@
 # Grad-CAM with PyTorch
 
-PyTorch implementation of Grad-CAM (Gradient-weighted Class Activation Mapping) [[1](##references)]. Grad-CAM localizes and highlights discriminative regions that a convolutional neural network-based model activates to predict visual concepts. This repository only supports image classification models.
+PyTorch implementation of Grad-CAM (Gradient-weighted Class Activation Mapping) [[1](##references)] in image classification. This repository also contains implementations of vanilla backpropagation, guided backpropagation [[2](##references)], deconvnet [[2](##references)], and guided Grad-CAM [[1](##references)], occlusion sensitivity maps [[3](##references)].
 
-## Dependencies
-* Python 2.7+/3.6+
-* PyTorch 0.4.1+
-* torchvision 0.2.2+
-* click
-* opencv
-* tqdm
+## Requirements
+
+Python 2.7 / 3.+
+
+```bash
+$ pip install click opencv-python matplotlib
+$ pip install "torch>=0.4.1" torchvision
+```
 
 ## Basic usage
 
 ```sh
-python main.py demo1 [OPTIONS]
+python main.py [DEMO_ID] [OPTIONS]
 ```
 
+Demo ID:
+
+* [`demo1`](#demo-1)
+* [`demo2`](#demo-2)
+* [`demo3`](#demo-3)
+
 Options:
+
 * ```-i```, ```--image-paths```: image path, which can be provided multiple times (required)
 * ```-a```, ```--arch```: a model name from ```torchvision.models```, e.g. "resnet152" (required)
 * ```-t```, ```--target-layer```: a module name to be visualized, e.g. "layer4.2" (required)
@@ -35,86 +43,58 @@ The command above generates, for top *k* classes:
 The guided-* do not support `F.relu` but only `nn.ReLU` in this codes.
 For instance, off-the-shelf `inception_v3` cannot cut off negative gradients during backward operation (issue #2).
 
-`demo2`, `demo3`, and `demo4` are hard-coded examples.
-
-## Examples
+## Demo 1
 
 ![](samples/cat_dog.png)
 
-### Demo 1
-
 Generate all kinds of visualization maps given a torchvision model, a target layer, and images.
 
 ```bash
-python main.py demo1 -a resnet152 \
-                     -t layer4 \
-                     -i samples/cat_dog.png
+python main.py demo1 -a resnet152 -t layer4 \
+                     -i samples/cat_dog.png -i samples/vegetables.jpg # You can add more images
 ```
 
-You can specify multiple images like:
-
-```bash
-python main.py demo1 -a resnet152 \
-                     -t layer4 \
-                     -i samples/cat_dog.png \
-                     -i samples/vegetables.jpg
-```
-
-|              Predicted class               |                         #1 boxer                         |                         #2 bull mastiff                         |                         #3 tiger cat                         |
-| :----------------------------------------: | :------------------------------------------------------: | :-------------------------------------------------------------: | :----------------------------------------------------------: |
-|        Grad-CAM [[1](##references)]        |    ![](results/0-resnet152-gradcam-layer4-boxer.png)     |    ![](results/0-resnet152-gradcam-layer4-bull_mastiff.png)     |    ![](results/0-resnet152-gradcam-layer4-tiger_cat.png)     |
-|          Vanilla backpropagation           |        ![](results/0-resnet152-vanilla-boxer.png)        |        ![](results/0-resnet152-vanilla-bull_mastiff.png)        |        ![](results/0-resnet152-vanilla-tiger_cat.png)        |
-|      "Deconvnet" [[2](##references)]       |       ![](results/0-resnet152-deconvnet-boxer.png)       |       ![](results/0-resnet152-deconvnet-bull_mastiff.png)       |       ![](results/0-resnet152-deconvnet-tiger_cat.png)       |
-| Guided backpropagation [[2](##references)] |        ![](results/0-resnet152-guided-boxer.png)         |        ![](results/0-resnet152-guided-bull_mastiff.png)         |        ![](results/0-resnet152-guided-tiger_cat.png)         |
-|    Guided Grad-CAM [[1](##references)]     | ![](results/0-resnet152-guided_gradcam-layer4-boxer.png) | ![](results/0-resnet152-guided_gradcam-layer4-bull_mastiff.png) | ![](results/0-resnet152-guided_gradcam-layer4-tiger_cat.png) |
+|              Predicted class               |                       #1 boxer                        |                       #2 bull mastiff                        |                       #3 tiger cat                        |
+| :----------------------------------------: | :---------------------------------------------------: | :----------------------------------------------------------: | :-------------------------------------------------------: |
+|        Grad-CAM [[1](##references)]        |    ![](docs/0-resnet152-gradcam-layer4-boxer.png)     |    ![](docs/0-resnet152-gradcam-layer4-bull_mastiff.png)     |    ![](docs/0-resnet152-gradcam-layer4-tiger_cat.png)     |
+|          Vanilla backpropagation           |        ![](docs/0-resnet152-vanilla-boxer.png)        |        ![](docs/0-resnet152-vanilla-bull_mastiff.png)        |        ![](docs/0-resnet152-vanilla-tiger_cat.png)        |
+|      "Deconvnet" [[2](##references)]       |       ![](docs/0-resnet152-deconvnet-boxer.png)       |       ![](docs/0-resnet152-deconvnet-bull_mastiff.png)       |       ![](docs/0-resnet152-deconvnet-tiger_cat.png)       |
+| Guided backpropagation [[2](##references)] |        ![](docs/0-resnet152-guided-boxer.png)         |        ![](docs/0-resnet152-guided-bull_mastiff.png)         |        ![](docs/0-resnet152-guided-tiger_cat.png)         |
+|    Guided Grad-CAM [[1](##references)]     | ![](docs/0-resnet152-guided_gradcam-layer4-boxer.png) | ![](docs/0-resnet152-guided_gradcam-layer4-bull_mastiff.png) | ![](docs/0-resnet152-guided_gradcam-layer4-tiger_cat.png) |
 
 Grad-CAM with different models for "bull mastiff" class
 
-|            Model             |                     ```resnet152```                      |                      ```vgg19```                       |                      ```vgg19_bn```                       |                      ```densenet201```                       |                      ```squeezenet1_1```                       |
-| :--------------------------: | :------------------------------------------------------: | :----------------------------------------------------: | :-------------------------------------------------------: | :----------------------------------------------------------: | :------------------------------------------------------------: |
-|            Layer             |                       ```layer4```                       |                     ```features```                     |                      ```features```                       |                        ```features```                        |                         ```features```                         |
-| Grad-CAM [[1](##references)] | ![](results/0-resnet152-gradcam-layer4-bull_mastiff.png) | ![](results/0-vgg19-gradcam-features-bull_mastiff.png) | ![](results/0-vgg19_bn-gradcam-features-bull_mastiff.png) | ![](results/0-densenet201-gradcam-features-bull_mastiff.png) | ![](results/0-squeezenet1_1-gradcam-features-bull_mastiff.png) |
+|            Model             |                    ```resnet152```                    |                     ```vgg19```                     |                     ```vgg19_bn```                     |                     ```densenet201```                     |                     ```squeezenet1_1```                     |
+| :--------------------------: | :---------------------------------------------------: | :-------------------------------------------------: | :----------------------------------------------------: | :-------------------------------------------------------: | :---------------------------------------------------------: |
+|            Layer             |                     ```layer4```                      |                   ```features```                    |                     ```features```                     |                      ```features```                       |                       ```features```                        |
+| Grad-CAM [[1](##references)] | ![](docs/0-resnet152-gradcam-layer4-bull_mastiff.png) | ![](docs/0-vgg19-gradcam-features-bull_mastiff.png) | ![](docs/0-vgg19_bn-gradcam-features-bull_mastiff.png) | ![](docs/0-densenet201-gradcam-features-bull_mastiff.png) | ![](docs/0-squeezenet1_1-gradcam-features-bull_mastiff.png) |
 
-### Demo 2
+## Demo 2
 
-Generate Grad-CAM at different layers of ResNet-152 for "bull mastiff" class.
+Generate Grad-CAM maps for "bull mastiff" class, at different layers of ResNet-152 (hardcoded).
 
 ```bash
 python main.py demo2 -i samples/cat_dog.png
 ```
 
-|            Layer             |                       ```relu```                       |                       ```layer1```                       |                       ```layer2```                       |                       ```layer3```                       |                       ```layer4```                       |
-| :--------------------------: | :----------------------------------------------------: | :------------------------------------------------------: | :------------------------------------------------------: | :------------------------------------------------------: | :------------------------------------------------------: |
-| Grad-CAM [[1](##references)] | ![](results/0-resnet152-gradcam-relu-bull_mastiff.png) | ![](results/0-resnet152-gradcam-layer1-bull_mastiff.png) | ![](results/0-resnet152-gradcam-layer2-bull_mastiff.png) | ![](results/0-resnet152-gradcam-layer3-bull_mastiff.png) | ![](results/0-resnet152-gradcam-layer4-bull_mastiff.png) |
-
-### Demo 3
-
-Generate Grad-CAM with the original models.
-Here we use Xception v1 from my other repo and visualize the response at the last convolution layer (see `demo3()` for more details).
-If you want to adapt your own model, please verify the model uses only `nn.ReLU`, not `F.relu`.
-
-```bash
-python main.py demo3 -i samples/cat_dog.png
-```
-
-|       Predicted class        |                           #1 bull mastiff                           |                           #2 tiger cat                           |                           #3 boxer                           |
-| :--------------------------: | :-----------------------------------------------------------------: | :--------------------------------------------------------------: | :----------------------------------------------------------: |
-| Grad-CAM [[1](##references)] | ![](results/0-xception_v1-gradcam-exit_flow.conv4-bull_mastiff.png) | ![](results/0-xception_v1-gradcam-exit_flow.conv4-tiger_cat.png) | ![](results/0-xception_v1-gradcam-exit_flow.conv4-boxer.png) |
+|            Layer             |                     ```relu```                      |                     ```layer1```                      |                     ```layer2```                      |                     ```layer3```                      |                     ```layer4```                      |
+| :--------------------------: | :-------------------------------------------------: | :---------------------------------------------------: | :---------------------------------------------------: | :---------------------------------------------------: | :---------------------------------------------------: |
+| Grad-CAM [[1](##references)] | ![](docs/0-resnet152-gradcam-relu-bull_mastiff.png) | ![](docs/0-resnet152-gradcam-layer1-bull_mastiff.png) | ![](docs/0-resnet152-gradcam-layer2-bull_mastiff.png) | ![](docs/0-resnet152-gradcam-layer3-bull_mastiff.png) | ![](docs/0-resnet152-gradcam-layer4-bull_mastiff.png) |
 
-### Demo 4
+## Demo 3
 
-Generate the occlusion sensitivity map [[1](##references), [3](##references)] based on logit scores. 
+Generate the occlusion sensitivity map [[1](##references), [3](##references)] based on logit scores.
 The red and blue regions indicate a relative increase and decrease from non-occluded scores respectively: the blue regions are critical!
 
 ```bash
-python main.py demo4 -a resnet152 -i samples/cat_dog.png
+python main.py demo3 -a resnet152 -i samples/cat_dog.png
 ```
 
-|           Patch size           |                          10x10                           |                          15x15                           |                          25x25                           |                          35x35                           |                          45x45                           |                          90x90                           |
-| :----------------------------: | :------------------------------------------------------: | :------------------------------------------------------: | :------------------------------------------------------: | :------------------------------------------------------: | :------------------------------------------------------: | :------------------------------------------------------: |
-|    **"boxer"** sensitivity     |    ![](results/0-resnet152-sensitivity-10-boxer.png)     |    ![](results/0-resnet152-sensitivity-15-boxer.png)     |    ![](results/0-resnet152-sensitivity-25-boxer.png)     |    ![](results/0-resnet152-sensitivity-35-boxer.png)     |    ![](results/0-resnet152-sensitivity-45-boxer.png)     |    ![](results/0-resnet152-sensitivity-90-boxer.png)     |
-| **"bull mastiff"** sensitivity | ![](results/0-resnet152-sensitivity-10-bull_mastiff.png) | ![](results/0-resnet152-sensitivity-15-bull_mastiff.png) | ![](results/0-resnet152-sensitivity-25-bull_mastiff.png) | ![](results/0-resnet152-sensitivity-35-bull_mastiff.png) | ![](results/0-resnet152-sensitivity-45-bull_mastiff.png) | ![](results/0-resnet152-sensitivity-90-bull_mastiff.png) |
-|  **"tiger cat"** sensitivity   |  ![](results/0-resnet152-sensitivity-10-tiger_cat.png)   |  ![](results/0-resnet152-sensitivity-15-tiger_cat.png)   |  ![](results/0-resnet152-sensitivity-25-tiger_cat.png)   |  ![](results/0-resnet152-sensitivity-35-tiger_cat.png)   |  ![](results/0-resnet152-sensitivity-45-tiger_cat.png)   |  ![](results/0-resnet152-sensitivity-90-tiger_cat.png)   |
+|           Patch size           |                         10x10                         |                         15x15                         |                         25x25                         |                         35x35                         |                         45x45                         |                         90x90                         |
+| :----------------------------: | :---------------------------------------------------: | :---------------------------------------------------: | :---------------------------------------------------: | :---------------------------------------------------: | :---------------------------------------------------: | :---------------------------------------------------: |
+|    **"boxer"** sensitivity     |    ![](docs/0-resnet152-sensitivity-10-boxer.png)     |    ![](docs/0-resnet152-sensitivity-15-boxer.png)     |    ![](docs/0-resnet152-sensitivity-25-boxer.png)     |    ![](docs/0-resnet152-sensitivity-35-boxer.png)     |    ![](docs/0-resnet152-sensitivity-45-boxer.png)     |    ![](docs/0-resnet152-sensitivity-90-boxer.png)     |
+| **"bull mastiff"** sensitivity | ![](docs/0-resnet152-sensitivity-10-bull_mastiff.png) | ![](docs/0-resnet152-sensitivity-15-bull_mastiff.png) | ![](docs/0-resnet152-sensitivity-25-bull_mastiff.png) | ![](docs/0-resnet152-sensitivity-35-bull_mastiff.png) | ![](docs/0-resnet152-sensitivity-45-bull_mastiff.png) | ![](docs/0-resnet152-sensitivity-90-bull_mastiff.png) |
+|  **"tiger cat"** sensitivity   |  ![](docs/0-resnet152-sensitivity-10-tiger_cat.png)   |  ![](docs/0-resnet152-sensitivity-15-tiger_cat.png)   |  ![](docs/0-resnet152-sensitivity-25-tiger_cat.png)   |  ![](docs/0-resnet152-sensitivity-35-tiger_cat.png)   |  ![](docs/0-resnet152-sensitivity-45-tiger_cat.png)   |  ![](docs/0-resnet152-sensitivity-90-tiger_cat.png)   |
 
 This demo takes much time to compute per-pixel logits.
 You can control the resolution by changing sampling stride (`--stride`), or increasing batch size as to fit on your GPUs (`--n-batches`). The model is wrapped with `torch.nn.DataParallel` so that runs on multiple GPUs by default.