In [None]:
import torch
import torch.nn as nn
import torchvision
from torchvision import models, transforms
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

In [None]:
def get_image(path, img_transform, size = (300,300)):
    image = Image.open(path)
    image = image.resize(size, Image.LANCZOS)
    image = img_transform(image).unsqueeze(0)
    return image.to(device)

def get_gram(m):
    '''
    m is of shape(1,C,H,W)
    '''
    _, c, h, w = m.size()
    m = m.view(c, h * w)
    m = torch.mm(m, m.t())
    return m

def denormalize_img(inp):
    inp = inp.numpy().transpose((1, 2, 0)) # C,H,W --> (H,W,C)
    mean = np.array([0.485, 0.456, 0.406])
    std = np.array([0.229, 0.224, 0.225])
    inp = std * inp + mean
    inp = np.clip(inp, 0, 1)
    return inp

### Comprehensive Code Explanation

#### Function: `get_image`

```python
def get_image(path, img_transform, size=(300, 300)):
    image = Image.open(path)
    image = image.resize(size, Image.LANCZOS)
    image = img_transform(image).unsqueeze(0)
    return image.to(device)
```

1. **Line-by-line Breakdown:**
   - `def get_image(path, img_transform, size=(300, 300)):`: 定义一个名为 `get_image` 的函数，接受三个参数：`path`（图像路径），`img_transform`（图像变换函数），`size`（图像调整大小，默认为300x300）。
   - `image = Image.open(path)`: 使用PIL库打开指定路径的图像文件。
   - `image = image.resize(size, Image.LANCZOS)`: 将图像调整为指定大小，使用LANCZOS滤波器进行高质量的缩放。
   - `image = img_transform(image).unsqueeze(0)`: 对图像应用变换函数，并增加一个维度（通常用于批处理）。
   - `return image.to(device)`: 将图像移动到指定设备（如GPU）并返回。

2. **Purpose and Functionality:**
   - 该函数用于加载、调整大小并转换图像，以便在深度学习模型中使用。

3. **Technical Reasoning:**
   - 使用LANCZOS滤波器进行高质量缩放。
   - 增加维度以适应批处理需求。
   - 将图像移动到指定设备以加速计算。

#### Function: `get_gram`

```python
def get_gram(m):
    _, c, h, w = m.size()
    m = m.view(c, h * w)
    m = torch.mm(m, m.t())
    return m
```

1. **Line-by-line Breakdown:**
   - `def get_gram(m):`: 定义一个名为 `get_gram` 的函数，接受一个参数 `m`（特征图）。
   - `_, c, h, w = m.size()`: 获取特征图的尺寸（批次大小、通道数、高度、宽度）。
   - `m = m.view(c, h * w)`: 将特征图重塑为二维张量，形状为（通道数，高度*宽度）。
   - `m = torch.mm(m, m.t())`: 计算特征图的Gram矩阵。
   - `return m`: 返回Gram矩阵。

2. **Purpose and Functionality:**
   - 该函数用于计算特征图的Gram矩阵，常用于风格迁移任务中。

3. **Technical Reasoning:**
   - Gram矩阵用于捕捉特征图中的风格信息。

#### Function: `denormalize_img`

```python
def denormalize_img(inp):
    inp = inp.numpy().transpose((1, 2, 0))
    mean = np.array([0.485, 0.456, 0.406])
    std = np.array([0.229, 0.224, 0.225])
    inp = std * inp + mean
    inp = np.clip(inp, 0, 1)
    return inp
```

1. **Line-by-line Breakdown:**
   - `def denormalize_img(inp):`: 定义一个名为 `denormalize_img` 的函数，接受一个参数 `inp`（归一化图像）。
   - `inp = inp.numpy().transpose((1, 2, 0))`: 将张量转换为NumPy数组并调整维度顺序。
   - `mean = np.array([0.485, 0.456, 0.406])`: 定义均值数组。
   - `std = np.array([0.229, 0.224, 0.225])`: 定义标准差数组。
   - `inp = std * inp + mean`: 反归一化图像。
   - `inp = np.clip(inp, 0, 1)`: 将图像像素值限制在0到1之间。
   - `return inp`: 返回反归一化后的图像。

2. **Purpose and Functionality:**
   - 该函数用于将归一化图像转换回原始图像，以便进行可视化。

3. **Technical Reasoning:**
   - 反归一化步骤使得图像可以在标准显示设备上正确显示。

### Multilevel Function and Parameter Analysis

#### Function: `get_image`

**A. Detailed Parameter Explanation:**
- `path`: 图像文件路径，字符串类型，必须是有效的文件路径。
- `img_transform`: 图像变换函数，通常是由`torchvision.transforms`定义的变换序列。
- `size`: 图像调整大小，元组类型，包含两个整数，表示宽度和高度。

**B. Function Context Analysis:**
- 选择该函数是为了简化图像预处理步骤。
- 可替代实现：直接在数据加载器中进行图像变换。
- 性能和设计考虑：使用LANCZOS滤波器进行高质量缩放。

#### Function: `get_gram`

**A. Detailed Parameter Explanation:**
- `m`: 特征图，PyTorch张量，形状为（批次大小，通道数，高度，宽度）。

**B. Function Context Analysis:**
- 选择该函数是为了计算特征图的Gram矩阵，用于风格迁移。
- 可替代实现：使用其他矩阵操作库。
- 性能和设计考虑：使用矩阵乘法计算Gram矩阵。

#### Function: `denormalize_img`

**A. Detailed Parameter Explanation:**
- `inp`: 归一化图像，PyTorch张量，形状为（通道数，高度，宽度）。

**B. Function Context Analysis:**
- 选择该函数是为了将归一化图像转换回原始图像。
- 可替代实现：在图像显示时进行反归一化。
- 性能和设计考虑：使用NumPy进行高效数组操作。

### Specialized Analysis Areas

#### Function Choice Insights

- `get_image`函数选择了LANCZOS滤波器进行高质量缩放，这是为了在图像预处理中保持图像质量。
- `get_gram`函数使用矩阵乘法计算Gram矩阵，这是为了高效捕捉特征图中的风格信息。
- `denormalize_img`函数使用NumPy进行反归一化，这是为了高效处理数组操作。

#### Activation Functions

- 本代码未涉及激活函数，但在深度学习模型中，激活函数的选择对模型性能有重要影响。

#### Data Processing Functions

- `get_image`和`denormalize_img`函数涉及图像处理，前者用于预处理，后者用于反归一化。

### Code Review Dimensions

- **Syntax Correctness:** 代码语法正确，无明显错误。
- **Performance Optimization Opportunities:** 可以考虑在数据加载器中进行图像变换以提高效率。
- **Coding Best Practices Adherence:** 代码结构清晰，函数命名合理。
- **Algorithmic Improvement Potential:** 可以进一步优化图像处理步骤以提高性能。

### Parameter-Specific Guidance

- **Common Configuration Mistakes:** 确保图像路径有效，变换函数正确定义。
- **Parameter Tuning Strategies:** 根据具体任务调整图像大小和变换函数。
- **Input Validation Recommendations:** 添加输入验证以确保图像路径和变换函数有效。

### Constructive Technical Feedback

- **Improvement Suggestions:**
  - 在`get_image`函数中添加输入验证。
  - 在`denormalize_img`函数中添加对输入类型的检查。
  
- **Rationale for Recommended Modifications:**
  - 输入验证可以提高代码的鲁棒性，防止无效输入导致错误。
  
- **Concrete Implementation Examples:**

```python
def get_image(path, img_transform, size=(300, 300)):
    if not os.path.exists(path):
        raise FileNotFoundError(f"Image path {path} does not exist.")
    image = Image.open(path)
    image = image.resize(size, Image.LANCZOS)
    image = img_transform(image).unsqueeze(0)
    return image.to(device)

def denormalize_img(inp):
    if not isinstance(inp, torch.Tensor):
        raise TypeError("Input must be a PyTorch tensor.")
    inp = inp.numpy().transpose((1, 2, 0))
    mean = np.array([0.485, 0.456, 0.406])
    std = np.array([0.229, 0.224, 0.225])
    inp = std * inp + mean
    inp = np.clip(inp, 0, 1)
    return inp
```

通过这些改进，可以提高代码的鲁棒性和可维护性。

![figure](https://user-images.githubusercontent.com/30661597/107026142-96fa0100-67aa-11eb-9f71-4adce01dd362.png)

In [None]:
class FeatureExtractor(nn.Module):
    def __init__(self):
        super(FeatureExtractor, self).__init__()
        self.selected_layers = [3, 8, 15, 22]
        self.vgg = models.vgg16(pretrained=True).features

    def forward(self, x):
        layer_features = []
        for layer_number, layer in self.vgg._modules.items():
            x = layer(x)
            if int(layer_number) in self.selected_layers:
                layer_features.append(x)
        return layer_features

In [None]:
img_transform = transforms.Compose([transforms.ToTensor(),
                                    transforms.Normalize(mean=(0.485, 0.456, 0.406), std=(0.229, 0.224, 0.225))])

content_img = get_image('content.jpg', img_transform)
style_img = get_image('style.jpg', img_transform)
generated_img = content_img.clone()    # or nn.Parameter(torch.FloatTensor(content_img.size()))
generated_img.requires_grad = True

optimizer = torch.optim.Adam([generated_img], lr=0.003, betas=[0.5, 0.999])
encoder = FeatureExtractor().to(device)

for p in encoder.parameters():
    p.requires_grad = False

In [None]:
content_weight = 1
style_weight = 100

for epoch in range(500):

    content_features = encoder(content_img)
    style_features = encoder(style_img)
    generated_features = encoder(generated_img)

    content_loss = torch.mean((content_features[-1] - generated_features[-1])**2)

    style_loss = 0
    for gf, sf in zip(generated_features, style_features):
        _, c, h, w = gf.size()
        gram_gf = get_gram(gf)
        gram_sf = get_gram(sf)
        style_loss += torch.mean((gram_gf - gram_sf)**2)  / (c * h * w)

    loss = content_weight * content_loss + style_weight * style_loss
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if epoch % 10 == 0:
        print ('Epoch [{}]\tContent Loss: {:.4f}\tStyle Loss: {:.4f}'.format(epoch, content_loss.item(), style_loss.item()))

In [None]:
inp = generated_img.detach().cpu().squeeze()
inp = denormalize_img(inp)
plt.imshow(inp)