In [3]:
import torch.nn as nn
import torch.nn.functional as F
import torch

In [None]:
class StudentNet(nn.Module):
    '''
    在这个Net里面 我们会使用 Depthwise & Pointwise Convolution Layer 来叠 model
    你会发现，将原本的Convolution Layer 换成 Dw & Pw 后， Acurracy 通常不会降低很多
    
    另外，取名为 StudentNet 是因为这个 Model 后续要做 Knowledge Distillation
    '''
    
    def __init__(self,base=16,width_mult=1):
        '''
        Args:
            base: 这个model一开始的ch数量 每过一层都会*2 直到base*16为止
            width_mult: 为了之后的 Network Pruning使用，在base*8 chs的Layer上会 * width_mult代表剪枝后的ch数量
        '''
        super(StudentNet,self).__init__()
        multiplier = [1,2,4,8,16,16,16,16]
        
        # bandwidth: 每一个layer所使用的channel数量
        bandwidth = [base * m for m in multiplier]
        
        # 我们只是Pruning第三层以后的layer  ??? why not pruning layer 8
        for i in range(3,7):
            bandwidth[i] = int(bandwidth*width_mult)
            
        self.cnn = nn.Sequential(
            # 第一层我们通常不做拆解Convolution Layer
            nn.Sequential(
                nn.Conv2d(3,bandwidth[0],3,1,1),
                nn.BatchNorm2d(bandwidth[0]),
                nn.ReLU6(),
                nn.MaxPool2d(2,2,0)
            ),
            
            # 接下来开始pruning
            nn.Sequential(
                # DW
                nn.Conv2d(bandwidth[0],bandwidth[0],3,1,1,groups=bandwidth[0]),
                # Batch Normalization
                nn.BatchNorm2d(bandwidth[0]),
                # RELU6 是限制neural最小只能到0，最大只能到6。MobileNet都是用的RELU6
                # 使用RELU6是因为如果数字过大时，不方便压缩到float16，也不方便之后的parameters quantization，所以用R
                nn.ReLU6(),
                # PW
                nn.Conv2d(bandwidth[0],bandwidth[1],1)
                # 过完PW后不需要再过RELU，经验上PW+RELU效果都会变差
                # 每过完一个block就进行down sampling
                nn.MaxPool2d(2,2,0)，                
            ),
            
            nn.Sequential(
                nn.Conv2d(bandwidth[1],bandwidth[1],3,1,1,groups=bandwidth[0]),
                nn.BatchNorm2d(bandwidth[1]),
                nn.ReLU6(),
                nn.Conv2d(bandwidth[1],bandwidth[2],1)
                nn.MaxPool2d(2,2,0)，                
            ),

            nn.Sequential(
                nn.Conv2d(bandwidth[2],bandwidth[2],3,1,1,groups=bandwidth[0]),
                nn.BatchNorm2d(bandwidth[2]),
                nn.ReLU6(),
                nn.Conv2d(bandwidth[2],bandwidth[3],1)
                nn.MaxPool2d(2,2,0)，                
            ),
            
            nn.Sequential(
                nn.Conv2d(bandwidth[3],bandwidth[3],3,1,1,groups=bandwidth[0]),
                nn.BatchNorm2d(bandwidth[3]),
                nn.ReLU6(),
                nn.Conv2d(bandwidth[3],bandwidth[4],1)
                nn.MaxPool2d(2,2,0)，                
            ),
            
            nn.Sequential(
                nn.Conv2d(bandwidth[4],bandwidth[4],3,1,1,groups=bandwidth[0]),
                nn.BatchNorm2d(bandwidth[4]),
                nn.ReLU6(),
                nn.Conv2d(bandwidth[4],bandwidth[5],1)
                nn.MaxPool2d(2,2,0)，                
            ),            
            
            nn.Sequential(
                nn.Conv2d(bandwidth[5],bandwidth[5],3,1,1,groups=bandwidth[0]),
                nn.BatchNorm2d(bandwidth[5]),
                nn.ReLU6(),
                nn.Conv2d(bandwidth[5],bandwidth[6],1)
                nn.MaxPool2d(2,2,0)，                
            ),            

            nn.Sequential(
                nn.Conv2d(bandwidth[6],bandwidth[6],3,1,1,groups=bandwidth[0]),
                nn.BatchNorm2d(bandwidth[6]),
                nn.ReLU6(),
                nn.Conv2d(bandwidth[6],bandwidth[7],1)
                nn.MaxPool2d(2,2,0)，                
            ),            

            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
            
        )
        