In [14]:
import torch   
import torch.nn as nn
import copy
from torch.functional import F

### AbstractTorch
Ceci est un prototype de moteur d'évaluation s'appuyant sur Torch. L'idée est de surcharger nn.Linear avec des méthodes hybrides, gérant un flux abstrait pour l'évaluation et un flux concret. La simultanéité des deux flux permet d'oberver la position du centre du zonotope par rapport à la valeur réelle de la sortie de la fonction. 
Ce moteur est moins précis que Saimple car il ne génère pas de nouveaux symboles mais additionne les approximations dans un symbole poubelle. 

L'implémentation du modèle abstrait comporte une quantité fixe de symboles qui sont gérés comme des épaisseurs de batch. La dernière épaisseur de batch correspond au symbole poubelle, les opération linéaires sont opérées pour cette épaisseur par la valeur absolu de la matrice des poids. 

Pour l'instant sont implémentées les classes conv2D, Linear , et ReLU. 
        #TODO implémenter maxpool2D, ... 
    

L'idée est de tirer profit de la classe nn.Module de Torch en la surchargeant avec des méthodes mixes (flux concret et abstrait). On tire profit de la structure de base
de la méthode forward. Au lieu de considérer un batch, on considère une entrée en dimension 0 avec dans les dimensions habituelles du batch des couches de symbole. Une couche (un épaisseur de batch) représente
un symbole abstrait. La dernière couche correspond au symbole poubelle. 


La couche 0 représente le centre du zonotope
Les couches suivantes représentent les symboles. Elles sont calculées pour les opération linéaires (Linear et Conv2D) par 
$$\textbf{W}(x_\epsilon)+\textbf{b}-(\textbf{W}(0)+\textbf{b})$$
    x[1:]=lin(x_epsilon)-lin(torch.zeros_like(x_epsilon))

La derniere couche (bruit poubelle) est calculée par

$$\textbf{|W|}(x_\epsilon)+\textbf{b}-(\textbf{|W|}(0)+\textbf{b})$$


Pour implémenter le tenseur linéaire représentant la valeur absolue, on duplique la couche lin ou conv et on applique la valeur absolue à la matrice de poids. 



La méthode abstractTensor permet, à partir d'un tenseur d'origine, de générer un tenseur abstrait. 

Cette méthode doit être largement enrichie en classe, avec différentes méthodes telles que 
    add_noise
    mul_noise
    ...


In [2]:
def abstractTensor(tensor: torch.Tensor, alpha : list[float]):
    assert len(alpha)==len(tensor.flatten()), "The length of alpha should be equal to the length of the flatten tensor"
    print(tensor.shape)
    
    flatten_tensor  = tensor.flatten()
    abstract_tensor=[]
    abstract_tensor.append(tensor)
    for i in range(1,len(flatten_tensor)+1):
        abstract_tensor_layer = torch.zeros_like(flatten_tensor)
        abstract_tensor_layer[i-1]=alpha[i-1]
        abstract_tensor_layer = abstract_tensor_layer.reshape(tensor.shape)
        abstract_tensor.append(abstract_tensor_layer)
    
    abstract_tensor.append(torch.zeros_like(tensor))
    abstract_tensor= torch.stack(abstract_tensor)

    
    return abstract_tensor

In [15]:
class AbstractNN(nn.Module):

    def __init__(self,num_symbols: int,num_depth=1,device=torch.device("cpu")):

        super(AbstractNN,self).__init__()
        num_symbols = num_symbols +2
        self.num_symbols = num_symbols
        self.num_depth = num_depth
        self.device = device



    @staticmethod    
    def abstract_linear(in_features:int,out_features:int,x,x_true,device=torch.device("cpu")):
        x =x.unsqueeze(1).to(device)
        x_true=x_true.to(device)
        lin = nn.Sequential(nn.Flatten(),
                            nn.Linear(in_features=in_features, out_features=out_features,device=device))
        lin_abs = copy.deepcopy(lin).to(device)
        lin_abs[1].weight.data =torch.abs(lin[1].weight.data)
     
        
        x_value = x[0].unsqueeze(1)
        x_epsilon= x[1:-1].unsqueeze(1)
        x_noise =x[-1].unsqueeze(1)
       
        x=lin(x)    
        x_true = lin(x_true)
        x[0]=lin(x_value)
        x[1:-1]=lin(x_epsilon)-lin(torch.zeros_like(x_epsilon))
        x[-1]=lin_abs(x_noise)-lin_abs(torch.zeros_like(x_noise))
        x_min = x[0] - torch.sum(torch.abs(x[1:]),dim=0)
        x_max = x[0] + torch.sum(torch.abs(x[1:]),dim=0)
        print(x_min.type())
        return x,x_min,x_max,x_true
    
    @staticmethod
    def abstract_conv2D(in_channels:int,out_channels:int,kernel_size:int,x,x_true,device=torch.device("cpu")):
        x=x.to(device)
        x_true = x_true.to(device)
        conv = nn.Conv2d(in_channels=in_channels,out_channels=out_channels,kernel_size=kernel_size,device=device)
      
        conv_abs = copy.deepcopy(conv).to(device)
        conv_abs.weight.data = torch.abs(conv.weight.data)
     
       
        x_value = x[0]
        x_epsilon= x[1:-1]
        x_noise = x[-1]
        x=conv(x)
        x[0]=conv(x_value)
        x_true = conv(x_true)
        x[1:-1]=conv(x_epsilon)-conv(torch.zeros_like(x_epsilon).to(device))
        x[-1]=conv_abs(x_noise)-conv_abs(torch.zeros_like(x_noise).to(device))
        x_min = x[0] - torch.sum(torch.abs(x[1:]),dim=0)
        x_max = x[0] + torch.sum(torch.abs(x[1:]),dim=0)
        
        return x,x_min,x_max,x_true
    
    @staticmethod
    def abstract_relu_conv2D(x,x_min,x_max,x_true,num_symbols:int):
        sgn_min = torch.sign(x_min)
        sgn_max = torch.sign(x_max)
        sgn = sgn_min+sgn_max
        p = x_max/(torch.abs(x_max)+torch.abs(x_min))
        q = x_max*(1-p)/2
        d = torch.abs(q)
        x_true  = nn.ReLU()(x_true)
        copy_x_for_approx = copy.deepcopy(x)
        mask_p = (sgn==0)*1
        mask_1 =(sgn==2)*1 + (sgn==1)*1
        mask_p = mask_p.unsqueeze(0).expand(num_symbols,-1,-1,-1)
        mask_1 = mask_1.unsqueeze(0).expand(num_symbols,-1,-1,-1)
        
        #approximation of the center 0, (p*x+q) or the value itself 
        copy_x_for_approx[0]= mask_p[0]*(p*copy_x_for_approx[0]+q)+mask_1[0]*copy_x_for_approx[0]
        
        #update of the epsilon
        copy_x_for_approx[1:-1]=p*mask_p[1:-1]*copy_x_for_approx[1:-1] + mask_1[1:-1]*copy_x_for_approx[1:-1]

        #update of the noise symbol -> projection 0, |W|*espilon_noise or new noise if new linear approximation
        copy_x_for_approx[-1]=d*mask_p[-1] +copy_x_for_approx[-1]*mask_p[-1] +mask_1[-1]*copy_x_for_approx[-1]

        x=copy_x_for_approx
        
        x_min = x[0] - torch.sum(torch.abs(x[1:]),dim=0)
        x_max = x[0] + torch.sum(torch.abs(x[1:]),dim=0)

         

        return x,x_min,x_max,x_true
    
    @staticmethod
    def abstract_relu(x,x_min,x_max,x_true, num_symbols:int):
        sgn_min = torch.sign(x_min)
        sgn_max = torch.sign(x_max)
        sgn = sgn_min+sgn_max
        p = x_max/(torch.abs(x_max)+torch.abs(x_min))
        q = x_max*(1-p)/2
        d = torch.abs(q)
        x_true  = nn.ReLU()(x_true)
        copy_x_for_approx = copy.deepcopy(x)

        #mask for values that will be approximated by the linear approximation
        mask_p = (sgn==0)*1
        #mask for the values for those the output is the same as the input (y=x)
        mask_1 =(sgn==2)*1+ (sgn==1)*1
        #expand the mask to the number of symbols
        mask_p = mask_p.unsqueeze(0).expand(num_symbols,-1)
        mask_1 = mask_1.unsqueeze(0).expand(num_symbols,-1)
        #approximation of the center  
        copy_x_for_approx[0]= mask_p[0]*(p*copy_x_for_approx[0]+q)+mask_1[0]*copy_x_for_approx[0]
        #uptade of the epsilon
        copy_x_for_approx[1:-1]=p*mask_p[1:-1]*copy_x_for_approx[1:-1] + mask_1[1:-1]*copy_x_for_approx[1:-1]
        #update of the noise symbol -> projection 0, |W|*espilon_noise or new noise if new linear approximation
        copy_x_for_approx[-1]=d*mask_p[-1] +copy_x_for_approx[-1]*mask_p[-1] + mask_1[-1]*copy_x_for_approx[-1]
        x=copy_x_for_approx

        x_min = x[0] - torch.sum(torch.abs(x[1:]),dim=0)
        x_max = x[0] + torch.sum(torch.abs(x[1:]),dim=0)
         

        return x,x_min,x_max,x_true


    def forward(self,x):

        
        x_true = x
        x_true = x_true[0].unsqueeze(0)
       
        x,x_min,x_max,x_true = self.abstract_conv2D(self.num_depth,16,3,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu_conv2D(x,x_min,x_max,x_true,self.num_symbols)
        
       
        x,x_min,x_max,x_true = self.abstract_conv2D(16,16,3,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu_conv2D(x,x_min,x_max,x_true,self.num_symbols)

        x,x_min,x_max,x_true = self.abstract_conv2D(16,32,3,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu_conv2D(x,x_min,x_max,x_true,self.num_symbols)

        x,x_min,x_max,x_true = self.abstract_conv2D(32,32,3,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu_conv2D(x,x_min,x_max,x_true,self.num_symbols)

        x,x_min,x_max,x_true = self.abstract_linear(86528,6272,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu(x,x_min,x_max,x_true,self.num_symbols)

        x,x_min,x_max,x_true = self.abstract_linear(6272,6272,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu(x,x_min,x_max,x_true,self.num_symbols)

        x,x_min,x_max,x_true = self.abstract_linear(6272,6272,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu(x,x_min,x_max,x_true,self.num_symbols)

        x,x_min,x_max,x_true = self.abstract_linear(6272,6272,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu(x,x_min,x_max,x_true,self.num_symbols)
       
        x,x_min,x_max,x_true = self.abstract_linear(6272,512,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu(x,x_min,x_max,x_true,self.num_symbols)
        
        x,x_min,x_max,x_true = self.abstract_linear(512,256,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu(x,x_min,x_max,x_true,self.num_symbols)


        x,x_min,x_max,x_true = self.abstract_linear(256,8,x,x_true,device=self.device)
        x,x_min,x_max,x_true = self.abstract_relu(x,x_min,x_max,x_true,self.num_symbols)

        return x,x_min,x_max,x_true
        


Ici on évalue un modèle généré aléatoirement, composé de 4 couches de convolution et de 5 couches linéaires, chacunes avec une fonction d'activation ReLU
L'évaluation se fait sur un tenseur [54,54] généré aléatoirement, qui peut correspondre à une image par exemple. 

In [16]:
!PYTORCH_MPS_HIGH_WATERMARK_RATIO=0.0
device =torch.device('mps')
tensor = torch.randn(60,60)
print(torch.max(tensor.flatten()  ))
alpha = 0.00005*torch.ones_like(tensor.flatten())
abstract_tensor = abstractTensor(tensor,alpha).float()

print(f"abstract_tensor.shape= {abstract_tensor.shape}")
abstract_tensor = abstract_tensor.to(device)
print(f"abstract_tensor.type= {abstract_tensor.type()}")
model = AbstractNN(60*60,device=device)
model = model.to(device)
print(model)

with torch.no_grad():
 
   result,x_min,x_max,x_true=model(abstract_tensor.unsqueeze(1))


print(f"y_min       =  {x_min}")
print(f"y_max       =  {x_max}")
print(f"center Ztp  =  {result[0]}")
print(f"y_true      =  {x_true[:]}")
print(f"y_max-x_min =  {x_max-x_min}")
print(f"Trash symbol=  {result[-1]}")


tensor(3.3813)
torch.Size([60, 60])
abstract_tensor.shape= torch.Size([3602, 60, 60])
abstract_tensor.type= torch.mps.FloatTensor
AbstractNN()
torch.mps.FloatTensor
torch.mps.FloatTensor
torch.mps.FloatTensor
torch.mps.FloatTensor
torch.mps.FloatTensor
torch.mps.FloatTensor
torch.mps.FloatTensor
y_min       =  tensor([-1193.7042, -1237.4697, -1197.5117, -1252.3264, -1265.5195, -1218.4731,
        -1218.3680, -1277.1106], device='mps:0')
y_max       =  tensor([1800.4186, 1849.2915, 1796.5129, 1893.8081, 1894.3350, 1900.6194,
        1836.1801, 1899.2114], device='mps:0')
center Ztp  =  tensor([303.3572, 305.9109, 299.5005, 320.7408, 314.4077, 341.0731, 308.9060,
        311.0504], device='mps:0')
y_true      =  tensor([[0.0119, 0.0580, 0.0236, 0.0000, 0.0128, 0.0125, 0.0000, 0.0000]],
       device='mps:0')
y_max-x_min =  tensor([2994.1228, 3086.7612, 2994.0247, 3146.1345, 3159.8545, 3119.0925,
        3054.5481, 3176.3220], device='mps:0')
Trash symbol=  tensor([1497.0614, 1543.3806, 1

Ici on évalue un modèle fictif, l'entrée est une image de 26 sur 26 par 3 épaisseur,avec un symbole associé avec chaque dimension d'entrée (3*26*26)
Attention, la dimension de la première couche linéaire doit s'accorder, le code vous renvoiera une erreur (10368 au lieu de 67712)

In [11]:

tensor = torch.randn(3,26,26)
print(torch.max(tensor.flatten()  ))
alpha = 0.000005*torch.ones_like(tensor.flatten())
abstract_tensor = abstractTensor(tensor,alpha)
print(f"abstract_tensor.shape= {abstract_tensor.shape}")
model = AbstractNN(26*26*3,num_depth=3)
model.eval()

with torch.no_grad():
 
   result,x_min,x_max,x_true=model(abstract_tensor)


print(f"y_min       =  {x_min}")
print(f"y_max       =  {x_max}")
print(f"center Ztp  =  {result[0]}")
print(f"y_true      =  {x_true[:]}")
print(f"y_max-x_min =  {x_max-x_min}")
print(f"Trash symbol=  {result[-1]}")

tensor(3.2062)
torch.Size([3, 26, 26])
abstract_tensor.shape= torch.Size([2030, 3, 26, 26])
y_min       =  tensor([0.0279, -0.0000, 0.0438, -0.0000, -0.0000, 0.0425, 0.0369, 0.0619])
y_max       =  tensor([0.0282, 0.0000, 0.0441, 0.0000, 0.0000, 0.0428, 0.0372, 0.0623])
center Ztp  =  tensor([0.0281, -0.0000, 0.0439, -0.0000, -0.0000, 0.0427, 0.0370, 0.0621])
y_true      =  tensor([[0.0281, 0.0000, 0.0439, 0.0000, 0.0000, 0.0427, 0.0370, 0.0621]])
y_max-x_min =  tensor([0.0003, 0.0000, 0.0004, 0.0000, 0.0000, 0.0004, 0.0003, 0.0004])
Trash symbol=  tensor([0.0002, 0.0000, 0.0002, 0.0000, 0.0000, 0.0002, 0.0002, 0.0002])
