- 5위 코드

In [9]:
import torch
import torch.nn as nn

class AutoEncoder(nn.Module):
    def __init__(self, D_in, H, D_out, dropout):
        super(AutoEncoder, self).__init__()
        encoder_layer = nn.Linear(D_in, H, bias=True)
        decoder_layer = nn.Linear(H, D_out, bias=True)

        torch.nn.init.xavier_uniform_(encoder_layer.weight)
        torch.nn.init.xavier_uniform_(decoder_layer.weight)

        self.encoder = nn.Sequential(
                        nn.Dropout(dropout),
                        encoder_layer,
                        nn.BatchNorm1d(H),
                        nn.LeakyReLU())
        self.decoder = nn.Sequential(
                        decoder_layer,
                        nn.Sigmoid())

    def forward(self, x):
        out_encoder = self.encoder(x)
        out_decoder = self.decoder(out_encoder)
        return out_decoder

# 모델 인스턴스 생성
D_in = 24666
D_out = 24666
H = 450
dropout = 0.2
model = AutoEncoder(D_in, H, D_out, dropout)

# 모델 구조 출력
print(model)

from torchsummary import summary
summary(model, (24666,))

AutoEncoder(
  (encoder): Sequential(
    (0): Dropout(p=0.2, inplace=False)
    (1): Linear(in_features=24666, out_features=450, bias=True)
    (2): BatchNorm1d(450, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (3): LeakyReLU(negative_slope=0.01)
  )
  (decoder): Sequential(
    (0): Linear(in_features=450, out_features=24666, bias=True)
    (1): Sigmoid()
  )
)
----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
           Dropout-1                [-1, 24666]               0
            Linear-2                  [-1, 450]      11,100,150
       BatchNorm1d-3                  [-1, 450]             900
         LeakyReLU-4                  [-1, 450]               0
            Linear-5                [-1, 24666]      11,124,366
           Sigmoid-6                [-1, 24666]               0
Total params: 22,225,416
Trainable params: 22,225,416
Non-trainable params: 0
--------------------

In [10]:
import torch
import torch.nn as nn

class AutoEncoder(nn.Module):
    def __init__(self, D_in, H, D_out, dropout):
        super(AutoEncoder, self).__init__()
        encoder_layer = nn.Linear(D_in, H, bias=True)
        decoder_layer = nn.Linear(H, D_out, bias=True)

        torch.nn.init.xavier_uniform_(encoder_layer.weight)
        torch.nn.init.xavier_uniform_(decoder_layer.weight)

        self.encoder = nn.Sequential(
                        nn.Dropout(dropout),
                        encoder_layer,
                        nn.BatchNorm1d(H),
                        nn.LeakyReLU())
        self.decoder = nn.Sequential(
                        decoder_layer,
                        nn.Sigmoid())

    def forward(self, x):
        out_encoder = self.encoder(x)
        out_decoder = self.decoder(out_encoder)
        return out_decoder

# 모델 인스턴스 생성
D_in = 24666
D_out = 24666
H = 64
dropout = 0.2
model = AutoEncoder(D_in, H, D_out, dropout)

# 모델 구조 출력
print(model)

from torchsummary import summary
summary(model, (24666,))

AutoEncoder(
  (encoder): Sequential(
    (0): Dropout(p=0.2, inplace=False)
    (1): Linear(in_features=24666, out_features=64, bias=True)
    (2): BatchNorm1d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    (3): LeakyReLU(negative_slope=0.01)
  )
  (decoder): Sequential(
    (0): Linear(in_features=64, out_features=24666, bias=True)
    (1): Sigmoid()
  )
)
----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
           Dropout-1                [-1, 24666]               0
            Linear-2                   [-1, 64]       1,578,688
       BatchNorm1d-3                   [-1, 64]             128
         LeakyReLU-4                   [-1, 64]               0
            Linear-5                [-1, 24666]       1,603,290
           Sigmoid-6                [-1, 24666]               0
Total params: 3,182,106
Trainable params: 3,182,106
Non-trainable params: 0
-------------------------

- tensorflow 버전

In [8]:
import tensorflow as tf
from tensorflow.keras.layers import Input, Dense, Dropout, BatchNormalization, LeakyReLU
from tensorflow.keras.models import Model

# 모델 정의
input_dim = 24666
hidden_dim = 450
dropout_rate = 0.2

input_layer = Input(shape=(input_dim,))
encoded = Dropout(0.2)(input_layer)
encoded = Dense(hidden_dim)(encoded)
encoded = BatchNormalization(input_shape=(450,), trainable=False)(encoded)
encoded = LeakyReLU(alpha=0.01)(encoded)

decoded = Dense(input_dim, activation='sigmoid')(encoded)

autoencoder = Model(inputs=input_layer, outputs=decoded)

# 모델 요약 출력
autoencoder.summary()

Model: "model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_3 (InputLayer)        [(None, 24666)]           0         
                                                                 
 dropout_2 (Dropout)         (None, 24666)             0         
                                                                 
 dense_3 (Dense)             (None, 450)               11100150  
                                                                 
 batch_normalization_1 (Batc  (None, 450)              1800      
 hNormalization)                                                 
                                                                 
 leaky_re_lu_1 (LeakyReLU)   (None, 450)               0         
                                                                 
 dense_4 (Dense)             (None, 24666)             11124366  
                                                             


trainable=False를 설정하는 이유는 배치 정규화 레이어를 학습 중에 고정하기 위해서입니다. 배치 정규화는 기본적으로 학습 중에 스케일 및 평균을 조정하면서 데이터의 정규화를 수행합니다. 그러나 때로는 이러한 스케일 및 평균을 고정하고 싶을 때가 있습니다.

예를 들어, 사전 학습된 모델을 미세 조정하는 경우에는 사전 학습된 모델의 일부 레이어를 고정하고 싶을 수 있습니다. 이 경우 해당 레이어의 가중치와 통계 정보를 고정함으로써 미세 조정 중에 이 레이어가 크게 변경되지 않도록 할 수 있습니다.

따라서 trainable=False를 설정하면 해당 레이어의 가중치 및 통계 정보를 학습 중에 업데이트하지 않고 고정할 수 있습니다. 이는 모델의 특정 부분을 고정하고 다른 부분만 학습시키려는 경우에 유용합니다.