In [None]:
tf.keras.layers.Dense(
    units,
    activation=None,
    use_bias=True,
    kernel_initializer="glorot_uniform",
    bias_initializer="zeros",
    kernel_regularizer=None,
    bias_regularizer=None,
    activity_regularizer=None,
    kernel_constraint=None,
    bias_constraint=None,
    **kwargs
)

## [ 개 요 ]

- Dense: Fully connected layer

- Dense는 [ output = activation(dot(input, kernel) + bias) ] 인 연산을 구현
    - activation: 활성화 요소로 전달된 활성화 함수
    - kernel: 레이어에 의해 생성된 가중치 행렬
    - bias: 레이어에 의해 생성된 bias벡터
    
- [Note] 
    - 레이어(계층)로 들어가는 입력이 2보다 큰 rank(차원)를 갖는다면 dense는 입력의 마지막 축과 커널 축을 따라 입력과 kernel(가중치) 사이에 dot product를 계산한다(tf.tensordot사용).
    - (ex) input이 (batch_size, d0, d1)라면, 
      (d1, units)형태의 텐서를 생성하고 
      모든 하위 텐서는 (1, 1, d1) 형태로 입력의 축 2를 따라 작동하여 
      output은 (batch_size, d0, 단위)의 형태가 된다.

In [None]:
 # Create a `Sequential` model and add a Dense layer as the first layer.  
model = tf.keras.models.Sequential()
model.add(tf.keras.Input(shape=(16,)))
model.add(tf.keras.layers.Dense(32, activation='relu'))
# Now the model will take as input arrays of shape (None, 16)  
# and output arrays of shape (None, 32).  
# Note that after the first layer, you don't need to specify  
# the size of the input anymore:  
model.add(tf.keras.layers.Dense(32))
model.output_shape
(None, 32)

###  [ Arguments ]

1. **units**: Positive integer, dimensionality of the output space.
    - 양의 정수, 출력 공간의 차수

2. **activation**: Activation function to use. If you don't specify anything, no activation is applied (ie. "linear" activation: a(x) = x).
    - 사용할 활성화 함수, 아무 것도 지정하지 않으면 활성화가 적용되지 않음(예: "선형" 활성화: a(x) = x)
    - 옵션(문자열)으로 넣을 수도 있고, 함수로 넣을 수도 있고, 클래스로 넣을 수도 있음
    - 클래스로 넣으면 쪼개서 넣기가 가능
    - 아래 4개의 dense는 모두 같은것
    - Dense(16, activation='relu')
    - Dense(16, activation=tf.keras.activations.relu)
    - Dense(16, activation=tf.keras.layers.Activation(activation='relu'))
    - Dense(16, activation=tf.keras.layers.ReLU())
    - https://keras.io/api/layers/activations/

3. **use_bias**: Boolean, whether the layer uses a bias vector.
    - 계층이 바이어스 벡터를 사용하는지 여부를 나타내는 부울 parameter
    - default = True
    
---

4. **kernel_initializer**: Initializer for the kernel weights matrix.
    - 초기 가중치 설정 매개변수
    - model.add(Dense(64,
                kernel_initializer='random_uniform',
                bias_initializer='zeros'))
    - random_uniform : -0.05 ~ 0.05로 임의의 값으로 초기화
    - random_normal : 평균이 0, 표준편차가 0.05로 정규분포에 따라 초기화
    - zeros : 모든 가중치를 0으로 초기화 
    - he_normal : He 정규분포 초기값 설정 (ResNet의 창시자Kaiming He가 제안)

5. **bias_initializer**: Initializer for the bias vector.
    - bias vector를 위한 초기화 함수
    
---

6. **kernel_regularizer**: Regularizer function applied to the kernel weights matrix.
    - 커널 가중치 행렬에 적용되는 정규화 함수
    - https://keras.io/api/layers/regularizers/

7. **bias_regularizer**: Regularizer function applied to the bias vector.
    - Regularizer 함수가 바이어스 벡터에 적용
    - https://keras.io/api/layers/regularizers/

8. **activity_regularizer**: Regularizer function applied to the output of the layer (its "activation").
    - 출력값을 정규화하는 방법에 대한 파라미터
    - https://keras.io/api/layers/regularizers/
    
---
어느정도 값이 넘어가면 짤라라! 

9. **kernel_constraint**: Constraint function applied to the kernel weights matrix.
    - kernel weight matrix에 적용된 제약 조건 함수
    - https://keras.io/api/layers/constraints/
    - 다양한 정규화 함수나 규제를 통해서 결과를 개선
10. **bias_constraint**: Constraint function applied to the bias vector.
    - bias vector에 적용되는 제한함수.
    - https://keras.io/api/layers/constraints/


## [ Vs Pytorch ]

- https://discuss.pytorch.org/t/pytorch-equivalent-of-keras/29412


