In [None]:
import torch
import torch.nn as nn

`nn.Linear`는 PyTorch에서 **선형 계층 (Fully Connected Layer)** 또는 **Dense Layer**를 구현할 때 사용합니다. 수학적으로는 다음과 같은 연산을 수행합니다:

$\text{output} = xW^T + b$

## 신경망 구조

```
입력층 (10)              선형 계층              출력층 (5)
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

  x₁ ──────┐
  x₂ ──────┤
  x₃ ──────┤
  ...      ├──→ y₁, y₂, y₃, y₄, y₅
  x₁₀──────┘

연산: y = x @ W^T + b
입력: [B, 10] → 출력: [B, 5]
파라미터: weight [5, 10] (50개) + bias [5] (5개) = 55개


**Shape 규칙:**
- 입력: [B, in_features]
- 가중치: [out_features, in_features]
- 바이어스: [out_features]
- 출력: [B, out_features]

**예시:** 입력 [3, 10] → 출력 [3, 5]

In [None]:
# 선형 계층 생성: 입력 10차원 → 출력 5차원
linear = nn.Linear(in_features=10, out_features=5)
linear

Linear(in_features=10, out_features=5, bias=True)

In [None]:
# 입력 텐서: 배치 3개, 각 10차원
x = torch.randn(3, 10)
x.shape

torch.Size([3, 10])

In [None]:
# 순전파: [3, 10] → [3, 5]
output = linear(x)
print(output.shape)

torch.Size([3, 5])


**파라미터:**
- weight: [out_features, in_features] = [5, 10]
- bias: [out_features] = [5]
- 모두 `requires_grad=True`로 학습 가능

In [None]:
# 파라미터 확인
print(linear.weight)  # 가중치 [5, 10]
print(linear.bias)    # 바이어스 [5]

Parameter containing:
tensor([[ 0.2223, -0.0673, -0.2955, -0.0047, -0.0730, -0.2915, -0.1625,  0.0125,
         -0.2353, -0.0323],
        [ 0.2665,  0.1949, -0.1652, -0.2674, -0.1950,  0.0514, -0.1785,  0.2613,
          0.0781, -0.2568],
        [-0.0155,  0.1881, -0.2641,  0.3025,  0.1109,  0.0886,  0.1027, -0.1587,
         -0.1610,  0.1072],
        [-0.1296, -0.2429, -0.0596,  0.3117,  0.1577, -0.0176, -0.1492, -0.1846,
         -0.2610, -0.0656],
        [-0.2707,  0.2627,  0.2784,  0.1981,  0.0198, -0.0849,  0.0040,  0.0528,
         -0.0705,  0.1934]], requires_grad=True)
Parameter containing:
tensor([-0.1122,  0.1841, -0.0498, -0.2594,  0.2779], requires_grad=True)


In [None]:
# 파라미터 shape 확인
print(linear.weight.shape)  # [5, 10]
print(linear.bias.shape)   # [5]

torch.Size([5, 10])
torch.Size([5])
