In [2]:
from dataclasses import dataclass
from typing import Optional

# dataclass
dataclass는 class의 init이나 repr 생성을 단순화 해주는 기능을 가지고 있습니다.

이는 예제를 보시면 한 번에 쉽게 이해할 수 있습니다.

In [5]:
#기존 class 작성법.
#함수의 초기 설정에 들어가야하는 인자가 많은 경우 __init__ 함수에 작성해야하는 내용이 많아집니다.
class ModelArgs():
    def __init__(
            self, 
            dim: int = 32, 
            n_layers: int = 32, 
            n_heads: int = 32, 
            n_kv_heads: Optional[int] = None,
            vocab_size: int = -1,
            multiple_of: int = 256,
            ffn_dim_multiplier: Optional[float] = None,
            norm_eps: float = 1e-5,
            rope_theta: float = 50000,
            max_batch_size: int = 32,
            max_seq_len: int = 2048
    ):
        #함수 안에 들어가는 인자를 위에서 모두 선언하였음에도, 클래스에 self값으로 넣어주기 위해 다시 긴 내용을 작성해야합니다.
        self.dim = dim
        self.n_layers = n_layers
        self.n_heads = n_heads
        self.n_kv_heads = n_kv_heads
        self.vocab_size = vocab_size
        self.multiple_of = multiple_of
        self.ffn_dim_multiplier = ffn_dim_multiplier
        self.norm_eps = norm_eps
        self.rope_theta = rope_theta
        self.max_batch_size = max_batch_size
        self.max_seq_len = max_seq_len

In [7]:
temp = ModelArgs()

print('dim:',temp.dim)
print('n_layers:',temp.n_layers)
print('n_heads:',temp.n_heads)
print('n_kv_heads:',temp.n_kv_heads)

dim: 32
n_layers: 32
n_heads: 32
n_kv_heads: None


In [8]:
#dataclass 데코레이터를 통해 self등 불필요한 반복 작성을 줄여 코드 작성의 효율성을 높일 수 있습니다.
#아래 코드는 위 클래스 코드와 동일하다고 보시면 됩니다.
@dataclass
class ModelArgs:
    dim: int = 4096
    n_layers: int = 32
    n_heads: int = 32
    n_kv_heads: Optional[int] = None # Optional은 None or type을 의미합니다. 기본값이 None일 때 자주 사용합니다.
    vocab_size: int = -1
    multiple_of: int = 256  # make SwiGLU hidden layer size multiple of large power of 2
    ffn_dim_multiplier: Optional[float] = None
    norm_eps: float = 1e-5
    rope_theta: float = 500000

    max_batch_size: int = 32
    max_seq_len: int = 2048

In [9]:
temp = ModelArgs()

print('dim:',temp.dim)
print('n_layers:',temp.n_layers)
print('n_heads:',temp.n_heads)
print('n_kv_heads:',temp.n_kv_heads)

dim: 4096
n_layers: 32
n_heads: 32
n_kv_heads: None


**참고 : typing**

Python은 함수나 클래스에 들어오는 인자값의 형태 규정을 딱히 하지 않아 높은 자유도를 가지고 있습니다.

다만 이러한 자유도는 잘못된 인자값 타입이 들어왔을 때 감지하지 못한다는 단점을 가지고 있죠.

이러한 점을 최근에는 typing을 활용하여 인자값의 형태에 대한 힌트를 넣어줌으로써 해결하는 방법이 많이 사용되고 있습니다.