Add qwen2 tie word embedding #630

yileld · 2024-07-16T06:48:18Z

Qwen2 1.5B uses tie word embedding, which is different from other Qwen2 model. So we should add a step to load lm_head's weight from embed_tokens layer.

add qwen2 tie word embedding

c4455dd

Ying1123 merged commit fe3be15 into sgl-project:main Jul 16, 2024

zhyncs mentioned this pull request Jul 18, 2024

Qwen2-1.5B not work. Only output many “!” #589

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add qwen2 tie word embedding #630

Add qwen2 tie word embedding #630

yileld commented Jul 16, 2024

Add qwen2 tie word embedding #630

Add qwen2 tie word embedding #630

Conversation

yileld commented Jul 16, 2024