fix falcon-40b accuracy issue #39

Yejing-Lai · 2023-12-28T07:26:20Z

"FalconDecoderLayer" module will choose the "glmtype" fused_qkv_type. But the Falcon model should use the "bloomtype".

delock · 2024-01-03T01:12:28Z

@Yejing-Lai can you add text output before/after your fix for documentation purpose? Thanks!

Yejing-Lai · 2024-01-04T01:45:58Z

before fix output: ('DeepSpeed is a machine learning framework for deep neural networks (DNNs) and deep reinforcement learning (DRL). It is written in C++ and is e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e', 32)

after fix output:('DeepSpeed is a machine learning framework for deep neural networks (DNNs) and deep reinforcement learning (DRL). It is written in C++ and is based on PyTorch.\nDeepSpeed is designed to scale DNNs and DRL to large numbers of GPUs and TPUs.\nDeepSpeed is', 32)

delock · 2024-01-04T02:02:42Z

before fix output: ('DeepSpeed is a machine learning framework for deep neural networks (DNNs) and deep reinforcement learning (DRL). It is written in C++ and is e e e e e e e e e e e e e e e e e e e e e e e e e e e e e e', 32)

after fix output:('DeepSpeed is a machine learning framework for deep neural networks (DNNs) and deep reinforcement learning (DRL). It is written in C++ and is based on PyTorch.\nDeepSpeed is designed to scale DNNs and DRL to large numbers of GPUs and TPUs.\nDeepSpeed is', 32)

Thanks!

delock · 2024-01-04T02:03:35Z

@Yejing-Lai is this PR already submitted to upstream?

fix falcon-40b accuracy issue

0e5fa02

delock merged commit 092b0f2 into delock:gma/run-opt-branch Jan 4, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

fix falcon-40b accuracy issue #39

fix falcon-40b accuracy issue #39

Uh oh!

Yejing-Lai commented Dec 28, 2023

Uh oh!

delock commented Jan 3, 2024

Uh oh!

Yejing-Lai commented Jan 4, 2024

Uh oh!

delock commented Jan 4, 2024

Uh oh!

delock commented Jan 4, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

fix falcon-40b accuracy issue #39

fix falcon-40b accuracy issue #39

Uh oh!

Conversation

Yejing-Lai commented Dec 28, 2023

Uh oh!

delock commented Jan 3, 2024

Uh oh!

Yejing-Lai commented Jan 4, 2024

Uh oh!

delock commented Jan 4, 2024

Uh oh!

delock commented Jan 4, 2024

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants