Evaluate: Qwen/Qwen1.5-XX #26

ggbetz · 2024-03-23T10:45:53Z

For {XX} in [0.5B, 1.8B, 4B, 7B, 14B, 32B, 72B]:

Check:

The model has not been evaluated yet and doesn't show up on the CoT Leaderboard.
There is no evaluation request issue for the model in the repo.
The parameters below have been adapted and shall be used.

Parameters:

NEXT_MODEL_PATH=Qwen/Qwen1.5-{XX}
NEXT_MODEL_REVISION=main
NEXT_MODEL_PRECISION=bfloat16
MAX_LENGTH=2048 
GPU_MEMORY_UTILIZATION=0.7
VLLM_SWAP_SPACE=8

The text was updated successfully, but these errors were encountered:

ggbetz · 2024-04-11T15:00:40Z

Qwen models fail to generate reasoning traces.
https://github.com/logikon-ai/cot-eval/blob/f9bfe8f757edbed49324df680214a24fbde37213/src/cot_eval/__main__.py#L139C1-L146C53

ggbetz · 2024-04-17T06:28:08Z

Might however be related to #48, as I've been testing the smallest base model only...

ggbetz added the eval_request label Mar 23, 2024

ggbetz changed the title ~~Evaluate: Qwen/Qwen1.5-14B~~ Evaluate: Qwen/Qwen1.5-XX Apr 10, 2024

ggbetz assigned yakazimir and unassigned yakazimir Apr 10, 2024

ggbetz added the bug Something isn't working label Apr 11, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Evaluate: Qwen/Qwen1.5-XX #26

Evaluate: Qwen/Qwen1.5-XX #26

ggbetz commented Mar 23, 2024 •

edited

Loading

ggbetz commented Apr 11, 2024

ggbetz commented Apr 17, 2024

Evaluate: Qwen/Qwen1.5-XX #26

Evaluate: Qwen/Qwen1.5-XX #26

Comments

ggbetz commented Mar 23, 2024 • edited Loading

ggbetz commented Apr 11, 2024

ggbetz commented Apr 17, 2024

ggbetz commented Mar 23, 2024 •

edited

Loading