liushz

Follow

liushz

Follow

@shanghai AI Lab / CS master of FuDan NLP

7 followers · 10 following

Shanghai

Achievements

Achievements

Highlights

Pro

Pinned Loading

open-compass/opencompass open-compass/opencompass Public

OpenCompass is an LLM evaluation platform, supporting a wide range of models (Llama3, Mistral, InternLM2,GPT-4,LLaMa2, Qwen,GLM, Claude, etc) over 100+ datasets.

Python 4k 428
open-compass/MathBench open-compass/MathBench Public

[ACL 2024 Findings] MathBench: A Comprehensive Multi-Level Difficulty Mathematics Evaluation Dataset

84 1