Skip to content

Releases: wangzhaode/llm-export

llama3-8b-instruct-onnx

19 Apr 05:31
Compare
Choose a tag to compare

`Llama-3-8B-Instruct 导出的分段模型,导出命令如下:

python llm_export.py --path ../Llama-3-8B-Instruct --export_split 

模型列表:

  • lm.onnx
  • block_[0-31].onnx

qwen1.5-7b-chat-onnx

13 Mar 08:34
Compare
Choose a tag to compare

qwen1.5-7b-chat 导出的分段模型,导出命令如下:

python llm_export.py --path ../Qwen1_5-7B-Chat --export_split

模型列表:

  • embedding.onnx
  • lm.onnx
  • block_[0-31].onnx

qwen1.5-4b-chat-onnx

13 Mar 06:16
8c6f1b6
Compare
Choose a tag to compare

qwen1.5-4b-chat 导出的分段模型,导出命令如下:

python llm_export.py --path ../Qwen1_5-4B-Chat --export_split

模型列表:

  • embedding.onnx
  • lm.onnx
  • block_[0-39].onnx

qwen1.5-1.8b-chat-onnx

13 Mar 06:15
8c6f1b6
Compare
Choose a tag to compare

qwen1.5-1.8b-chat 导出的分段模型,导出命令如下:

python llm_export.py --path ../Qwen1_5-1.8B-Chat --export_split

模型列表:

  • embedding.onnx
  • lm.onnx
  • block_[0-23].onnx

qwen1.5-0.5b-chat-onnx

13 Mar 06:14
8c6f1b6
Compare
Choose a tag to compare

qwen1.5-0.5b-chat 导出的分段模型,导出命令如下:

python llm_export.py --path ../Qwen1_5-0_5B-Chat --export_split

模型列表:

  • embedding.onnx
  • lm.onnx
  • block_[0-23].onnx

yi-6b-chat-onnx

24 Jan 07:13
Compare
Choose a tag to compare

Yi-6B-Chat 导出的分段模型,导出命令如下:

python llm_export.py --path ../Yi-6B-Chat --export_split --embed_bf16

模型列表:

  • embedding.onnx
  • lm.onnx
  • block_[0-31].onnx

deepseek-7b-chat-onnx

24 Jan 12:57
Compare
Choose a tag to compare

deepseek-llm-7b-chatt 导出的分段模型,导出命令如下:

python llm_export.py --path ../deepseek-llm-7b-chat--export_split --embed_bf16

模型列表:

  • embedding.onnx
  • lm.onnx
  • block_[0-29].onnx

tinyllama-1.1b-chat-onnx

23 Jan 08:44
Compare
Choose a tag to compare

TinyLlama-1.1B-Chat 导出的分段模型,导出命令如下:

python llm_export.py --path ../TinyLlama-1_1B-Chat --export_split

模型列表:

  • embedding.onnx
  • lm.onnx
  • block_[0-21].onnx

bge-large-zh-onnx

17 Jan 08:15
Compare
Choose a tag to compare

bge-large-zh 导出的模型,导出命令如下:

python llm_export.py --path ../bge-large-zh --export

模型列表:

  • bge-large-zh.onnx

qwen-vl-onnx

05 Jan 06:08
Compare
Choose a tag to compare

Qwen-VL-Chat 导出的分段模型,导出命令如下:

python llm_export.py --path ../internlm-chat-7b --export_split

模型列表:

  • embedding.onnx
  • visual.onnx (文件过大,未上传)
  • lm.onnx (文件过大,未上传)
  • block_[0-31].onnx