Releases: wangzhaode/llm-export
Releases · wangzhaode/llm-export
llama3-8b-instruct-onnx
`Llama-3-8B-Instruct 导出的分段模型,导出命令如下:
python llm_export.py --path ../Llama-3-8B-Instruct --export_split
模型列表:
- lm.onnx
- block_[0-31].onnx
qwen1.5-7b-chat-onnx
qwen1.5-7b-chat
导出的分段模型,导出命令如下:
python llm_export.py --path ../Qwen1_5-7B-Chat --export_split
模型列表:
- embedding.onnx
- lm.onnx
- block_[0-31].onnx
qwen1.5-4b-chat-onnx
qwen1.5-4b-chat
导出的分段模型,导出命令如下:
python llm_export.py --path ../Qwen1_5-4B-Chat --export_split
模型列表:
- embedding.onnx
- lm.onnx
- block_[0-39].onnx
qwen1.5-1.8b-chat-onnx
qwen1.5-1.8b-chat
导出的分段模型,导出命令如下:
python llm_export.py --path ../Qwen1_5-1.8B-Chat --export_split
模型列表:
- embedding.onnx
- lm.onnx
- block_[0-23].onnx
qwen1.5-0.5b-chat-onnx
qwen1.5-0.5b-chat
导出的分段模型,导出命令如下:
python llm_export.py --path ../Qwen1_5-0_5B-Chat --export_split
模型列表:
- embedding.onnx
- lm.onnx
- block_[0-23].onnx
yi-6b-chat-onnx
Yi-6B-Chat
导出的分段模型,导出命令如下:
python llm_export.py --path ../Yi-6B-Chat --export_split --embed_bf16
模型列表:
- embedding.onnx
- lm.onnx
- block_[0-31].onnx
deepseek-7b-chat-onnx
deepseek-llm-7b-chatt
导出的分段模型,导出命令如下:
python llm_export.py --path ../deepseek-llm-7b-chat--export_split --embed_bf16
模型列表:
- embedding.onnx
- lm.onnx
- block_[0-29].onnx
tinyllama-1.1b-chat-onnx
TinyLlama-1.1B-Chat
导出的分段模型,导出命令如下:
python llm_export.py --path ../TinyLlama-1_1B-Chat --export_split
模型列表:
- embedding.onnx
- lm.onnx
- block_[0-21].onnx
bge-large-zh-onnx
bge-large-zh
导出的模型,导出命令如下:
python llm_export.py --path ../bge-large-zh --export
模型列表:
- bge-large-zh.onnx
qwen-vl-onnx
Qwen-VL-Chat
导出的分段模型,导出命令如下:
python llm_export.py --path ../internlm-chat-7b --export_split
模型列表:
- embedding.onnx
- visual.onnx (文件过大,未上传)
- lm.onnx (文件过大,未上传)
- block_[0-31].onnx