msModelSlim

简介

MindStudio ModelSlim（昇腾模型压缩工具，msModelSlim），一个以加速为目标、压缩为技术、昇腾为根本的亲和压缩工具。包含量化和压缩等一系列推理优化技术，旨在加速大语言稠密模型、MoE模型、多模态理解模型、多模态生成模型等。

昇腾AI模型开发用户可以灵活调用Python API接口，适配算法和模型，完成精度性能调优，并支持导出不同格式模型，通过MindIE、vLLM Ascend等推理框架在昇腾AI处理器上运行。

目录结构

├─config             # 配置文件
├─docs               # 文档目录
├─example            # 案例目录
├─lab_calib          # 校准集
├─lab_practice       # 最佳实践
├─msmodelslim
│  ├─app             # 应用
│  ├─cli             # 命令行和接口
│  ├─core            # 其他量化模块和组件
│  ├─infra           # 量化基础设施
│  ├─model           # 模型适配
│  ├─quant           
│  │  ├─ir           # 量化模式 
│  │  └─processor    # 算法
│  └─utils           # 通用基础设施
└─test               # 测试目录

版本说明

msModelSlim的版本说明包含msModelSlim的软件版本配套关系和软件包下载以及每个版本的特性变更说明，具体参见版本说明。

环境部署

具体安装步骤请查看《msModelSlim工具安装指南》。

快速入门

快速入门旨在帮助用户快速通过一键量化的方式完成大模型量化功能。

具体快速入门请查看快速入门。

功能介绍

支持矩阵

支持矩阵旨在以表格形式呈现不同功能和模型已适配场景的情况。

具体支持矩阵请查看支持矩阵。

功能指南

功能指南基于msModelSlim不同架构下的功能支持情况，提供功能使用说明和接口说明。

具体功能指南请查看功能指南。

自主量化

面向需要将自有模型接入 msModelSlim 的开发者，提供自主将模型接入msModelSlim一键量化的指导。

具体模型接入指南请查看自主量化模型接入指南。

案例集

案例集通过具体的文字说明和代码示例，以实际应用场景为基础，旨在指导用户快速熟悉特定场景下msModelSlim工具的使用，包括一些精度调优方法等，msModelSlim将持续完善案例集。

案例分类	案例名称	说明
量化精度调优	w8a8精度调优策略	w8a8精度调优策略指南
	w8a16精度调优策略	w8a16精度调优策略指南
	v1框架量化精度调优	v1框架量化精度调优指南
	v1框架Qwen3-32B w8a8a精度调优	v1框架Qwen3-32B w8a8a精度调优案例
稀疏量化调试	稀疏量化精度调试案例	稀疏量化精度调试方法和案例
权重转换	msModelSlim量化权重转AutoAWQ&AutoGPTQ使用指南	量化权重格式转换指南
推理部署	加速库&MindIE-Torch场景下的量化权重使用案例	推理加速库中量化权重使用方法

FAQ

安全声明

描述msModelSlim产品的安全加固信息、公网地址信息及通信矩阵等内容。详情请参见msModelSlim工具安全声明。

免责声明

致msModelSlim使用者

本工具仅供调试和开发之用，使用者需自行承担使用风险，并理解以下内容：
- msModelSlim工具依赖的transformers、PyTorch等第三方开源软件，均由第三方社区提供和维护，因第三方开源软件导致的问题的修复依赖相关社区的贡献和反馈。您应理解，msModelSlim仓库不保证第三方开源软件本身的问题进行修复，也不保证会测试或纠正所有第三方开源软件的漏洞和错误。
- 在您使用msModelSlim工具时，工具通常会从硬盘中读取您从互联网所下载的模型权重（通过您提供的命令行参数或配置文件）。使用非可信的模型权重可能会导致未知的安全风险，建议您在使用工具前通过SHA256校验等方法，确保模型权重可信后再传递给工具。
- 出于安全性及权限最小化角度考虑，您不应以root等高权限账户使用msModelSlim工具，建议您使用普通用户权限安装执行。
  - 用户须自行保证最小权限原则（如禁止 other 用户可写，常见如禁止 666、777）。
  - 使用 msModelSlim 工具请确保执行用户的 umask 值大于等于 0027，否则会导致生成的量化模型数据所在目录和文件权限过大。
    - 若要查看 umask 的值，可执行命令：umask
    - 若要修改 umask 的值，可执行命令：umask 新的取值
  - 请确保原始模型数据存放和量化模型数据保存在不含软链接的当前用户目录下，否则可能会引起安全问题。
- 数据处理及删除：用户在使用本工具过程中产生的数据属于用户责任范畴。建议用户在使用完毕后及时删除相关数据，以防信息泄露。
- 数据保密与传播：使用者了解并同意不得将通过本工具产生的数据随意外发或传播。对于由此产生的信息泄露、数据泄露或其他不良后果，本工具及开发者概不负责。
- 用户输入安全性：用户需自行保证输入的命令行的安全性，并承担因输入不当导致的任何安全风险或损失。对于由于输入命令行不当所导致的问题，本工具及其开发者概不负责。
免责声明范围：本免责声明适用于所有使用本工具的个人或实体。使用本工具即表示您同意并接受本声明的内容，并愿意承担因使用该功能而产生的风险和责任，如有异议请停止使用本工具。
在使用本工具之前，请谨慎阅读并理解以上免责声明的内容。对于使用本工具所产生的任何问题或疑问，请及时联系开发者。

致数据所有者

如果您不希望您的数据集在msModelSlim中的模型被提及，或希望更新msModelSlim中的模型关于您的数据集的描述，请在Gitcode提issue，msModelSlim将根据您的issue要求删除或更新您的数据集描述。衷心感谢您对msModelSlim的理解和贡献。

LICENSE

msModelSlim产品的使用许可证，具体请参见LICENSE。

msModelSlim产品docs目录下的文档适用CC-BY 4.0许可证，具体请参见LICENSE。

贡献声明

提交错误报告：如果您在msModelSlim中发现了一个不存在安全问题的漏洞，请在msModelSlim仓库中的Issues中搜索，以防该漏洞已被提交，如果找不到漏洞可以创建一个新的Issues。如果发现了一个安全问题请不要将其公开，请参阅安全问题处理方式。提交错误报告时应该包含完整信息。
安全问题处理：本项目中对安全问题处理的形式，请通过邮箱通知项目核心人员确认编辑。
解决现有问题：通过查看仓库的Issues列表可以发现需要处理的问题信息, 可以尝试解决其中的某个问题。
如何提出新功能：请使用Issues的Feature标签进行标记，我们会定期处理和确认开发。
开始贡献：
a. Fork本项目的仓库。
b. Clone到本地。
c. 创建开发分支。
d. 本地测试：提交前请通过所有单元测试，包括新增的测试用例。
e. 提交代码。
f. 新建Pull Request。
g. 代码检视：您需要根据评审意见修改代码，并重新提交更新。此流程可能涉及多轮迭代。
h. 当您的PR获得足够数量的检视者批准后，Committer会进行最终审核。
i. 审核和测试通过后，CI会将您的PR合并入到项目的主干分支。

建议与交流

欢迎大家为社区做贡献。如果有任何疑问或建议，请提交Issues，我们会尽快回复。感谢您的支持。

致谢

msModelSlim 由华为公司的下列部门及昇腾生态合作伙伴联合贡献：

华为公司：

计算产品线
2012实验室

感谢来自社区的每一个PR，欢迎贡献 msModelSlim 。

Name		Name	Last commit message	Last commit date
Latest commit History 79 Commits
ascend_utils		ascend_utils
config		config
docs/zh		docs/zh
example		example
lab_calib		lab_calib
lab_practice		lab_practice
modelslim		modelslim
msitmodelslim		msitmodelslim
msmodelslim		msmodelslim
precision_tool		precision_tool
security		security
test		test
LICENSE		LICENSE
OWNERS		OWNERS
README.md		README.md
install.sh		install.sh
pytest.ini		pytest.ini
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

msModelSlim

最新消息

2026年1月

2025年12月

2025年11月

2025年10月

2025年9月

2025年8月

简介

目录结构

版本说明

环境部署

快速入门

功能介绍

支持矩阵

功能指南

自主量化

案例集

FAQ

安全声明

免责声明

致msModelSlim使用者

致数据所有者

LICENSE

贡献声明

建议与交流

致谢

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

msModelSlim

最新消息

2026年1月

2025年12月

2025年11月

2025年10月

2025年9月

2025年8月

简介

目录结构

版本说明

环境部署

快速入门

功能介绍

支持矩阵

功能指南

自主量化

案例集

FAQ

安全声明

免责声明

致msModelSlim使用者

致数据所有者

LICENSE

贡献声明

建议与交流

致谢

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages