IBM 旗下的作业调度器 LSF, 作为一款在 HPC 领域内应用广泛的商业调度器,其 Manual 是针对众多行业客户而编写的。文档受众主要是各大、中、小型企业的集群管理者,其次则为数量更多的集群使用者,与少部分功能开发者。但实际上,因为各企业/非企业级用户的软硬件基础架构、业务场景等有所不同,所以,作为集群的管理者,除了需要熟悉官网中介绍的功能操作外,也有必要结合实际的工作需求,基于所在行业,进行实际经验的总结与梳理。
- 基础性的概念、文章等内容,需要完全掌握理解,尽量做到——全文准确翻译;
- 章节目录,简介说明等内容,用于快速了解都实现了哪些功能,涉及到哪些工具,同样会进行翻译,并保留原英文目录,作为对照;
- 功能解释,特性说明等内容,一般在真正用到时,再翻阅查询即可,且阅读原文更能准确把握其真实含义,因此,不会翻译,而是根据使用经验给出阅读建议,即划重点;
- 经验总结、资源分享等内容,会根据个人实际经验及兴趣,有选择地介绍某些工具,如 k8s,API 等,或分享整理一些搜集到的,不错的资源。
本 LSF Handbook 站点,前大半部分(1~9)是从集群管理及二次开发者的角度出发,摘选出 LSF Manual 的部分重点章节,进行的一些翻译与增补,后小半部分(10~12),则是经验与资源的分享。
序号 | 章节 | 原文 | 重要度 |
---|---|---|---|
一 | 快速入门 | Getting started | ⭐⭐⭐ |
二 | LSF 基础 | LSF foundations | ⭐⭐⭐⭐⭐ |
三 | 安装部署 | Install, upgrade, and migrate | ⭐⭐ |
四 | 运行作业 | Run jobs | ⭐⭐⭐⭐ |
五 | 管理 LSF | Administer LSF | ⭐⭐⭐⭐⭐ |
六 | 参考文档 | Reference | ⭐⭐⭐⭐ |
七 | 关联工具 | LSF on Windows、 LSF License Scheduler、 LSF Data Manager、 LSF resource connnector、 LSF Connector for Kubernetes |
⭐⭐⭐ |
八 | LSF 扩展 | Extend LSF | ⭐⭐ |
九 | 最佳实践 | Best practices and tips | ⭐⭐⭐ |
十 | 经验建议 | ⭐⭐⭐ | |
十一 | 拓展延伸 | ⭐⭐ | |
十二 | 资源分享 | ⭐⭐ |
鉴于作者水平精力有限,出现错误纰漏之处在所难免,希望读者不吝批评指正。如果有任何意见或建议,请发 issues 联系。
如果想共同参与项目更新,或有独到的使用经验或资源等希望分享,欢迎 fork 与 PRs,共同践行开源理念,谢谢!
基于 IBM Spectrum LSF 10.1.0 官方文档。
本站点采用知识共享署名-非商业性使用 4.0 国际许可协议进行许可。