Deploy-GLM-on-Android

借助开源项目executorch，在Android上部署GLM-Edge-1.5B-Chat模型.

效果展示

glm-edge-1.5B-chat-xnnpack_20241227_20140735.mp4

部署思路

executorch能够在Android上部署LLAMA模型，参考下列链接一步一步执行即可。两个链接对运行环境的要求不同，它们都可以成功在Android上部署LLAMA模型

由于GLM-Edge-1.5B-Chat的模型结构与LLAMA的模型结构相似，我们可以复用executorch部署LLAMA模型的代码，部署GLM-Edge-1.5B-Chat模型。只需要解决下列挑战：

将GLM-Edge-1.5B-Chat模型权重转换为LLAMA模型权重
将GLM-Edge-1.5B-Chat的tokenizer.json转换成tokenizer.model

GLM-Edge-1.5B-Chat的使用huggingface transformers的tokenizer，其词表存储在tokenizer.json中。而executorch使用基于tiktoken的tokenizer，其词表存储在tokenizer.model中
修改executorch的代码，增加GLM-Edge-1.5B-Chat的ChatTemplate
- cpp代码https://github.com/pytorch/executorch/blob/6a085fff7f78cb51443d97a827503acc6ae28e3c/examples/models/llama2/tokenizer/llama_tiktoken.cpp#L21 中硬编码了special tokens
- java代码https://github.com/pytorch/executorch/blob/6a085fff7f78cb51443d97a827503acc6ae28e3c/examples/demo-apps/android/LlamaDemo/app/src/main/java/com/example/executorchllamademo/PromptFormat.java#L18-L63 中硬编码了chat template

部署方法1（二选一）：全流程的编译、转换、部署

有空再更新

部署方法2（二选一）：下载转换好的模型和预编译好的aar

下载转换好的模型
- xnnpack: https://huggingface.co/wandz/glm-edge-1.5B-xnnpack
- qnn: to-be-continued

将模型传到手机上

adb shell mkdir -p /data/local/tmp/llama
adb push ./glm-edge-1.5B-xnnpack/glm_edge_1.5B_xnnpack.pte /data/local/tmp/llama
adb push ./glm-edge-1.5B-xnnpack/glm_edge_tokenizer.model /data/local/tmp/llama

注意:

手机要开启开发者模式
需要安装adb，参考https://developer.android.com/tools/adb?hl=zh-cn

将./prebuilt_libs/xnnpack/executorch-llama.aar复制到./LlamaDemo/app/libs目录下
编译java项目

用Android Studio打开./LlamaDemo目录，运行app(^R) 。 Android Studio将完成编译，并在手机上安装app（可以操作手机，同意安装）

参考https://github.com/pytorch/executorch/blob/v0.4.0/examples/demo-apps/android/LlamaDemo/docs/delegates/xnnpack_README.md#run-the-android-demo-app

项目文件说明

LlamaDemo: 基于https://github.com/pytorch/executorch/tree/v0.4.0/examples/demo-apps/android/LlamaDemo做了修改, 增加了GLM模型的ChatTemplate
prebuilt_libs: 我预先编译好的executorch-llama.aar

TODO

[] 全流程的部署方式
[] qnn部署方式
[] 将修改的代码提交到executorch，而不是复制一份LlamaDemo

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
LlamaDemo		LlamaDemo
prebuilt_libs/xnnpack		prebuilt_libs/xnnpack
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Deploy-GLM-on-Android

效果展示

部署思路

部署方法1（二选一）：全流程的编译、转换、部署

部署方法2（二选一）：下载转换好的模型和预编译好的aar

项目文件说明

TODO

About

Uh oh!

Releases

Packages

Languages

License

aaa123git/Deploy-GLM-on-Android

Folders and files

Latest commit

History

Repository files navigation

Deploy-GLM-on-Android

效果展示

部署思路

部署方法1（二选一）：全流程的编译、转换、部署

部署方法2（二选一）：下载转换好的模型和预编译好的aar

项目文件说明

TODO

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages