🚀 Release Notes
⚠️ 重要提示:重要数据请不要留在 Easy Chat 中;更新前请备份cache/目录,重点关注easy-chat目录。如果是老版本的 JSON 格式聊天记录,还可以在里面找到;bin 文件则无法直接查看,请务必不要将重要数据放在 Easy Chat 中。万一真的丢失了重要数据,可以联系我帮忙找回,或者自行使用 AI 工具,了解 bin 文件结构,找回内容。所以记得备份!
⚠️ IMPORTANT: Do not store important data in Easy Chat. Please back up the entirecache/directory before upgrading, especially theeasy-chat/subdirectory. Old JSON-format chat records can still be viewed, but.binfiles are not human-readable. If you lose important data, contact me for help, or use AI tools to understand the.binfile structure and recover the content. Backup now!
📦 基础版本
- 仅包含编译后的 class 文件和依赖库,不包含 JRE 和 llama.cpp
- 需要系统已安装 Java 21+ 运行环境
- 平台无关,Linux/Windows 通用
📦 完整版本(内置 JRE)
- 编译后的 class 文件
- 所有依赖库(lib/*.jar)
- 精简版 JRE 26.0.1(内置,无需额外安装 Java 运行环境)
- 启动脚本(run.sh / run.bat)
🧩 llama.cpp 版本
- 本项目中打包的 llamacpp 二进制来自 llama.cpp 项目的 Release(最新版本发布页:https://github.com/ggml-org/llama.cpp/releases/latest)
- Linux Vulkan: b9769
- Linux ROCm 7.2: b9769
- Windows CUDA12: b9769
- Windows CUDA13: b9769
- Windows Vulkan: b9769
- Windows HIP: b9769
📦 可用版本
平台无关(需系统 Java 21+):
llama.cpp-hub-v0.9.4.9.zip
Linux:
llama.cpp-hub-v0.9.4.9-b9769-linux-rocm-7.2.zipllama.cpp-hub-v0.9.4.9-b9769-linux-vulkan.zipllama.cpp-hub-v0.9.4.9-linux.zip
Windows:
llama.cpp-hub-v0.9.4.9-b9769-windows-cuda12.zipllama.cpp-hub-v0.9.4.9-b9769-windows-cuda13.zipllama.cpp-hub-v0.9.4.9-b9769-windows-hip.zipllama.cpp-hub-v0.9.4.9-b9769-windows-vulkan.zipllama.cpp-hub-v0.9.4.9-windows.zip
📝 使用方法
Linux:
unzip <你下载的 linux zip 包>
cd <解压后的目录>
chmod +x run.sh
chmod +x jre/bin/java
./run.shWindows:
unzip <你下载的 windows zip 包>
cd <解压后的目录>
run.bat注意:
- 升级前请先备份
cache/目录。 - Back up the
cache/directory before upgrading. - 本版本已内置精简版 JRE,无需额外安装 Java 环境。
- Windows CUDA 版本文件较大,是因为使用了
cudart包,包含了 CUDA 运行环境。 - 请根据你的 GPU 选择对应的版本:
- NVIDIA GPU: 使用 cuda12 或 cuda13 版本
- AMD GPU: 使用 hip 版本,Linux系统,AI MAX+ 395(或其它ROCm7.2支持的GPU)可以使用ROCm7.2版本
- 其他 GPU(如核显) 或不确定: 使用 vulkan 版本
- 不需要llamacpp:使用无 llamacpp 版本
⚠️ JVM 内存配置 / JVM Memory Configuration
本应用是轻量级 HTTP 服务器,默认分配 128MB 内存。
模型由外部 llama.cpp 进程加载,不占用此 JVM 内存。
This is a lightweight HTTP server with 128MB default memory.
Models are loaded by external llama.cpp processes, not this JVM.
💡 作者的话 / Author's Note: 我不想浪费兄弟们的内存,就设置个 128MB 又不是不能用!
真出问题了再改大,然后告诉我是怎么不够用的吧!
I don't want to waste everyone's memory - 128MB works just fine!
If you really run into issues, increase it and let me know what went wrong!
📌 最新提交
2cf490b - 修复:潜在BUG,允许自启动的状态没有正确同步,导致某些场合下无法从API获取到可使用的模型 (IIIIIllllIIIIIlllll, 8 minutes ago)
📋 自上次发布以来的变更
构建时间: 2026-06-23 12:06:49 UTC