Release v0.9.4.9 · IIIIIllllIIIIIlllll/llama.cpp-hub

🚀 Release Notes

⚠️ 重要提示：重要数据请不要留在 Easy Chat 中；更新前请备份 cache/ 目录，重点关注 easy-chat 目录。如果是老版本的 JSON 格式聊天记录，还可以在里面找到；bin 文件则无法直接查看，请务必不要将重要数据放在 Easy Chat 中。万一真的丢失了重要数据，可以联系我帮忙找回，或者自行使用 AI 工具，了解 bin 文件结构，找回内容。所以记得备份！

⚠️ IMPORTANT: Do not store important data in Easy Chat. Please back up the entire cache/ directory before upgrading, especially the easy-chat/ subdirectory. Old JSON-format chat records can still be viewed, but .bin files are not human-readable. If you lose important data, contact me for help, or use AI tools to understand the .bin file structure and recover the content. Backup now!

📦 基础版本

仅包含编译后的 class 文件和依赖库，不包含 JRE 和 llama.cpp
需要系统已安装 Java 21+ 运行环境
平台无关，Linux/Windows 通用

📦 完整版本（内置 JRE）

编译后的 class 文件
所有依赖库（lib/*.jar）
精简版 JRE 26.0.1（内置，无需额外安装 Java 运行环境）
启动脚本（run.sh / run.bat）

🧩 llama.cpp 版本

本项目中打包的 llamacpp 二进制来自 llama.cpp 项目的 Release（最新版本发布页：https://github.com/ggml-org/llama.cpp/releases/latest）
Linux Vulkan: b9769
Linux ROCm 7.2: b9769
Windows CUDA12: b9769
Windows CUDA13: b9769
Windows Vulkan: b9769
Windows HIP: b9769

📦 可用版本

平台无关（需系统 Java 21+）:

llama.cpp-hub-v0.9.4.9.zip

Linux:

llama.cpp-hub-v0.9.4.9-b9769-linux-rocm-7.2.zip
llama.cpp-hub-v0.9.4.9-b9769-linux-vulkan.zip
llama.cpp-hub-v0.9.4.9-linux.zip

Windows:

llama.cpp-hub-v0.9.4.9-b9769-windows-cuda12.zip
llama.cpp-hub-v0.9.4.9-b9769-windows-cuda13.zip
llama.cpp-hub-v0.9.4.9-b9769-windows-hip.zip
llama.cpp-hub-v0.9.4.9-b9769-windows-vulkan.zip
llama.cpp-hub-v0.9.4.9-windows.zip

📝 使用方法

Linux:

unzip <你下载的 linux zip 包>
cd <解压后的目录>
chmod +x run.sh
chmod +x jre/bin/java
./run.sh

Windows:

unzip <你下载的 windows zip 包>
cd <解压后的目录>
run.bat

注意：

升级前请先备份 cache/ 目录。
Back up the cache/ directory before upgrading.
本版本已内置精简版 JRE，无需额外安装 Java 环境。
Windows CUDA 版本文件较大，是因为使用了 cudart 包，包含了 CUDA 运行环境。
请根据你的 GPU 选择对应的版本：
- NVIDIA GPU: 使用 cuda12 或 cuda13 版本
- AMD GPU: 使用 hip 版本，Linux系统，AI MAX+ 395（或其它ROCm7.2支持的GPU）可以使用ROCm7.2版本
- 其他 GPU（如核显）或不确定: 使用 vulkan 版本
- 不需要llamacpp：使用无 llamacpp 版本

⚠️ JVM 内存配置 / JVM Memory Configuration

本应用是轻量级 HTTP 服务器，默认分配 128MB 内存。
模型由外部 llama.cpp 进程加载，不占用此 JVM 内存。

This is a lightweight HTTP server with 128MB default memory.
Models are loaded by external llama.cpp processes, not this JVM.

💡 作者的话 / Author's Note: 我不想浪费兄弟们的内存，就设置个 128MB 又不是不能用！
真出问题了再改大，然后告诉我是怎么不够用的吧！
I don't want to waste everyone's memory - 128MB works just fine!
If you really run into issues, increase it and let me know what went wrong!

📌 最新提交

2cf490b - 修复：潜在BUG，允许自启动的状态没有正确同步，导致某些场合下无法从API获取到可使用的模型 (IIIIIllllIIIIIlllll, 8 minutes ago)

📋 自上次发布以来的变更

修复：潜在BUG，允许自启动的状态没有正确同步，导致某些场合下无法从API获取到可使用的模型 (2cf490b)
增加：可以在EasyChat的模型列表里加载/停止模型了 (ebbbf6c)

构建时间: 2026-06-23 12:06:49 UTC

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

v0.9.4.9

Choose a tag to compare

Sorry, something went wrong.