Skip to content

v0.9.4.9

Latest

Choose a tag to compare

@github-actions github-actions released this 23 Jun 12:06
· 1 commit to master since this release

🚀 Release Notes

⚠️ 重要提示:重要数据请不要留在 Easy Chat 中;更新前请备份 cache/ 目录,重点关注 easy-chat 目录。如果是老版本的 JSON 格式聊天记录,还可以在里面找到;bin 文件则无法直接查看,请务必不要将重要数据放在 Easy Chat 中。万一真的丢失了重要数据,可以联系我帮忙找回,或者自行使用 AI 工具,了解 bin 文件结构,找回内容。所以记得备份!

⚠️ IMPORTANT: Do not store important data in Easy Chat. Please back up the entire cache/ directory before upgrading, especially the easy-chat/ subdirectory. Old JSON-format chat records can still be viewed, but .bin files are not human-readable. If you lose important data, contact me for help, or use AI tools to understand the .bin file structure and recover the content. Backup now!

📦 基础版本

  • 仅包含编译后的 class 文件和依赖库,不包含 JRE 和 llama.cpp
  • 需要系统已安装 Java 21+ 运行环境
  • 平台无关,Linux/Windows 通用

📦 完整版本(内置 JRE)

  • 编译后的 class 文件
  • 所有依赖库(lib/*.jar)
  • 精简版 JRE 26.0.1(内置,无需额外安装 Java 运行环境)
  • 启动脚本(run.sh / run.bat)

🧩 llama.cpp 版本

  • 本项目中打包的 llamacpp 二进制来自 llama.cpp 项目的 Release(最新版本发布页:https://github.com/ggml-org/llama.cpp/releases/latest)
  • Linux Vulkan: b9769
  • Linux ROCm 7.2: b9769
  • Windows CUDA12: b9769
  • Windows CUDA13: b9769
  • Windows Vulkan: b9769
  • Windows HIP: b9769

📦 可用版本

平台无关(需系统 Java 21+):

  • llama.cpp-hub-v0.9.4.9.zip

Linux:

  • llama.cpp-hub-v0.9.4.9-b9769-linux-rocm-7.2.zip
  • llama.cpp-hub-v0.9.4.9-b9769-linux-vulkan.zip
  • llama.cpp-hub-v0.9.4.9-linux.zip

Windows:

  • llama.cpp-hub-v0.9.4.9-b9769-windows-cuda12.zip
  • llama.cpp-hub-v0.9.4.9-b9769-windows-cuda13.zip
  • llama.cpp-hub-v0.9.4.9-b9769-windows-hip.zip
  • llama.cpp-hub-v0.9.4.9-b9769-windows-vulkan.zip
  • llama.cpp-hub-v0.9.4.9-windows.zip

📝 使用方法

Linux:

unzip <你下载的 linux zip 包>
cd <解压后的目录>
chmod +x run.sh
chmod +x jre/bin/java
./run.sh

Windows:

unzip <你下载的 windows zip 包>
cd <解压后的目录>
run.bat

注意:

  • 升级前请先备份 cache/ 目录
  • Back up the cache/ directory before upgrading.
  • 本版本已内置精简版 JRE,无需额外安装 Java 环境。
  • Windows CUDA 版本文件较大,是因为使用了 cudart 包,包含了 CUDA 运行环境。
  • 请根据你的 GPU 选择对应的版本:
    • NVIDIA GPU: 使用 cuda12 或 cuda13 版本
    • AMD GPU: 使用 hip 版本,Linux系统,AI MAX+ 395(或其它ROCm7.2支持的GPU)可以使用ROCm7.2版本
    • 其他 GPU(如核显) 或不确定: 使用 vulkan 版本
    • 不需要llamacpp:使用无 llamacpp 版本

⚠️ JVM 内存配置 / JVM Memory Configuration

本应用是轻量级 HTTP 服务器,默认分配 128MB 内存。
模型由外部 llama.cpp 进程加载,不占用此 JVM 内存。

This is a lightweight HTTP server with 128MB default memory.
Models are loaded by external llama.cpp processes, not this JVM.

💡 作者的话 / Author's Note: 我不想浪费兄弟们的内存,就设置个 128MB 又不是不能用!
真出问题了再改大,然后告诉我是怎么不够用的吧!
I don't want to waste everyone's memory - 128MB works just fine!
If you really run into issues, increase it and let me know what went wrong!


📌 最新提交

2cf490b - 修复:潜在BUG,允许自启动的状态没有正确同步,导致某些场合下无法从API获取到可使用的模型 (IIIIIllllIIIIIlllll, 8 minutes ago)

📋 自上次发布以来的变更

  • 修复:潜在BUG,允许自启动的状态没有正确同步,导致某些场合下无法从API获取到可使用的模型 (2cf490b)
  • 增加:可以在EasyChat的模型列表里加载/停止模型了 (ebbbf6c)

构建时间: 2026-06-23 12:06:49 UTC