Sync master with upstream release b6907 #310

jan-service-account · 2025-11-01T00:37:59Z

Updates dev branch with latest release (b6907) from ggml-org/llama.cpp

* Update requirements-convert_legacy_llama.txt Updated requirements to support Qwen3-VL in transformers 4.57.1 version * Update requirements/requirements-convert_legacy_llama.txt Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> --------- Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

…ml-org#16836) * respect input size when getting/setting tensor data allows partial repacking/copying when get tensor size is smaller than the actual tensor * Removed duplicate repack_mxfp4_mxfp4x4x2 function

* vulkan: fix shmem overrun in mmq id shader * metal : fix mul_mm_id --------- Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

…ml-org#16796) * Experimenting crash fix * added assert for aborting and fixed comment * changed to check if a pipeline is empty or not * Moved function in class definition * replaced with is_empty * Modified is_empty to check only unaligned pipelines

* CUDA: add expert reduce kernel * contigous checks, better formatting, use std::vector instead of array * use vector empty instead of size Co-authored-by: Johannes Gäßler <johannesg@5d6.de> --------- Co-authored-by: Johannes Gäßler <johannesg@5d6.de>

* CUDA: Volta tensor core support for MMF * more generic checks for hardware support * Update ggml/src/ggml-cuda/mmf.cuh Co-authored-by: Aman Gupta <amangupta052@gmail.com> --------- Co-authored-by: Aman Gupta <amangupta052@gmail.com>

Signed-off-by: Giuseppe Scrivano <gscrivan@redhat.com>

* Model: Minimax M2 * Cleanup * Cleanup pt. 2 * Cleanup pt. 3 * Update convert_hf_to_gguf_update.py - merge catch blocks Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> * Remove vocab models and test * Remove all redundant hparam settings covered by TextModel * Move super to start, don't set block_count * Update src/llama-model.cpp Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> * Update gguf-py/gguf/constants.py Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> --------- Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

* Sqashed: llama-model.cpp refactoring * Fix formatting of attn / ffn / ffn_moe calls * Fix import regression / unify spacing in models.h * totally DID NOT miss those! * Add missing qwen3vl(moe) models * Add missing new .cpp files to build * Remove extra semicolons * Editor checker * Update src/models/models.h Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com> --------- Co-authored-by: Sigbjørn Skjæret <sigbjorn.skjaeret@scala.com>

RodriMora and others added 16 commits October 30, 2025 23:15

opencl: fix boundary handling for mul_mm (ggml-org#16875)

9984cbb

ci : enable free-disk-space on cuda docker build (ggml-org#16877)

6eb208d

ggml-hexagon: respect input size when getting/setting tensor data (gg…

13002a0

…ml-org#16836) * respect input size when getting/setting tensor data allows partial repacking/copying when get tensor size is smaller than the actual tensor * Removed duplicate repack_mxfp4_mxfp4x4x2 function

vulkan: fix shmem overrun in mmq id shader (ggml-org#16873)

d2a2673

* vulkan: fix shmem overrun in mmq id shader * metal : fix mul_mm_id --------- Co-authored-by: Georgi Gerganov <ggerganov@gmail.com>

vulkan: disable spirv-opt for rope shaders (ggml-org#16872)

d2d931f

server : fix typos in server.cpp comments [no ci] (ggml-org#16883)

0f715b4

server : don't print user inputs to console (ggml-org#16871)

c22473b

batch : fix consistency checks for the input positions (ggml-org#16890)

8da3c0e

sync : ggml

6d39015

model : add Granite Hybrid nano types (ggml-org#16896)

e58d585

Signed-off-by: Giuseppe Scrivano <gscrivan@redhat.com>

jan-service-account merged commit 5a4d7c2 into dev Nov 1, 2025
3 checks passed

jan-service-account deleted the update-dev-from-master-2025-11-01-00-37 branch November 1, 2025 00:39

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Sync master with upstream release b6907 #310

Sync master with upstream release b6907 #310

Uh oh!

jan-service-account commented Nov 1, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

15 participants

Sync master with upstream release b6907 #310

Sync master with upstream release b6907 #310

Uh oh!

Conversation

jan-service-account commented Nov 1, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

15 participants