sync : ggml (ggml_scale, ggml_row_size, etc.) #1677

ggerganov · 2023-12-22T09:40:39Z

No description provided.

ggerganov · 2023-12-22T10:01:15Z

ggml-alloc.c

@@ -449,11 +449,10 @@ static void init_view(ggml_gallocr_t galloc, struct ggml_tensor * view, bool upd
    if (update_backend) {
        view->backend = view->view_src->backend;
    }
-    view->buffer  = view->view_src->buffer;
+    // views are initialized in the alloc buffer rather than the view_src buffer
+    view->buffer  = alloc->buffer;


@slaren After the sync, the following command produces incorrect transcription:

make samples make -j && ./main -m ./models/ggml-medium.en.bin -f ./samples/gb0.wav

Reverting just this line fixes the issue. Any guess what this could be related to?
Maybe something is incompatible with the whisper_allocr_graph_realloc logic

I think it is because this change interferes with auto-inline logic. This should fix it:

diff --git a/ggml-alloc.c b/ggml-alloc.c index a97436b..a27dd54 100644 --- a/ggml-alloc.c +++ b/ggml-alloc.c @@ -72,7 +72,7 @@ static void remove_allocated_tensor(ggml_tallocr_t alloc, struct ggml_tensor * t // check if a tensor is allocated by this buffer static bool ggml_tallocr_is_own(ggml_tallocr_t alloc, const struct ggml_tensor * tensor) { - return tensor->buffer == alloc->buffer; + return tensor->buffer == alloc->buffer && (!tensor->view_src || tensor->view_src->buffer == alloc->buffer); } static bool ggml_is_view(struct ggml_tensor * t) {

* ggerganov/master: whisper : Replace WHISPER_PRINT_DEBUG with WHISPER_LOG_DEBUG (ggerganov#1681) sync : ggml (ggml_scale, ggml_row_size, etc.) (ggerganov#1677) docker : Dockerize whisper.cpp (ggerganov#1674) CI : Add coverage for talk-llama when WHISPER_CUBLAS=1 (ggerganov#1672) examples : Revert CMakeLists.txt for talk-llama (ggerganov#1669) cmake : set default CUDA architectures (ggerganov#1667)

* sync : ggml * sync : llama.cpp * talk-llama : fix obsolete param * ggml-alloc : fix ggml_tallocr_is_own * talk.wasm : update to new ggml * ggml : fix type punning in ggml_scale * ggml : cuda jetson + arm quants warnings

sync : ggml

8e5cf73

ggerganov mentioned this pull request Dec 22, 2023

sync : llama.cpp (ggml_scale, ggml_row_size, ggml_mul_mat_set_prec) ggerganov/ggml#662

Merged

ggerganov commented Dec 22, 2023

View reviewed changes

ggerganov added 4 commits December 22, 2023 12:09

sync : llama.cpp

108769a

talk-llama : fix obsolete param

16f847f

ggml-alloc : fix ggml_tallocr_is_own

122be77

talk.wasm : update to new ggml

f0b7663

ggerganov marked this pull request as ready for review December 22, 2023 11:06

ggerganov changed the title ~~sync : ggml~~ sync : ggml (ggml_scale, ggml_row_size, etc.) Dec 22, 2023

ggerganov added 2 commits December 22, 2023 13:20

ggml : fix type punning in ggml_scale

534c0d3

ggml : cuda jetson + arm quants warnings

a86a7d2

ggerganov merged commit 3a53021 into master Dec 22, 2023
74 checks passed

ggerganov deleted the sync branch December 22, 2023 15:54

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

sync : ggml (ggml_scale, ggml_row_size, etc.) #1677

sync : ggml (ggml_scale, ggml_row_size, etc.) #1677

ggerganov commented Dec 22, 2023 •

edited

ggerganov Dec 22, 2023

slaren Dec 22, 2023 •

edited

sync : ggml (ggml_scale, ggml_row_size, etc.) #1677

sync : ggml (ggml_scale, ggml_row_size, etc.) #1677

Conversation

ggerganov commented Dec 22, 2023 • edited

ggerganov Dec 22, 2023

Choose a reason for hiding this comment

slaren Dec 22, 2023 • edited

Choose a reason for hiding this comment

ggerganov commented Dec 22, 2023 •

edited

slaren Dec 22, 2023 •

edited