Implement vggish by yuki399 · Pull Request #1061 · ailia-ai/ailia-models

yuki399 · 2023-03-02T19:32:59Z

kyakuno · 2023-03-23T03:53:10Z

モデルアップロード済み。
https://storage.googleapis.com/ailia-models/vggish/vggish.onnx

kyakuno · 2023-03-23T06:41:06Z

audio_processing/vggish/vggish.py

+    else:
+        wav_data = librosa.load(input_path, sr=SAMPLE_RATE)[0]
+
+    samples = wav_data / 32768.0  # Convert to [-1.0, +1.0]


librosaの段階で-1.0 - +1.0に正規化されているのを、さらに/32768.0で小さくしているように見えます。

kyakuno · 2023-03-23T06:41:43Z

audio_processing/vggish/vggish.py

+    savepath = get_savepath(args.savepath, input_path)
+    logger.info(f'saved at : {savepath}')
+
+    np.save(savepath, result)


torchで計算したfeatureをnumpyで保存しておいて、誤差をprintしていただければと思います。

kyakuno · 2024-03-04T09:01:29Z

@yuki399 こちらも対応検討、お願いします。

yuki399 · 2024-03-12T21:34:56Z

指摘に関して修正しました

# Conflicts: # README.md # scripts/download_all_models.sh

kyakuno · 2025-01-02T01:38:54Z

入力の時間方向がStatic Shapeで19に固定されているので、音声の長さが19でない場合にReshapeでエラーになる。

kyakuno · 2025-01-02T01:39:34Z

@yuki399 入力のバッチサイズをDynamicShapeでエクスポートして、音声の長さが異なる場合も処理可能にできますでしょうか？

kyakuno · 2025-01-02T01:40:27Z

また、--inputに複数のファイルを与えた場合に、それぞれのファイルでEmbeddingを計算し、ファイル同士の距離をprintできればと思います。

yuki added 2 commits March 3, 2023 04:31

Implement vggish

4908f67

fix script/download_all_models.sh and README

6341ce4

kyakuno added 2 commits March 23, 2023 15:33

Update required ailia version

62c9826

Fix ailia audio error

175178e

kyakuno reviewed Mar 23, 2023

View reviewed changes

kyakuno added the waiting_enhancement label Mar 23, 2023

Removal of normalization and addition of error display

fe7b9a0

kyakuno removed the waiting_enhancement label Jan 1, 2025

kyakuno added 3 commits January 2, 2025 10:25

Merge branch 'master' into vggish

271aad2

# Conflicts: # README.md # scripts/download_all_models.sh

Fix import

f5e0d75

Fix usage

2dcd8fe

kyakuno added the waiting_enhancement label Jan 2, 2025

kyakuno closed this Apr 19, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Comments

Implement vggish#1061

Implement vggish#1061
yuki399 wants to merge 8 commits intomasterfrom
vggish

yuki399 commented Mar 2, 2023

Uh oh!

kyakuno commented Mar 23, 2023

Uh oh!

kyakuno Mar 23, 2023

Uh oh!

kyakuno Mar 23, 2023

Uh oh!

kyakuno commented Mar 4, 2024

Uh oh!

yuki399 commented Mar 12, 2024

Uh oh!

kyakuno commented Jan 2, 2025

Uh oh!

kyakuno commented Jan 2, 2025

Uh oh!

kyakuno commented Jan 2, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Comments

Conversation

yuki399 commented Mar 2, 2023

Uh oh!

kyakuno commented Mar 23, 2023

Uh oh!

kyakuno Mar 23, 2023

Choose a reason for hiding this comment

Uh oh!

kyakuno Mar 23, 2023

Choose a reason for hiding this comment

Uh oh!

kyakuno commented Mar 4, 2024

Uh oh!

yuki399 commented Mar 12, 2024

Uh oh!

kyakuno commented Jan 2, 2025

Uh oh!

kyakuno commented Jan 2, 2025

Uh oh!

kyakuno commented Jan 2, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants