Support computing features for whisper #82

csukuangfj · 2023-11-08T11:13:33Z

Usage

import torchaudio
import torch
import kaldifeat

def compute_features(filename: str) -> torch.Tensor:
    """
    Args:
      filename:
        Path to an audio file.
    Returns:
      Return a 3-D float32 tensor of shape (1, 80, 3000) containing the features.
    """
    wave, sample_rate = torchaudio.load(filename)
    audio = wave[0].contiguous()  # only use the first channel
    if sample_rate != 16000:
        audio = torchaudio.functional.resample(
            audio, orig_freq=sample_rate, new_freq=16000
        )

    opts = kaldifeat.WhisperFbankOptions(device="cpu")
    whisper_fbank = kaldifeat.WhisperFbank(opts)
    features = whisper_fbank(audio)  # [num_frames, 80]

    # we need to pad it to [3000, 80]
    pad = 3000 - features.shape[0]
    if pad > 0:
        features = torch.nn.functional.pad(features, (0, 0, 0, pad), "constant", 0)
    else:
        features = features[:3000]

    features = features.t()
    # now features is [80, 3000]
    return features.unsqueeze(0)  # [1, 80, 3000]

csukuangfj added 3 commits November 8, 2023 19:00

Support computing features for whisper models

f076ef4

Release v1.25.2

4e79413

fix style issues

dbd9e8d

csukuangfj merged commit 01aed93 into master Nov 8, 2023
5 of 35 checks passed

csukuangfj deleted the support-whisper branch November 8, 2023 11:23

xingchensong mentioned this pull request Nov 22, 2023

feat(whisper): support whisper arch wenet-e2e/wenet#2141

Merged

9 tasks

xingchensong mentioned this pull request Jan 24, 2024

Whisper inference support in cpp runtime wenet-e2e/wenet#2320

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Support computing features for whisper #82

Support computing features for whisper #82

csukuangfj commented Nov 8, 2023 •

edited

Support computing features for whisper #82

Support computing features for whisper #82

Conversation

csukuangfj commented Nov 8, 2023 • edited

Usage

csukuangfj commented Nov 8, 2023 •

edited