diarization

Here are 91 public repositories matching this topic...

Purfview / whisper-standalone-win

Whisper & Faster-Whisper standalone executables for those who don't want to bother with Python.

subtitles speech-recognition openai speech-to-text whisper asr speaker-diarization uvr transcriber diarization faster-whisper ctranslate2 whisperx whisper-faster vocal-extractor

Updated Apr 20, 2025

R3gm / SoniTranslate

Star

Synchronized Translation for Videos. Video dubbing

text-to-speech translation tts speech-to-text stt audio-processing asr document-translator dubbing diarization automatic-dubbing subtitle-to-speech translate-audio translate-video video-dubbing

Updated Jan 30, 2025
Python

transcriptionstream / transcriptionstream

Star

turnkey self-hosted offline transcription and diarization service with llm summary

automation speech-recognition transcription whisper speaker-diarization diarization llm whisperx ollama mistral-7b

Updated Sep 25, 2024
Python

microsoft / UniSpeech

Star

UniSpeech - Large Scale Self-Supervised Learning for Speech

speech pytorch speech-recognition speaker-verification speech-processing speech-separation diarization speech-diarization

Updated Apr 5, 2024
Python

revdotcom / reverb

Star

Open source inference code for Rev's model

docker open-source opensource neural-network canary speech-recognition deeplearning speech-to-text whisper rev asr speaker-diarization speechrecognition asr-model diarization huggingface revai pyannote wenet

Updated Apr 22, 2025
Python

gong-io / gecko

Star

Gecko - A Tool for Effective Annotation of Human Conversations

transcription voice-detection diarization human-conversations annotating-files

Updated Mar 15, 2023
JavaScript

thewh1teagle / sherpa-rs

Sponsor

Star

Rust bindings to https://github.com/k2-fsa/sherpa-onnx

audio rust embeddings speech-recognition sherpa diarization

Updated May 14, 2025
Rust

SuyashMore / MevonAI-Speech-Emotion-Recognition

Star

Identify the emotion of multiple speakers in an Audio Segment

machine-learning deep-learning artificial-intelligence convolutional-neural-networks mfcc emotion-analysis speech-processing keras-tensorflow emotion-recognition colab-notebook mfcc-analysis uis-rnn diarization

Updated Feb 12, 2023
C

cvqluu / simple_diarizer

Star

Simplified diarization pipeline using some pretrained models - audio file to diarized segments in a few lines of code

speech-to-text transcription asr speaker-diarization colab-notebook diarization

Updated May 2, 2024
Python

desh2608 / dover-lap

Star

Python package for combining diarization system outputs.

ensemble-machine-learning diarization dover-lap

Updated Oct 12, 2023
Python

bunyaminergen / Callytics

Star

Callytics is an advanced call analytics solution that leverages speech recognition and large language models (LLMs) technologies to analyze phone conversations from customer service and call centers.

opensource sentiment-analysis voice-recognition speech-recognition openai topic-modeling summary speech-to-text transcription speech-processing forced-alignment denoising voice-activity-detection speech-emotion-recognition diarization llm llama3

Updated Apr 7, 2025
Python

thewh1teagle / pyannote-rs

Sponsor

Star

pyannote audio diarization in rust

rust speech-recognition whisper asr diarization onnxruntime

Updated Dec 13, 2024
Rust

wq2012 / SimpleDER

Star

A lightweight library to compute Diarization Error Rate (DER).

machine-learning metrics speech-recognition speech-processing speaker-diarization diarization

Updated Aug 28, 2023
Python

JSchmie / ScrAIbe

Star

Tool for automatic transcription and speaker diarization based on whisper and pyannote.

speech-to-text transcription diarization

Updated Jan 20, 2025
Python

Picovoice / falcon

Star

On-device speaker diarization powered by deep learning

deep-learning speaker-recognition speaker-diarization on-device diarization

Updated May 8, 2025
Python

cvqluu / nn-similarity-diarization

Star

Neural network based similarity scoring for diarization (pytorch implementation of "LSTM based Similarity Measurement with Spectral Clustering for Speaker Diarization")

neural-network speech pytorch similarity lstm kaldi speaker-recognition similarity-score speaker-diarization diarization