audio-ai

Here are 8 public repositories matching this topic...

EmulationAI / awesome-large-audio-models

Collection of resources on the applications of Large Language Models (LLMs) in Audio AI.

music-information-retrieval automatic-speech-recognition speech-to-text audio-processing music-ai music-processing large-language-models foundational-models speech-ai audio-ai large-audio-models speech-llms large-language-model-speech

Updated Aug 3, 2024

kyegomez / AudioFlamingo

Sponsor

Star

Implementation of the model "AudioFlamingo" from the paper: "Audio Flamingo: A Novel Audio Language Model with Few-Shot Learning and Dialogue Abilities"

audio machine-learning ai ml artificial-intelligence transformer deeplearning attention-mechanism attention-model attention-is-all-you-need llm audio-ai

Updated Jan 27, 2025
Python

serp-ai / ai-text-to-audio-latent-diffusion

Sponsor

Star

text-to-audio-latent-diffusion

text-to-audio latent-diffusion audio-diffusion text-to-audio-ai latent-audio-diffusion audio-ai ai-audio-generation

Updated Aug 25, 2023
Python

ksasso1028 / audio-reverb-removal

Star

Code to train a custom time-domain autoencoder to dereverb audio

audio dsp pytorch autoencoder convolutional-neural-networks time-domain denoising-autoencoders denoising multi-task-learning dereverberation autoencoder-neural-network demucs audio-denoising audio-machine-learning audio-ml audio-ai convtasnet

Updated Nov 30, 2023
Python

aaivu / KuralNet

Star

A deep learning-based Speech Emotion Recognition (SER) model trained primarily on Indian languages. Designed for applications in call centers, sentiment analysis, and accessibility tools.