audio-captioning

Star

Here are 17 public repositories matching this topic...

TheoCoombes / ClipCap

Star

Using pretrained encoder and language models to generate captions from multimedia inputs.

vqa image-captioning language-model encoder-decoder audio-captioning vision-transformer

Updated Mar 11, 2023
Python

Labbeti / aac-datasets

Star

Audio Captioning datasets for PyTorch.

audio deep-learning pytorch dataset caption datasets captioning audio-captioning

Updated Jun 14, 2024
Python

audio-captioning / clotho-dataset

Star

Python code for handling the Clotho dataset.

audio natural-language-processing deep-learning audio-signal-processing captioning audio-captioning clotho-dataset

Updated Nov 24, 2020
Python

ilaria-manco / song-describer

Star

Song Describer is a data collection platform for annotating music with textual descriptions.

annotations data-collection audio-captioning music-dataset

Updated May 28, 2024
Python

an-tran528 / wavetransformer

Star

Code base for WaveTransformer: A novel architecture for automated audio captioning

audio-captioning

Updated Mar 1, 2021
Python

audio-captioning / dcase-2020-baseline

Star

Audio captioning baseline system for DCASE 2020 challenge.

machine-learning deep-neural-networks deep-learning signal-processing audio-signal-processing captioning dcase machine-listening audio-captioning dcase2020

Updated Aug 22, 2023
Python

Labbeti / aac-metrics

Star

Metrics for evaluating Automated Audio Captioning systems, designed for PyTorch.

audio metrics text captioning audio-captioning

Updated Jun 28, 2024
Python

lukewys / dcase_2020_T6

Star

2nd place solution for 2020 DCASE challenge task 6 audio captioning. http://dcase.community/challenge2020/task-automatic-audio-captioning-results#wuyusong2020_t6

deep-learning audio-captioning

Updated Aug 3, 2023
Python

blmoistawinde / fense

Star

Fluency ENhanced Sentence-bert Evaluation (FENSE), metric for audio caption evaluation. And Benchmark dataset AudioCaps-Eval, Clotho-Eval.

benchmark evaluation-metrics audio-captioning audiocaption

Updated Feb 1, 2023
Python

Labbeti / conette-audio-captioning

Star

CoNeTTE: An efficient Audio Captioning system leveraging multiple datasets with Task Embedding

audio-captioning automated-audio-captioning

Updated Jun 10, 2024
Python

Sreyan88 / RECAP

Star

Code for ICASSP 2024 Paper: RECAP: Retrieval-Augmented Audio Captioning

audio nlp ai ml clap audio-processing rag audio-captioning retreival generative-ai

Updated Jun 23, 2024
Python

paniquex / Automated_Audio_Captioning_DCASE2020

Star

6-th task solution of DCASE2020

audio gru attention audio-processing mixup audio-captioning

Updated Jun 22, 2022
Python

audio-captioning / clotho-dataloader

Star

PyTorch dataloader for Clotho dataset.

pytorch dataloader audio-captioning clotho-dataset

Updated Mar 30, 2020
Python

dr-costas / clotho-baseline-dataset

Star

Code for using with the Clotho dataset

audio dataset zenodo machine-listening audio-captioning

Updated Dec 24, 2019
Python

Labbeti / dcase2024-task6-baseline

Star

DCASE2024 Challenge Task 6 baseline system (Automated Audio Captioning)

baseline audio-captioning dcase2024

Updated Apr 19, 2024
Python

zelaki / wsac

Star

This reporsitory code form Weakly Supervised Automaed Audio Captioning via Text Only Training

clap audio-captioning dcase2023

Updated Jun 12, 2023
Python

Labbeti / dcase2021task6

Star

IRIT-UPS DCASE 2021 AUDIO CAPTIONING SYSTEM

machine-learning deep-learning dcase audio-captioning dcase2021 dcase2021task6

Updated Jul 5, 2021
Python

Improve this page

Add a description, image, and links to the audio-captioning topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the audio-captioning topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

audio-captioning

Here are 17 public repositories matching this topic...

TheoCoombes / ClipCap

Labbeti / aac-datasets

audio-captioning / clotho-dataset

ilaria-manco / song-describer

an-tran528 / wavetransformer

audio-captioning / dcase-2020-baseline

Labbeti / aac-metrics

lukewys / dcase_2020_T6

blmoistawinde / fense

Labbeti / conette-audio-captioning

Sreyan88 / RECAP

paniquex / Automated_Audio_Captioning_DCASE2020

audio-captioning / clotho-dataloader

dr-costas / clotho-baseline-dataset

Labbeti / dcase2024-task6-baseline

zelaki / wsac

Labbeti / dcase2021task6

Improve this page

Add this topic to your repo