demtmeder

Yixuan Lin demtmeder

Grad student in Shanghai. Multimodal / speech / vision foundation models. Half my repos exist because debugging was easier than writing the bug report.

Shanghai Jiao Tong University
Shanghai, China

Achievements

Popular repositories Loading

audio-vis-align audio-vis-align Public

Training and evaluation toolkit for audio-visual contrastive representation alignment (CLIP-style, but for audio + video).

Python 92
mllm-playground mllm-playground Public

A Gradio-based interactive playground for poking at multimodal LLMs — compare outputs side-by-side, swap prompts, inspect attention.

Python
demtmeder demtmeder Public

Profile README

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Yixuan Lin demtmeder

Achievements

Achievements

Block or report demtmeder

Popular repositories Loading

Uh oh!