visual-speech-recognition

Visual speech recognition with face inputs: code and models for F&G 2020 paper "Can We Read Speech Beyond the Lips? Rethinking RoI Selection for Deep Visual Speech Recognition"

computer-vision pytorch lip-reading visual-speech-recognition speech-reading

Updated Apr 12, 2021
Python

Megamind22 / lstArab100words

Star

Deep Visual Speech Recognition in arabic words

computer-vision pytorch arabic lip-reading visual-speech-recognition

Updated Oct 18, 2023
Jupyter Notebook

YasserdahouML / VSR_test_set

Star

WildVSR

visual-speech-recognition

Updated Dec 13, 2023
Python

umbertocappellazzo / Llama-AVSR

Star

[ICASSP 2025] Official Pytorch implementation of "Large Language Models are Strong Audio-Visual Speech Recognition Learners".

audio-visual-speech-recognition visual-speech-recognition large-language-models

Updated Mar 10, 2025
Python

david-gimeno / tailored-avsr

Star

Official source code for the paper "Tailored Design of Audio-Visual Speech Recognition Models using Branchformers"

audio-visual-speech-recognition interpretability visual-speech-recognition lipreading robust-asr parameter-efficient

Updated Feb 24, 2025
Python

Saeed-Biabani / LipReading

Star

Visual Speech Recognition using deep learing methods

python pytorch visual-speech-recognition lipreading lipnet lipreading-pytorch

Updated Apr 7, 2024
Python

YasserdahouML / Lip2Vec

Star

Lip2Vec

visual-speech-recognition

Updated Dec 13, 2023
Python

manideep2510 / Lipreading-Keras

Star

Implementation of "Combining Residual Networks with LSTMs for Lipreading" in Keras and Tensorflow2.0

deep-learning keras lstm resnet visual-speech-recognition lipreading tensorflow2 lipreading-keras

Updated Nov 22, 2022
Python

Pooventhiran / VSR

Star

Speaker-Independent Speech Recognition using Visual Features

speech-recognition speech-to-text lip-reading visual-speech-recognition lipreading vsr visual-speech

Updated Dec 17, 2020
Python

SMIL-SPCRAS / EMOLIPS

Star

EMOLIPS: TWO-LEVEL APPROACH FOR LIP-READING EMOTIONAL SPEECH

automatic-speech-recognition lip-reading visual-speech-recognition emotional-speech

Updated Sep 9, 2023
Python

david-gimeno / evaluating-end2end-spanish-lipreading

Star

Visual Speech Recognition for Spanish

benchmark evaluation spanish visual-speech-recognition lipreading

Updated Feb 28, 2025
Jupyter Notebook

mohamed-gasser / Word-Level-LipReading-in-Arabic

Star

Deep Visual Speech Recognition in arabic words

python machine-learning computer-vision deep-learning pytorch arabic lip-reading visual-speech-recognition

Updated Oct 12, 2023

BenedettoSimone / Lipnet-ITA

Star

LipReadingITA: Keras implementation of the method described in the paper 'LipNet: End-to-End Sentence-level Lipreading'. Research project for University of Salerno.

deep-learning visual-speech-recognition lipnet

Updated Apr 30, 2023

elnaske / LipNet

Star

A single-speaker reimplementation of the LipNet architecture for lip reading.

computer-vision pytorch visual-speech-recognition lipnet

Updated Jan 18, 2025
Python

luomingshuang / lipreading_with_icefall

Star

In this repository, I try to use k2, icefall and Lhotse for lip reading. I will modify it for the lip reading task. Many different lip-reading datasets should be added. -_-

audio-visual-speech-recognition k2 lip-reading visual-speech-recognition icefall

Updated Apr 9, 2022
Python

Improve this page

Add a description, image, and links to the visual-speech-recognition topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the visual-speech-recognition topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

visual-speech-recognition

Here are 23 public repositories matching this topic...

mpc001 / Visual_Speech_Recognition_for_Multiple_Languages

mpc001 / auto_avsr

smeetrs / deep_avsr

sailordiary / LipNet-PyTorch

georgesterpu / pyVSR

VIPL-Audio-Visual-Speech-Understanding / deep-face-speechreading

Megamind22 / lstArab100words

YasserdahouML / VSR_test_set

umbertocappellazzo / Llama-AVSR

david-gimeno / tailored-avsr

Saeed-Biabani / LipReading

YasserdahouML / Lip2Vec

manideep2510 / Lipreading-Keras

Pooventhiran / VSR

SMIL-SPCRAS / EMOLIPS

david-gimeno / evaluating-end2end-spanish-lipreading

mohamed-gasser / Word-Level-LipReading-in-Arabic

BenedettoSimone / Lipnet-ITA

elnaske / LipNet

luomingshuang / lipreading_with_icefall

Improve this page

Add this topic to your repo