Skip to content

KDT 해커톤 4회 식스센스 팀 S2S 프로젝트: 경증 청각장애인을 위한 듣기 평가 보조 서비스

Notifications You must be signed in to change notification settings

6-Sense-AI/KDT-SoundToShow

Repository files navigation

s2s (2)

KDT-SoundToShow

KDT 해커톤 4회 식스센스 팀 S2S 프로젝트: 경증 청각장애인을 위한 듣기 평가 보조 서비스

1. 프로젝트명

  • 경증 청각장애인을 위한 청취 보조 서비스
  • 서비스설명 : 입력된 음성의 주파수를 변환한 음성, 텍스트와 비디오를 병행 제공한다. librosa로 입력된 음성에서 주파수를 변환한 음성을 반환한다. 또한 입력된 음성을 인식한 후 각각 wav2lip 모델과 Whisper API를 활용, 음성과 동기화된 입모양 영상과 텍스트를 생성해 반환한다.

2. 주요기능

  • 가청 주파수 음역대 선택기능 제공
  • 영상, 입모양, 자막 생성여부 선택기능 제공
  • Librosa 라이브러리를 활용하여 기존 음성을 사용자의 가청 주파수 음역대로 변환
  • Wav2Lip 모델을 통해 영상의 입모양 제공
  • Whisper OpenAI를 통해 STT 서비스 제공

3. 개발환경

구분 내용
사용언어 Python / HTML / CSS / JavaScript
사용한 라이브러리 Librosa / PyTorch
개발도구 VisualStudioCode / Jupyter / Google Colab
데이터베이스 MySQL

4. 아키텍처(구조)

시스템 아키텍쳐

시스템 아키텍쳐

5. 흐름도

서비스 흐름도 ['영어 듣기 평가 시험' 사례에 서비스 적용을 가정]

기능흐름도

6. 서비스 실행 화면

메인 페이지

시작 화면

s2s메인

세부 설명

메인2

모드 선택 페이지

파일 업로드 및 모드 선택

모드선택

주파수 모드 선택 [잘 들리는 모드 확인하기]

잘들리는모드

결과 페이지

결과

7. 제작 일정

image

)

8. 팀원 소개 및 담당 업무

image

About

KDT 해커톤 4회 식스센스 팀 S2S 프로젝트: 경증 청각장애인을 위한 듣기 평가 보조 서비스

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages