Skip to content

Trợ lý ảo loa thông minh tiếng Việt, phiên bản xử lý offline

License

Notifications You must be signed in to change notification settings

tieppm/vietbot_offline

 
 

Repository files navigation

vietbot_offline

Vietbot Offline phiên bản Beta, xử lý tại chỗ không cần máy chủ

Sơ đồ luồng xử lý của Vietbot

+---+   +----------------+   +---+   +---+                           +---+
|Mic|-->|Audio Processing|-->|KWS|-->|STT|-------------------------->|NLU|
+---+   +----------------+   +---+   +---+                           +-+-+
                                                                       |
                                                                       |
+-------+   +--------+   +-------------+    +----------------------+   |
|Speaker|<--|Playback|<-- File Path/Link|<--|Knowledge/Skill/Action|<--+
+-------+   +--------+   +-------------+    +----------------------+

Mic: Phần cứng để ghi âm, vietbot hỗ trợ tất cả các loại phần cứng Mic mà hệ điều hành Linux/Windows nhận diện được

Audio Processing: Tùy chọn Có/Không có tùy thuộc vào phần cứng của Micro bao gồm Acoustic Echo Cancellation (AEC), Beamforming, Noise Suppression (NS)..vv

Keyword Spotting (KWS): Cơ chế phát hiện hotword để kích hoạt chế độ lắng nghe dòng lệnh. Vietbot sử dụng cơ chế của Picovoice(porcupine)

Speech To Text (STT): Cơ chế lắng nghe âm thanh và trả về text tức thời. Vietbot sử dụng cơ chế STT của Google, Viettel

Natural Language Understanding (NLU): Phân tách các text thành các cấu trúc ra lệnh. Vietbot sử dụng hai đối tượng Action/Object đã được khai báo sẵn, cũng như có thể bổ sung để phân tách các cấu trúc ra lệnh

Knowledge/Skill/Action: Các Skill, chia thành Skill xử lý tại chỗ hoặc xử lý trên Cloud, các Skill là các Module xử lý để cho ra câu trả lời.

File Path: Đường dẫn file sinh ra từ cơ chế tổng hợp âm thanh các câu trả lời hoặc đường dẫn File nhạc có sẵn trên thẻ dựa theo kết quả trả lời từ Skill

Link: Link online theo kết quả trả về từ các Skill

Playback: Cơ chế phát nhạc theo đường dẫn File hoặc link, hỗ trợ tiếp tục nhận lệnh trong khi đang Playback

Speaker: Phần cứng phát âm thanh

DANH SÁCH PHẦN CỨNG TƯƠNG THÍCH=> ĐỘ PHẦN CỨNG => FLASH THẺ NHỚ => CÀI MỚI TỪ ĐẦU => CÀI ĐẶT, CẬP NHẬT PHẦN MỀM => CẤU HÌNH STT VÀ TTS => CẤU HÌNH HOTWORD => CÁCH CHẠY => WIFI-CONNECT> => LOA TTS> => ĐIỀU KHIỂN HASS> =>

About

Trợ lý ảo loa thông minh tiếng Việt, phiên bản xử lý offline

Resources

License

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 82.6%
  • HTML 16.1%
  • Shell 1.3%