Vietbot Offline phiên bản Beta, xử lý tại chỗ không cần máy chủ
+---+ +----------------+ +---+ +---+ +---+
|Mic|-->|Audio Processing|-->|KWS|-->|STT|-------------------------->|NLU|
+---+ +----------------+ +---+ +---+ +-+-+
|
|
+-------+ +--------+ +-------------+ +----------------------+ |
|Speaker|<--|Playback|<-- File Path/Link|<--|Knowledge/Skill/Action|<--+
+-------+ +--------+ +-------------+ +----------------------+
Mic: Phần cứng để ghi âm, vietbot hỗ trợ tất cả các loại phần cứng Mic mà hệ điều hành Linux/Windows nhận diện được
Audio Processing: Tùy chọn Có/Không có tùy thuộc vào phần cứng của Micro bao gồm Acoustic Echo Cancellation (AEC), Beamforming, Noise Suppression (NS)..vv
Keyword Spotting (KWS): Cơ chế phát hiện hotword để kích hoạt chế độ lắng nghe dòng lệnh. Vietbot sử dụng cơ chế của Picovoice(porcupine)
Speech To Text (STT): Cơ chế lắng nghe âm thanh và trả về text tức thời. Vietbot sử dụng cơ chế STT của Google, Viettel
Natural Language Understanding (NLU): Phân tách các text thành các cấu trúc ra lệnh. Vietbot sử dụng hai đối tượng Action/Object đã được khai báo sẵn, cũng như có thể bổ sung để phân tách các cấu trúc ra lệnh
Knowledge/Skill/Action: Các Skill, chia thành Skill xử lý tại chỗ hoặc xử lý trên Cloud, các Skill là các Module xử lý để cho ra câu trả lời.
File Path: Đường dẫn file sinh ra từ cơ chế tổng hợp âm thanh các câu trả lời hoặc đường dẫn File nhạc có sẵn trên thẻ dựa theo kết quả trả lời từ Skill
Link: Link online theo kết quả trả về từ các Skill
Playback: Cơ chế phát nhạc theo đường dẫn File hoặc link, hỗ trợ tiếp tục nhận lệnh trong khi đang Playback
Speaker: Phần cứng phát âm thanh