Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

"I did not understand $trigger" #392

Closed
mikagouzee opened this issue Jan 25, 2017 · 30 comments
Closed

"I did not understand $trigger" #392

mikagouzee opened this issue Jan 25, 2017 · 30 comments

Comments

@mikagouzee
Copy link

mikagouzee commented Jan 25, 2017

Description

Yo Alex
Félicitations pour ton taf, j'ai installé Jarvis assez facilement, et par rapport à la galère que j'ai eu avec JASPER, ça fait bien plaisir.

J'ai installé Raspbian à partir de noobs puis j'ai lancé tes installeurs après avoir cloné ton repo. J'ai un peu du trifouiller pour comprendre ton interface (devoir appuyer sur espace pour sélectionner et sur annuler pour revenir en arrière est un peu déroutant), mais j'ai fini par démarrer Jarvis avec Snowboy pour la reconnaissance des trigger et des commandes.

Seulement voila, quand je parle à "k-9" (le nom que je lui ai donné originellement, mais j'ai entre temps réinstallé et utilisé 'Canine'), j'ai quelques soucis :
--le début de la synthèse vocale est coupée (j'entends "lo" au lieu de "hello", par exemple)
--jarvis semble ne rien entendre de ce que je pourrais dire hormis "knine/'canine", et me dit qu'il ne comprend même pas ce terme.

Le son est bon, le micro fonctionne donc je soupçonne une erreur de config qqpart mais je ne sais pas trop ce qui a pu se passer.

Un conseil?

premier test en mode normal :
pi@Madmanwithabox:~/jarvis $ ./jarvis.sh
Checking updates for jarvis...Up-to-date
knine: Hello
User defined commands:
AIDE BONJOUR|SALUT COMMENTAPPELLE*
MERCI AU REVOIR|BYE ANNULE*|TERMINE*
ENCORE* TEST VERSION
REPETE () ET (*) CA VA >OUI

NON
knine: Waiting to hear 'knine'
Doctor: knine
knine: Yes?
Doctor: knine
knine: I did not understand: knine
Doctor: knine
knine: I did not understand: knine
Doctor: knine
knine: I did not understand: knine
Doctor: ^C pi@Madmanwithabox:~/jarvis $

Result

Deuxieme test en mode debug
DEBUG: program_startup hook
Canine: Yes, Master ?
User defined commands:
AIDE BONJOUR|SALUT COMMENTAPPELLE*
MERCI AU REVOIR|BYE ANNULE*|TERMINE*
ENCORE* TEST VERSION
REPETE () ET (*) CA VA >OUI

NON
Canine: Waiting to hear 'Canine'
Doctor: (listening...)
DEBUG: models=alexa,canine,knine,snowboy
Cannot connect to server socket err = No such file or directory
Cannot connect to server request channel
jack server is not running or cannot be started
INFO:snowboy:Keyword 2 detected at time: 2017-01-25 20:23:45
DEBUG: modelid=1
canine
Canine: I did not understand: canine
Doctor: (listening...)
DEBUG: models=alexa,canine,knine,snowboy
Cannot connect to server socket err = No such file or directory
Cannot connect to server request channel
jack server is not running or cannot be started
INFO:snowboy:Keyword 2 detected at time: 2017-01-25 20:23:50
DEBUG: modelid=1
canine
Canine: I did not understand: canine
Doctor: (listening...)
DEBUG: models=alexa,canine,knine,snowboy
Cannot connect to server socket err = No such file or directory
Cannot connect to server request channel
jack server is not running or cannot be started
INFO:snowboy:Keyword 2 detected at time: 2017-01-25 20:24:03
DEBUG: modelid=1
canine
Canine: I did not understand: canine
Doctor: (listening...)
DEBUG: models=alexa,canine,knine,snowboy
Cannot connect to server socket err = No such file or directory
Cannot connect to server request channel
jack server is not running or cannot be started
^CDEBUG: program exit handler
DEBUG: program_exit hook

@alexylem
Copy link
Owner

Tu peux coller l'ensemble de la console avec Jarvis en mode troubleshooting? (y compris les paramètres de démarrage)
Dans le 2ème exemple, tu as bien le trigger = Canine et un modèle snowboy "canine".
Donc à priori ca devrait marcher.

@mikagouzee
Copy link
Author

Hello Alex,

j'essaierai ce soir

J'ai en effet le trigger et le modele snowboy, mais il ne reconnait pas ce que je dis après.

J'ai testé le mode clavier, il comprend les commandes, mais en vocal c'est broken.

Merci pour ton aide :)

@mikagouzee
Copy link
Author

mikagouzee commented Feb 1, 2017

------------ Config ------------
jv_version           17.01.26 
jv_arch              armv7l 
jv_os_name           raspbian 
jv_os_version        8 
language             en_GB 
play_hw              hw:0,1 
rec_hw               hw:1,0 
speaker              ALSA 
microphone           Texas Instruments PCM2900 Audio Codec 
trigger_stt          snowboy 
command_stt          snowboy 
tts_engine           svox_pico 
--------------------------------

DEBUG: program_startup hook
canine: Yes, Master ?
User defined commands:
*AIDE*			*BONJOUR*|*SALUT*	*COMMENT*APPELLE*
*MERCI*			*AU REVOIR*|*BYE*	ANNULE*|TERMINE*
ENCORE*			*TEST*			*VERSION*
*REPETE (*) ET (*)	*CA VA*			>*OUI*
>*NON*
canine: Waiting to hear 'canine'
Doctor: (listening...)
DEBUG: models=alexa,canine,snowboy
INFO:snowboy:Keyword 2 detected at time: 2017-02-01 17:22:24
DEBUG: modelid=1
canine
DEBUG: entering_cmd hook
canine: Yes?
Doctor: (listening...)
DEBUG: models=alexa,canine,snowboy
INFO:snowboy:Keyword 2 detected at time: 2017-02-01 17:22:27
DEBUG: modelid=1
canine
canine: I did not understand: canine
Doctor: (listening...)
DEBUG: models=alexa,canine,snowboy

Résultat après avoir testé avec "jack_control start" : same result.

Du coup si tu as un autre conseil je suis preneur.

@Lusitanos67
Copy link

Et si tu te mettais en language FR ?

@mikagouzee
Copy link
Author

mikagouzee commented Feb 2, 2017 via email

@Lusitanos67
Copy link

Je propose des idées :)
, il y a peut-être un bug, mais je suis d'accord avec ton raisonnement

@mikagouzee
Copy link
Author

Bon j'ai test après l'avoir mis en français, aucun changement, juste une voix horrible.

J'ai constaté qu'au début, QUOI QUE JE DISE, il fait comme s'il avait reconnu le mot clef, puis après il décide que QUOI QUE JE DISE, il ne comprend pas.

Un petit coup de main Alex? On compte sur toi :D

@alexylem
Copy link
Owner

alexylem commented Feb 5, 2017

Heu... juste avant de continuer, tu peux éviter de mettre snowboy comme moteur de reconnaissance des commandes 😄 pke la c'est sûr que ca va pas marcher.
Snowboy pour le hotword, Bing pour les commandes (comme recommandé dans l'installation).

@mikagouzee
Copy link
Author

mikagouzee commented Feb 6, 2017 via email

@mikagouzee
Copy link
Author

mikagouzee commented Feb 7, 2017

J'ai test après m'être inscrit sur Bing api :

------------ Config ------------
jv_version           17.02.04 
jv_arch              armv7l 
jv_os_name           raspbian 
jv_os_version        8 
language             en_GB 
play_hw              hw:0,1 
rec_hw               hw:1,0 
speaker              ALSA 
microphone           Texas Instruments PCM2900 Audio Codec 
trigger_stt          snowboy 
command_stt          bing 
tts_engine           svox_pico 
--------------------------------

canine: Yes, Master ?
User defined commands:
*AIDE*			*BONJOUR*|*SALUT*	*COMMENT*APPELLE*
*MERCI*			*AU REVOIR*|*BYE*	ANNULE*|TERMINE*
ENCORE*			*TEST*			*VERSION*
*REPETE (*) ET (*)	*CA VA*			>*OUI*
>*NON*
canine: Waiting to hear 'canine'
Doctor: (listening...)
DEBUG: models=alexa,canine,snowboy
Cannot connect to server socket err = No such file or directory
Cannot connect to server request channel
jack server is not running or cannot be started
INFO:snowboy:Keyword 2 detected at time: 2017-02-07 18:03:28
DEBUG: modelid=1
canine
DEBUG: entering_cmd hook
canine: Yes?
Doctor: (listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 08 (10 = 1 sec)
DEBUG: token missing or expired
DEBUG: json=eyJ0eXAiOiJKV1QiLCJhbGciOiJIUzI1NiJ9.eyJzY29wZSI6Imh0dHBzOi8vc3BlZWNoLnBsYXRmb3JtLmJpbmcuY29tIiwic3Vic2NyaXB0aW9uLWlkIjoiNjVkODIxM2ZhYzRiNDdlYmE1NzdkMzFlYzVmNmIwZDQiLCJwcm9kdWN0LWlkIjoiQmluZy5TcGVlY2guUHJldmlldyIsImNvZ25pdGl2ZS1zZXJ2aWNlcy1lbmRwb2ludCI6Imh0dHBzOi8vYXBpLmNvZ25pdGl2ZS5taWNyb3NvZnQuY29tL2ludGVybmFsL3YxLjAvIiwiYXp1cmUtcmVzb3VyY2UtaWQiOiIiLCJpc3MiOiJ1cm46bXMuY29nbml0aXZlc2VydmljZXMiLCJhdWQiOiJ1cm46bXMuc3BlZWNoIiwiZXhwIjoxNDg2NDkxMjExfQ.Hr_DyoS01tVULdvO7RR2QKPZN_xpxTIMXsB8cnCL9j4
DEBUG: token will expire in 590 seconds
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=8010262d-770b-41c9-a10f-cc04de8620cd&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"b11f47eb-5443-469b-9745-f4ed5e84c17c","NOSPEECH":"1"}}}
?(listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 05 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=ebd5cbb6-fce4-45fc-9f6b-832c577f1907&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"3331c30b-1dfa-4dd8-9113-efc4ef64c122","NOSPEECH":"1"}}}
?(listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 00 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?//version=3.0&requestid=a7d4f6d1-a58e-4ec0-bdf0-99f92430b1c2&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"45e4c744-0444-488a-b5e7-49745a9f0a68","NOSPEECH":"1"}}}
?
DEBUG: 3 attempts failed, end of conversation
DEBUG: exiting_cmd hook
canine: Waiting to hear 'canine'
Doctor: (listening...)
DEBUG: models=alexa,canine,snowboy
^CDEBUG: program exit handler
DEBUG: program_exit hook

J'ai fait un autre test un peu après mais dans un environnement un peu bruyant. Cela dit Jarvis semble avoir du mal à comprendre (Pour le mot clef "canine", il m'a dit "I did not understand good night", "I did not understand new line", ... pour "merci" il croit que je dis "max" et quand je dis "test" ou "ça va" il me répond "bip" et affiche un interrobang ?. )

Je dois retester avec plus de silence, ou y a qqchose qui cloche dans ma config?

@alexylem
Copy link
Owner

alexylem commented Feb 8, 2017

Il dirait que tu es en anglais. Change la langue pour le Français déjà ca devrait aller mieux...

@mikagouzee
Copy link
Author

Je vais essayer, mais tu veux dire qu'on ne peut pas utiliser Jarvis dans une autre langue que le français? Parce que je parle en anglais avec la machine (kénaïneu pour Canine... k-9 quoi).

Je te tiens au courant de mes progres :)

@mikagouzee
Copy link
Author

Alors, j'ai retest :

en français : ça ne change rien : cette fois il a compris "lénine" et "gmail" à la place de Canine, mais pas de réaction.

En anglais : même combat.

J'ai constaté qu'en fait, QUOI QUE JE DISE, il commence par répondre "yes" comme si tout se passait bien, puis il fait de la merde (quoi que je dise aussi).

Donc en fait ça ne marche pas du tout la :(

J'ai constaté aussi qu'il répète ce que je dis (en troubleshooting mode, je sais pas s'il est censé faire ça en temps normal), et visiblement il enregistre correctement, donc le souci est dans la reconnaissance.

Une estimation ? Un indice?

@mikagouzee
Copy link
Author

mikagouzee commented Feb 8, 2017

------------ Config ------------
jv_version           17.02.04 
jv_arch              armv7l 
jv_os_name           raspbian 
jv_os_version        8 
language             en_GB 
play_hw              hw:0,1 
rec_hw               hw:1,0 
speaker              ALSA 
microphone           Texas Instruments PCM2900 Audio Codec 
trigger_stt          snowboy 
command_stt          bing 
tts_engine           svox_pico 
--------------------------------

canine: Yes, Master ?
User defined commands:
*AIDE*			*BONJOUR*|*SALUT*	*COMMENT*APPELLE*
*MERCI*			*AU REVOIR*|*BYE*	ANNULE*|TERMINE*
ENCORE*			*TEST*			*VERSION*
*REPETE (*) ET (*)	*CA VA*			>*OUI*
>*NON*
canine: Waiting to hear 'canine'
Doctor: (listening...)

DEBUG: models=alexa,canine,snowboy
INFO:snowboy:Keyword 2 detected at time: 2017-02-08 11:12:14
DEBUG: modelid=1
canine
DEBUG: entering_cmd hook
canine: Yes?
Doctor: (listening...)

*ici j'ai dit "bonjour"*
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 02 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=d09ff75e-abf7-453e-bf9b-9b1a57c9e013&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"success","scenario":"ulm","name":"bull","lexical":"bull","properties":{"requestid":"85394e46-7b3b-4a8a-858a-ce663a8cfb54","HIGHCONF":"1"}},"results":[{"scenario":"ulm","name":"bull","lexical":"bull","confidence":"0.6525138","properties":{"HIGHCONF":"1"}}]}
bull
canine: I did not understand: bull

*Ici j'ai dit "test"*
Doctor: (listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 05 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=c44d12fc-c429-4a11-b653-2678f3f3a658&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"ad85f124-b34d-4d97-a747-96e81a37337d","NOSPEECH":"1"}}}

*Ici je n'ai pas eu le temps de dire quoi que ce soit*
?(listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 00 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=3cf74fa2-9dea-400b-af3f-e7bd37b38c7d&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"9966adf0-78c5-4cbb-bb92-0dc455051365","NOSPEECH":"1"}}}


?(listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 05 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=e572ddf0-ca19-4ac9-80b8-0a3fa4c2b13b&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"a9fc022b-cc84-420d-b11c-c8bfabc6868c","NOSPEECH":"1"}}}
?

DEBUG: 3 attempts failed, end of conversation
DEBUG: exiting_cmd hook
canine: Waiting to hear 'canine'
Doctor: (listening...)

*ICI j'ai dit "BWABLABLABLAWA" et il a quand même réagi.*
DEBUG: models=alexa,canine,snowboy
INFO:snowboy:Keyword 2 detected at time: 2017-02-08 11:12:45
DEBUG: modelid=1
canine
DEBUG: entering_cmd hook
canine: Yes?
Doctor: (listening...)


utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 08 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=f096b88f-b049-41f3-a104-66c18896ea33&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=en-GB&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"61a5a8ae-7eae-4e7e-a88f-f8d60e02323a","NOSPEECH":"1"}}}
?(listening...)


utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
^CDEBUG: program exit handler
DEBUG: program_exit hook

Voila je sais pas si c'est utile pour toi, moi tout ce que je vois c'est des calls curl vers une API :( j'ai aucune idée de ce que sont --endian little ni rien :/

la même en français :

------------ Config ------------
jv_version           17.02.04 
jv_arch              armv7l 
jv_os_name           raspbian 
jv_os_version        8 
language             fr_FR 
play_hw              hw:0,1 
rec_hw               hw:1,0 
speaker              ALSA 
microphone           Texas Instruments PCM2900 Audio Codec 
trigger_stt          snowboy 
command_stt          bing 
tts_engine           svox_pico 
--------------------------------

canine: Yes, Master ?
User defined commands:
*AIDE*			*BONJOUR*|*SALUT*	*COMMENT*APPELLE*
*MERCI*			*AU REVOIR*|*BYE*	ANNULE*|TERMINE*
ENCORE*			*TEST*			*VERSION*
*REPETE (*) ET (*)	*CA VA*			>*OUI*
>*NON*
canine: Waiting to hear 'canine'
Doctor: (listening...)
DEBUG: models=alexa,canine,snowboy
INFO:snowboy:Keyword 2 detected at time: 2017-02-08 11:18:11
DEBUG: modelid=1
canine
DEBUG: entering_cmd hook
canine: Yes?

*ICI j'ai dit test*
Doctor: (listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 05 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=994680e1-ffe4-4eb9-9c9b-f222cbc88297&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=fr-FR&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"b7030341-7179-4ccf-a4a4-c2ca41176bab","NOSPEECH":"1"}}}
?(listening...)

*ICI j'ai dit "bonjour"*
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 05 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=6455551e-5813-47b6-8647-2261f43f1ee0&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=fr-FR&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"error","properties":{"requestid":"d41c9dba-d802-489c-a6f7-5ee7a7ca2096","NOSPEECH":"1"}}}
?(listening...)

*ICI j'ai dit "YADA YADA YADA" et cet enf*ire de jarvis m'a compris. Biggest troll ever.*
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was 05 (10 = 1 sec)
DEBUG: curl https://speech.platform.bing.com/recognize/query?version=3.0&requestid=90ddf4e2-87e7-4092-918d-d3b7a2e92204&appid=D4D52672-91D7-4C74-8AD8-42B1D98141A5&format=json&locale=fr-FR&device.os=linux&scenarios=ulm&instanceid=E043E4FE-51EF-4B74-8133-B728C4FEA8AA&result.profanitymarkup=0
DEBUG: json={"version":"3.0","header":{"status":"success","scenario":"ulm","name":"yada yada yada","lexical":"yada yada yada","properties":{"requestid":"5623beb8-eac7-416a-90d5-174d9e49d078","HIGHCONF":"1"}},"results":[{"scenario":"ulm","name":"yada yada yada","lexical":"yada yada yada","confidence":"0.8943228","properties":{"HIGHCONF":"1"}}]}
yada yada yada
canine: I did not understand: yada yada yada
Doctor: (listening...)

utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 10% trim 0 10
DEBUG: speech duration was  (10 = 1 sec)
DEBUG: timeout, end of conversation
DEBUG: exiting_cmd hook
DEBUG: exiting_cmd hook
canine: Waiting to hear 'canine'
Doctor: (listening...)
DEBUG: models=alexa,canine,snowboy

A noter que lors d'un de mes tests en anglais, il m'a répondu "I did not understand "k 9" "... Alors que c'est littéralement mon hotword è_é

Du coup je suis un peu paumé la.

@alexylem
Copy link
Owner

alexylem commented Feb 8, 2017

Ok, bon difficile à voir d'ou vient le pb exactement.
Déjà rassures-moi, tu as bien compris la différence entre hotword et commandes n'est-ce pas? Il faut bien dire le Hotword à Snowboy, puis Jarvis dit Oui? et après Bing prend le relai pour reconnaitre ta commande.
Snowboy est indépendant de la langue et de l'accent, puisque c'est toi qui enregistre ton hotword avec ta voix. Ce que je trouve bizarre dans ton premier exemple est que tu parles français ("bonjour") à Jarvis qui est en anglais. Normal qu'il ne pige rien (d'où le "bull").
Ensuite quand tu le configure en français, Bing ne comprend pas. Si tu regardes de plus près les messages de retour (ils sont la pour être lus), je vois:

"NOSPEECH":"1"

Ce qui correspond très probablement à un pb de réglage micro. Voir #118.
Regarde bien aussi speech duration, que je vois à une demi seconde. Ca ne fait pas bcp. Tu entends bien clairement ta voix dire la phrase complète en mode troubleshooting? Dans le cas contraire regarde du côté des réglages de sox: #112
Persévères, tu vas finir par y arriver 😄

@mikagouzee
Copy link
Author

Hello Alex

J'ai bien compris la différence entre hotword et commande.

Mon hotword est "canine" (à prononcer "kénaïneu", à l'anglaise donc).

Après avoir démarré Jarvis en troubleshooting mode, je peux dire ce que je veux, que ce soit "Canine", "Grand mère", "Agroououuuurururourour" ou même faire des bruits de pet avec ma bouche, il me répond "oui?".
Ensuite, je peux faire ce que je veux, il ne comprend pas ce que je dis.

J'ai essayé de parler à Jarvis avec les mots clefs définis comme user defined command :
User defined commands:
AIDE BONJOUR|SALUT COMMENTAPPELLE*
MERCI AU REVOIR|BYE ANNULE*|TERMINE*
ENCORE* TEST VERSION
REPETE () ET (*) CA VA >OUI

NON

Donc j'ai essayé "bonjour", okay c'est du français et ça ne marche pas parce qu'il est configuré dans une autre langue.... C'est possible. Cela dit, "test", ça se dit pareil en anglais et en français, et il reconnait pas mieux.

Quand je le configure en Anglais, Bing ne comprend pas mieux qu'en Français. Dans les deux cas, la détection vocale est aléatoire, peu efficace voire carrément Trollesque (voire exemple où la machine me répond "I did not understand K 9" .... )

J'entends parfaitement bien ma voix (parfois un peu brouillée ou hachée, mais audible et compréhensible) environ 9 fois sur 10, sauf de temps en temps où la machine semble décider que le son du silence est suffisant (je suppose que Jarvis est fan de Simon & Garfunkel).

Je pense normal que les durées d'enregistrement soient "courts", je prends pas deux minutes à dire "bonjour" ou "test", mais je vais regarder les deux liens que tu as posté.

Merci pour ta patience :)

@EmGeI
Copy link

EmGeI commented Feb 10, 2017

Même problème pour moi.
Install de "Pixel" fraiche, git clone du projet, lancement et rien ne se passe.
Comme pour @mikagouzee, je lance, quoi que je dise, il me répond "oui" puis après plus rien.

Voici le debug :

./jarvis.sh -v
DEBUG: program_startup hook
------------ Config ------------
jv_version 17.02.04
jv_arch armv7l
jv_os_name raspbian
jv_os_version 8
language fr_FR
play_hw false
rec_hw false
speaker Default
microphone Default
trigger_stt snowboy
command_stt bing
tts_engine voxygen

toto: Bonjour
User defined commands:
AIDE BONJOUR|SALUT COMMENTAPPELLE*
MERCI AU REVOIR|BYE ANNULE*|TERMINE*
ENCORE* TEST VERSION
REPETE () ET () CA VA >OUI
NON
Commands from plugin jarvis-weather-wunderground-fr:
METEODEMAIN
METEO
toto: Waiting to hear 'toto'
Greg: (listening...)
DEBUG: models=alexa,jarvis,jarvisse,korben,snowboy,toto
Cannot connect to server socket err = No such file or directory
Cannot connect to server request channel
jack server is not running or cannot be started
INFO:snowboy:Keyword 6 detected at time: 2017-02-10 14:50:54
DEBUG: modelid=5
toto
DEBUG: entering_cmd hook
toto: oui?
Greg: (listening...)
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 1% trim 0 10
DEBUG: speech duration was 85 (10 = 1 sec)
DEBUG: too long for a command (max 4 secs), ignoring...
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 1% trim 0 10
DEBUG: speech duration was 55 (10 = 1 sec)
DEBUG: too long for a command (max 4 secs), ignoring...
utils/timeout.sh 10 rec -V1 -q -r 16000 -c 1 -b 16 -e signed-integer --endian little jarvis-record.wav silence 1 0.1 1% 1 0.5 1% trim 0 10
^CDEBUG: program exit handler
DEBUG: program_exit hook

@Lusitanos67
Copy link

DEBUG: too long for a command (max 4 secs), ignoring...

Ton micro est trop sensible, ou alors tu parle trop longtemps ^^

@EmGeI
Copy link

EmGeI commented Feb 10, 2017

Parler trop longtemps, je pense pas je demande juste la météo =D
Je check au niveau de la sensibilité alors ;)

@EmGeI
Copy link

EmGeI commented Feb 10, 2017

Ok donc pour ma part, l'incident venait bien d'un problème de micro.
C'est pas encore le trop, mais en tout cas Jarvis répond plus facilement maintenant. (Encore quelque faux positif, ainsi que des NOSPEECH=1) mais la source de l'incident reste la même. Merci @Lusitanos67 ;)

@Lusitanos67
Copy link

Content pour toi ;)

@alexylem
Copy link
Owner

@mikagouzee s'il te répond oui tout de suite alors il doit y avoir un pb avec ton hotword. Essaye d'en "trainer" un autre ou d'utiliser snowboy (en changeant ton trigger en "snowboy"). Ainsi tu pourras y séparer les 2 pbs et tenter de les résoudre plus simplement. A mon avis si la reconnaissance de Bing est si mauvaise, alors ca doit venir de ton micro (surtout si comme tu dis c'est "brouillé/haché"...). Tu as quoi comme micro?

@mikagouzee
Copy link
Author

mikagouzee commented Feb 13, 2017 via email

@wikijm
Copy link
Collaborator

wikijm commented Feb 21, 2017

@mikagouzee Est ce que tu as eu le temps de faire des tests ?

@mikagouzee
Copy link
Author

mikagouzee commented Feb 22, 2017 via email

@wikijm
Copy link
Collaborator

wikijm commented Feb 22, 2017

@mikagouzee OK. Je fais la chasse aux issues sans réponse en ce moment, histoire de ne pas noyer @alexylem sous les demandes.

Si tu penses faire des tests plus tard, je t'invite à clôturer le ticket, quitte à le rouvrir plus tard s'il y a des avancées =-)

@mikagouzee
Copy link
Author

Je viens de faire un test en utilisant le keyword snowboy, je peux l'appeler chocolat il me répond quand meme "Yes" avant de plus rien comprendre.

J'ai essayé de train un autre keyword, et il a du coup effacé tous ceux que j'avais entrainé jusque la.

Ahem.

Je vais réinstaller....

@alexylem
Copy link
Owner

@mikagouzee tu peux aussi essayer de baisser le sensibilité de snowboy dans Settings > Voice Reco > Snowboy settings > Sensibility.

@mikagouzee
Copy link
Author

mikagouzee commented Feb 27, 2017 via email

@wikijm
Copy link
Collaborator

wikijm commented Mar 5, 2017

@mikagouzee En attendant ton retour je clôture.

@wikijm wikijm closed this as completed Mar 5, 2017
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

5 participants