# SpeechToText 语音转文本

SpeechToText组件通过封装[HTML5 `SpeechRecognition` API](https://developer.mozilla.org/en-US/docs/Web/API/SpeechRecognition)控制浏览器的语音识别服务。

底层实现为`panel.widgets.SpeechToText`，参数基本一致，参考文档：https://panel.holoviz.org/reference/widgets/SpeechToText.html


In [1]:
##ignore
%load_ext vuepy
from panel_vuepy import vpanel


## 基本用法

语音转文本组件提供了一个简单的界面来启动和停止语音识别服务，将用户的语音转换为文本。

> **注意**：此功能是**实验性的**，**只有Chrome和少数其他浏览器支持**。有关支持SpeechRecognition API的浏览器的最新列表，请参见[caniuse.com](https://caniuse.com/speech-recognition)或[MDN文档](https://developer.mozilla.org/en-US/docs/Web/API/SpeechRecognition#Browser_compatibility)。在某些浏览器（如Chrome）中，即使支持此功能，`grammars`、`interim_results`和`max_alternatives`参数也可能尚未实现。
> 
> 在像Chrome这样的浏览器上，在网页上使用语音识别涉及基于服务器的识别引擎。**您的音频会被发送到网络服务进行识别处理，因此它无法离线工作**。这对您的用例来说是否足够安全和保密，需要您自行评估。


In [2]:
%%vuepy_run --plugins vpanel --show-code
<template>
  <PnSpeechToText 
    button_type="light"
    v-model="speech_text.value"
  />
  <PnStaticText :value="f'result: {speech_text.value}'" />
</template>
<script lang='py'>
import panel as pn
from vuepy import ref

speech_text = ref("")
</script>

{"vue": "<!-- --plugins vpanel --show-code -->\n<template>\n  <PnSpeechToText \n    button_type=\"light\"\n    v-model=\"speech_text.value\"\n  />\n  <PnStaticText :value=\"f'result: {speech_text.value}'\" />\n</template>\n<script lang='py'>\nimport panel as pn\nfrom vuepy import ref\n\nspeech_text = ref(\"\")\n</script>\n", "setup": ""}


VBox(children=(VBox(children=(VBox(children=(VBox(children=(BokehModel(combine_events=True, render_bundle={'do…


## 自定义按钮

可以通过设置`button_type`、`button_not_started`和`button_started`参数来自定义按钮的外观。


In [3]:
%%vuepy_run --plugins vpanel --show-code
<template>
  <PnRow>
    <PnSpeechToText 
      button_type="success" 
      button_not_started="点击开始识别" 
      button_started="点击停止识别"
      v-model="custom_text.value"
    />
    <PnStaticText :value="f'识别结果: {custom_text.value}'" />
  </PnRow>
</template>
<script lang='py'>
import panel as pn
from vuepy import ref

custom_text = ref("")
</script>

{"vue": "<!-- --plugins vpanel --show-code -->\n<template>\n  <PnRow>\n    <PnSpeechToText \n      button_type=\"success\" \n      button_not_started=\"\u70b9\u51fb\u5f00\u59cb\u8bc6\u522b\" \n      button_started=\"\u70b9\u51fb\u505c\u6b62\u8bc6\u522b\"\n      v-model=\"custom_text.value\"\n    />\n    <PnStaticText :value=\"f'\u8bc6\u522b\u7ed3\u679c: {custom_text.value}'\" />\n  </PnRow>\n</template>\n<script lang='py'>\nimport panel as pn\nfrom vuepy import ref\n\ncustom_text = ref(\"\")\n</script>\n", "setup": ""}


VBox(children=(VBox(children=(VBox(children=(BokehModel(combine_events=True, render_bundle={'docs_json': {'603…


## 连续识别

通过设置`continuous=True`，语音识别服务会保持打开状态，允许您连续说多个语句。


In [4]:
%%vuepy_run --plugins vpanel --show-code
<template>
  <PnSpeechToText 
    button_type="warning" 
    :continuous="True"
    v-model="continuous_text.value"
  />
  <PnStaticText :value="f'连续识别结果: {continuous_text.value}'" />
</template>
<script lang='py'>
import panel as pn
from vuepy import ref

continuous_text = ref("")
</script>



VBox(children=(VBox(children=(VBox(children=(VBox(children=(BokehModel(combine_events=True, render_bundle={'do…


## 使用语法列表

可以使用`GrammarList`限制识别服务识别的单词或单词模式。


In [5]:
%%vuepy_run --plugins vpanel --show-code
<template>
  <PnCol>
    <PnStaticText value="尝试说出一种颜色（英文）如red, blue, green等" />
    <PnSpeechToText 
      button_type="primary" 
      :grammars="grammar_list"
      v-model="grammar_text.value"
    />
    <PnStaticText :value="f'识别结果: {grammar_text.value}'" />
  </PnCol>
</template>
<script lang='py'>
import panel as pn
from panel.widgets import GrammarList
from vuepy import ref

# 创建语法列表
grammar_list = GrammarList()
color_grammar = "#JSGF V1.0; grammar colors; public <color> = red | green | blue | yellow | purple | orange | black | white | pink | brown;"
grammar_list.add_from_string(color_grammar, 1)

grammar_text = ref("")
</script>

{"vue": "<!-- --plugins vpanel --show-code -->\n<template>\n  <PnCol>\n    <PnStaticText value=\"\u5c1d\u8bd5\u8bf4\u51fa\u4e00\u79cd\u989c\u8272\uff08\u82f1\u6587\uff09\u5982red, blue, green\u7b49\" />\n    <PnSpeechToText \n      button_type=\"primary\" \n      :grammars=\"grammar_list\"\n      v-model=\"grammar_text.value\"\n    />\n    <PnStaticText :value=\"f'\u8bc6\u522b\u7ed3\u679c: {grammar_text.value}'\" />\n  </PnCol>\n</template>\n<script lang='py'>\nimport panel as pn\nfrom panel.widgets import GrammarList\nfrom vuepy import ref\n\n# \u521b\u5efa\u8bed\u6cd5\u5217\u8868\ngrammar_list = GrammarList()\ncolor_grammar = \"#JSGF V1.0; grammar colors; public <color> = red | green | blue | yellow | purple | orange | black | white | pink | brown;\"\ngrammar_list.add_from_string(color_grammar, 1)\n\ngrammar_text = ref(\"\")\n</script>\n", "setup": ""}


VBox(children=(VBox(children=(VBox(children=(BokehModel(combine_events=True, render_bundle={'docs_json': {'08e…


## 显示详细结果

可以通过`results`属性获取更详细的结果，包括置信度级别。


In [6]:
%%vuepy_run --plugins vpanel --show-code
<template>
  <PnCol>
    <PnSpeechToText 
      button_type="danger" 
      v-model="detailed_text.value"
      @change="update_results"
    />
  </PnCol>
  <PnHTML :object="results_html.value" />
</template>
<script lang='py'>
import panel as pn
from vuepy import ref

detailed_text = ref("")
results_html = ref("")

def update_results(event):
    # 通过引用获取SpeechToText组件实例
    speech_component = event.owner
    # 获取格式化的HTML结果
    results_html.value = speech_component.results_as_html
</script>

{"vue": "<!-- --plugins vpanel --show-code -->\n<template>\n  <PnCol>\n    <PnSpeechToText \n      button_type=\"danger\" \n      v-model=\"detailed_text.value\"\n      @change=\"update_results\"\n    />\n  </PnCol>\n  <PnHTML :object=\"results_html.value\" />\n</template>\n<script lang='py'>\nimport panel as pn\nfrom vuepy import ref\n\ndetailed_text = ref(\"\")\nresults_html = ref(\"\")\n\ndef update_results(event):\n    # \u901a\u8fc7\u5f15\u7528\u83b7\u53d6SpeechToText\u7ec4\u4ef6\u5b9e\u4f8b\n    speech_component = event.owner\n    # \u83b7\u53d6\u683c\u5f0f\u5316\u7684HTML\u7ed3\u679c\n    results_html.value = speech_component.results_as_html\n</script>\n", "setup": ""}


VBox(children=(VBox(children=(VBox(children=(VBox(children=(BokehModel(combine_events=True, render_bundle={'do…


## API

### 属性

| 属性名 | 说明 | 类型 | 默认值 |
| -------- | ------------------- | ---------------------------------------------------------------| ------- |
| results | 识别的结果，字典列表 | ^[List[Dict]] | [] |
| value | 最近的语音识别结果字符串 | ^[str] | "" |
| lang | 当前语音识别服务的语言（BCP 47格式） | ^[str] | 'en-US' |
| continuous | 是否返回每次识别的连续结果，或仅返回单个结果 | ^[boolean] | false |
| interim_results | 是否应返回临时结果 | ^[boolean] | false |
| max_alternatives | 每个结果提供的最大识别替代方案数量 | ^[int] | 1 |
| service_uri | 指定当前语音识别服务使用的语音识别服务位置 | ^[str] | — |
| grammars | 表示当前语音识别服务将理解的语法的GrammarList对象 | ^[GrammarList] | None |
| started | 语音识别服务是否已启动 | ^[boolean] | false |
| audio_started | 音频是否已启动 | ^[boolean] | false |
| sound_started | 声音是否已启动 | ^[boolean] | false |
| speech_started | 用户是否已开始说话 | ^[boolean] | false |
| button_hide | 是否隐藏切换开始/停止按钮 | ^[boolean] | false |
| button_type | 按钮类型 | ^[str] | 'default' |
| button_not_started | 语音识别服务未启动时按钮上显示的文本 | ^[str] | '' |
| button_started | 语音识别服务启动时按钮上显示的文本 | ^[str] | '' |

### Events

| 事件名 | 说明 | 类型 |
| --- | --- | --- |
| change | 当识别结果改变时触发 | ^[Callable]`(event: dict) -> None` |

### 方法

| 属性名 | 说明 | 类型 |
| --- | --- | --- |
| results_deserialized | 获取识别的结果，RecognitionResult对象列表 | ^[property] |
| results_as_html | 获取格式化为HTML的结果 | ^[property] |


## Controls

In [8]:
##controls
import panel as pn
from panel.widgets import SpeechToText, GrammarList

pn.extension()

speech_to_text_basic = SpeechToText(button_type="light")
pn.Row(speech_to_text_basic.controls(jslink=False), speech_to_text_basic) 