语音输入 - Zebra Technologies TechDocs

概述

语音输入使 DataWedge 可以将口语输入转换为按键，如同键入或从扫描获取一样。语音输入使用 GMS 设备上包含的 Google 语音识别引擎。当条码受潮、损坏、覆有杂散标记或由于其他原因而无法扫描时，可以使用语音转数据捕获。

语音输入选项：

使用定义的开始短语或 PTT 按钮开始语音捕获
使用短语或超时值终止语音捕获
在说出“发送 Tab”命令时发送 TAB 字符
在说出“发送 Enter”命令时发送 ENTER 字符
将返回的数据限制为字母或数字字符
在等待开始短语或数据捕获时播放音频提示
验证说出的数据，根据需要编辑获取的数据
脱机工作

此功能仅在 Zebra Android Nougat 和 Oreo GMS 设备上受支持。

观看有关 DataWedge 语音输入的 DevTalk 演示：

版本历史记录

DataWedge 7.4 - 引入了通过 PTT（通话按键）按钮激活语音捕获的功能，并有用于 DataWedge Intent API 的新开始选项语音输入参数。

工作原理

语音输入依赖于 DataWedge 配置文件进行配置。确保将要接收语音捕获的数据的应用程序与配置文件关联。配置文件中的语音输入部分提供用于控制语音数据捕获的选项。请参阅下面的主要功能部分。

语音数据采集可通过预定义的开始短语或按下 PTT 按钮来激活。运行时，语音输入置于“等待开始短语”状态（请参见图 8）。语音数据捕获在说出预定义的“开始短语”之后开始，然后将状态更改为“等待数据”（请参见图 9）。在说出数据之后，或是在说出可选的“结束短语”（如果已定义）之后，语音捕获会在超时值过后停止。数据源可以标识为语音输入，以便根据任何应用程序要求来处理语音数据。条码扫描和语音输入可以存在于相同的 DataWedge 配置文件中，因此两种数据捕获方法可以交换使用。

观看使用 DWDemo 应用程序的语音输入基本知识的演示：

观看展示用于多个字段条目的发送 Enter 命令的演示：

主要功能

可从 DataWege 配置文件访问语音输入功能。

已启用 - 启用语音输入。
数据采集开始选项 - 选择用于语音捕获的触发器选项。

开始短语 - 设置用于触发语音捕获的开始短语。开始短语在选项数据采集开始短语中指定。
PTT 按钮 - 设置用于触发语音捕获的 PTT 按钮。仅在 EC30、MC93、TC52/TC57、TC72/TC77 和 TC8300 设备上支持。对于其他设备，PTT 按钮可以映射到设备上的可用按钮。

数据采集开始短语 - 如果开始短语已选为数据采集开始选项，则是用于开始数据采集的指定短语。开始短语中不支持数字和特殊字符。默认值是 "start"。
数据捕获结束短语 - 用于结束数据捕获的可选短语。无默认值。
结束检测超时 - 为处于“等待数据”状态期间的数据捕获设置超时值（以秒为单位）。如果该值设置为 "0" 并且定义了结束短语，则会无限期等待数据捕获。而当未定义结束短语时，会立即返回数据。此超时是近似值，因为可能会遇到 1 到 2 秒的延迟。默认值为 "0"。
Tab 命令 - 在说出命令“发送 Tab”时发送 Tab 键。仅当设备处于“等待开始短语”状态时，才支持此命令。
Enter 命令 - 在说出命令“发送 Enter”时发送 Enter 键。仅当设备处于“等待开始短语”状态时，才支持此命令。
数据类型 - 配置要返回的数据类型，其中包括：任意、字母或数字。限制根据首选项捕获的数据需要数据类型。数据类型选择：

任意 - 返回所有扫描的数据。例如，如果扫描了条码 ABC123，则返回 ABC123。
字母 - 仅返回字母字符。例如，如果扫描了条码 ABC123，则仅返回 ABC。
数字 - 仅返回数字。例如，如果扫描了条码 ABC123，则仅返回 123。

开始短语等待提示音 - 控制开始短语等待提示音。它可启用/禁用“等待开始”的音频反馈，以便在错过弹出消息通知以及“等待数据”状态发生更改时，通知设备正在等待启动语音引擎。
数据捕获等待提示音 - 控制数据捕获等待提示音。它可启用/禁用“等待数据”的音频反馈，以便在错过弹出消息通知时，通知设备正在等待捕获数据。
脱机语音识别 - 在无法访问互联网时启用脱机语音识别。这会使用脱机识别语音引擎来检测说出的数据。
验证窗口 - 在说话之后验证结果（显示输出的数据），并且提供在同一屏幕上编辑数据（如果需要）的功能。这可用于脱机模式，因为在此模式下收到的结果可能不准确。

请参阅下面的“限制”。

配置

语音输入参数

DataWedge 语音输入可以通过 DataWedge API 以编程方式进行控制。请参阅 Set Config API 中的“DataWedge 语音输入插件”，以配置以下语音输入参数：

参数名称	参数值
voice_input_enabled	true，false
voice_data_capture_start_phrase	start（默认值）
voice_data_capture_end_phrase	[空白]（默认值）
voice_end_detection_timeout	0-30（以秒为单位）
voice_tab_command	true，false
voice_enter_command	true，false
voice_data_type	0 - 任意，1 - 字母，2 - 数字
voice_start_phrase_waiting_tone	true，false
voice_data_capture_waiting_tone	true，false
voice_validation_window	true，false
voice_data_capture_waiting_tone	true，false
voice_offline_speech	true，false
voice_data_capture_start_option	START_PHRASE（默认） PTT_BUTTON

设置语音输入配置示例

请参阅 DataWedge Set Config API。

限制

语音输入仅使用英语进行验证。
脱机语音识别提供准确性水平较低。
在使用应用程序管理器的 DisableGMSApps 操作的 GMS 限制模式下，语音输入无法正常工作，因为它依赖于 Google 语音识别。
不要在使用 DataWedge 语音输入时使用 Google Assistant，因为它可能会导致不必要的行为。
不支持提供数字和其他特殊字符作为数据捕获开始短语的一部分。
如果 Enterprise Home Screen (EHS) 处于限制模式，则不支持语音输入。但是，启用 EHS 中的所有权限设置会恢复 DataWedge 中的语音输入。
如果在语音采集过程中释放了 PTT（通话按键）按钮，则由于语音引擎此时仍在继续监听，可能会有 1 到 2 秒的延迟来显示采集的数据。
如果 PTT Express 已启用且正在运行，则不应同时使用语音输入，否则会导致意外行为。

相关指南：