语音输入

DataWedge 7.4

概述

语音输入使 DataWedge 可以将口语输入转换为按键,如同键入或从扫描获取一样。语音输入使用 GMS 设备上包含的 Google 语音识别引擎。当条码受潮、损坏、覆有杂散标记或由于其他原因而无法扫描时,可以使用语音转数据捕获。

语音输入选项:

  • 使用定义的开始短语或 PTT 按钮开始语音捕获
  • 使用短语或超时值终止语音捕获
  • 在说出“发送 Tab”命令时发送 TAB 字符
  • 在说出“发送 Enter”命令时发送 ENTER 字符
  • 将返回的数据限制为字母或数字字符
  • 在等待开始短语或数据捕获时播放音频提示
  • 验证说出的数据,根据需要编辑获取的数据
  • 脱机工作

此功能仅在 Zebra Android Nougat 和 Oreo GMS 设备上受支持。

观看有关 DataWedge 语音输入的 DevTalk 演示:

版本历史记录

  • DataWedge 7.4 - 引入了通过 PTT(通话按键)按钮激活语音捕获的功能,并有用于 DataWedge Intent API 的新开始选项语音输入参数。

工作原理

语音输入依赖于 DataWedge 配置文件进行配置。确保将要接收语音捕获的数据的应用程序与配置文件关联。配置文件中的语音输入部分提供用于控制语音数据捕获的选项。请参阅下面的主要功能部分。

语音数据采集可通过预定义的开始短语或按下 PTT 按钮来激活。运行时,语音输入置于“等待开始短语”状态(请参见图 8)。语音数据捕获在说出预定义的“开始短语”之后开始,然后将状态更改为“等待数据”(请参见图 9)。在说出数据之后,或是在说出可选的“结束短语”(如果已定义)之后,语音捕获会在超时值过后停止。数据源可以标识为语音输入,以便根据任何应用程序要求来处理语音数据。条码扫描和语音输入可以存在于相同的 DataWedge 配置文件中,因此两种数据捕获方法可以交换使用。

观看使用 DWDemo 应用程序的语音输入基本知识的演示:

观看展示用于多个字段条目的发送 Enter 命令的演示:

主要功能

可从 DataWege 配置文件访问语音输入功能。

img

  • 已启用 - 启用语音输入。

  • 数据采集开始选项 - 选择用于语音捕获的触发器选项。

  • 开始短语 - 设置用于触发语音捕获的开始短语。开始短语在选项数据采集开始短语中指定。
  • PTT 按钮 - 设置用于触发语音捕获的 PTT 按钮。仅在 EC30、MC93、TC52/TC57、TC72/TC77 和 TC8300 设备上支持。对于其他设备,PTT 按钮可以映射到设备上的可用按钮。
  • 数据采集开始短语 - 如果开始短语已选为数据采集开始选项,则是用于开始数据采集的指定短语。开始短语中不支持数字和特殊字符。默认值是 "start"。

  • 数据捕获结束短语 - 用于结束数据捕获的可选短语。无默认值。

  • 结束检测超时 - 为处于“等待数据”状态期间的数据捕获设置超时值(以秒为单位)。如果该值设置为 "0" 并且定义了结束短语,则会无限期等待数据捕获。而当未定义结束短语时,会立即返回数据。此超时是近似值,因为可能会遇到 1 到 2 秒的延迟。默认值为 "0"。

  • Tab 命令 - 在说出命令“发送 Tab”时发送 Tab 键。仅当设备处于“等待开始短语”状态时,才支持此命令。

  • Enter 命令 - 在说出命令“发送 Enter”时发送 Enter 键。仅当设备处于“等待开始短语”状态时,才支持此命令。

  • 数据类型 - 配置要返回的数据类型,其中包括:任意、字母或数字。限制根据首选项捕获的数据需要数据类型。数据类型选择:

  • 任意 - 返回所有扫描的数据。例如,如果扫描了条码 ABC123,则返回 ABC123。
  • 字母 - 仅返回字母字符。例如,如果扫描了条码 ABC123,则仅返回 ABC。
  • 数字 - 仅返回数字。例如,如果扫描了条码 ABC123,则仅返回 123。
  • 开始短语等待提示音 - 控制开始短语等待提示音。它可启用/禁用“等待开始”的音频反馈,以便在错过弹出消息通知以及“等待数据”状态发生更改时,通知设备正在等待启动语音引擎。

  • 数据捕获等待提示音 - 控制数据捕获等待提示音。它可启用/禁用“等待数据”的音频反馈,以便在错过弹出消息通知时,通知设备正在等待捕获数据。

  • 脱机语音识别 - 在无法访问互联网时启用脱机语音识别。这会使用脱机识别语音引擎来检测说出的数据。

  • 验证窗口 - 在说话之后验证结果(显示输出的数据),并且提供在同一屏幕上编辑数据(如果需要)的功能。这可用于脱机模式,因为在此模式下收到的结果可能不准确。

img

请参阅下面的“限制”。

配置

语音输入参数

DataWedge 语音输入可以通过 DataWedge API 以编程方式进行控制。请参阅 Set Config API 中的“DataWedge 语音输入插件”,以配置以下语音输入参数:

参数名称 参数值
voice_input_enabled true,false
voice_data_capture_start_phrase start(默认值)
voice_data_capture_end_phrase [空白](默认值)
voice_end_detection_timeout 0-30(以秒为单位)
voice_tab_command true,false
voice_enter_command true,false
voice_data_type 0 - 任意,1 - 字母,2 - 数字
voice_start_phrase_waiting_tone true,false
voice_data_capture_waiting_tone true,false
voice_validation_window true,false
voice_data_capture_waiting_tone true,false
voice_offline_speech true,false
voice_data_capture_start_option START_PHRASE(默认)
PTT_BUTTON

设置语音输入配置示例

请参阅 DataWedge Set Config API

限制

  • 语音输入仅使用英语进行验证。
  • 脱机语音识别提供准确性水平较低。
  • 在使用应用程序管理器的 DisableGMSApps 操作的 GMS 限制模式下,语音输入无法正常工作,因为它依赖于 Google 语音识别。
  • 不要在使用 DataWedge 语音输入时使用 Google Assistant,因为它可能会导致不必要的行为。
  • 不支持提供数字和其他特殊字符作为数据捕获开始短语的一部分。
  • 如果 Enterprise Home Screen (EHS) 处于限制模式,则不支持语音输入。但是,启用 EHS 中的所有权限设置会恢复 DataWedge 中的语音输入。
  • 如果在语音采集过程中释放了 PTT(通话按键)按钮,则由于语音引擎此时仍在继续监听,可能会有 1 到 2 秒的延迟来显示采集的数据。
  • 如果 PTT Express 已启用且正在运行,则不应同时使用语音输入,否则会导致意外行为。

相关指南