Web Speech API的语音识别功能在Chrome、Edge和Opera中支持良好,需HTTPS或localhost环境;Safari和Firefox不支持,需用第三方服务补充。
Web Speech API 是浏览器内置的一项功能,允许网页应用实现语音识别和语音合成功能。其中的语音识别部分(SpeechRecognition)可以让用户通过麦克风输入语音,并将其转换为文本,适用于搜索、表单填写、语音控制等场景。
目前 Web Speech API 的语音识别功能在不同浏览器中的支持程度不一,尤其在跨平台一致性方面存在差异:
在集成前,建议先检测当前浏览器是否支持 SpeechRecognition,避免脚本报错:
if ('SpeechRecognition' in window || 'webkitSpeechRecognition' in window) { // 支持语音识别 } else { console.log('当前浏览器不支持语音识别'); }
由于 Chrome 使用了前缀,需同时判断 window.SpeechRecognition 和 window.webkitSpeechRecognition。
基本上就这些。如果目标用户主要使用 Chrome 或 Edge,Web Speech API 是一个轻量且高效的语音识别方案;若需广泛兼容 Safari 或 Firefox,则需结合第三方服务(如阿里云、百度语音、Google Cloud Speech-to-Text)自行封装接口。