JavaScript语音合成依赖Web Speech API的SpeechSynthesis接口,支持纯前端文本转语音;需检测window.speechSynthesis可用性,监听voiceschanged获取音色,创建SpeechSynthesisUtterance配置参数后调用speak()播放,并可控制暂停、恢复、取消及监听事件。
JavaScript 实现语音合成主要依靠 Web Speech API 中的 SpeechSynthesis 接口,它无需后端、纯前端即可将文本转为语音,兼容 Chrome、Edge、Safari(部分支持)、Firefox(需手动启用)等现代浏览器。
不是所有浏览器都默认启用或完全支持该 API,调用前应先检测可用性:
window.speechSynthesis 判断是否存在speechSynthesis.getVoices() 获取系统可用音色列表(注意:首次调用可能为空,需监听 voiceschanged 事件)示例:
if ('speechSynthesis' in window) {
const synth = window.speechSynthesis;
synth.onvoiceschanged = () => {
const voices = synth.getVoices();
console.log('可用语音:', voices);
};
} else {
console.warn('当前浏览器不支持语音合成');
}
创建 SpeechSynthesisUtterance 实例,配置文字、语速、音高、音量和指定语音(voice),再交给 speechSynthesis.speak() 播放:
text:要朗读的字符串(建议过滤 HTML 标签和特殊符号)rate:语速(0.1–10,默认 1)pitch:音高(0–2,默认 1)volume:音量(0–1,默认 1)voice:从 getVoices() 中选取,例如 voices.find(v => v.lang === 'zh-CN')
示例(中文朗读):
const utterance = new SpeechSynthesisUtterance('你好,欢迎使用语音合成');
utterance.lang = 'zh-CN';
utterance.rate = 0.9;
utterance.pitch = 1.1;
// 选择中文语音(确保已加载完成)
synth.onvoiceschanged = () => {
const voices = synth.get
Voices();
const cnVoice = voices.find(v => v.lang.includes('zh'));
if (cnVoice) utterance.voice = cnVoice;
};
synth.speak(utterance);
语音合成支持暂停、恢复、取消和事件监听,适合做交互式语音功能:
synth.pause() 和 synth.resume() 控制播放暂停/继续synth.cancel() 终止所有排队中的语音onstart、onend、onerror、onpause、onresume
例如监听结束并自动播放下一句:
utterance.onend = () => {
console.log('朗读完成');
// 可触发下一步逻辑,如高亮对应段落、加载新内容等
};
实际开发中容易踩坑的地方:
speak()
speak() 会自动入队,但未处理好 cancel() 可能导致旧语音意外播放不复杂但容易忽略细节,合理封装成工具函数可大幅提升复用性和健壮性。