HTML5如何实现语音识别和朗读指定内容?

5 min read

HTML5提供了一系列的在浏览器中使用语音识别和语音合成的API。

语音识别API(SpeechRecognition)可以使浏览器监听麦克风输入的音频,将其转换为文本,从而实现语音识别功能。

以下是一个简单的示例,展示如何在浏览器中使用SpeechRecognition API:

// 创建一个 SpeechRecognition 对象
const recognition = new webkitSpeechRecognition();

// 设置语言为中文
recognition.lang = 'zh-CN';

// 开始识别
recognition.start();

// 当获取到语音输入时,调用该回调函数
recognition.onresult = function(event) {
   console.log(event.results);
}

语音合成API(SpeechSynthesis)可以使用浏览器内置的语音合成引擎,将文本转换为语音输出。

以下是一个简单的示例,展示如何在浏览器中使用SpeechSynthesis API:

// 创建一个新的 SpeechSynthesisUtterance 对象
const utterance = new SpeechSynthesisUtterance();

// 设置要朗读的文本
utterance.text = 'Hello World!';

// 使用浏览器内置的语音合成引擎朗读文本
window.speechSynthesis.speak(utterance);

以上是HTML5识别语音读出的内容和朗读指定的内容的基本操作,你可以根据具体需求和API文档进一步了解和使用。