日期:2021-02-24 10:55
一个完整的对话交互是由听懂理解回答三个步骤完成的闭环,其中, 听懂需要语音识别(Automatic Speech Recognition, ASR)技术;理解需要自然语 言处理(Natural Language Processing, NLP)技术;回答需要语音合成(Text To Speech, TTS)技术。三个步骤环环相扣,相辅相成。语音识别技术是对话交互的开端,是保证对话 交互高效准确进行的基础。
语音识别技术自 20 世纪 50 年代开始步入萌芽阶段,发展至今,主流算法模型已经经 历了四个阶段:包括模板匹配阶段、模式和特征分析阶段、概率统计建模阶段和现在主流的 深度神经