语音识别技术的研究进展与展望

被引:71
作者
王海坤
潘嘉
刘聪
机构
[1] 科大讯飞股份有限公司人工智能研究院
关键词
自动语音识别; 深度神经网络; 声学模型; 语言模型;
D O I
暂无
中图分类号
TN912.34 [语音识别与设备];
学科分类号
0711 ;
摘要
自动语音识别(ASR)技术的目的是让机器能够"听懂"人类的语音,将人类语音信息转化为可读的文字信息,是实现人机交互的关键技术,也是长期以来的研究热点。最近几年,随着深度神经网络的应用,加上海量大数据的使用和云计算的普及,语音识别取得了突飞猛进的进展,在多个行业突破了实用化的门槛,越来越多的语音技术产品进入了人们的日常生活,包括苹果的Siri、亚马逊的Alexa、讯飞语音输入法、叮咚智能音箱等都是其中的典型代表。对语音识别技术的发展情况、最近几年的关键突破性技术进行了介绍,并对语音识别技术的发展趋势做了展望。
引用
收藏
页码:1 / 11
页数:11
相关论文
共 7 条
[1]   A fast learning algorithm for deep belief nets [J].
Hinton, Geoffrey E. ;
Osindero, Simon ;
Teh, Yee-Whye .
NEURAL COMPUTATION, 2006, 18 (07) :1527-1554
[2]   Training products of experts by minimizing contrastive divergence [J].
Hinton, GE .
NEURAL COMPUTATION, 2002, 14 (08) :1771-1800
[3]   Long short-term memory [J].
Hochreiter, S ;
Schmidhuber, J .
NEURAL COMPUTATION, 1997, 9 (08) :1735-1780
[4]  
Deep belief networks for phone recognition .2 MOHAMED A R,DAHL G,HINTON G. . 2009
[5]  
Deep neural network language models .2 ARSOY E,SAINATH T N,KINGSBURY B,et al. NAACL-HLT 2012 Workshop . 2012
[6]  
Highway long short-term memory RNNS for distant speech recognition .2 ZHANG Y,CHEN G G,YU D,et al. 2016 IEEE International Conference on Acoustics,Speech and Signal Processing . 2016
[7]  
Feedforward sequential memory networks:a new structure to learn long-term dependency .2 ZHANG S L,LIU C,JIANG H,et al. . 2015