面向游戏客服场景的自动问答系统研究与实现

被引:23
作者
王丽月
叶东毅
机构
[1] 福州大学数学与计算机科学学院
关键词
word2vec; 句子相似度; 文本分类; 自动问答; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
针对游戏客服场景中玩家领域化、口语化的提问方式,应用深度学习工具word2vec建立带有语义的词的向量表示,设计了一种利用词向量距离,结合同义词替换、权重、句子长度、词序等因素的句子相似度计算模型。在该模型基础上,通过预分类、重定义分类规则,对KNN分类算法的大类占优、全局匹配计算代价高等问题进行改进,实现了一种基于文本分类的面向游戏客服场景的自动问答系统。实验结果表明,该系统具有较高的问题分类准确率和分类效率。
引用
收藏
页码:152 / 159
页数:8
相关论文
共 15 条
[1]
统计学习方法.[M].李航; 著.清华大学出版社.2012,
[3]
中文句子相似度计算的研究.[J].贾宗福;王知非;.科技信息.2009, 11
[4]
kNN文本分类器类偏斜问题的一种处理对策 [J].
郝秀兰 ;
陶晓鹏 ;
徐和祥 ;
胡运发 .
计算机研究与发展, 2009, (01) :52-61
[5]
句子相似度计算新方法及在问答系统中的应用 [J].
周法国 ;
杨炳儒 .
计算机工程与应用, 2008, (01) :165-167+178
[6]
一种改进的句子相似度计算模型 [J].
杨思春 .
电子科技大学学报, 2006, (06) :956-959
[7]
基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[8]
问答式检索技术及评测研究综述 [J].
吴友政 ;
赵军 ;
段湘煜 ;
徐波 .
中文信息学报, 2005, (03) :1-13
[9]
文本自动分类中特征权重算法的改进研究 [J].
徐凤亚 ;
罗振声 .
计算机工程与应用, 2005, (01) :181-184+220
[10]
基于层叠隐马模型的汉语词法分析 [J].
刘群 ;
张华平 ;
俞鸿魁 ;
程学旗 .
计算机研究与发展, 2004, (08) :1421-1429