基于BiGRU_MulCNN的农业问答问句分类技术研究

被引:40
作者
金宁 [1 ,2 ]
赵春江 [3 ,4 ]
吴华瑞 [3 ,4 ]
缪祎晟 [3 ,4 ]
李思 [5 ]
杨宝祝 [3 ,4 ]
机构
[1] 沈阳农业大学信息与电气工程学院
[2] 沈阳建筑大学研究生院
[3] 国家农业信息化工程技术研究中心
[4] 北京农业信息技术研究中心
[5] 沈阳建筑大学党委组织部
基金
北京市自然科学基金;
关键词
农业信息分类; 自然语言处理; 双向门控循环单元神经网络; 卷积神经网络;
D O I
暂无
中图分类号
S126 [电子技术、计算机技术在农业上的应用]; TP391.1 [文字信息处理];
学科分类号
082806 [农业信息与电气工程]; 120506 [数字人文];
摘要
"中国农技推广"问答社区每天新增提问数据近万条,对提问的有效分类是实现智能问答的关键技术环节。海量提问数据具有特征稀疏性强、噪声大、规范性差的特点,制约了文本分类效果。为了改善农业问答问句短文本分类性能,提出了BiGRUMulCNN分类模型,运用TF-IDF算法拓展文本特征,并加权表示文本词向量,利用双向门控循环单元神经网络获取输入词向量的上下文特征信息,构建多尺度并行卷积神经网络,进行多粒度的特征提取。试验结果表明,基于混合神经网络的短文本分类模型可以优化文本表示和文本特征提取,能够准确地对用户提问进行自动分类,正确率达95. 9%,与其他9种文本分类方法相比,分类性能优势明显。
引用
收藏
页码:199 / 206
页数:8
相关论文
共 12 条
[1]
用于短文本分类的BLSTMMLPCNN模型 [J].
郑诚 ;
洪彤彤 ;
薛满意 .
计算机科学, 2019, 46 (06) :206-211
[2]
基于频繁项特征扩展的短文本分类方法 [J].
靳一凡 ;
傅颖勋 ;
马礼 .
计算机科学, 2019, 46(S1) (S1) :478-481
[3]
基于word2vec和Attention-Seq2Seq的水稻病虫害智能问答方法研究 [J].
许童羽 ;
赵冬雪 ;
周云成 ;
冯帅 ;
王郝日钦 .
沈阳农业大学学报, 2019, (03) :378-384
[4]
面向大规模中文文本分类的朴素贝叶斯并行Spark算法(英文) [J].
刘鹏 ;
赵慧含 ;
滕家雨 ;
仰彦妍 ;
刘亚峰 ;
朱宗卫 .
JournalofCentralSouthUniversity, 2019, 26 (01) :1-12
[5]
基于卷积模型的农业问答语性特征抽取分析 [J].
张明岳 ;
吴华瑞 ;
朱华吉 .
农业机械学报, 2018, 49 (12) :203-210
[6]
基于NB和CHI值的农业文本分类方法 [J].
周云成 ;
许童羽 ;
邓寒冰 .
江苏农业科学, 2018, 46 (17) :219-223
[7]
基于word2vec和LSTM的句子相似度计算及其在水稻FAQ问答系统中的应用 [J].
梁敬东 ;
崔丙剑 ;
姜海燕 ;
沈毅 ;
谢元澄 .
南京农业大学学报, 2018, 41 (05) :946-953
[8]
基于支持向量的最近邻文本分类方法 [J].
古丽娜孜艾力木江 ;
乎西旦居马洪 ;
孙铁利 ;
梁义 .
智能系统学报, 2018, 13 (05) :799-807
[9]
基于BIGRU的番茄病虫害问答系统问句分类研究 [J].
赵明 ;
董翠翠 ;
董乔雪 ;
陈瑛 .
农业机械学报, 2018, 49 (05) :271-276
[10]
基于CP-CNN的中文短文本分类研究 [J].
余本功 ;
张连彬 .
计算机应用研究, 2018, 35 (04) :1001-1004