限定领域口语对话系统中超出领域话语的对话行为识别

被引:3
作者
黄沛杰
王俊东
柯子烜
林丕源
机构
[1] 华南农业大学数学与信息学院
关键词
对话行为识别; 超出领域话语; 随机森林; 词向量; 口语对话系统;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
由于领域外话语具有内容短小、表达多样性、开放性及口语化等特点,限定领域口语对话系统中超出领域话语的对话行为识别是一个挑战。该文提出了一种结合外部无标签微博数据的随机森林对话行为识别方法。该文采用的微博数据无需根据应用领域特点专门收集和挑选,又与口语对话同样具有口语化和表达多样性的特点,其训练得到的词向量在超出领域话语出现超出词汇表字词时提供了有效的相似性扩展度量。随机森林模型具有较好的泛化能力,适合训练数据有限的分类任务。中文特定领域的口语对话语料库测试表明,该文提出的超出领域话语的对话行为识别方法取得了优于最大熵、卷积神经网络等短文本分类研究进展中的方法的效果。
引用
收藏
页码:182 / 189+200 +200
页数:9
相关论文
共 39 条
  • [1] 基于词矢量相似度的短文本分类
    马成龙
    姜亚松
    李艳玲
    张艳
    颜永红
    [J]. 山东大学学报(理学版), 2014, 49 (12) : 18 - 22+35
  • [2] 随机森林方法研究综述
    方匡南
    吴见彬
    朱建平
    谢邦昌
    [J]. 统计与信息论坛, 2011, 26 (03) : 32 - 38
  • [3] 汉语股票实时行情查询对话系统
    张琳
    高峰
    郭荣
    毛家菊
    陆汝占
    [J]. 计算机应用, 2004, (07) : 61 - 63
  • [4] 校园导航系统Easy Nav的设计与实现
    黄寅飞
    郑方
    燕鹏举
    徐明星
    吴文虎
    [J]. 中文信息学报, 2001, (04) : 35 - 40
  • [5] Combining heterogeneous deep neural networks with conditional random fields for Chinese dialogue act recognition[J] . Yucan Zhou,Qinghua Hu,Jie Liu,Yuan Jia. &nbspNeurocomputing . 2015
  • [6] Random forests
    Breiman, L
    [J]. MACHINE LEARNING, 2001, 45 (01) : 5 - 32
  • [7] How may I help you?[J] . A.L Gorin,G Riccardi,J.H Wright. &nbspSpeech Communication . 1997 (1)
  • [8] Bagging predictors
    Breiman, L
    [J]. MACHINE LEARNING, 1996, 24 (02) : 123 - 140
  • [9] JUPlTER: a telephone-based conversational interface for weather information. Zue, V.,Seneff, S.,Glass, J.R.,Polifroni, J.,Pao, C.,Hazen, T.J.,Hetherington, L. Speech and Audio Processing, IEEE Transactions on . 2000
  • [10] Out-of-Domain Utterance Detection Using Classification Confidences of Multiple Topics. Ian Lane,Tatsuya Kawahara,Tomoko Matsui,Satoshi Nakamura. IEEE Transactions on Audio, Speech, and Language Processing . 2007