基于潜在语义分析的汉语问答系统答案提取

被引:43
作者
余正涛 [1 ]
樊孝忠 [2 ]
郭剑毅 [1 ]
耿增民 [2 ]
机构
[1] 昆明理工大学信息工程与自动化学院 
[2] 北京理工大学计算机科学工程系 
关键词
问答系统; 答案提取; 相似度; 向量空间模型; 潜在语义分析;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为了解决在汉语问答系统答案提取时,由于词的同义或多义现象而导致的“漏提”或“错提”等问题,提出了一种基于潜在语义分析(LSA)的问题和答案句子相似度计算方法.它利用空间向量模型作为问题和句子的表示方法,借助于潜在语义分析理论,对大量问答作句子语料统计分析,构建了一个潜在的词-句子语义空间,从而消除了词之间的相关性,并在语义空间上实现了问题与答案句子相似度计算,有效地解决了词的同义和多义问题.最后结合问题类型和相似度计算结果,对汉语基于事实的简单陈述问题进行了答案句子提取实验.答案提取的MRR值达到了0.47,明显优于空间向量模型.结果说明该方法具有很好的效果.
引用
收藏
页码:1889 / 1893
页数:5
相关论文
共 8 条
  • [1] 基于网络的中文问答系统及信息抽取算法研究
    崔桓
    蔡东风
    苗雪雷
    [J]. 中文信息学报, 2004, (03) : 24 - 31
  • [2] 基于潜在语义分析的BBS文档Bayes鉴别器
    刘昌钰
    唐常杰
    于中华
    杜永萍
    郭颖
    [J]. 计算机学报, 2004, (04) : 566 - 572
  • [3] 基于潜在语义分析的信息检索
    盖杰
    王怡
    武港山
    [J]. 计算机工程, 2004, (02) : 58 - 60
  • [4] 基于互联网的中文问答系统
    张永奎
    赵辄谦
    白丽君
    陈鑫卿
    [J]. 计算机工程, 2003, (15) : 84 - 85+197
  • [5] 自动问答综述
    郑实福
    刘挺
    秦兵
    李生
    [J]. 中文信息学报, 2002, (06) : 46 - 52
  • [6] 基于潜在语义索引的文本摘要方法
    林鸿飞
    高仁璟
    [J]. 大连理工大学学报, 2001, (06) : 744 - 748
  • [7] 基于示例的文本标题分类机制
    林鸿飞
    [J]. 计算机研究与发展, 2001, (09) : 1132 - 1136
  • [8] Thomas K. Landauer,Peter W. Foltz,Darrell Laham.An introduction to latent semantic analysis[J].Discourse Processes,1998(2-3)