基于句子相似度计算的信息抽取

被引:4
作者
廉站俊 [1 ]
吕学强 [1 ]
张玉杰 [2 ]
施水才 [1 ]
机构
[1] 北京信息科技大学中文信息处理研究中心
[2] 大连工业大学信息学院
关键词
信息抽取; 概率分布; 主题; 句子相似度计算;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
提出一种基于句子相似度的信息抽取方法。采用句子主题相似度计算,对测试语料进行小句主题识别;同时结合句子主题在整个文章中的概率分布特点,提高识别的准确性。以网络上个人信息资源为语料,在该系统上进行测试,取得较好效果。
引用
收藏
页码:38 / 41
页数:4
相关论文
共 4 条
[1]   基于规则的中文时间词和数词的自动识别算法 [J].
高霄云 ;
杨建林 .
现代图书情报技术, 2007, (03) :46-50
[2]   无结构文本信息抽取综述 [J].
李向阳 ;
苗壮 ;
肖江 .
军事通信技术, 2004, 25 (02) :31-36
[3]   基于语义依存的汉语句子相似度计算 [J].
李彬 ;
刘挺 ;
秦兵 ;
李生 .
计算机应用研究, 2003, (12) :15-17
[4]  
车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004(07)