基于句子相似度计算的信息抽取

被引：4

作者：

廉站俊 ^{[1
]}

吕学强 ^{[1
]}

张玉杰 ^{[2
]}

施水才 ^{[1
]}

机构：

[1] 北京信息科技大学中文信息处理研究中心

[2] 大连工业大学信息学院

来源：

关键词：

信息抽取; 概率分布; 主题; 句子相似度计算;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

提出一种基于句子相似度的信息抽取方法。采用句子主题相似度计算,对测试语料进行小句主题识别;同时结合句子主题在整个文章中的概率分布特点,提高识别的准确性。以网络上个人信息资源为语料,在该系统上进行测试,取得较好效果。

引用

页码：38 / 41

页数：4

共 4 条

[1] 基于规则的中文时间词和数词的自动识别算法 [J].

高霄云 ;

杨建林 .

[2] 无结构文本信息抽取综述 [J].

李向阳 ;

苗壮 ;

肖江 .

[3] 基于语义依存的汉语句子相似度计算 [J].

李彬 ;

刘挺 ;

秦兵 ;

李生 .

[4]

车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004(07)