基于语境框架的文本相似度计算

被引:24
作者
晋耀红
机构
[1] 不详
[2] 中国科学院声学研究所 北京
[3] 不详
关键词
文本相似度; 语境框架; 领域; 情景; 背景; 文本语义结构; 褒贬;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
介绍了一种新的文本形式化的语义模型———语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。
引用
收藏
页码:36 / 39
页数:4
相关论文
共 4 条
[1]   基于汉明距离的文本相似度计算 [J].
张焕炯 ;
王国胜 ;
钟义信 .
计算机工程与应用, 2001, (19) :21-22
[2]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[3]   基于属性论的文本相似度计算 [J].
潘谦红 ;
王炬 ;
史忠植 .
计算机学报, 1999, (06) :651-655
[4]  
HNC(概念层次网络)理论[M]. 清华大学出版社 , 黄曾阳著, 1998