学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于语境框架的文本相似度计算
被引:24
作者
:
论文数:
引用数:
h-index:
机构:
晋耀红
机构
:
[1]
不详
[2]
中国科学院声学研究所 北京
[3]
不详
来源
:
计算机工程与应用
|
2004年
/ 16期
关键词
:
文本相似度;
语境框架;
领域;
情景;
背景;
文本语义结构;
褒贬;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
介绍了一种新的文本形式化的语义模型———语境框架。语境框架是一个三维的语义描述,它把文本内容抽象成领域(静态范畴)、情景(动态描述)、背景(褒贬、参照等)三个侧面。在语境框架的基础上,设计实现了文本相似度计算算法。算法从概念层面入手,充分考虑了文本的领域和对象的语义角色对相似度的影响,重点针对文本中的歧义、多义、概念组合现象,以及语言中的褒贬倾向,实现了文本间语义相似程度的量化。算法已经应用到文本过滤系统中,用以比较用户过滤要求和待过滤文本之间的相似度。实际应用中取得了比较满意的效果。
引用
收藏
页码:36 / 39
页数:4
相关论文
共 4 条
[1]
基于汉明距离的文本相似度计算
[J].
论文数:
引用数:
h-index:
机构:
张焕炯
;
论文数:
引用数:
h-index:
机构:
王国胜
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程学院
钟义信
.
计算机工程与应用,
2001,
(19)
:21
-22
[2]
基于向量空间模型的文本自动分类系统的研究与实现
[J].
论文数:
引用数:
h-index:
机构:
庞剑锋
;
论文数:
引用数:
h-index:
机构:
卜东波
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
白硕
.
计算机应用研究,
2001,
(09)
:23
-26
[3]
基于属性论的文本相似度计算
[J].
论文数:
引用数:
h-index:
机构:
潘谦红
;
论文数:
引用数:
h-index:
机构:
王炬
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
史忠植
.
计算机学报,
1999,
(06)
:651
-655
[4]
HNC(概念层次网络)理论[M]. 清华大学出版社 , 黄曾阳著, 1998
←
1
→
共 4 条
[1]
基于汉明距离的文本相似度计算
[J].
论文数:
引用数:
h-index:
机构:
张焕炯
;
论文数:
引用数:
h-index:
机构:
王国胜
;
钟义信
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学信息工程学院
钟义信
.
计算机工程与应用,
2001,
(19)
:21
-22
[2]
基于向量空间模型的文本自动分类系统的研究与实现
[J].
论文数:
引用数:
h-index:
机构:
庞剑锋
;
论文数:
引用数:
h-index:
机构:
卜东波
;
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
白硕
.
计算机应用研究,
2001,
(09)
:23
-26
[3]
基于属性论的文本相似度计算
[J].
论文数:
引用数:
h-index:
机构:
潘谦红
;
论文数:
引用数:
h-index:
机构:
王炬
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所!北京
史忠植
.
计算机学报,
1999,
(06)
:651
-655
[4]
HNC(概念层次网络)理论[M]. 清华大学出版社 , 黄曾阳著, 1998
←
1
→