学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于语义信息的中文短信文本相似度研究
被引:9
作者
:
刘金岭
论文数:
0
引用数:
0
h-index:
0
机构:
淮阴工学院计算机工程学院
淮阴工学院计算机工程学院
刘金岭
[
1
]
宋连友
论文数:
0
引用数:
0
h-index:
0
机构:
沧州师范学院计算机系
淮阴工学院计算机工程学院
宋连友
[
2
]
论文数:
引用数:
h-index:
机构:
范玉虹
[
2
]
机构
:
[1]
淮阴工学院计算机工程学院
[2]
沧州师范学院计算机系
来源
:
计算机工程
|
2012年
/ 38卷
/ 13期
关键词
:
短信文本;
相似度;
TF-IDF模型;
特征词;
向量空间模型;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
在传统TF-IDF模型基础上分析中文短信文本中特征词的语义信息,提出一种中文短信文本相似度度量方法。对短信文本进行预处理,计算各词语的TF-IDF值,并选择TF-IDF值较高的词作为特征词,借助向量空间模型的词语向量相似度,结合词语相似度加权,给出2篇短信文本相似度的计算方法。实验结果表明,该方法在F-度量值上优于TF-IDF算法及词语语义相似度算法。
引用
收藏
页码:58 / 60+70 +70
页数:4
相关论文
共 7 条
[1]
改进的K均值算法在中文文本聚类中的研究.[D].李梅.安徽大学.2010, 10
[2]
特征词抽取与查询扩展融合的信息检索系统模型
黄名选
论文数:
0
引用数:
0
h-index:
0
机构:
广西教育学院数学与计算机科学系
黄名选
[J].
情报杂志,
2011,
30
(11)
: 162
-
165+155
[3]
利用本体关联度改进的TF-IDF特征词提取方法
徐建民
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
徐建民
王金花
论文数:
0
引用数:
0
h-index:
0
机构:
河北大学工商学院
不详
王金花
马伟瑜
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
马伟瑜
[J].
情报科学 ,
2011,
(02)
: 279
-
283
[4]
一种基于语料特性的聚类算法
论文数:
引用数:
h-index:
机构:
曾依灵
论文数:
引用数:
h-index:
机构:
许洪波
论文数:
引用数:
h-index:
机构:
吴高巍
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所网络重点实验室
中国科学院计算技术研究所网络重点实验室
白硕
[J].
软件学报,
2010,
21
(11)
: 2802
-
2813
[5]
基于语义树的中文词语相似度计算与分析
论文数:
引用数:
h-index:
机构:
张亮
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
中文信息学报,
2010,
(06)
: 23
-
30
[6]
基于VSM的文本相似度计算的研究
郭庆琳
论文数:
0
引用数:
0
h-index:
0
机构:
华北电力大学计算机科学与技术学院
北京大学计算机系
华北电力大学计算机科学与技术学院
郭庆琳
李艳梅
论文数:
0
引用数:
0
h-index:
0
机构:
华北电力大学计算机科学与技术学院
华北电力大学计算机科学与技术学院
李艳梅
论文数:
引用数:
h-index:
机构:
唐琦
[J].
计算机应用研究,
2008,
(11)
: 3256
-
3258
[7]
基于词汇语义计算的文本相似度研究
余刚
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
余刚
裴仰军
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
裴仰军
论文数:
引用数:
h-index:
机构:
朱征宇
陈华月
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈华月
[J].
计算机工程与设计,
2006,
(02)
: 241
-
244
←
1
→
共 7 条
[1]
改进的K均值算法在中文文本聚类中的研究.[D].李梅.安徽大学.2010, 10
[2]
特征词抽取与查询扩展融合的信息检索系统模型
黄名选
论文数:
0
引用数:
0
h-index:
0
机构:
广西教育学院数学与计算机科学系
黄名选
[J].
情报杂志,
2011,
30
(11)
: 162
-
165+155
[3]
利用本体关联度改进的TF-IDF特征词提取方法
徐建民
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
徐建民
王金花
论文数:
0
引用数:
0
h-index:
0
机构:
河北大学工商学院
不详
王金花
马伟瑜
论文数:
0
引用数:
0
h-index:
0
机构:
不详
不详
马伟瑜
[J].
情报科学 ,
2011,
(02)
: 279
-
283
[4]
一种基于语料特性的聚类算法
论文数:
引用数:
h-index:
机构:
曾依灵
论文数:
引用数:
h-index:
机构:
许洪波
论文数:
引用数:
h-index:
机构:
吴高巍
白硕
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所网络重点实验室
中国科学院计算技术研究所网络重点实验室
白硕
[J].
软件学报,
2010,
21
(11)
: 2802
-
2813
[5]
基于语义树的中文词语相似度计算与分析
论文数:
引用数:
h-index:
机构:
张亮
论文数:
引用数:
h-index:
机构:
尹存燕
陈家骏
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
南京大学计算机软件新技术国家重点实验室
陈家骏
[J].
中文信息学报,
2010,
(06)
: 23
-
30
[6]
基于VSM的文本相似度计算的研究
郭庆琳
论文数:
0
引用数:
0
h-index:
0
机构:
华北电力大学计算机科学与技术学院
北京大学计算机系
华北电力大学计算机科学与技术学院
郭庆琳
李艳梅
论文数:
0
引用数:
0
h-index:
0
机构:
华北电力大学计算机科学与技术学院
华北电力大学计算机科学与技术学院
李艳梅
论文数:
引用数:
h-index:
机构:
唐琦
[J].
计算机应用研究,
2008,
(11)
: 3256
-
3258
[7]
基于词汇语义计算的文本相似度研究
余刚
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
余刚
裴仰军
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
裴仰军
论文数:
引用数:
h-index:
机构:
朱征宇
陈华月
论文数:
0
引用数:
0
h-index:
0
机构:
重庆大学计算机学院
陈华月
[J].
计算机工程与设计,
2006,
(02)
: 241
-
244
←
1
→