学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种基于公共词块的英文短文本相似度算法
被引:7
作者
:
黄贤英
论文数:
0
引用数:
0
h-index:
0
机构:
重庆理工大学计算机科学与工程学院
黄贤英
论文数:
引用数:
h-index:
机构:
刘英涛
论文数:
引用数:
h-index:
机构:
饶勤菲
机构
:
[1]
重庆理工大学计算机科学与工程学院
来源
:
重庆理工大学学报(自然科学)
|
2015年
/ 29卷
/ 08期
关键词
:
短文本;
词序;
公共词块;
相似度算法;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
短文本相似度计算是自然语言处理方面的研究热点,传统基于词项的文本相似度算法只考虑了词项因素,忽略了词序对短文本相似性的影响。为此提出了一种基于公共词块的短文本相似度计算方法,综合考虑了词项和词序因素,将基于词项重合的重叠相似度算法与公共词块间的词序相似度算法相结合,并采用自适应的加权组合方式得到短文本相似度值。实验结果显示:与传统算法相比,该算法在稳定性和F值方面都具有较好的结果。
引用
收藏
页码:88 / 93
页数:6
相关论文
共 11 条
[1]
基于语义与最大匹配度的短文本分类研究
[J].
论文数:
引用数:
h-index:
机构:
孙建旺
;
论文数:
引用数:
h-index:
机构:
吕学强
;
论文数:
引用数:
h-index:
机构:
张雷瀚
.
计算机工程与设计,
2013,
34
(10)
:3613
-3618
[2]
改进的基于《知网》的词汇语义相似度计算
[J].
论文数:
引用数:
h-index:
机构:
朱征宇
;
论文数:
引用数:
h-index:
机构:
孙俊华
.
计算机应用,
2013,
33
(08)
:2276
-2279+2288
[3]
基于隐主题分析和文本聚类的微博客中新闻话题的发现
[J].
论文数:
引用数:
h-index:
机构:
路荣
;
论文数:
引用数:
h-index:
机构:
项亮
;
论文数:
引用数:
h-index:
机构:
刘明荣
;
论文数:
引用数:
h-index:
机构:
杨青
.
模式识别与人工智能,
2012,
25
(03)
:382
-387
[4]
概念树在短文本语义相似度上的应用
[J].
论文数:
引用数:
h-index:
机构:
赵小谦
;
论文数:
引用数:
h-index:
机构:
郑彦
;
论文数:
引用数:
h-index:
机构:
储海庆
.
计算机技术与发展,
2012,
22
(06)
:159
-162
[5]
语义分析与词频统计相结合的中文文本相似度量方法研究
[J].
论文数:
引用数:
h-index:
机构:
华秀丽
;
朱巧明
论文数:
0
引用数:
0
h-index:
0
机构:
江苏省计算机信息处理技术重点实验室
苏州大学计算机科学与技术学院
朱巧明
;
李培峰
论文数:
0
引用数:
0
h-index:
0
机构:
江苏省计算机信息处理技术重点实验室
苏州大学计算机科学与技术学院
李培峰
.
计算机应用研究,
2012,
29
(03)
:833
-836
[6]
一种中文微博新闻话题检测的方法
[J].
郑斐然
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
郑斐然
;
苗夺谦
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
苗夺谦
;
张志飞
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
张志飞
;
高灿
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
高灿
.
计算机科学,
2012,
39
(01)
:138
-141
[7]
基于《知网》的汉语未登录词语义相似度计算
[J].
张瑞霞
论文数:
0
引用数:
0
h-index:
0
机构:
华北水利水电学院信息工程学院
华北水利水电学院信息工程学院
张瑞霞
;
论文数:
引用数:
h-index:
机构:
杨国增
;
吴慧欣
论文数:
0
引用数:
0
h-index:
0
机构:
华北水利水电学院信息工程学院
华北水利水电学院信息工程学院
吴慧欣
.
中文信息学报,
2012,
26
(01)
:16
-21
[8]
动态向量的中文短文本聚类
[J].
金春霞
论文数:
0
引用数:
0
h-index:
0
机构:
淮阴工学院计算机工程学院
金春霞
;
论文数:
引用数:
h-index:
机构:
周海岩
.
计算机工程与应用,
2011,
47
(33)
:156
-158
[9]
基于概念网络的短文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
林小俊
;
论文数:
引用数:
h-index:
机构:
张猛
;
论文数:
引用数:
h-index:
机构:
暴筱
;
李军
论文数:
0
引用数:
0
h-index:
0
机构:
北京市朝阳区档案局
北京大学机器感知与智能教育部重点实验室
李军
;
吴玺宏
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学机器感知与智能教育部重点实验室
北京大学机器感知与智能教育部重点实验室
吴玺宏
.
计算机工程,
2010,
36
(21)
:4
-6
[10]
热点新闻间关系的研究.[D].程佳.上海交通大学.2011, 07
←
1
2
→
共 11 条
[1]
基于语义与最大匹配度的短文本分类研究
[J].
论文数:
引用数:
h-index:
机构:
孙建旺
;
论文数:
引用数:
h-index:
机构:
吕学强
;
论文数:
引用数:
h-index:
机构:
张雷瀚
.
计算机工程与设计,
2013,
34
(10)
:3613
-3618
[2]
改进的基于《知网》的词汇语义相似度计算
[J].
论文数:
引用数:
h-index:
机构:
朱征宇
;
论文数:
引用数:
h-index:
机构:
孙俊华
.
计算机应用,
2013,
33
(08)
:2276
-2279+2288
[3]
基于隐主题分析和文本聚类的微博客中新闻话题的发现
[J].
论文数:
引用数:
h-index:
机构:
路荣
;
论文数:
引用数:
h-index:
机构:
项亮
;
论文数:
引用数:
h-index:
机构:
刘明荣
;
论文数:
引用数:
h-index:
机构:
杨青
.
模式识别与人工智能,
2012,
25
(03)
:382
-387
[4]
概念树在短文本语义相似度上的应用
[J].
论文数:
引用数:
h-index:
机构:
赵小谦
;
论文数:
引用数:
h-index:
机构:
郑彦
;
论文数:
引用数:
h-index:
机构:
储海庆
.
计算机技术与发展,
2012,
22
(06)
:159
-162
[5]
语义分析与词频统计相结合的中文文本相似度量方法研究
[J].
论文数:
引用数:
h-index:
机构:
华秀丽
;
朱巧明
论文数:
0
引用数:
0
h-index:
0
机构:
江苏省计算机信息处理技术重点实验室
苏州大学计算机科学与技术学院
朱巧明
;
李培峰
论文数:
0
引用数:
0
h-index:
0
机构:
江苏省计算机信息处理技术重点实验室
苏州大学计算机科学与技术学院
李培峰
.
计算机应用研究,
2012,
29
(03)
:833
-836
[6]
一种中文微博新闻话题检测的方法
[J].
郑斐然
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
郑斐然
;
苗夺谦
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
苗夺谦
;
张志飞
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
张志飞
;
高灿
论文数:
0
引用数:
0
h-index:
0
机构:
同济大学计算机科学与技术系
高灿
.
计算机科学,
2012,
39
(01)
:138
-141
[7]
基于《知网》的汉语未登录词语义相似度计算
[J].
张瑞霞
论文数:
0
引用数:
0
h-index:
0
机构:
华北水利水电学院信息工程学院
华北水利水电学院信息工程学院
张瑞霞
;
论文数:
引用数:
h-index:
机构:
杨国增
;
吴慧欣
论文数:
0
引用数:
0
h-index:
0
机构:
华北水利水电学院信息工程学院
华北水利水电学院信息工程学院
吴慧欣
.
中文信息学报,
2012,
26
(01)
:16
-21
[8]
动态向量的中文短文本聚类
[J].
金春霞
论文数:
0
引用数:
0
h-index:
0
机构:
淮阴工学院计算机工程学院
金春霞
;
论文数:
引用数:
h-index:
机构:
周海岩
.
计算机工程与应用,
2011,
47
(33)
:156
-158
[9]
基于概念网络的短文本分类方法
[J].
论文数:
引用数:
h-index:
机构:
林小俊
;
论文数:
引用数:
h-index:
机构:
张猛
;
论文数:
引用数:
h-index:
机构:
暴筱
;
李军
论文数:
0
引用数:
0
h-index:
0
机构:
北京市朝阳区档案局
北京大学机器感知与智能教育部重点实验室
李军
;
吴玺宏
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学机器感知与智能教育部重点实验室
北京大学机器感知与智能教育部重点实验室
吴玺宏
.
计算机工程,
2010,
36
(21)
:4
-6
[10]
热点新闻间关系的研究.[D].程佳.上海交通大学.2011, 07
←
1
2
→