学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于加权TextRank的文本关键词提取方法
被引:62
作者
:
论文数:
引用数:
h-index:
机构:
徐立
[
1
,
2
]
机构
:
[1]
商丘职业技术学院软件学院
[2]
中国科学技术大学苏州研究院
来源
:
计算机科学
|
2019年
/ 46(S1)卷
/ S1期
关键词
:
提取;
加权;
词频;
TextRank;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
为提升提取文本关键词的准确性,文中提出了一种文本关键词提取方法。该方法融合词频、词长、词语位置及词性等关键词提取影响因素,提出了候选关键词的权重公式;通过实验获取权重公式的相对最优权重系数;将权重公式应用到TextRank算法的候选关键词得分公式中,以提升提取文本关键词的准确性。通过实验对比了OPW-Text-Rank算法与TextRank算法对单文本关键词提取的准确率、召回率及F值,结果表明,OPW-TextRank算法在窗口大小为6时,提取关键词的准确率高于TextRank算法。在以文本关键词提取为基础的自然语言处理系统中所提算法具有一定的实用性。
引用
收藏
页码:142 / 145
页数:4
相关论文
共 9 条
[1]
Deep learning in neural networks: An overview.[J].Jürgen Schmidhuber.Neural Networks.2015,
[2]
基于WMFLDA主题模型的文本相似度计算
[J].
论文数:
引用数:
h-index:
机构:
张璐
;
论文数:
引用数:
h-index:
机构:
芦天亮
;
论文数:
引用数:
h-index:
机构:
杜彦辉
.
计算机应用研究,
2019,
36
(10)
:2916
-2919+2951
[3]
共词分析与LDA模型分析在文本主题挖掘中的比较研究
[J].
论文数:
引用数:
h-index:
机构:
曲靖野
;
论文数:
引用数:
h-index:
机构:
陈震
;
胡轶楠
论文数:
0
引用数:
0
h-index:
0
机构:
广西海警第一支队
北华大学信息技术与传媒学院
胡轶楠
.
情报科学 ,
2018,
(02)
:18
-23
[4]
中文文本的主题关键短语提取技术
[J].
论文数:
引用数:
h-index:
机构:
杨玥
;
论文数:
引用数:
h-index:
机构:
张德生
.
计算机科学,
2017,
44(S2)
(S2)
:432
-436
[5]
大数据环境下舆情分析与决策支持研究文献综述
[J].
论文数:
引用数:
h-index:
机构:
夏火松
;
论文数:
引用数:
h-index:
机构:
甄化春
.
情报杂志 ,
2015,
(02)
:1
-6+21
[6]
融合LDA与TextRank的关键词抽取研究
[J].
论文数:
引用数:
h-index:
机构:
顾益军
;
论文数:
引用数:
h-index:
机构:
夏天
.
现代图书情报技术,
2014,
(Z1)
:41
-47
[7]
基于多特征融合的中文文本关键词提取方法
[J].
论文数:
引用数:
h-index:
机构:
张建娥
.
情报理论与实践,
2013,
36
(10)
:105
-108
[8]
词语位置加权TextRank的关键词抽取研究
[J].
论文数:
引用数:
h-index:
机构:
夏天
.
现代图书情报技术,
2013,
(09)
:30
-34
[9]
Tag-TextRank:一种基于Tag的网页关键词抽取方法
[J].
李鹏
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
李鹏
;
论文数:
引用数:
h-index:
机构:
王斌
;
论文数:
引用数:
h-index:
机构:
石志伟
;
论文数:
引用数:
h-index:
机构:
崔雅超
;
论文数:
引用数:
h-index:
机构:
李恒训
.
计算机研究与发展,
2012,
49
(11)
:2344
-2351
←
1
→
共 9 条
[1]
Deep learning in neural networks: An overview.[J].Jürgen Schmidhuber.Neural Networks.2015,
[2]
基于WMFLDA主题模型的文本相似度计算
[J].
论文数:
引用数:
h-index:
机构:
张璐
;
论文数:
引用数:
h-index:
机构:
芦天亮
;
论文数:
引用数:
h-index:
机构:
杜彦辉
.
计算机应用研究,
2019,
36
(10)
:2916
-2919+2951
[3]
共词分析与LDA模型分析在文本主题挖掘中的比较研究
[J].
论文数:
引用数:
h-index:
机构:
曲靖野
;
论文数:
引用数:
h-index:
机构:
陈震
;
胡轶楠
论文数:
0
引用数:
0
h-index:
0
机构:
广西海警第一支队
北华大学信息技术与传媒学院
胡轶楠
.
情报科学 ,
2018,
(02)
:18
-23
[4]
中文文本的主题关键短语提取技术
[J].
论文数:
引用数:
h-index:
机构:
杨玥
;
论文数:
引用数:
h-index:
机构:
张德生
.
计算机科学,
2017,
44(S2)
(S2)
:432
-436
[5]
大数据环境下舆情分析与决策支持研究文献综述
[J].
论文数:
引用数:
h-index:
机构:
夏火松
;
论文数:
引用数:
h-index:
机构:
甄化春
.
情报杂志 ,
2015,
(02)
:1
-6+21
[6]
融合LDA与TextRank的关键词抽取研究
[J].
论文数:
引用数:
h-index:
机构:
顾益军
;
论文数:
引用数:
h-index:
机构:
夏天
.
现代图书情报技术,
2014,
(Z1)
:41
-47
[7]
基于多特征融合的中文文本关键词提取方法
[J].
论文数:
引用数:
h-index:
机构:
张建娥
.
情报理论与实践,
2013,
36
(10)
:105
-108
[8]
词语位置加权TextRank的关键词抽取研究
[J].
论文数:
引用数:
h-index:
机构:
夏天
.
现代图书情报技术,
2013,
(09)
:30
-34
[9]
Tag-TextRank:一种基于Tag的网页关键词抽取方法
[J].
李鹏
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所
李鹏
;
论文数:
引用数:
h-index:
机构:
王斌
;
论文数:
引用数:
h-index:
机构:
石志伟
;
论文数:
引用数:
h-index:
机构:
崔雅超
;
论文数:
引用数:
h-index:
机构:
李恒训
.
计算机研究与发展,
2012,
49
(11)
:2344
-2351
←
1
→