学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于语义的文档关键词提取方法
被引:41
作者
:
论文数:
引用数:
h-index:
机构:
姜芳
[
1
]
论文数:
引用数:
h-index:
机构:
李国和
[
1
]
岳翔
论文数:
0
引用数:
0
h-index:
0
机构:
中海油研究总院信息数据中心
中国石油大学(北京)地球物理与信息工程学院油气数据挖掘北京市重点实验室
岳翔
[
2
]
机构
:
[1]
中国石油大学(北京)地球物理与信息工程学院油气数据挖掘北京市重点实验室
[2]
中海油研究总院信息数据中心
来源
:
计算机应用研究
|
2015年
/ 32卷
/ 01期
关键词
:
语义距离;
密度聚类;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
以语义为基础实现文档关键词提取是提高自动提取准确度的有效途径。以中文文档为处理对象,通过《同义词词林》计算词语间语义距离,对词语进行密度聚类,得到主题相关类,并从主题相关类中选取中心词作为关键词。通过统计实验和打分实验,证明基于语义的文档关键词提取方法具有较高的准确率、召回率,并且提取的关键词具有较高的主题相关度。
引用
收藏
页码:142 / 145
页数:4
相关论文
共 5 条
[1]
基于语义的中文文本关键词提取算法
[J].
论文数:
引用数:
h-index:
机构:
王立霞
;
论文数:
引用数:
h-index:
机构:
淮晓永
.
计算机工程,
2012,
38
(01)
:1
-4
[2]
基于粗集理论的中文关键词短语构成规则挖掘
[J].
论文数:
引用数:
h-index:
机构:
刘远超
;
论文数:
引用数:
h-index:
机构:
王晓龙
;
论文数:
引用数:
h-index:
机构:
徐志明
;
论文数:
引用数:
h-index:
机构:
刘秉权
.
电子学报,
2007,
(02)
:371
-374
[3]
词表的自动丰富——从元数据中提取关键词及其定位
[J].
论文数:
引用数:
h-index:
机构:
王军
.
中文信息学报,
2005,
(06)
[4]
关键词自动标引的最大熵模型应用研究
[J].
论文数:
引用数:
h-index:
机构:
李素建
;
论文数:
引用数:
h-index:
机构:
王厚峰
;
论文数:
引用数:
h-index:
机构:
俞士汶
;
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
辛乘胜
.
计算机学报,
2004,
(09)
:1192
-1197
[5]
用于不同密度聚类的多阶段等密度线算法
[J].
赵艳厂
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院北京,北京,北京,北京
赵艳厂
;
论文数:
引用数:
h-index:
机构:
宋梅
;
谢帆
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院北京,北京,北京,北京
谢帆
;
论文数:
引用数:
h-index:
机构:
宋俊德
.
北京邮电大学学报,
2003,
(02)
:42
-47
←
1
→
共 5 条
[1]
基于语义的中文文本关键词提取算法
[J].
论文数:
引用数:
h-index:
机构:
王立霞
;
论文数:
引用数:
h-index:
机构:
淮晓永
.
计算机工程,
2012,
38
(01)
:1
-4
[2]
基于粗集理论的中文关键词短语构成规则挖掘
[J].
论文数:
引用数:
h-index:
机构:
刘远超
;
论文数:
引用数:
h-index:
机构:
王晓龙
;
论文数:
引用数:
h-index:
机构:
徐志明
;
论文数:
引用数:
h-index:
机构:
刘秉权
.
电子学报,
2007,
(02)
:371
-374
[3]
词表的自动丰富——从元数据中提取关键词及其定位
[J].
论文数:
引用数:
h-index:
机构:
王军
.
中文信息学报,
2005,
(06)
[4]
关键词自动标引的最大熵模型应用研究
[J].
论文数:
引用数:
h-index:
机构:
李素建
;
论文数:
引用数:
h-index:
机构:
王厚峰
;
论文数:
引用数:
h-index:
机构:
俞士汶
;
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所,北京大学计算语言学研究所,北京大学计算语言学研究所,人民日报社新闻信息中心北京,北京,北京,北京
辛乘胜
.
计算机学报,
2004,
(09)
:1192
-1197
[5]
用于不同密度聚类的多阶段等密度线算法
[J].
赵艳厂
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院北京,北京,北京,北京
赵艳厂
;
论文数:
引用数:
h-index:
机构:
宋梅
;
谢帆
论文数:
0
引用数:
0
h-index:
0
机构:
北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院,北京邮电大学电子工程学院北京,北京,北京,北京
谢帆
;
论文数:
引用数:
h-index:
机构:
宋俊德
.
北京邮电大学学报,
2003,
(02)
:42
-47
←
1
→