学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于高维聚类技术的中文关键词提取算法
被引:2
作者
:
论文数:
引用数:
h-index:
机构:
高学东
吴玲玉
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学经济管理学院
吴玲玉
机构
:
[1]
北京科技大学经济管理学院
来源
:
中国管理信息化
|
2011年
/ 14卷
/ 09期
关键词
:
关键词提取;
小词典分词;
高维聚类;
CABOSFV;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
关键词提取是中文信息处理技术研究中的热点和难点,基于统计信息的方法是其中一个重要分支。本文针对基于统计信息关键词提取方法准确率低的问题,提出基于高维聚类技术的中文关键词提取算法。算法通过依据小词典的快速分词、二次分词、高维聚类和关键词甄选4个步骤实现关键词的提取。理论分析和实验显示,基于高维聚类技术的中文关键词提取方法具备更好的稳定性、更高的效率和更准确的结果。
引用
收藏
页码:23 / 27
页数:5
相关论文
共 5 条
[1]
一种基于复杂网络特征的中文文档关键词抽取算法
[J].
论文数:
引用数:
h-index:
机构:
赵鹏
;
论文数:
引用数:
h-index:
机构:
蔡庆生
;
论文数:
引用数:
h-index:
机构:
王清毅
;
耿焕同
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系
耿焕同
.
模式识别与人工智能,
2007,
20
(06)
:827
-831
[2]
Keyword Extraction Based on tf/idf for Chinese News Document
[J].
LI JuanziFAN QinaZHANG Kuo Department of Computer Science and TechnologyTsinghua UniversityBeijing China
论文数:
0
引用数:
0
h-index:
0
LI JuanziFAN QinaZHANG Kuo Department of Computer Science and TechnologyTsinghua UniversityBeijing China
.
Wuhan University Journal of Natural Sciences,
2007,
(05)
:917
-921
[3]
一种基于词汇链的关键词抽取方法
[J].
论文数:
引用数:
h-index:
机构:
索红光
;
论文数:
引用数:
h-index:
机构:
刘玉树
;
论文数:
引用数:
h-index:
机构:
曹淑英
.
中文信息学报,
2006,
(06)
:25
-30
[4]
基于新的关键词提取方法的快速文本分类系统
[J].
罗杰
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学电子信息学院
罗杰
;
陈力
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学电子信息学院
陈力
;
论文数:
引用数:
h-index:
机构:
夏德麟
;
王凯
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学电子信息学院
王凯
.
计算机应用研究,
2006,
(04)
:32
-34
[5]
高维稀疏聚类知识发现[M]. 冶金工业出版社 , 武森等著, 2003
←
1
→
共 5 条
[1]
一种基于复杂网络特征的中文文档关键词抽取算法
[J].
论文数:
引用数:
h-index:
机构:
赵鹏
;
论文数:
引用数:
h-index:
机构:
蔡庆生
;
论文数:
引用数:
h-index:
机构:
王清毅
;
耿焕同
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学技术大学计算机科学与技术系
耿焕同
.
模式识别与人工智能,
2007,
20
(06)
:827
-831
[2]
Keyword Extraction Based on tf/idf for Chinese News Document
[J].
LI JuanziFAN QinaZHANG Kuo Department of Computer Science and TechnologyTsinghua UniversityBeijing China
论文数:
0
引用数:
0
h-index:
0
LI JuanziFAN QinaZHANG Kuo Department of Computer Science and TechnologyTsinghua UniversityBeijing China
.
Wuhan University Journal of Natural Sciences,
2007,
(05)
:917
-921
[3]
一种基于词汇链的关键词抽取方法
[J].
论文数:
引用数:
h-index:
机构:
索红光
;
论文数:
引用数:
h-index:
机构:
刘玉树
;
论文数:
引用数:
h-index:
机构:
曹淑英
.
中文信息学报,
2006,
(06)
:25
-30
[4]
基于新的关键词提取方法的快速文本分类系统
[J].
罗杰
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学电子信息学院
罗杰
;
陈力
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学电子信息学院
陈力
;
论文数:
引用数:
h-index:
机构:
夏德麟
;
王凯
论文数:
0
引用数:
0
h-index:
0
机构:
武汉大学电子信息学院
王凯
.
计算机应用研究,
2006,
(04)
:32
-34
[5]
高维稀疏聚类知识发现[M]. 冶金工业出版社 , 武森等著, 2003
←
1
→