学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
一种基于《知网》的中文文本聚类算法的研究
被引:35
作者
:
论文数:
引用数:
h-index:
机构:
赵鹏
[
1
]
论文数:
引用数:
h-index:
机构:
蔡庆生
[
2
]
机构
:
[1]
安徽大学计算智能与信号处理教育部重点实验室
[2]
中国科学技术大学计算机系
来源
:
计算机工程与应用
|
2007年
/ 12期
关键词
:
向量空间模型;
本体论;
知网;
D O I
:
暂无
中图分类号
:
TP301.6 [算法理论];
学科分类号
:
080201
[机械制造及其自动化]
;
摘要
:
针对基于关键词集的中文文本聚类算法中存在的问题,将《知网》引入到中文文本的特征表示中,并在此基础上提出了一种基于《知网》的中文文本聚类算法。该算法在中文文本表示中加入了基于《知网》的概念特征,实验结果表明该算法能够更好地将语义相关的中文文档聚集在一起,与传统的基于关键词集的中文文本聚类算法相比,聚类质量得到了较大提高。
引用
收藏
页码:162 / 163
页数:2
相关论文
共 4 条
[1]
基于Bayes潜在语义模型的半监督Web挖掘
[J].
宫秀军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放实验室,中国科学院计算技术研究所智能信息处理开放实验室北京,北京
宫秀军
;
论文数:
引用数:
h-index:
机构:
史忠植
.
软件学报,
2002,
(08)
:1508
-1514
[2]
基于模糊概念图的文档聚类及其在Web中的应用
[J].
陈宁
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
陈宁
;
陈安
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
陈安
;
论文数:
引用数:
h-index:
机构:
周龙骧
;
贾维嘉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
贾维嘉
;
罗三定
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
罗三定
.
软件学报,
2002,
(08)
:1598
-1605
[3]
一种概念空间自生成方法
[J].
傅伟鹏
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
傅伟鹏
;
吴斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
吴斌
;
何清
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
何清
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
史忠植
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
不详
.
计算机工程与应用 ,
2002,
(07)
:63
-65+88
[4]
基于义原同现频率的汉语词义排歧方法
[J].
论文数:
引用数:
h-index:
机构:
杨尔弘
;
论文数:
引用数:
h-index:
机构:
张国清
;
张永奎
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系!太原,上海师范大学计算中心!上海,山西大学计算机科学系!太原
张永奎
.
计算机研究与发展,
2001,
(07)
:833
-838
←
1
→
共 4 条
[1]
基于Bayes潜在语义模型的半监督Web挖掘
[J].
宫秀军
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院计算技术研究所智能信息处理开放实验室,中国科学院计算技术研究所智能信息处理开放实验室北京,北京
宫秀军
;
论文数:
引用数:
h-index:
机构:
史忠植
.
软件学报,
2002,
(08)
:1508
-1514
[2]
基于模糊概念图的文档聚类及其在Web中的应用
[J].
陈宁
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
陈宁
;
陈安
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
陈安
;
论文数:
引用数:
h-index:
机构:
周龙骧
;
贾维嘉
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
贾维嘉
;
罗三定
论文数:
0
引用数:
0
h-index:
0
机构:
中国科学院研究生院信息学院
罗三定
.
软件学报,
2002,
(08)
:1598
-1605
[3]
一种概念空间自生成方法
[J].
傅伟鹏
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
傅伟鹏
;
吴斌
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
吴斌
;
何清
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
何清
;
史忠植
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
史忠植
;
不详
论文数:
0
引用数:
0
h-index:
0
机构:
中国科技大学研究生院计算机学部
不详
.
计算机工程与应用 ,
2002,
(07)
:63
-65+88
[4]
基于义原同现频率的汉语词义排歧方法
[J].
论文数:
引用数:
h-index:
机构:
杨尔弘
;
论文数:
引用数:
h-index:
机构:
张国清
;
张永奎
论文数:
0
引用数:
0
h-index:
0
机构:
山西大学计算机科学系!太原,上海师范大学计算中心!上海,山西大学计算机科学系!太原
张永奎
.
计算机研究与发展,
2001,
(07)
:833
-838
←
1
→