利用关联规则挖掘文本主题词的方法

被引:11
作者
刘菲
黄萱菁
吴立德
机构
[1] 复旦大学计算机科学与工程系
关键词
关键词抽取; 关联规则挖掘; 文本挖掘;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
主题词抽取是目前信息检索领域研究的热点,与一系列数据挖掘相关的任务密切相关。该文提出一种新的利用关联规则挖掘中文文本主题词的方法,该方法抽取的主题词包括关键词和相关检索词两部分。在关键词抽取的基础上,采用数据挖掘中的关联规则挖掘算法抽取相关检索词,用于扩展检索或相关检索,提高了用户对于文档的理解。实验表明该方法取得了较好的效果。
引用
收藏
页码:81 / 83
页数:3
相关论文
共 2 条
[1]   Controlling high bandwidth aggregates in the network [J].
Mahajan, R ;
Bellovin, SM ;
Floyd, S ;
Ioannidis, J ;
Paxson, V ;
Shenker, S .
ACM SIGCOMM COMPUTER COMMUNICATION REVIEW, 2002, 32 (03) :62-73
[2]   Learning algorithms for keyphrase extraction [J].
Turney P.D. .
Information Retrieval, 2000, 2 (4) :303-336