文本挖掘研究进展

被引:50
作者
谌志群
张国煊
机构
[1] 杭州电子科技大学计算机学院
基金
浙江省自然科学基金;
关键词
文本挖掘; 数据挖掘; 文本知识发现; 自然语言处理; 关联规则; 文本聚类; 趋势分析;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品。
引用
收藏
页码:65 / 74
页数:10
相关论文
共 6 条
  • [1] Web日志中有趣关联规则的发现
    李颖基
    彭宏
    郑启伦
    曾炜
    [J]. 计算机研究与发展, 2003, (03) : 435 - 439
  • [2] Knowledge discovery in texts for constructing decision support systems
    Loh, S
    De Oliveira, JPM
    Gameiro, MA
    [J]. APPLIED INTELLIGENCE, 2003, 18 (03) : 357 - 366
  • [3] MedMiner: An Internet Text-Mining Tool for Biomedical Information, with Application to Gene Expression Profiling[J] . L. Tanabe,U. Scherf,L.H. Smith,J.K. Lee,L. Hunter,J.N. Weinstein.BioTechniques . 1999 (6)
  • [4] Mining text using keyword distributions
    Feldman, R
    Dagan, I
    Hirsh, H
    [J]. JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, 1998, 10 (03) : 281 - 300
  • [5] A new and versatile method for association generation[J] . Amihood Amir,Ronen Feldman,Reuven Kashi.Information Systems . 1997 (6)
  • [6] Discovering Ephemeral Associations among News Topics .2 Montes-y-Gomez M,Gelbukh A,Lopez-Lopez A. Proc of IJCAI Workshop on Adaptive Text Extraction and Mining . 2001