文本挖掘研究进展

被引：50

作者：

谌志群

张国煊

机构：

[1] 杭州电子科技大学计算机学院

来源：

模式识别与人工智能 | 2005年 / 18卷 / 01期

基金：

浙江省自然科学基金;

关键词：

文本挖掘; 数据挖掘; 文本知识发现; 自然语言处理; 关联规则; 文本聚类; 趋势分析;

D O I：

暂无

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

文本挖掘又称为文本数据挖掘或文本知识发现,是指在大规模文本集合中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先介绍了文本挖掘的概念,包括文本挖掘的定义、特点、与其它几个研究领域(数据挖掘、信息检索、信息抽取、计算语言学等)的关系;然后讨论了文本挖掘模型、文本特征抽取与中间表示、文本挖掘的分类与实现技术;最后介绍了几个文本挖掘产品。

引用

页码：65 / 74

页数：10

共 6 条

[1] Web日志中有趣关联规则的发现
李颖基
彭宏
郑启伦
曾炜
[J]. 计算机研究与发展, 2003, (03) : 435 - 439
[2] Knowledge discovery in texts for constructing decision support systems
Loh, S
De Oliveira, JPM
Gameiro, MA
[J]. APPLIED INTELLIGENCE, 2003, 18 (03) : 357 - 366
[3] MedMiner: An Internet Text-Mining Tool for Biomedical Information, with Application to Gene Expression Profiling[J] . L. Tanabe,U. Scherf,L.H. Smith,J.K. Lee,L. Hunter,J.N. Weinstein.BioTechniques . 1999 (6)
[4] Mining text using keyword distributions
Feldman, R
Dagan, I
Hirsh, H
[J]. JOURNAL OF INTELLIGENT INFORMATION SYSTEMS, 1998, 10 (03) : 281 - 300
[5] A new and versatile method for association generation[J] . Amihood Amir,Ronen Feldman,Reuven Kashi.Information Systems . 1997 (6)
[6] Discovering Ephemeral Associations among News Topics .2 Montes-y-Gomez M,Gelbukh A,Lopez-Lopez A. Proc of IJCAI Workshop on Adaptive Text Extraction and Mining . 2001

← 1 →