基于Web的文本挖掘技术研究

被引:18
作者
许高建
机构
[1] 合肥工业大学计算机与信息学院
关键词
Web挖掘; 文本挖掘; 文本分类; 文本聚类;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。
引用
收藏
页码:187 / 190
页数:4
相关论文
共 13 条
[1]   文本挖掘技术研究 [J].
薛为民 ;
陆玉昌 .
北京联合大学学报(自然科学版), 2005, (04) :59-63
[2]   Web文本挖掘研究 [J].
易高翔 ;
程耕国 .
武汉科技大学学报(自然科学版), 2005, (01) :72-74
[3]   Web文本挖掘技术 [J].
郭庚麒 .
计算机与网络, 2004, (Z1) :114-116
[4]   Web文本挖掘浅析 [J].
王连军 .
现代图书情报技术, 2002, (06) :38-40+94
[5]   基于Web的文本挖掘 [J].
唐菁 ;
张前 ;
陈泓婕 ;
刘宁 ;
杨炳儒 .
计算机工程与应用, 2002, (21) :198-201
[6]   Web搜索引擎综述 [J].
张卫丰 ;
徐宝文 ;
周晓宇 ;
许蕾 ;
李东 .
计算机科学, 2001, (09) :24-28
[7]   Web挖掘研究 [J].
韩家炜 ;
孟小峰 ;
王静 ;
李盛恩 ;
不详 .
计算机研究与发展 , 2001, (04) :405-414
[8]   基于Web Mining的智能化、个性化的远程教育模型研究 [J].
汪启军 ;
申瑞民 .
计算机工程, 2000, (12) :157-159
[9]   基于潜在语义索引的文本浏览机制 [J].
林鸿飞 ;
姚天顺 .
中文信息学报, 2000, (05) :49-56
[10]   用于数据采掘的贝叶斯分类器研究 [J].
林士敏 ;
田凤占 ;
陆玉昌 .
计算机科学, 2000, (10) :73-76