Web文本挖掘在互联网信息统计中的研究与设计

被引:5
作者
李颖
阎保平
机构
[1] 中国科学院研究生院
关键词
互联网; 信息统计; Web挖掘; 文本挖掘; 文本分类; 模式匹配;
D O I
10.19304/j.cnki.issn1000-7180.2005.01.017
中图分类号
TP393.4 [国际互联网];
学科分类号
摘要
互联网的迅猛发展,越来越迫切地需要全面准确对网上信息进行分类及统计,Web挖掘技术的兴起,尤其是该技术中的文本挖掘,使这种统计成为可能。本文研究了互联网信息统计的现状,介绍了Web挖掘技术并分析了Web文本挖掘的关键技术。继而结合文本挖掘技术设计了网站分类系统的模型,同时对其开发步骤进行了说明。最后展望了此技术方案在相关领域的应用前景。
引用
收藏
页码:62 / 65+69 +69
页数:5
相关论文
共 4 条