基于多示例学习的中文Web目录页面推荐

被引:14
作者
黎铭
薛晓冰
周志华
机构
[1] 南京大学计算机软件新技术国家重点实验室
基金
国家杰出青年科学基金;
关键词
多示例学习; Web挖掘; 机器学习; 中文Web目录页面推荐; 前缀树;
D O I
10.13328/j.cnki.jos.2004.09.006
中图分类号
TP393.092 [];
学科分类号
摘要
多示例学习为中文 Web 挖掘提供了一种新的思路.提出中文 Web 目录页面推荐这种特殊的 Web 挖掘任务,并且将其转化为多示例学习问题来解决.在真实世界数据集上的实验结果显示,该方法能够有效地解决该问题.
引用
收藏
页码:1328 / 1335
页数:8
相关论文
共 6 条
  • [1] 一种中文文档的非受限无词典抽词方法
    金翔宇
    孙正兴
    张福炎
    [J]. 中文信息学报, 2001, (06) : 33 - 39
  • [2] 无词典高频字串快速提取和统计算法研究
    韩客松
    王永成
    陈桂林
    [J]. 中文信息学报, 2001, (02) : 23 - 30
  • [3] PAC learning axis-aligned rectangles with respect to product distributions from multiple-instance examples
    Long, PM
    Tan, L
    [J]. MACHINE LEARNING, 1998, 30 (01) : 7 - 21
  • [4] Solving the multiple instance problem with axis-parallel rectangles[J] . Thomas G. Dietterich,Richard H. Lathrop,Tomás Lozano-Pérez.Artificial Intelligence . 1997 (1)
  • [5] LectureNotes inArtificialIntelligence .2 ZhouZH,ZhangML. Springer-Verlag . 2003
  • [6] A probabilistic analysis of theRocchio algorithm withTFIDF for text categorization .2 JoachimsT. Proc. of the14thInt’’lConf. onMachineLearning . 1997