每个网页都包含了大量的超链接,其中既包含了相关链接,也包含了大量噪声链接。提出了一种基于链接分块的相关链接提取方法。首先,将网页按照HTML语言中标签将网页分成许多的块,从块中提取链接,形成若干链接块;其次,根据相关链接的成块出现,相关链接文字与其所在网页标题含相同词等特征,应用规则与统计相结合的方法从所有链接块中提取相关链接块。相关链接提取方法测试结果,精确率在85%以上,召回率在70%左右,表明该方法很有效。 更多 还原 AbstractFilter('ChDivSummary', 'ChDivSummaryMore', 'ChDivSummaryReset'); 关键词: 网页分块;链接块;相关链接提取; 基金资助: 富士通研发中心有限公司委托研究项目; 专辑: 信息科技 专题: 互联网技术 分类号: TP393.092 在线公开时间: 2006-12-07(知网平台在线公开时间,不代表文献的发表时间) 观看视频: 手机阅读 HTML阅读 原版阅读 CAJ下载 PDF下载 AI 辅助阅读 个人成果免费下载 学位论文投稿 下载:114 页码:110-113 页数:4 大小:40K 相关服务推荐 CNKI学术情报 > 智能审校 > 论文智能排版 > 学术评价支撑平台 > 引文网络 参考文献 引证文献 共引文献 同被引文献 二级参考文献 二级引证文献 相关文献推荐 相似文献 读者推荐 相关基金文献 关联作者 相关视频 批量下载 HTML阅读 CAJ下载 PDF下载 原版阅读