共 4 条
基于语义分析的主题信息采集系统的设计与实现
被引:14
作者:
赵佳鹤
王秀坤
刘亚欣
机构:
[1] 大连理工大学计算机科学与工程系
来源:
关键词:
主题信息采集;
知网;
扩展元数据;
搜索策略;
D O I:
暂无
中图分类号:
TP311.52 [];
学科分类号:
摘要:
设计并实现了一个基于语义分析的主题信息采集系统(SAFWC),提出一种链接价值预测算法(SPageRank)。该算法从语义的角度出发,结合“知网”,通过对扩展元数据进行主题相关性判定来选择、预测与主题相关的URL。实验结果表明,该系统具有较高的采集效率及精度。
引用
收藏
页码:406 / 408
页数:3
相关论文