中文网页标引源主题表达能力的调查统计

被引:59
作者
丁璇
侯汉清
章成志
机构
[1] 南京农业大学信息管理系,南京农业大学信息管理系,南京农业大学信息管理系南京,,南京,,南京,
关键词
汉语; 网页; 主题标引; 加权; 自动标引; 调查;
D O I
暂无
中图分类号
G353.2 [情报编译报道];
学科分类号
120502 [情报学];
摘要
通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,以便为自动标引及人工智能搜索引擎的研制提供数据。
引用
收藏
页码:70 / 72+91 +91
页数:4
相关论文
共 3 条
[1]
基于知识库的中文网络检索工具——经济信息智能搜索引擎研究 [D]. 
薛鹏军 .
南京农业大学,
2001
[2]
主题法导论.[M].侯汉清;马张华主编;张涵等编著;.北京大学出版社.1991,
[3]
统计分析法自动标引的改进 [J].
赵云志 .
情报学报, 2000, (04) :333-337