联想树分析法及其在无词库中文自动标引中的应用

被引:8
作者
顾立帆
王永成
机构
[1] 上海交通大学计算中心
关键词
极低频; 语义单位; 非完整; 中文自动标引; 主题词表; 分析法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文探索了一种基于频率统计的中文自动标引方法。已往的自动标引所采用的词典匹配法有词典不完备等限制。而本文所介绍的方法则实现了不用任何词典,并进行了真正的全文献处理的自由词抽词标引。它突破了已有经验和知识的限制,能自动发现和学习新词,可以说它是一种具有自学习特点的智能性中文文献的自动标引方法。基于该方法的自由词主题标引系统已经实现,本文对此作了简要介绍。
引用
收藏
页码:354 / 360
页数:7
相关论文
共 3 条
[1]   关键词的特性及其在文献主题标引中的作用 [J].
李淑华 .
情报理论与实践, 1989, (01) :29-30
[2]   我国科技文献计算机标引研究的现状 [J].
高崇谦 .
情报学报, 1989, 8 (01) :67-73
[3]   关于文献主题标引发展趋势的探讨 [J].
董春元 .
情报学报, 1988, 7 (03) :207-211