电子政务主题词表应用系统中主题标引算法研究

被引:4
作者
倪静
赵新力
李惠安
机构
[1] 中国科学技术信息研究所
[2] 中华人民共和国科学技术部 北京
[3] 北京
关键词
电子政务; 主题标引; 词典分词; N-gram;
D O I
暂无
中图分类号
D630.1 [国家机关工作];
学科分类号
1204 ; 120401 ;
摘要
从政务文献主题标引的需求出发 ,面向《电子政务主题词表》的网络应用 ,探讨政务文献主题标引的方法和技术 ,提出了词典法和N gram提取技术相结合的实用算法。这一算法可以弥补传统的词典法由于政务文献涉及层面广泛和新词出现频繁所带来的词汇不足的问题。同时 ,讨论了利用该词表进行赋词标引的有关问题。
引用
收藏
页码:15 / 19
页数:5
相关论文
共 5 条
[1]   自动抽词与自动分词 [J].
张琪玉 .
图书馆杂志, 2002, (03) :13-14
[2]   基于统计的常用词搭配(Collocation)的发现方法 [J].
孙健 ;
王伟 ;
钟义信 .
情报学报, 2002, (01) :12-16
[3]   无需词典支持和切词处理的中文文档分类 [J].
周水庚 ;
关佶红 ;
胡运发 .
高技术通讯, 2001, (03) :31-35
[4]   文献信息自动标引研究 [J].
苏新宁 ;
邹晓明 .
现代图书情报技术, 2000, (01) :23-26
[5]  
..Luhn H P;.IBM Journal of Research and Development.1957,