学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
词表的自动丰富——从元数据中提取关键词及其定位
被引:77
作者
:
论文数:
引用数:
h-index:
机构:
王军
机构
:
[1]
北京大学信息管理系北京
来源
:
中文信息学报
|
2005年
/ 06期
关键词
:
计算机应用;
中文信息处理;
词表;
元数据;
关键词提取;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
词表和分类法是传统纸质文献环境下最重要的知识组织工具。它的更新和维护一直依靠手工进行。这限制了它在数字图书馆和网络信息环境下的应用。本文介绍了一项基于统计的、从元数据的标题中抽取关键词并定位在词表中的方法。定位的依据是抽取出的关键词所对应的标引词集的收敛性质。标引词是用于标引文献主题的、来自于词表的受控词汇,即主题词。在《中国分类主题词表》和北京大学图书馆提供的5千余条计算机科技领域的书目数据上所进行实验证明了文中所述的方法是可行的、有效的。这一方法可以直接用来实现基于已标引语料库的自动编目和元数据自动生成。
引用
收藏
页数:8
相关论文
共 4 条
[1]
基于字串内部结合紧密度的汉语自动抽词实验研究
[J].
罗盛芬
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系,智能技术与系统国家重点实验室清华大学计算机科学与技术系北京,北京
罗盛芬
;
论文数:
引用数:
h-index:
机构:
孙茂松
.
中文信息学报,
2003,
(03)
:9
-14
[2]
中文词的自动办理
[J].
论文数:
引用数:
h-index:
机构:
王永成
;
论文数:
引用数:
h-index:
机构:
苏海菊
;
论文数:
引用数:
h-index:
机构:
莫燕
.
中文信息学报,
1990,
(04)
:1
-11
[3]
Thesauri on the Web: current developments and trends[J] Ali Asghar Shiri;Crawford Revie Online Information Review 2000,
[4]
张琪玉情报语言学文集[M] 张琪玉著; 北京图书馆出版社 1999,
←
1
→
共 4 条
[1]
基于字串内部结合紧密度的汉语自动抽词实验研究
[J].
罗盛芬
论文数:
0
引用数:
0
h-index:
0
机构:
智能技术与系统国家重点实验室清华大学计算机科学与技术系,智能技术与系统国家重点实验室清华大学计算机科学与技术系北京,北京
罗盛芬
;
论文数:
引用数:
h-index:
机构:
孙茂松
.
中文信息学报,
2003,
(03)
:9
-14
[2]
中文词的自动办理
[J].
论文数:
引用数:
h-index:
机构:
王永成
;
论文数:
引用数:
h-index:
机构:
苏海菊
;
论文数:
引用数:
h-index:
机构:
莫燕
.
中文信息学报,
1990,
(04)
:1
-11
[3]
Thesauri on the Web: current developments and trends[J] Ali Asghar Shiri;Crawford Revie Online Information Review 2000,
[4]
张琪玉情报语言学文集[M] 张琪玉著; 北京图书馆出版社 1999,
←
1
→