学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于分类标注语料库的关键词标引知识自动获取
被引:6
作者
:
刘华
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学华文学院
刘华
机构
:
[1]
暨南大学华文学院
来源
:
图书情报工作
|
2007年
/ 07期
关键词
:
关键词标引;
分类语料库;
主题度;
D O I
:
暂无
中图分类号
:
G254.2 [主题法];
学科分类号
:
摘要
:
基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。
引用
收藏
页码:41 / 43
页数:3
相关论文
共 6 条
[1]
网页信息抽取及建库系统C#实现
[J].
刘华
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学华文学院应用语言学系
刘华
.
计算机工程,
2006,
(16)
:49
-51
[2]
关键词自动标引系统实现
[J].
刘华
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学华文学院
刘华
.
现代图书情报技术,
2006,
(02)
:88
-90
[3]
中文全文检索系统中实现主题词标引思路
[J].
论文数:
引用数:
h-index:
机构:
吴春玉
.
情报杂志,
2005,
(01)
:115
-116+119
[4]
关键词自动标引的最大熵模型应用研究
[J].
论文数:
引用数:
h-index:
机构:
李素建
;
王厚峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
王厚峰
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
俞士汶
;
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
辛乘胜
.
计算机学报,
2004,
(09)
:1192
-1197
[5]
基于PAT TREE统计语言模型与关键词自动提取
[J].
杨文峰
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
杨文峰
;
李星
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
李星
.
计算机工程与应用,
2001,
(15)
:17
-19+35
[6]
文献信息计算机全文全自动标引方法[J]. 叶志清,刘瑞红,袁庆,胡修兰.情报学报. 2003 (02)
←
1
→
共 6 条
[1]
网页信息抽取及建库系统C#实现
[J].
刘华
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学华文学院应用语言学系
刘华
.
计算机工程,
2006,
(16)
:49
-51
[2]
关键词自动标引系统实现
[J].
刘华
论文数:
0
引用数:
0
h-index:
0
机构:
暨南大学华文学院
刘华
.
现代图书情报技术,
2006,
(02)
:88
-90
[3]
中文全文检索系统中实现主题词标引思路
[J].
论文数:
引用数:
h-index:
机构:
吴春玉
.
情报杂志,
2005,
(01)
:115
-116+119
[4]
关键词自动标引的最大熵模型应用研究
[J].
论文数:
引用数:
h-index:
机构:
李素建
;
王厚峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
王厚峰
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
俞士汶
;
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
辛乘胜
.
计算机学报,
2004,
(09)
:1192
-1197
[5]
基于PAT TREE统计语言模型与关键词自动提取
[J].
杨文峰
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
杨文峰
;
李星
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学电子工程系!北京
李星
.
计算机工程与应用,
2001,
(15)
:17
-19+35
[6]
文献信息计算机全文全自动标引方法[J]. 叶志清,刘瑞红,袁庆,胡修兰.情报学报. 2003 (02)
←
1
→