基于分类标注语料库的关键词标引知识自动获取

被引:6
作者
刘华
机构
[1] 暨南大学华文学院
关键词
关键词标引; 分类语料库; 主题度;
D O I
暂无
中图分类号
G254.2 [主题法];
学科分类号
摘要
基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。
引用
收藏
页码:41 / 43
页数:3
相关论文
共 6 条
[1]   网页信息抽取及建库系统C#实现 [J].
刘华 .
计算机工程, 2006, (16) :49-51
[2]   关键词自动标引系统实现 [J].
刘华 .
现代图书情报技术, 2006, (02) :88-90
[3]   中文全文检索系统中实现主题词标引思路 [J].
吴春玉 .
情报杂志, 2005, (01) :115-116+119
[4]   关键词自动标引的最大熵模型应用研究 [J].
李素建 ;
王厚峰 ;
俞士汶 ;
辛乘胜 .
计算机学报, 2004, (09) :1192-1197
[5]   基于PAT TREE统计语言模型与关键词自动提取 [J].
杨文峰 ;
李星 .
计算机工程与应用, 2001, (15) :17-19+35
[6]  
文献信息计算机全文全自动标引方法[J]. 叶志清,刘瑞红,袁庆,胡修兰.情报学报. 2003 (02)