基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验

被引:13
作者
查贵庭
侯汉清
机构
[1] 南京农业大学信息管理系
关键词
新闻标引; 自动标引; 自动分类; 词表技术; 自然语言标引;
D O I
暂无
中图分类号
G254.3 [文献编目];
学科分类号
摘要
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。
引用
收藏
页码:273 / 277
页数:5
相关论文
共 5 条