基于组合特征的中文新闻网页关键词提取方法

被引:8
作者
袁津生
毛新武
机构
[1] 不详
[2] 北京林业大学信息学院
[3] 不详
关键词
提取; 组合特征; 组合词; 有向图; 新闻网页;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对中文新闻网页的特点,使用了包括统计特征、位置特征和词性特征等在内的多种特征综合评定候选关键词的权重大小。对于部分分词结果不能良好地反映主题的问题,提出了一种基于有向图的组合词生成方法,旨在找出高频次的相邻词作为组合词。实验结果表明,该方法较传统的TF-IDF方法效率有较大提升,能够有效提取出新闻网页关键词。
引用
收藏
页码:222 / 226
页数:5
相关论文
共 11 条