基于主题特征的关键词抽取

被引:31
作者
刘俊
邹东升
邢欣来
李英豪
机构
[1] 重庆大学计算机学院
基金
中国博士后科学基金;
关键词
关键词抽取; 主题特征; 主题模型; 装袋决策树;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
为了使抽取出的关键词更能反映文档主题,提出了一种新的词的主题特征(topic feature,TF)计算方法,该方法利用主题模型中词和主题的分布情况计算词的主题特征。并将该特征与关键词抽取中的常用特征结合,用装袋决策树方法构造一个关键词抽取模型。实验结果表明提出的主题特征可以提升关键词抽取的效果,同时验证了装袋决策树在关键词抽取中的适用性。
引用
收藏
页码:4224 / 4227
页数:4
相关论文
empty
未找到相关数据