高效的短文本主题词抽取方法

被引:14
作者
常鹏 [1 ]
马辉 [2 ]
机构
[1] 天津大学管理学院
[2] 天津城市建设学院管理系
关键词
抽取; 词共现; 主题抽取;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
为了克服传统主题词抽取算法中的主题漂移与主题误判等问题,提出了利用词的共现信息来提高主题词抽取的准确率。根据词汇与文本中的上下文环境词汇的共现关系来调节词的权重评分,与文本主题具有较高共现率的词将被优先抽取为文本的主题词,从而提高文本的主题词抽取精度。经实验证明,提出的主题词抽取方法较一般主题词抽取方法准确率有所提升,特别是抽取文本篇幅较短时,该方法明显优于一般方法。
引用
收藏
页码:126 / 128+154 +154
页数:4
相关论文
共 4 条