基于多属性加权的社会化问答社区关键词提取方法

被引:6
作者
余本功 [1 ,2 ]
李婷 [1 ]
杨颖 [1 ]
机构
[1] 合肥工业大学管理学院
[2] 合肥工业大学过程优化与智能决策教育部重点实验室
关键词
社会化问答社区; 关键词提取; TF-IDF; 多属性加权;
D O I
10.13266/j.issn.0252-3116.2018.05.015
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
[目的 /意义]现有的关键词提取方法不适应社会化问答社区文本长度较短、内容表述口语化、数据集稀疏的特点,且很少考虑用户关注程度对词语重要性的影响,不能有效地提取此类文本的关键词,因此,提出针对社会化问答社区的多属性加权关键词提取方法。[方法 /过程]多属性加权关键词提取方法通过引入调节函数和词性对传统TF-IDF进行改进,并通过线性加权融合用户回答数、关注数、浏览数以及评论数4个用户关注属性来综合度量词语权重。[结果/结论]实验表明,该方法能更有效地提取社会化问答社区文本的关键词。
引用
收藏
页码:132 / 139
页数:8
相关论文
共 27 条
[1]   社会化问答用户特征识别与行为动机分析——以“知乎”为例 [J].
陈娟 ;
高杉 ;
邓胜利 .
情报科学, 2017, 35 (05) :69-74+80
[2]   基于词或词组长度和频数的短中文文本关键词提取算法 [J].
陈伟鹤 ;
刘云 .
计算机科学, 2016, 43 (12) :50-57
[3]   国内外知识流研究热点:基于词频的统计分析 [J].
傅柱 ;
王曰芬 ;
陈必坤 .
图书馆学研究 , 2016, (14) :2-12+21
[4]   基于网络问答社区的话题识别与分析——以知乎“老年人”话题为例 [J].
黄鲁成 ;
蒋林杉 ;
苗红 ;
吴菲菲 .
图书情报工作, 2016, 60 (05) :93-100
[5]   基于词频统计的文本关键词提取方法 [J].
罗燕 ;
赵书良 ;
李晓超 ;
韩玉辉 ;
丁亚飞 .
计算机应用, 2016, 36 (03) :718-725
[6]   社会化问答平台用户体验影响因素实证分析——以知乎为例 [J].
陈娟 ;
邓胜利 .
图书情报工作, 2015, (24) :102-108
[7]   基于加权知识网络的企业社区用户创新知识建模及分析方法 [J].
廖晓 ;
李志宏 ;
席运江 .
系统工程理论与实践, 2016, (01) :94-105
[8]   一种基于加权LDA模型和多粒度的文本特征选择方法 [J].
李湘东 ;
巴志超 ;
黄莉 .
现代图书情报技术 , 2015, (05) :42-49
[9]   文本分类中受词性影响的特征权重计算方法 [J].
路永和 ;
王鸿滨 .
现代图书情报技术, 2015, (04) :18-25
[10]   多准则排序中的路径问题及层次分析法推广 [J].
刘开第 ;
庞彦军 ;
周少玲 ;
马丽涛 ;
栗文国 .
系统工程理论与实践, 2015, (04) :973-983