共 27 条
基于多属性加权的社会化问答社区关键词提取方法
被引:6
作者:
余本功
[1
,2
]
李婷
[1
]
杨颖
[1
]
机构:
[1] 合肥工业大学管理学院
[2] 合肥工业大学过程优化与智能决策教育部重点实验室
来源:
关键词:
社会化问答社区;
关键词提取;
TF-IDF;
多属性加权;
D O I:
10.13266/j.issn.0252-3116.2018.05.015
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
[目的 /意义]现有的关键词提取方法不适应社会化问答社区文本长度较短、内容表述口语化、数据集稀疏的特点,且很少考虑用户关注程度对词语重要性的影响,不能有效地提取此类文本的关键词,因此,提出针对社会化问答社区的多属性加权关键词提取方法。[方法 /过程]多属性加权关键词提取方法通过引入调节函数和词性对传统TF-IDF进行改进,并通过线性加权融合用户回答数、关注数、浏览数以及评论数4个用户关注属性来综合度量词语权重。[结果/结论]实验表明,该方法能更有效地提取社会化问答社区文本的关键词。
引用
收藏
页码:132 / 139
页数:8
相关论文