依存句法模板下的商品特征标签抽取研究

被引:20
作者
聂卉
杜嘉忠
机构
[1] 中山大学资讯管理学院
关键词
评论挖掘; 标签抽取; 依存句法分析;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
【目的】面向在线商品评论,通过探索"产品特征–观点"对应关系的识别方法,抽取商品特征标签,凝练评论精华。在网络资讯良莠混杂的环境下,帮助用户有效获得有价值的资讯。【方法】引入依存语法关系,对评论模板实现自动分类、过滤、泛化并形成模板库。基于模板库和外部词典提取特征标签,同时确立候选标签的筛选过滤机制。【结果】面向真实的网络评论集,本文方法的性能优于单纯过滤与泛化的抽取方法。F值最优达到56.5%,调整参数后,准确率达到65%。【局限】需要在特征抽取前依据评论语句质量进行前期过滤,考虑特征词库的自动化获取,在模板形成过程中,还需添加更多的句法关系,进一步提高特征标签的抽取准确度。【结论】单纯依据句法模板频率进行模板过滤的方法有提升空间。特征抽取过程考虑模板的长度特征,设定抽取窗口,对特征标签进行筛选、合并特征能获取更好的抽取结果。
引用
收藏
页码:44 / 50
页数:7
相关论文
共 6 条
[1]
消费者网络口碑传播的动机研究 [D]. 
蒋音播 .
华中科技大学,
2009
[2]
面向中文客户评论的评价搭配识别研究 [J].
陈炯 ;
张虎 ;
曹付元 .
计算机工程与设计, 2013, 34 (03) :1073-1077
[3]
基于依存关系的旅游景点评论的特征—观点对抽取 [J].
王素格 ;
吴苏红 .
中文信息学报, 2012, 26 (03) :116-121
[4]
基于句法树结构的情感评价单元抽取算法 [J].
黄亿华 ;
濮小佳 ;
袁春风 ;
武港山 .
计算机应用研究, 2011, 28 (09) :3229-3234
[5]
基于句法路径的情感评价单元识别 [J].
赵妍妍 ;
秦兵 ;
车万翔 ;
刘挺 .
软件学报, 2011, 22 (05) :887-898
[6]
汉语句子语义极性分析和观点抽取方法的研究 [J].
娄德成 ;
姚天昉 .
计算机应用, 2006, (11) :2622-2625