基于产品评论的观点挖掘研究

被引:0
作者
张阳
机构
[1] 西北大学
关键词
产品评论; 观点挖掘; 产品特征; 文本倾向性;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
各类厂商及消费者现在已越来越重视产品的评价,挖掘产品评论因此具有十分重要的意义。目前,厂商或消费者从评论文本中提取有价值的信息通常以人工阅读的方式来进行,效率低下。本文对自动化挖掘产品评论进行研究,给出一种自动抽取产品特征词汇的方法,并对评论文本进行不同粒度的情感倾向性判断,设计并实现一个基于产品评论的观点挖掘系统。论文的研究工作如下: 1.从产品的评论文本出发,给出一种基于自扩展的产品特征提取方法,从评论文本中抽取出产品特征,发现用户评价产品的侧重点。该算法仅由若干种子词汇来进行挖掘,再通过词语相似度、词语距离等进行修剪,最终达到挖掘产品特征词汇的目的。 2.针对传统的“特征—意见”词对不能完全概括文本的情感内容这一问题,本文在“特征一意见”词对的基础上,对其进行扩展,定义情感描述项用于描述文本的情感内容;并提出一种情感描述项抽取算法,结合产品特征词汇,挖掘出文本中的情感描述项。 3.研究不同粒度中文文本倾向性计算方法。对于文本整体倾向性判别,提出一种基于情感描述项和改进的互信息的情感极性计算方法,使得在判断文本整体倾向性时不再依靠情感资源,从而具有更好的移植性和准确性;对于词语级细粒度的情感倾向性判别,结合词语相似度,并配合情感描述项可以判定用户对于不同产品特征的情感倾向。 4.为满足自动化挖掘产品评论文本,在以上研究的基础上,根据观点挖掘系统使用者的用户需求,设计实现一个基于产品评论的观点挖掘系统。该系统可以自动抽取网站上的产品评论并进行相关预处理,发现产品评论文本中的特征词汇,并对评论整体和某产品特征对应的意见词进行情感极性判定,并将挖掘结果进行直观展示。
引用
收藏
页数:65
共 27 条
[1]
产品评论挖掘研究综述 [J].
郗亚辉 ;
张明 ;
袁方 ;
王煜 .
山东大学学报(理学版), 2011, 46 (05) :16-23+38
[2]
文本分类中互信息特征选择方法的研究 [J].
范小丽 ;
刘晓霞 .
计算机工程与应用 , 2010, (34) :123-125
[3]
文本情感分析 [J].
赵妍妍 ;
秦兵 ;
刘挺 .
软件学报, 2010, 21 (08) :1834-1848
[4]
基于CRF算法的汉语比较句识别和关系抽取 [J].
黄高辉 ;
姚天昉 ;
刘全升 .
计算机应用研究, 2010, 27 (06) :2061-2064
[5]
基于语义理解的文本情感分类方法研究 [J].
闻彬 ;
何婷婷 ;
罗乐 ;
宋乐 ;
王倩 .
计算机科学, 2010, 37 (06) :261-264
[6]
一种基于知网的中文句子情感倾向判别方法 [J].
党蕾 ;
张蕾 .
计算机应用研究, 2010, 27 (04) :1370-1372
[7]
基于弱监督学习的产品特征抽取 [J].
伍星 ;
何中市 ;
黄永文 .
计算机工程, 2009, 35 (13) :199-201
[8]
产品评论挖掘研究综述 [J].
伍星 ;
何中市 ;
黄永文 .
计算机工程与应用 , 2008, (36) :37-41
[9]
汉语比较句识别研究 [J].
黄小江 ;
万小军 ;
杨建武 ;
肖建国 .
中文信息学报, 2008, (05) :30-38
[10]
基于HowNet的句子褒贬倾向性研究 [J].
熊德兰 ;
程菊明 ;
田胜利 .
计算机工程与应用, 2008, (22) :143-145