共 1 条
基于双语信息和标签传播算法的中文情感词典构建方法
被引:35
作者:
李寿山
[1
,2
]
李逸薇
[2
]
黄居仁
[2
]
苏艳
[1
]
机构:
[1] 苏州大学计算机科学与技术学院
[2] 香港理工大学中文及双语学系
来源:
关键词:
情感分析;
双语信息;
情感字典;
标签传播;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
文本情感分析是目前自然语言处理领域的一个热点研究问题,具有广泛的实用价值和理论研究意义。情感词典构建则是文本情感分析的一项基础任务,即将词语按照情感倾向分为褒义、中性或者贬义。然而,中文情感词典构建存在两个主要问题:1)许多情感词存在多义、歧义的现象,即一个词语在不同语境中它的语义倾向也不尽相同,这给词语的情感计算带来困难;2)由国内外相关研究现状可知,中文情感字典建设的可用资源相对较少。考虑到英文情感分析研究中存在大量语料和词典,该文借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息。在四个领域的实验结果显示我们的方法能获得一个分类精度高、覆盖领域语境的中文情感词典。
引用
收藏
页码:75 / 81
页数:7
相关论文