现当代文学作品的作者身份识别研究

被引:20
作者
年洪东
陈小荷
王东波
机构
[1] 南京师范大学文学院
关键词
作者身份识别; 机器学习; 计算风格学; 现当代文学;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置]; TP181 [自动推理、机器学习];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ; 0812 ; 0835 ;
摘要
主要利用了SVM统计机器学习模型对中国现当代文学八位代表人物的作品进行了作者身份识别研究,在识别过程中选取了以词汇为基础的多种统计量作为识别特征,并且采取了基于低密度多特征的训练方法,在跨文体的作品的作者身份识别中取得了非常优异的识别性能。
引用
收藏
页码:226 / 229
页数:4
相关论文
共 5 条
[1]   基于语义分析的作者身份识别方法研究 [J].
武晓春 ;
黄萱菁 ;
吴立德 .
中文信息学报, 2006, (06) :61-68
[2]   计算方法在汉语风格学研究中的应用 [J].
曾毅平 ;
朱晓文 .
福建师范大学学报(哲学社会科学版), 2006, (01) :14-17
[3]   ARE THE THISTED-EFRON AUTHORSHIP TESTS VALID [J].
VALENZA, RJ .
COMPUTERS AND THE HUMANITIES, 1991, 25 (01) :27-46
[4]  
文本分类及其相关技术研究 .2 李荣陆. . 2005
[5]  
Using Markov chains for identification of Writers .2 Khmelev D,Tweedy F J. Literary and Linguistic Computing . 2001