从高频词等级相关角度探析《红楼梦》作者

被引:6
作者
马创新 [1 ]
陈小荷 [2 ]
机构
[1] 江苏师范大学语言科学与艺术学院
[2] 南京师范大学文学院
关键词
高频词; 等级; 相关度; 作者信息;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
该文提出一种"基于高频词等级相关度的方法"来探析存疑文献的作者信息,把各份语料中的词型均按照出现频次递减排列并确定等级,然后通过计算出语料之间高频词等级的相关度,来推断语料之间语言风格的相似度,并且把这种方法与"基于词型共现率的方法"和"基于词例共现率的方法"相比较。把《红楼梦》的120回均分为12份语料,使用"基于高频词等级相关度的方法"计算这12份语料两两之间的相关度。研究发现《红楼梦》的前8份语料两两之间相关度高,后4份语料两两之间相关度也高,而前8份语料与后4份语料这两部分语料之间相关度低。推断《红楼梦》前80回应是同一人所写,后40回应是另一人所写。
引用
收藏
页码:97 / 102
页数:6
相关论文
共 20 条