基于句类特征的作者写作风格分类研究

被引:18
作者
张运良 [1 ]
朱礼军 [1 ]
乔晓东 [1 ]
张全 [2 ]
机构
[1] 不详
[2] 中国科学技术信息研究所
[3] 不详
[4] 中国科学院声学研究所
[5] 不详
关键词
文本分类; 作者写作风格; 句类; 向量空间模型; 概念层次网络(HNC)理论; 自然语言理解;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
不同作家的作品有自己的特点,这些特点体现在词汇、句型、修辞手法等各个方面,尝试使用句类特征进行作者写作风格分类,进一步可以用于作者的识别。利用向量空间模型,以句类作为特征,并通过混合句类分解等技术对句类向量空间降维,使用itc算法对特征项进行权重计算,KNN算法进行分类并利用集成判决技术,形成作者写作风格分类器。本分类器的性能在近现代小说的按作者写作风格的分类和鉴别方面的性能是可以接受的,并有进一步提升的可能。
引用
收藏
页码:129 / 131+223 +223
页数:4
相关论文
共 9 条