文献中的词语分布、词型等级和风格计算

被引:9
作者
马创新 [1 ]
陈小荷 [2 ]
机构
[1] 江苏师范大学语言科学与艺术学院
[2] 南京师范大学文学院
关键词
词语分布; 离散; 集中; 检索; 风格;
D O I
暂无
中图分类号
H14 [语法];
学科分类号
摘要
文献的语言风格是作者在语言运用方面的思维定势的体现,对于文献之间语言风格的差异,以前的研究大多采用定性分析的方式加以比较和概括,而在文献检索和文本分类领域需要得到量化的语言风格相似度。该文首先分析文献中词语分布的普遍规律,以先秦八部经典文献为观察语料,发现这些文献中的词语既呈离散分布,又呈集中分布;然后通过计算文献之间词型等级的相关系数,来获取量化的语言风格相似度,构建了八部文献之间的相似度矩阵,验证了语言风格的差异不仅体现在使用的常用词上,还更细微地体现在常用词的使用频率等级上。
引用
收藏
页码:20 / 27
页数:8
相关论文
共 16 条