共 1 条
高频词与低频词的界分及词频估算法
被引:186
作者:
孙清兰
机构:
[1] 东北师大图书情报学系
来源:
关键词:
Zepf’s Law——Studies;
Frequency of terms——Calculations;
Document metrology——Theories;
D O I:
10.13530/j.cnki.jlis.1992.02.019
中图分类号:
G256 [文献学];
学科分类号:
050104 ;
060107 ;
060202 ;
摘要:
<正> 齐夫第二定律揭示了低频词的分布规律,给出:In,/I1=2/n(n+1)……(1) 式中,In代表文中出现n次的词汇数量。比值与文章长度无关。高频词与低频词分界有个临界值,这是Donohue,J·C·于1973年提出的。其计算公式
引用
收藏
页码:78 / 81+95
+95-96
页数:6
相关论文