高频词与低频词的界分及词频估算法

被引:186
作者
孙清兰
机构
[1] 东北师大图书情报学系
关键词
Zepf’s Law——Studies; Frequency of terms——Calculations; Document metrology——Theories;
D O I
10.13530/j.cnki.jlis.1992.02.019
中图分类号
G256 [文献学];
学科分类号
050104 ; 060107 ; 060202 ;
摘要
<正> 齐夫第二定律揭示了低频词的分布规律,给出:In,/I1=2/n(n+1)……(1) 式中,In代表文中出现n次的词汇数量。比值与文章长度无关。高频词与低频词分界有个临界值,这是Donohue,J·C·于1973年提出的。其计算公式
引用
收藏
页码:78 / 81+95 +95-96
页数:6
相关论文
共 1 条
[1]   汉语文集的齐夫分布 [J].
王崇德 ;
来玲 .
情报科学, 1989, (02) :1-8+42+79