现代汉语词频统计通过国家鉴定

被引:2
作者
庞关
机构
关键词
词频统计; 语言统计; 自动分词; 现代汉语; 计算机; 使用频度; 叔度; 选材;
D O I
10.16412/j.cnki.1001-8476.1986.05.026
中图分类号
学科分类号
摘要
<正> 现代汉语词频统计是由国家科委下达,委托国家标准局主管的重大科研项目,由北京航空学院等11个单位研制。此次词频统计,选取原始母体材料约三亿汉字,用等距抽样和随机抽样的方法从三亿汉字中抽样约二千五百万字。选材的特点是:1.选材范围广。有报纸、期刊,大中学各科教材,各种通俗读物及专著等。全部选材来自1679篇文章和专著,具有较强的代表性。2.选材分科多。全部选材分为社会科学和自然科学两大类,每类又各分五个子类
引用
收藏
页码:59 / 60
页数:2
相关论文
empty
未找到相关数据