学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
现代汉语词频统计通过国家鉴定
被引:2
作者
:
庞关
论文数:
0
引用数:
0
h-index:
0
庞关
机构
:
来源
:
语文建设
|
1986年
/ 05期
关键词
:
词频统计;
语言统计;
自动分词;
现代汉语;
计算机;
使用频度;
叔度;
选材;
D O I
:
10.16412/j.cnki.1001-8476.1986.05.026
中图分类号
:
学科分类号
:
摘要
:
<正> 现代汉语词频统计是由国家科委下达,委托国家标准局主管的重大科研项目,由北京航空学院等11个单位研制。此次词频统计,选取原始母体材料约三亿汉字,用等距抽样和随机抽样的方法从三亿汉字中抽样约二千五百万字。选材的特点是:1.选材范围广。有报纸、期刊,大中学各科教材,各种通俗读物及专著等。全部选材来自1679篇文章和专著,具有较强的代表性。2.选材分科多。全部选材分为社会科学和自然科学两大类,每类又各分五个子类
引用
收藏
页码:59 / 60
页数:2
相关论文
未找到相关数据
未找到相关数据