字词频统计与汉语分词规范

被引:2
作者
刘源
机构
关键词
汉语分词; 现代汉语; 中文信息处理; 词频统计; 语言统计; 分词词典;
D O I
10.16412/j.cnki.1001-8476.1992.05.016
中图分类号
学科分类号
摘要
<正> 一、中文信息处理的字频统计我国在70年代曾组织“七四八工程”,对2100余万汉字的语料,进行汉字的字频统计,得出了《现代汉字综合使用频度表》,为《信息交换用汉字编码字符集——基本集》提供了基础。但由于当时的历史条件,统计资料有一定的局限性,而且是初次进行这项工作,技术和经验都嫌不足,致使以这一统计材料为依据的《信息交换用汉字编码字符集——基本集》中所收的一二级汉字中,有少数字的使用率极低,甚至是目
引用
收藏
页码:35 / 38
页数:4
相关论文
empty
未找到相关数据