词汇计量研究与常用词知识库建设

被引:5
作者
俞士汶 [1 ,2 ]
朱学锋 [1 ]
机构
[1] 北京大学计算语言学研究所计算语言学教育部重点实验室
[2] 语言能力协同创新中心
关键词
汉语常用词知识库; 《中国语言生活状况报告》; 综合型语言知识库; 《现代汉语语法信息词典》; 部件词;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
面向自然语言处理的词汇语义研究应该以词汇的计量研究为基础。该文在评述汉语词汇计量研究的主要成果以后,提出一个汉语常用词知识库的建设任务,并给出常用词表的构造性定义、词表常用性的定量评价方法以及"部件词"的概念,最后介绍现代汉语常用词知识库的总体设计和已经做的工作。期望常用词知识库的建设能为汉语词汇语义学研究、为中文信息处理事业的发展做出贡献。
引用
收藏
页码:16 / 20
页数:5
相关论文
共 7 条
  • [1] 《汉语高频词语法信息词典》的研制
    朱学锋
    张化瑞
    段慧明
    俞士汶
    [J]. 语言文字应用, 2004, (03) : 98 - 104
  • [2] 综合型语言知识库及其前景
    俞士汶
    穗志方
    朱学锋
    [J]. 中文信息学报, 2011, (06) : 12 - 20
  • [3] 中国语言资源论丛[M]. 商务印书馆 , 张普, 2009
  • [4] 中国语言生活状况报告[M]. 商务印书馆 , 教育部语言文字信息管理司, 2011
  • [5] 现代汉语语法信息词典详解[M]. 清华大学出版社 , 俞士汶等著, 2003
  • [6] 现代汉语频率词典[M]. 北京语言学院出版社 , 北京语言学院语言教学研究所编, 1986
  • [7] 北京大学现代汉语语料库基本加工规范
    俞士汶
    段慧明
    朱学锋
    孙斌
    [J]. 中文信息学报, 2002, (05) : 49 - 64