基于知网的词汇语义自动分类系统

被引:25
作者
卢鹏
孙明勇
陆汝占
机构
[1] 上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系上海,上海,上海
关键词
《知网》; 语义分类; 平均互信息; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
词汇语义分类是现代汉语语义研究的重要组成部分。该文介绍的基于知网的词汇语义自动分类系统提供了词汇语义分类的一个新思路。目前该系统的研制已取得实质性成果,在基于知网的语义分类体系上,开发了粗分类模块,对知网提供的6万余条汉语常用词进行语义分类,得到1420个语义等价类;并在此基础上,开发了细分类模块,针对粗分类结果中颗粒度较大的词类,将其进一步细化为适合实际需要的子类。实验结果证明该系统所作的分类在自然语言处理和语言学研究中起到了重要作用。
引用
收藏
页码:127 / 131
页数:5
相关论文
共 2 条
[1]
计算语言学导论.[M].翁富良;王野翊著;.中国社会科学出版社.1998,
[2]
同义词词林.[M].梅家驹;竺一鸣;高蕴琦;殷鸿翔 编.上海辞书出版社.1983,