多语料库作法之中文姓名辨识

被引:18
作者
张俊盛
陈舜德
郑萦
刘显仲
柯淑津
机构
[1] 台湾清华大学资讯系及语言研究所
[2] 台湾声宝研究所软体研究室
[3] 台湾东吴大学电算系
关键词
断词; 中文; 语料库; 语库;
D O I
暂无
中图分类号
学科分类号
摘要
专用名词虽然只占中文文章中的词的百分之一到百分之二,但是,如果不对这些专用名词加以处理,将会形成自动分词的错误的大部分。本文首先描述了包括中文姓名辨识的分词方法,然后介绍其实验结果。最后,文章讨论了中文姓名辨识被遗漏和误判的原因,并提出未来的研究方向。
引用
收藏
页码:7 / 15
页数:9
相关论文
empty
未找到相关数据