中文机构名称的识别与分析

被引:75
作者
张小衡
王玲玲
机构
[1] 香港理工大学中文及双语学系
关键词
机构名称,专有名词,短语分析,自然语言处理;
D O I
暂无
中图分类号
H146.2 [词类];
学科分类号
0501 ; 050103 ;
摘要
中文机构名称数目庞大,层出不穷,绝大多数未能收入词典,给自然语言处理带来困扰。但是,从语言学的角度来看,机构名称是一种偏正复合式专有名词,同时又是一类较为简单的偏正名词词组,有自己的结构规律和形态标记。本文以高校名称为重点,以中国内地、香港和台湾三地实际语料为依据,从语言学和计算机技术两方面对机构名称的识别与分析展开讨论,并总结出相应的规则。根据这些规则,对六百多万字的三地语料库作高校名称识别,正确率(指前后界定位均正确)达973%,召回率为969%。这些规则还可应用于拼音 汉字智能转换和机器翻译等其它领域。
引用
收藏
页码:22 / 33
页数:12
相关论文
共 5 条
[1]   从“qinghuadaxue”谈起逐步实现中文智能输入 [J].
张小衡 .
中文信息, 1996, (05) :3-5
[2]  
汉语词法论[M]. 学林出版社 , 陈光磊著, 2001
[3]  
语言文字规范手册[M]. 中国青年出版社 , 语文出版社编, 1996
[4]  
核心推导语法[M]. 上海教育出版社 , 陆丙甫著, 1993
[5]  
现代汉语词汇概要[M]. 内蒙古人民出版社 , 武占坤, 1983