汉语未登录词识别现状及一种新识别方法介绍

被引:19
作者
王蕾 [1 ]
杨季文 [2 ]
机构
[1] 苏州卫生职业技术学院
[2] 苏州大学计算机科学与技术学院
关键词
专有名词识别; 属性标注; 错误驱动; 规则和实例;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
未登录词的识别对于各种汉语处理系统不仅有直接的实用意义,而且起到基础性的作用。在大规模中文文本的自动分词中,未被识别的未登录词是造成分词错误的一个重要原因,也成为许多自动分词系统走向应用的瓶颈。首先对未登录词的研究现状及现有方法做了一个综合的介绍,分析了目前方案的利弊。在此基础上提出了一个基于框架结构的未登录词专有名词识别方法。
引用
收藏
页码:213 / 215
页数:3
相关论文
共 10 条
[1]
汉语自动分词的研究现状与困难 [J].
张春霞 ;
郝天永 .
系统仿真学报, 2005, (01) :138-143+147
[2]
基于角色标注的中国人名自动识别研究 [J].
张华平 ;
刘群 .
计算机学报, 2004, (01) :85-91
[3]
基于统计的中文地名识别 [J].
黄德根 ;
岳广玲 ;
杨元生 .
中文信息学报, 2003, (02) :36-41
[4]
中国地名自动识别系统的设计与实现 [J].
谭红叶 ;
郑家恒 ;
刘开瑛 .
计算机工程, 2002, (08) :128-129+270
[5]
中国组织机构名自动识别系统的设计与实现 [J].
张辉 ;
徐健 .
电脑开发与应用, 2002, (01) :5-6+9
[6]
基于统计方法的中文姓名识别 [J].
黄德根 ;
杨元生 ;
王省 ;
张艳丽 ;
钟万勰 .
中文信息学报, 2001, (02) :31-37+44
[7]
基于统计和规则的中文姓名自动辨识 [J].
季姮 ;
罗振声 .
语言文字应用, 2001, (01) :14-18
[8]
基于统计方法的中文姓名识别 [J].
刘秉伟 ;
黄萱菁 ;
郭以昆 ;
吴立德 .
中文信息学报, 2000, (03) :16-24+36
[9]
基于语料库的中文姓名识别方法研究 [J].
郑家恒 ;
李鑫 ;
谭红叶 .
中文信息学报, 2000, (01) :7-12
[10]
中文姓名的自动辨识 [J].
孙茂松 ;
黄昌宁 ;
高海燕 ;
方捷 .
中文信息学报, 1995, (02)