汉语文本中交集型切分歧义的分类处理

被引:4
作者
李凯
左万利
吕巍
机构
[1] 吉林大学计算机科学与技术学院
关键词
自动分词; 交集型歧义字段; 宏结构; 类别;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
自动分词是中文信息处理的基本问题 ,交集型歧义字段的切分又是中文分词的难点 .本文把交集型歧义字段按其宏结构分类 ,再依据本文提出的 4条切分原则 ,使用歧义字段的结构信息和语法规则对不同类型的交集字段分别处理 ,提高了分词的准确性 .该分词方法已作为中文网页索引和检索工具被用于网络搜索引擎中 .实验效果表明 ,这一分词系统能够处理某些其它分词系统不能正确划分的实例
引用
收藏
页码:1486 / 1490
页数:5
相关论文
共 7 条
[1]   一种基于概率模型的分词系统 [J].
李家福 ;
张亚非 .
系统仿真学报, 2002, (05) :544-546+550
[2]   汉语语言的无词典分词模型系统 [J].
韩客松 ;
王永成 ;
陈桂林 .
计算机应用研究, 1999, (10) :8-9
[3]   汉语自动分词方法 [J].
殷建平 .
计算机工程与科学, 1998, (03) :62-68
[4]   基于神经网络的汉语自动分词系统的设计与分析 [J].
尹锋 .
情报学报, 1998, (01) :41-50
[5]   汉语自动分词中的神经网络技术研究 [J].
林亚平 ;
李彦 ;
童调生 ;
尹锋 .
湖南大学学报(自然科学版), 1997, (06) :96-102
[6]   书面汉语自动分词系统—CDWS [J].
梁南元 .
中文信息学报, 1987, (02) :44-52
[7]  
语法讲义[M]. 商务印书馆 , 朱德熙[著], 1982