汉语介词短语的自动识别

被引:14
作者
干俊伟
黄德根
机构
[1] 大连理工大学计算机科学与工程系
[2] 大连理工大学计算机科学与工程系 辽宁大连
[3] 辽宁大连
关键词
计算机应用; 中文信息处理; 短语识别; 介词短语;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
本文运用规则和统计相结合的方法构造了一个汉语介词短语识别算法。首先,根据介词和介词短语右边界组成的搭配模板自动提取可信搭配关系,并用这些搭配关系对介词短语进行识别。之后,用基于词性的三元边界统计模型和规则相结合的方法识别其它未处理的介词短语。通过对含有7323个介词短语的语料作交叉测试,精确率达到87·48%,召回率达到87·27%。
引用
收藏
页码:17 / 23
页数:7
相关论文
共 11 条
[1]   基于SVM的中文组块分析 [J].
李珩 ;
朱靖波 ;
姚天顺 .
中文信息学报, 2004, (02) :1-7
[2]   汉语组块识别 [J].
李珩 ;
谭咏梅 ;
朱靖波 ;
姚天顺 .
东北大学学报, 2004, (02) :114-117
[3]   面向特定领域的汉语句法主干分析 [J].
齐浩亮 ;
杨沐昀 ;
孟遥 ;
韩习武 ;
赵铁军 .
中文信息学报, 2004, (01) :1-5+13
[4]   基于最大熵模型的组块分析 [J].
李素建 ;
刘群 ;
杨志峰 .
计算机学报, 2003, (12) :1722-1727
[5]   基于最大熵方法的中英文基本名词短语识别 [J].
周雅倩 ;
郭以昆 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2003, (03) :440-446
[6]   汉语基本短语的自动识别 [J].
张昱琪 ;
周强 .
中文信息学报, 2002, (06) :1-8
[7]   一种基于混合分析的汉语文本句法语义分析方法 [J].
尹凌 ;
姚天昉 ;
张冬茉 ;
李芳 .
中文信息学报, 2002, (04) :45-51
[8]   基于神经元网络的汉语短语边界识别 [J].
奚晨海 ;
孙茂松 .
中文信息学报, 2002, (02) :20-26
[9]   基于统计的汉语组块分析 [J].
刘芳 ;
赵铁军 ;
于浩 ;
杨沐昀 ;
方高林 .
中文信息学报, 2000, (06) :28-32+39
[10]   汉语句子的组块分析体系 [J].
周强 ;
孙茂松 ;
黄昌宁 .
计算机学报, 1999, (11) :1158-1165