一种短语结构规则的自动获取方法

被引:4
作者
朱靖波
姚天顺
不详
机构
[1] 东北大学信息科学与工程学院计算机科学系
关键词
名词短语结构规则,距离函数,基于多特征的相似评估;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
文中提出一种新的知识获取方法,即从完全没有任何标注的生语料库中,采用NA假设自动构造带标训练数据,利用基于多特征的相似评估技术自动获取名词短语结构规则.该方法具有两个特点:①由于从没有任何标注的生语料库中自动获取带标训练数据,促使带标数据规模可以很大,且容易构造不同领域的带标语料库;②所获取的短语结构规则具有概率属性,可用于分类检索等应用中的名词短语抽取.为论证方法有效性,采用美国Berlitz公司的汽车配件真实语料进行测试,前50个名词短语结构规则的准确率高达80%.
引用
收藏
页码:90 / 96
页数:7
相关论文
empty
未找到相关数据