学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
一种短语结构规则的自动获取方法
被引:4
作者
:
朱靖波
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院计算机科学系
朱靖波
姚天顺
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院计算机科学系
姚天顺
不详
论文数:
0
引用数:
0
h-index:
0
机构:
东北大学信息科学与工程学院计算机科学系
不详
机构
:
[1]
东北大学信息科学与工程学院计算机科学系
来源
:
计算机研究与发展
|
1999年
/ 05期
关键词
:
名词短语结构规则,距离函数,基于多特征的相似评估;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
081203 ;
0835 ;
摘要
:
文中提出一种新的知识获取方法,即从完全没有任何标注的生语料库中,采用NA假设自动构造带标训练数据,利用基于多特征的相似评估技术自动获取名词短语结构规则.该方法具有两个特点:①由于从没有任何标注的生语料库中自动获取带标训练数据,促使带标数据规模可以很大,且容易构造不同领域的带标语料库;②所获取的短语结构规则具有概率属性,可用于分类检索等应用中的名词短语抽取.为论证方法有效性,采用美国Berlitz公司的汽车配件真实语料进行测试,前50个名词短语结构规则的准确率高达80%.
引用
收藏
页码:90 / 96
页数:7
相关论文
未找到相关数据
未找到相关数据