一种基于条件随机场的领域术语上下位关系获取方法

被引:5
作者
黄毅 [1 ]
王庆林 [1 ]
刘禹 [2 ]
机构
[1] 北京理工大学自动化学院
[2] 中国科学院自动化研究所
关键词
条件随机场; 上下位关系发现; 机器学习; 本体学习; 知识挖掘;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
081104 ; 0812 ; 081203 ; 0835 ; 1405 ;
摘要
提出一种基于条件随机场的领域术语上下位关系获取方法。首先,结合百科名片中结构化、制式化的语言表达形式,通过统计分析,提炼出适用于通用模型的特征词词典。然后,在词和词性特征的基础上,结合特征词词典内容和标点符号信息,利用CRF机器学习技术对术语间上下位关系的内在规律进行学习,得到其表达方式和存在环境的概率模型。最后,通过实验对模型的准确性进行验证,并提出了改进。实验结果表明:该方法抽取上下位关系的准确率达到73.50%。
引用
收藏
页码:355 / 359
页数:5
相关论文
共 3 条
  • [1] 本体学习研究综述
    杜小勇
    李曼
    王珊
    [J]. 软件学报, 2006, (09) : 1837 - 1847
  • [2] 基于Web挖掘的领域本体自动学习
    方卫东
    袁华
    刘卫红
    [J]. 清华大学学报(自然科学版), 2005, (S1) : 1729 - 1733
  • [3] 实体关系自动抽取
    车万翔
    刘挺
    李生
    [J]. 中文信息学报, 2005, (02) : 1 - 6