中文领域本体学习中术语的自动抽取

被引:14
作者
温春
王晓斌
石昭祥
机构
[1] 电子工程学院网络工程系
关键词
领域术语抽取; 领域主题一致度; 领域本体学习; 多字词候选术语; 字符串分解;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出一种领域术语自动抽取的混合策略,首先进行多字词候选术语抽取和分词,然后合并其结果,最后通过领域相关度和领域主题一致度抽取出最终领域术语。在多字词抽取和最终领域术语抽取阶段分别对现有方法进行了改进,降低了字符串分解的时间复杂度并提高了领域术语抽取的准确率和召回率。实验表明,术语抽取准确率为90.64%,优于现有的抽取方法。
引用
收藏
页码:2652 / 2655
页数:4
相关论文
共 7 条
  • [1] 基于卡方检验的汉语术语抽取[J].胡文敏,何婷婷,张勇. 计算机应用.2007(12)
  • [2] 特定领域本体自动构造方法[J].何婷婷,张小鹏. 计算机工程.2007(22)
  • [3] 领域术语自动抽取及其在文本分类中的应用[J].刘桃,刘秉权,徐志明,王晓龙. 电子学报.2007(02)
  • [4] 基于质子串分解的中文术语自动抽取[J].何婷婷,张勇. 计算机工程.2006(23)
  • [5] 本体学习研究综述[J].杜小勇,李曼,王珊. 软件学报.2006(09)
  • [6] 基于多策略的专业领域术语抽取器的设计[J].杜波,田怀凤,王立,陆汝占. 计算机工程.2005(14)
  • [7] 本体论研究综述[J].李善平,尹奇韡,胡玉杰,郭鸣,付相君. 计算机研究与发展.2004(07)