统计与规则相结合的术语抽取

被引:7
作者
唐涛
周俏丽
张桂平
机构
[1] 沈阳航空航天大学知识工程研究中心
关键词
术语抽取; 条件随机场; 未登录术语; 5-best;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
在面向特定领域的分词中,术语抽取效果的好坏会对分词精度产生很大影响。因此,高精度的术语抽取成为领域分词的基础工作。针对特定领域提出了一种统计和规则相结合的术语抽取方法。在条件随机场给出的5-best结果的基础上,通过规则及给分机制进行术语抽取,并对抽取结果利用规则进行后处理。实验表明,相比于传统的基于条件随机场1-best进行的术语抽取,该方法能够明显提高未登录术语的召回率。
引用
收藏
页码:71 / 74
页数:4
相关论文
共 9 条
  • [1] 一种中医名词术语自动抽取方法
    张五辈
    白宇
    王裴岩
    张桂平
    [J]. 沈阳航空航天大学学报, 2011, 28 (01) : 72 - 75
  • [2] 采用CRF技术的军事情报术语自动抽取研究
    贾美英
    杨炳儒
    郑德权
    杨靖
    [J]. 计算机工程与应用 , 2009, (32) : 126 - 129
  • [3] 基于统计和规则相结合的科技术语自动抽取研究
    刘豹
    张桂平
    蔡东风
    [J]. 计算机工程与应用, 2008, (23) : 147 - 150
  • [4] 基于卡方检验的汉语术语抽取
    胡文敏
    何婷婷
    张勇
    [J]. 计算机应用, 2007, (12) : 3019 - 3020+3025
  • [5] 自动提取含字母词语的领域新术语的研究
    姜韶华
    党延忠
    [J]. 计算机工程, 2007, (02) : 47 - 49
  • [6] 基于互信息的中文术语抽取系统
    张锋
    许云
    侯艳
    樊孝忠
    [J]. 计算机应用研究, 2005, (05) : 72 - 73+77
  • [7] 领域知识的获取[D]. 李卫.北京邮电大学. 2008
  • [8] 特定领域术语自动抽取方法的研究[D]. 马志斌.哈尔滨工业大学. 2009
  • [9] 基于CRFs的中文领域术语自动抽取研究[A]. 王海雄,郭剑毅,余正涛,毛存礼,张朝胜,雷春雅.第六届全国信息检索学术会议论文集[C]. 2010