新能源汽车领域中文术语抽取方法

被引:11
作者
何宇 [1 ]
吕学强 [1 ]
徐丽萍 [2 ]
机构
[1] 北京信息科技大学网络文化与数字传播北京市重点实验室
[2] 北京城市系统工程研究中心
基金
北京市自然科学基金;
关键词
术语抽取; 新能源汽车领域; 条件随机场; 依存句法关系;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
【目的】为提高新能源汽车领域中文术语抽取结果的准确率和召回率,提出一种适合该领域的术语抽取方法。【方法】在总结前人工作基础上,提出利用条件随机场模型作为抽取模型,选取词、词长、词性、依存关系、词典位置、停用词等特征作为特征模板。【结果】实验结果正确率为93.12%,召回率为90.47%。正确率比Baseline方法提高7.73%。【局限】该方法只提高较短术语抽取结果的正确率。【结论】依存关系作为条件随机场模型的一项特征可以提高新能源汽车领域中文术语抽取结果的正确率和召回率。
引用
收藏
页码:88 / 94
页数:7
相关论文
共 10 条
  • [1] 基于条件随机场的领域术语识别研究
    施水才
    王锴
    韩艳铧
    吕学强
    [J]. 计算机工程与应用 , 2013, (10) : 147 - 149+155
  • [2] 基于条件随机场的汽车领域术语抽取
    李丽双
    党延忠
    张婧
    李丹
    [J]. 大连理工大学学报, 2013, 53 (02) : 267 - 272
  • [3] 面向信息分析的专利术语抽取研究
    屈鹏
    王惠临
    [J]. 图书情报工作, 2013, 57 (01) : 130 - 135
  • [4] 一种中文领域概念词自动提取方法研究
    董丽丽
    李欢
    张翔
    刘闫锋
    [J]. 计算机工程与应用, 2014, 50 (06) : 127 - 131
  • [5] 统计与规则相结合的术语抽取
    唐涛
    周俏丽
    张桂平
    [J]. 沈阳航空航天大学学报, 2011, 28 (05) : 71 - 74
  • [6] C值和互信息相结合的术语抽取
    梁颖红
    张文静
    张有承
    [J]. 计算机应用与软件, 2010, 27 (04) : 108 - 110
  • [7] 基于层叠条件随机场的旅游领域命名实体识别
    郭剑毅
    薛征山
    余正涛
    张志坤
    张宜浩
    姚贤明
    [J]. 中文信息学报, 2009, (05) : 47 - 52
  • [8] 基于多策略融合的中文术语抽取方法[J]. 周浪,史树敏,冯冲,黄河燕.情报学报. 2010 (03)
  • [9] 基于多层术语度的一体化术语抽取研究[J]. 章成志.情报学报. 2011 (03)
  • [10] 专利文献与信息检索[M]. 知识产权出版社 , 国家知识产权局人事司, 2013