政务领域本体术语的自动抽取

被引:8
作者
翟笃风 [1 ]
刘柏嵩 [2 ]
机构
[1] 宁波大学商学院
[2] 宁波大学网络中心
关键词
政务领域本体; 术语; 单字合并法; C-value; TF-IDF算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影响领域术语抽取召回率的同时可以提高抽取术语的正确率。
引用
收藏
页码:59 / 65
页数:7
相关论文
共 5 条
[1]  
面向中文文本的本体学习方法研究.[D].官莹莹.吉林大学.2009, 09
[2]   Automatic recognition of multi-word terms: The C-value/NC-value method [J].
Frantzi K. ;
Ananiadou S. ;
Mima H. .
International Journal on Digital Libraries, 2000, 3 (2) :115-130
[3]  
Technical terminology: some linguistic properties and an algorithm for identification in text.[J].John S. Justeson;Slava M. Katz.Natural Language Engineering.1995, 1
[4]   中文领域本体学习中术语的自动抽取 [J].
温春 ;
王晓斌 ;
石昭祥 .
计算机应用研究, 2009, 26 (07) :2652-2655
[5]   基于多策略的专业领域术语抽取器的设计 [J].
杜波 ;
田怀凤 ;
王立 ;
陆汝占 .
计算机工程, 2005, (14) :159-160