基于分隔符和上下文术语的领域现象术语抽取

被引:7
作者
刘里
刘小明
机构
[1] 北京理工大学计算机学院
关键词
术语抽取; 分隔符; 复合词; NC-value算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.该方法首先用基于上下文的方法抽取得到分隔符集,然后结合分隔符集和上下文术语用改进的NC-value算法进行候选领域现象术语抽取,最后在候选领域现象术语中过滤掉名词性术语,进而得到最终结果.实验表明,文中方法对领域现象术语的抽取效果优于基于词频的方法和基于分隔符的方法.
引用
收藏
页码:146 / 149+155 +155
页数:5
相关论文
共 7 条