基于最大熵模型的本体概念获取方法

被引:15
作者
韦小丽 [1 ]
孙涌 [1 ,2 ]
张书奎 [1 ,2 ]
苗艳军 [1 ]
机构
[1] 苏州大学计算机科学与技术学院
[2] 江苏省计算机信息处理技术重点实验室
关键词
本体; 最大熵模型; 自然语言处理;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本体是语义检索的核心。本体构建主要包括领域概念获取和概念间关系获取,其中领域概念获取是本体构建的基础。采用基于最大熵模型的方法来获取概念,通过对领域文本进行挖掘而得到名词性短语,使用改进的TF-IDF公式从中抽取具有领域性的短语,并经人工修正后得到本体概念。实验表明该方法提高了概念的准确性和完整性。
引用
收藏
页码:114 / 116+120 +120
页数:4
相关论文
共 5 条
[1]   基于最大熵模型的组块分析 [J].
李素建 ;
刘群 ;
杨志峰 .
计算机学报, 2003, (12) :1722-1727
[2]   基于最大熵方法的中英文基本名词短语识别 [J].
周雅倩 ;
郭以昆 ;
黄萱菁 ;
吴立德 .
计算机研究与发展, 2003, (03) :440-446
[3]   语言信息处理技术中的最大熵模型方法 [J].
李素建 ;
刘群 ;
张志勇 ;
程学旗 .
计算机科学, 2002, (07) :108-110
[4]  
基于规则与统计的本体概念自动获取方法研究[J]. 张新,党延忠.情报学报. 2007 (06)
[5]   GENERALIZED ITERATIVE SCALING FOR LOG-LINEAR MODELS [J].
DARROCH, JN ;
RATCLIFF, D .
ANNALS OF MATHEMATICAL STATISTICS, 1972, 43 (05) :1470-&