基于Choquet积分的HMM商品信息抽取方法

被引:7
作者
邓斌 [1 ]
邵培基 [1 ]
夏国恩 [1 ,2 ]
机构
[1] 电子科技大学经济与管理学院
[2] 广西财经学院工商管理系
关键词
信息抽取; 比较购物; 隐马尔可夫模型; Choquet积分;
D O I
暂无
中图分类号
TP399-C2 [];
学科分类号
081203 ; 0835 ;
摘要
电子商务网站使用不同的网页编码技术和页面布局为比较购物信息获取带来了很大的难度。基于隐马尔可夫模型(HMM)的信息抽取模型有着易于建立、适应性强等优点,被视为一种有效的信息抽取方法。但是这种算法存在状态序列计算复杂、难以训练优化抽取模型等缺点。本文应用模糊积分单调性建立基于Choquet积分的隐马尔可夫模型(CI-HMM),解决HMM观察序列概率计算所需的条件独立性假设,优化HMM观察序列的计算。本文以网上书店商品数据进行实证,实验证明CI-HMM比HMM有更好适用性和精确度。
引用
收藏
页码:110 / 114
页数:5
相关论文
共 7 条
[1]   分类器融合中模糊积分理论研究进展 [J].
孔志周 ;
蔡自兴 .
小型微型计算机系统, 2008, (06) :1093-1098
[2]   浅析比较购物在我国的发展 [J].
奚望园 .
北方经贸, 2008, (02) :62-63
[3]   基于隐马尔可夫模型的文本信息抽取 [J].
刘云中 ;
林亚平 ;
陈治平 .
系统仿真学报, 2004, (03) :507-510
[4]   Training the fuzzy integral [J].
Keller, JM ;
Osborn, J .
INTERNATIONAL JOURNAL OF APPROXIMATE REASONING, 1996, 15 (01) :1-24
[5]  
A Maximization Technique Occurring in the Statistical Analysis of Probabilistic Functions of Markov Chains[J] . Leonard E. Baum,Ted Petrie,George Soules,Norman Weiss.The Annals of Mathematical Statistics . 1970 (1)
[6]  
Learning Hidden Markov Model Structure for Information Extraction .2 Seymore K,McCallum A,Rosenfeld R. Working Notes of the AAAI Workshop on Machine Learning for Information Extraction . 1999
[7]  
Fuzzy measures and fuzzy integrals: a survey .2 Sugeno,M,Gupta,MM,Saridis,GN,Gaines,BR. Fuzzy automata and decision processes . 1977