产品命名实体特征选择与识别研究

被引:7
作者
陆伟
鞠源
张晓娟
吴丹
机构
[1] 武汉大学信息资源研究中心
关键词
产品命名实体识别; CRF模型; 交叉验证; 最大熵模型;
D O I
10.13366/j.dik.2012.03.002
中图分类号
G203 [信息资源及其管理];
学科分类号
1204 ; 1402 ;
摘要
随着互联网经济的飞速发展,信息抽取领域的产品命名实体识别在商务智能领域有着广泛的应用。本文采用条件随机场(CRF)模型,选取词汇、词法和词形上一系列的特征进行训练,通过交叉验证对识别效果进行评价,并通过识别效果指导特征的选取。实验中比较了两种标注方式(BRAND/TYPE和PROD),并取得了令人满意的识别效果。在与最大熵模型对比中,验证了CRF模型对于产品实体识别的优越性。
引用
收藏
页码:4 / 12+34 +34
页数:10
相关论文
共 5 条
[1]   基于条件随机场的英文产品命名实体识别 [J].
张朝胜 ;
郭剑毅 ;
线岩团 ;
余正涛 ;
雷春雅 ;
王海雄 .
计算机工程与科学, 2010, 32 (06) :115-117
[2]   基于层叠条件随机场模型的中文机构名自动识别 [J].
周俊生 ;
戴新宇 ;
尹存燕 ;
陈家骏 .
电子学报, 2006, (05) :804-809
[3]   基于层叠隐马尔可夫模型的中文命名实体识别 [J].
俞鸿魁 ;
张华平 ;
刘群 ;
吕学强 ;
施水才 .
通信学报 , 2006, (02) :87-94
[4]   面向商务信息抽取的产品命名实体识别研究 [J].
刘非凡 ;
赵军 ;
吕碧波 ;
徐波 ;
于浩 ;
夏迎炬 .
中文信息学报, 2006, (01) :7-13
[5]  
An Algorithm that Learns What's in a Name.[J] . Daniel M. Bikel,Richard Schwartz,Ralph M. Weischedel. Machine Learning . 1999 (1-3)