学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
服装类商品属性实体识别
被引:10
作者
:
论文数:
引用数:
h-index:
机构:
周详
[
1
]
论文数:
引用数:
h-index:
机构:
李少波
[
1
,
2
]
论文数:
引用数:
h-index:
机构:
杨观赐
[
2
]
机构
:
[1]
中国科学院成都计算机应用研究所
[2]
现代制造技术教育部重点实验室(贵州大学)
来源
:
计算机应用
|
2015年
/ 35卷
/ 07期
关键词
:
命名实体识别;
服装类商品;
条件随机场;
电子商务;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
针对服装类商品标题中的商品属性实体识别问题,提出了一种边界探测规则与条件随机场(CRF)相结合的混合方法。首先,使用统计方法挖掘隐蔽的实体提示字信息;然后,以字为粒度对三种统计成词指标及其内涵进行了阐释;接着,基于统计成词指标和提示字信息设计了实体边界探测规则;最后,基于经验风险最小化给出了规则中阈值的确定方法。在与字标注的CRF模型的对比实验中,总体准确率、召回率、F1值分别提升了1.61%、2.54%和2.08%,验证了对于实体边界探测规则的有效性。所提方法可用于电子商务信息检索(IR)、电子商务信息抽取(IE)、查询意图识别等任务。
引用
收藏
页码:1945 / 1949
页数:5
相关论文
共 12 条
[1]
产品名实体识别及规范化研究
[D].
论文数:
引用数:
h-index:
机构:
梅丰
.
哈尔滨工业大学,
2011
[2]
统计学习方法.[M].李航; 著.清华大学出版社.2012,
[3]
基于迭代算法的新词识别
[J].
论文数:
引用数:
h-index:
机构:
赵小宝
;
论文数:
引用数:
h-index:
机构:
张华平
.
计算机工程,
2014,
40
(07)
:154
-158+164
[4]
基于CRF和规则的中文医疗机构名称识别
[J].
论文数:
引用数:
h-index:
机构:
张金龙
;
论文数:
引用数:
h-index:
机构:
王石
;
论文数:
引用数:
h-index:
机构:
钱存发
.
计算机应用与软件,
2014,
31
(03)
:159
-162+198
[5]
基于条件随机场方法的开放领域新词发现
[J].
论文数:
引用数:
h-index:
机构:
陈飞
;
论文数:
引用数:
h-index:
机构:
刘奕群
;
论文数:
引用数:
h-index:
机构:
魏超
;
张云亮
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
智能技术与系统国家重点实验室(清华大学)
张云亮
;
论文数:
引用数:
h-index:
机构:
张敏
;
论文数:
引用数:
h-index:
机构:
马少平
.
软件学报,
2013,
24
(05)
:1051
-1060
[6]
基于本体的产品命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
罗芳
;
论文数:
引用数:
h-index:
机构:
熊前兴
;
论文数:
引用数:
h-index:
机构:
肖敏
.
武汉理工大学学报(信息与管理工程版),
2011,
33
(06)
:948
-952
[7]
音乐命名实体识别方法
[J].
佘俊
论文数:
0
引用数:
0
h-index:
0
机构:
中国南方电网调峰调频发电公司信息通信中心
中国南方电网调峰调频发电公司信息通信中心
佘俊
;
论文数:
引用数:
h-index:
机构:
张学清
.
计算机应用,
2010,
30
(11)
:2928
-2931+2948
[8]
基于条件随机场的英文产品命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
张朝胜
;
论文数:
引用数:
h-index:
机构:
郭剑毅
;
论文数:
引用数:
h-index:
机构:
线岩团
;
论文数:
引用数:
h-index:
机构:
余正涛
;
论文数:
引用数:
h-index:
机构:
雷春雅
;
论文数:
引用数:
h-index:
机构:
王海雄
.
计算机工程与科学,
2010,
32
(06)
:115
-117
[9]
基于小规模尾字特征的中文命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
张大鲲
;
论文数:
引用数:
h-index:
机构:
李文波
.
电子学报,
2008,
(09)
:1833
-1838
[10]
基于单字提示特征的中文命名实体识别快速算法
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
李文波
;
论文数:
引用数:
h-index:
机构:
张大鲲
.
中文信息学报,
2008,
(01)
:104
-110
←
1
2
→
共 12 条
[1]
产品名实体识别及规范化研究
[D].
论文数:
引用数:
h-index:
机构:
梅丰
.
哈尔滨工业大学,
2011
[2]
统计学习方法.[M].李航; 著.清华大学出版社.2012,
[3]
基于迭代算法的新词识别
[J].
论文数:
引用数:
h-index:
机构:
赵小宝
;
论文数:
引用数:
h-index:
机构:
张华平
.
计算机工程,
2014,
40
(07)
:154
-158+164
[4]
基于CRF和规则的中文医疗机构名称识别
[J].
论文数:
引用数:
h-index:
机构:
张金龙
;
论文数:
引用数:
h-index:
机构:
王石
;
论文数:
引用数:
h-index:
机构:
钱存发
.
计算机应用与软件,
2014,
31
(03)
:159
-162+198
[5]
基于条件随机场方法的开放领域新词发现
[J].
论文数:
引用数:
h-index:
机构:
陈飞
;
论文数:
引用数:
h-index:
机构:
刘奕群
;
论文数:
引用数:
h-index:
机构:
魏超
;
张云亮
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
智能技术与系统国家重点实验室(清华大学)
张云亮
;
论文数:
引用数:
h-index:
机构:
张敏
;
论文数:
引用数:
h-index:
机构:
马少平
.
软件学报,
2013,
24
(05)
:1051
-1060
[6]
基于本体的产品命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
罗芳
;
论文数:
引用数:
h-index:
机构:
熊前兴
;
论文数:
引用数:
h-index:
机构:
肖敏
.
武汉理工大学学报(信息与管理工程版),
2011,
33
(06)
:948
-952
[7]
音乐命名实体识别方法
[J].
佘俊
论文数:
0
引用数:
0
h-index:
0
机构:
中国南方电网调峰调频发电公司信息通信中心
中国南方电网调峰调频发电公司信息通信中心
佘俊
;
论文数:
引用数:
h-index:
机构:
张学清
.
计算机应用,
2010,
30
(11)
:2928
-2931+2948
[8]
基于条件随机场的英文产品命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
张朝胜
;
论文数:
引用数:
h-index:
机构:
郭剑毅
;
论文数:
引用数:
h-index:
机构:
线岩团
;
论文数:
引用数:
h-index:
机构:
余正涛
;
论文数:
引用数:
h-index:
机构:
雷春雅
;
论文数:
引用数:
h-index:
机构:
王海雄
.
计算机工程与科学,
2010,
32
(06)
:115
-117
[9]
基于小规模尾字特征的中文命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
张大鲲
;
论文数:
引用数:
h-index:
机构:
李文波
.
电子学报,
2008,
(09)
:1833
-1838
[10]
基于单字提示特征的中文命名实体识别快速算法
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
李文波
;
论文数:
引用数:
h-index:
机构:
张大鲲
.
中文信息学报,
2008,
(01)
:104
-110
←
1
2
→