学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
基于词向量聚类的中文微博产品命名实体识别
被引:24
作者
:
论文数:
引用数:
h-index:
机构:
王洪亮
机构
:
[1]
石家庄职业技术学院
来源
:
兰州理工大学学报
|
2017年
/ 43卷
/ 01期
关键词
:
中文微博;
命名实体;
主题模型;
神经网络;
词向量;
D O I
:
10.13295/j.cnki.jlut.2017.01.020
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.
引用
收藏
页码:104 / 110
页数:7
相关论文
共 11 条
[1]
基于层叠条件随机场的中文病历命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
燕杨
;
文敦伟
论文数:
0
引用数:
0
h-index:
0
机构:
阿萨巴斯卡大学计算与信息系统学院
吉林大学通信工程学院
文敦伟
;
论文数:
引用数:
h-index:
机构:
王云吉
;
论文数:
引用数:
h-index:
机构:
王珂
.
吉林大学学报(工学版),
2014,
(06)
:1843
-1848
[2]
针对产品命名实体识别的半监督学习方法
[J].
论文数:
引用数:
h-index:
机构:
黄诗琳
;
论文数:
引用数:
h-index:
机构:
郑小林
;
论文数:
引用数:
h-index:
机构:
陈德人
.
北京邮电大学学报,
2013,
36
(02)
:20
-23+54
[3]
基于条件随机场的英文产品命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
张朝胜
;
论文数:
引用数:
h-index:
机构:
郭剑毅
;
论文数:
引用数:
h-index:
机构:
线岩团
;
论文数:
引用数:
h-index:
机构:
余正涛
;
论文数:
引用数:
h-index:
机构:
雷春雅
;
论文数:
引用数:
h-index:
机构:
王海雄
.
计算机工程与科学,
2010,
32
(06)
:115
-117
[4]
面向网络文本的中文产品命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
梅丰
;
论文数:
引用数:
h-index:
机构:
孙承杰
;
论文数:
引用数:
h-index:
机构:
孙珂
;
论文数:
引用数:
h-index:
机构:
程明波
;
论文数:
引用数:
h-index:
机构:
林磊
.
郑州大学学报(理学版),
2010,
42
(01)
:62
-66
[5]
基于层叠条件随机场的旅游领域命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
郭剑毅
;
论文数:
引用数:
h-index:
机构:
薛征山
;
论文数:
引用数:
h-index:
机构:
余正涛
;
论文数:
引用数:
h-index:
机构:
张志坤
;
论文数:
引用数:
h-index:
机构:
张宜浩
;
论文数:
引用数:
h-index:
机构:
姚贤明
.
中文信息学报,
2009,
23
(05)
:47
-52
[6]
基于单字提示特征的中文命名实体识别快速算法
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
李文波
;
论文数:
引用数:
h-index:
机构:
张大鲲
.
中文信息学报,
2008,
(01)
:104
-110
[7]
特征选择方法的研究和改进
[J].
论文数:
引用数:
h-index:
机构:
张永
;
陈思睿
论文数:
0
引用数:
0
h-index:
0
机构:
兰州理工大学计算机与通信学院
陈思睿
;
杨志勇
论文数:
0
引用数:
0
h-index:
0
机构:
兰州理工大学计算机与通信学院
杨志勇
;
贾桂霞
论文数:
0
引用数:
0
h-index:
0
机构:
兰州理工大学计算机与通信学院
贾桂霞
.
兰州理工大学学报,
2006,
(05)
:92
-95
[8]
基于层叠条件随机场模型的中文机构名自动识别
[J].
周俊生
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
周俊生
;
论文数:
引用数:
h-index:
机构:
戴新宇
;
论文数:
引用数:
h-index:
机构:
尹存燕
;
论文数:
引用数:
h-index:
机构:
陈家骏
.
电子学报,
2006,
(05)
:804
-809
[9]
面向商务信息抽取的产品命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
刘非凡
;
论文数:
引用数:
h-index:
机构:
赵军
;
论文数:
引用数:
h-index:
机构:
吕碧波
;
论文数:
引用数:
h-index:
机构:
徐波
;
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
于浩
;
夏迎炬
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
夏迎炬
.
中文信息学报,
2006,
(01)
:7
-13
[10]
Product named entity recognition in Chinese text
[J].
论文数:
引用数:
h-index:
机构:
Zhao, Jun
;
论文数:
引用数:
h-index:
机构:
Liu, Feifan
.
LANGUAGE RESOURCES AND EVALUATION,
2008,
42
(02)
:197
-217
←
1
2
→
共 11 条
[1]
基于层叠条件随机场的中文病历命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
燕杨
;
文敦伟
论文数:
0
引用数:
0
h-index:
0
机构:
阿萨巴斯卡大学计算与信息系统学院
吉林大学通信工程学院
文敦伟
;
论文数:
引用数:
h-index:
机构:
王云吉
;
论文数:
引用数:
h-index:
机构:
王珂
.
吉林大学学报(工学版),
2014,
(06)
:1843
-1848
[2]
针对产品命名实体识别的半监督学习方法
[J].
论文数:
引用数:
h-index:
机构:
黄诗琳
;
论文数:
引用数:
h-index:
机构:
郑小林
;
论文数:
引用数:
h-index:
机构:
陈德人
.
北京邮电大学学报,
2013,
36
(02)
:20
-23+54
[3]
基于条件随机场的英文产品命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
张朝胜
;
论文数:
引用数:
h-index:
机构:
郭剑毅
;
论文数:
引用数:
h-index:
机构:
线岩团
;
论文数:
引用数:
h-index:
机构:
余正涛
;
论文数:
引用数:
h-index:
机构:
雷春雅
;
论文数:
引用数:
h-index:
机构:
王海雄
.
计算机工程与科学,
2010,
32
(06)
:115
-117
[4]
面向网络文本的中文产品命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
梅丰
;
论文数:
引用数:
h-index:
机构:
孙承杰
;
论文数:
引用数:
h-index:
机构:
孙珂
;
论文数:
引用数:
h-index:
机构:
程明波
;
论文数:
引用数:
h-index:
机构:
林磊
.
郑州大学学报(理学版),
2010,
42
(01)
:62
-66
[5]
基于层叠条件随机场的旅游领域命名实体识别
[J].
论文数:
引用数:
h-index:
机构:
郭剑毅
;
论文数:
引用数:
h-index:
机构:
薛征山
;
论文数:
引用数:
h-index:
机构:
余正涛
;
论文数:
引用数:
h-index:
机构:
张志坤
;
论文数:
引用数:
h-index:
机构:
张宜浩
;
论文数:
引用数:
h-index:
机构:
姚贤明
.
中文信息学报,
2009,
23
(05)
:47
-52
[6]
基于单字提示特征的中文命名实体识别快速算法
[J].
论文数:
引用数:
h-index:
机构:
冯元勇
;
论文数:
引用数:
h-index:
机构:
孙乐
;
论文数:
引用数:
h-index:
机构:
李文波
;
论文数:
引用数:
h-index:
机构:
张大鲲
.
中文信息学报,
2008,
(01)
:104
-110
[7]
特征选择方法的研究和改进
[J].
论文数:
引用数:
h-index:
机构:
张永
;
陈思睿
论文数:
0
引用数:
0
h-index:
0
机构:
兰州理工大学计算机与通信学院
陈思睿
;
杨志勇
论文数:
0
引用数:
0
h-index:
0
机构:
兰州理工大学计算机与通信学院
杨志勇
;
贾桂霞
论文数:
0
引用数:
0
h-index:
0
机构:
兰州理工大学计算机与通信学院
贾桂霞
.
兰州理工大学学报,
2006,
(05)
:92
-95
[8]
基于层叠条件随机场模型的中文机构名自动识别
[J].
周俊生
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学计算机软件新技术国家重点实验室
周俊生
;
论文数:
引用数:
h-index:
机构:
戴新宇
;
论文数:
引用数:
h-index:
机构:
尹存燕
;
论文数:
引用数:
h-index:
机构:
陈家骏
.
电子学报,
2006,
(05)
:804
-809
[9]
面向商务信息抽取的产品命名实体识别研究
[J].
论文数:
引用数:
h-index:
机构:
刘非凡
;
论文数:
引用数:
h-index:
机构:
赵军
;
论文数:
引用数:
h-index:
机构:
吕碧波
;
论文数:
引用数:
h-index:
机构:
徐波
;
于浩
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
于浩
;
夏迎炬
论文数:
0
引用数:
0
h-index:
0
机构:
富士通研究开发中心有限公司
中国科学院自动化研究所模式识别国家重点实验室
夏迎炬
.
中文信息学报,
2006,
(01)
:7
-13
[10]
Product named entity recognition in Chinese text
[J].
论文数:
引用数:
h-index:
机构:
Zhao, Jun
;
论文数:
引用数:
h-index:
机构:
Liu, Feifan
.
LANGUAGE RESOURCES AND EVALUATION,
2008,
42
(02)
:197
-217
←
1
2
→