学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于字序列标注的中文关键词抽取研究
被引:7
作者
:
论文数:
引用数:
h-index:
机构:
王昊
邓三鸿
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
邓三鸿
苏新宁
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
苏新宁
机构
:
[1]
南京大学信息管理系
来源
:
现代图书情报技术
|
2011年
/ 12期
关键词
:
序列标注;
条件随机场;
关键词抽取;
机器学习;
字序列;
词序列;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
摘要
:
以某大学图书馆的所有馆藏书目为研究对象,在对图书关键词标引信息进分析的基础上,总结中文关键词的基本特点及其抽取规律,构建一个基于字序列标注的中文关键词抽取模型,提出中文关键词抽取的基础思路和实现方案,并通过实验论证模型的合理性、正确性和实用性,认为字序列标注方法优于词序列标注,基本上可以解决不分词情况下的中文关键词抽取问题。
引用
收藏
页码:39 / 45
页数:7
相关论文
共 10 条
[1]
关键词自动标引的最大熵模型应用研究
论文数:
引用数:
h-index:
机构:
李素建
王厚峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
王厚峰
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
俞士汶
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
辛乘胜
[J].
计算机学报,
2004,
(09)
: 1192
-
1197
[2]
基于相邻词的中文关键词自动抽取
论文数:
引用数:
h-index:
机构:
王灿辉
张敏
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学信息科学技术学院
清华大学信息科学技术学院
张敏
马少平
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学信息科学技术学院
清华大学信息科学技术学院
马少平
论文数:
引用数:
h-index:
机构:
黄宇
[J].
广西师范大学学报(自然科学版),
2007,
(02)
: 161
-
164
[3]
基于联合权重的多文档关键词抽取技术
杨洁
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
杨洁
季铎
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
季铎
蔡东风
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
蔡东风
林晓庆
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
辽东学院信息技术学院
沈阳航空工业学院知识工程中心
林晓庆
白宇
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
白宇
[J].
中文信息学报,
2008,
22
(06)
: 75
-
79
[4]
一种基于TFIDF方法的中文关键词抽取算法
徐文海
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学经济管理学院
徐文海
论文数:
引用数:
h-index:
机构:
温有奎
[J].
情报理论与实践,
2008,
(02)
: 298
-
302
[5]
改进的关键词抽取方法研究
邓箴
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
邓箴
包宏
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
包宏
[J].
计算机工程与设计,
2009,
30
(20)
: 4677
-
4680+4769
[6]
基于条件随机场的自动标引模型研究
章成志
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学信息管理系
南京理工大学信息管理系
章成志
苏新宁
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
南京理工大学信息管理系
苏新宁
[J].
中国图书馆学报,
2008,
(05)
: 89
-
94+99
[7]
基于机器学习的中文书目自动分类研究
论文数:
引用数:
h-index:
机构:
王昊
严明
论文数:
0
引用数:
0
h-index:
0
机构:
解放军南京政治学院基础部
南京大学信息管理系
严明
苏新宁
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
南京大学信息管理系
苏新宁
[J].
中国图书馆学报,
2010,
36
(06)
: 28
-
39
[8]
海量数据集上基于特征组合的关键词自动抽取[J]. 张庆国,薛德军,张振海,张君玉.情报学报. 2006 (05)
[9]
中文文本关键词自动抽取方法研究[J]. 张雪英,Jürgen Krause.情报学报. 2008 (04)
[10]
基于集成学习的自动标引方法研究[J]. 章成志.情报学报. 2010 (01)
←
1
→
共 10 条
[1]
关键词自动标引的最大熵模型应用研究
论文数:
引用数:
h-index:
机构:
李素建
王厚峰
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
王厚峰
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
俞士汶
辛乘胜
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算语言学研究所
辛乘胜
[J].
计算机学报,
2004,
(09)
: 1192
-
1197
[2]
基于相邻词的中文关键词自动抽取
论文数:
引用数:
h-index:
机构:
王灿辉
张敏
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学信息科学技术学院
清华大学信息科学技术学院
张敏
马少平
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学信息科学技术学院
清华大学信息科学技术学院
马少平
论文数:
引用数:
h-index:
机构:
黄宇
[J].
广西师范大学学报(自然科学版),
2007,
(02)
: 161
-
164
[3]
基于联合权重的多文档关键词抽取技术
杨洁
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
杨洁
季铎
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
季铎
蔡东风
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
蔡东风
林晓庆
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
辽东学院信息技术学院
沈阳航空工业学院知识工程中心
林晓庆
白宇
论文数:
0
引用数:
0
h-index:
0
机构:
沈阳航空工业学院知识工程中心
沈阳航空工业学院知识工程中心
白宇
[J].
中文信息学报,
2008,
22
(06)
: 75
-
79
[4]
一种基于TFIDF方法的中文关键词抽取算法
徐文海
论文数:
0
引用数:
0
h-index:
0
机构:
西安电子科技大学经济管理学院
徐文海
论文数:
引用数:
h-index:
机构:
温有奎
[J].
情报理论与实践,
2008,
(02)
: 298
-
302
[5]
改进的关键词抽取方法研究
邓箴
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
邓箴
包宏
论文数:
0
引用数:
0
h-index:
0
机构:
北京科技大学信息工程学院
包宏
[J].
计算机工程与设计,
2009,
30
(20)
: 4677
-
4680+4769
[6]
基于条件随机场的自动标引模型研究
章成志
论文数:
0
引用数:
0
h-index:
0
机构:
南京理工大学信息管理系
南京理工大学信息管理系
章成志
苏新宁
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
南京理工大学信息管理系
苏新宁
[J].
中国图书馆学报,
2008,
(05)
: 89
-
94+99
[7]
基于机器学习的中文书目自动分类研究
论文数:
引用数:
h-index:
机构:
王昊
严明
论文数:
0
引用数:
0
h-index:
0
机构:
解放军南京政治学院基础部
南京大学信息管理系
严明
苏新宁
论文数:
0
引用数:
0
h-index:
0
机构:
南京大学信息管理系
南京大学信息管理系
苏新宁
[J].
中国图书馆学报,
2010,
36
(06)
: 28
-
39
[8]
海量数据集上基于特征组合的关键词自动抽取[J]. 张庆国,薛德军,张振海,张君玉.情报学报. 2006 (05)
[9]
中文文本关键词自动抽取方法研究[J]. 张雪英,Jürgen Krause.情报学报. 2008 (04)
[10]
基于集成学习的自动标引方法研究[J]. 章成志.情报学报. 2010 (01)
←
1
→