基于字序列标注的中文关键词抽取研究

被引:7
作者
王昊
邓三鸿
苏新宁
机构
[1] 南京大学信息管理系
关键词
序列标注; 条件随机场; 关键词抽取; 机器学习; 字序列; 词序列;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
以某大学图书馆的所有馆藏书目为研究对象,在对图书关键词标引信息进分析的基础上,总结中文关键词的基本特点及其抽取规律,构建一个基于字序列标注的中文关键词抽取模型,提出中文关键词抽取的基础思路和实现方案,并通过实验论证模型的合理性、正确性和实用性,认为字序列标注方法优于词序列标注,基本上可以解决不分词情况下的中文关键词抽取问题。
引用
收藏
页码:39 / 45
页数:7
相关论文
共 10 条
  • [1] 关键词自动标引的最大熵模型应用研究
    李素建
    王厚峰
    俞士汶
    辛乘胜
    [J]. 计算机学报, 2004, (09) : 1192 - 1197
  • [2] 基于相邻词的中文关键词自动抽取
    王灿辉
    张敏
    马少平
    黄宇
    [J]. 广西师范大学学报(自然科学版), 2007, (02) : 161 - 164
  • [3] 基于联合权重的多文档关键词抽取技术
    杨洁
    季铎
    蔡东风
    林晓庆
    白宇
    [J]. 中文信息学报, 2008, 22 (06) : 75 - 79
  • [4] 一种基于TFIDF方法的中文关键词抽取算法
    徐文海
    温有奎
    [J]. 情报理论与实践, 2008, (02) : 298 - 302
  • [5] 改进的关键词抽取方法研究
    邓箴
    包宏
    [J]. 计算机工程与设计, 2009, 30 (20) : 4677 - 4680+4769
  • [6] 基于条件随机场的自动标引模型研究
    章成志
    苏新宁
    [J]. 中国图书馆学报, 2008, (05) : 89 - 94+99
  • [7] 基于机器学习的中文书目自动分类研究
    王昊
    严明
    苏新宁
    [J]. 中国图书馆学报, 2010, 36 (06) : 28 - 39
  • [8] 海量数据集上基于特征组合的关键词自动抽取[J]. 张庆国,薛德军,张振海,张君玉.情报学报. 2006 (05)
  • [9] 中文文本关键词自动抽取方法研究[J]. 张雪英,Jürgen Krause.情报学报. 2008 (04)
  • [10] 基于集成学习的自动标引方法研究[J]. 章成志.情报学报. 2010 (01)