共 11 条
基于组合特征的中文新闻网页关键词提取方法
被引:8
作者:

论文数: 引用数:
h-index:
机构:

论文数: 引用数:
h-index:
机构:
机构:
[1] 不详
[2] 北京林业大学信息学院
[3] 不详
来源:
关键词:
提取;
组合特征;
组合词;
有向图;
新闻网页;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
针对中文新闻网页的特点,使用了包括统计特征、位置特征和词性特征等在内的多种特征综合评定候选关键词的权重大小。对于部分分词结果不能良好地反映主题的问题,提出了一种基于有向图的组合词生成方法,旨在找出高频次的相邻词作为组合词。实验结果表明,该方法较传统的TF-IDF方法效率有较大提升,能够有效提取出新闻网页关键词。
引用
收藏
页码:222 / 226
页数:5
相关论文
共 11 条
- [1] 一种改进的TFIDF网页关键词提取方法[J]. 计算机应用与软件, 2011, 28 (05) : 25 - 27论文数: 引用数: h-index:机构:李培峰论文数: 0 引用数: 0 h-index: 0机构: 苏州大学计算机科学与技术学院论文数: 引用数: h-index:机构:
- [2] 基于语义关联的中文网页主题词提取方法研究[J]. 计算机应用研究, 2011, 28 (01) : 105 - 107+123李芳芳论文数: 0 引用数: 0 h-index: 0机构: 国防科学技术大学CISR技术国防科技重点实验室 国防科学技术大学CISR技术国防科技重点实验室葛斌论文数: 0 引用数: 0 h-index: 0机构: 国防科学技术大学CISR技术国防科技重点实验室 国防科学技术大学CISR技术国防科技重点实验室毛星亮论文数: 0 引用数: 0 h-index: 0机构: 中共湖南省委互联网新闻宣传办公室 国防科学技术大学CISR技术国防科技重点实验室汤大权论文数: 0 引用数: 0 h-index: 0机构: 国防科学技术大学CISR技术国防科技重点实验室 国防科学技术大学CISR技术国防科技重点实验室
- [3] 基于同义词链的中文关键词提取算法[J]. 计算机工程, 2010, 36 (19) : 93 - 95论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:丁秋林论文数: 0 引用数: 0 h-index: 0机构: 南京航空航天大学信息科学与技术学院
- [4] 基于词汇链的关键短语抽取方法的研究[J]. 计算机学报, 2010, 33 (07) : 1246 - 1255刘铭论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学计算机科学与技术学院王晓龙论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学计算机科学与技术学院刘远超论文数: 0 引用数: 0 h-index: 0机构: 哈尔滨工业大学计算机科学与技术学院
- [5] 基于语义联系的新闻网页关键词抽取[J]. 广西师范大学学报(自然科学版), 2009, 27 (01) : 145 - 148论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:胡学钢论文数: 0 引用数: 0 h-index: 0机构: 合肥工业大学计算机与信息学院 合肥工业大学计算机与信息学院论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [6] 松花江哈尔滨段二维水质模型参数敏感性分析[J]. 环境科学与管理, 2008, 33 (12) : 177 - 180论文数: 引用数: h-index:机构:闫妍论文数: 0 引用数: 0 h-index: 0机构: 东北林业大学谢新宇论文数: 0 引用数: 0 h-index: 0机构: 东北林业大学
- [7] 基于同义词词林的中文文本主题词提取[J]. 广西师范大学学报(自然科学版), 2007, (02) : 145 - 148程涛论文数: 0 引用数: 0 h-index: 0机构: 北京信息科技大学中文信息处理研究中心 北京信息科技大学中文信息处理研究中心论文数: 引用数: h-index:机构:王霞论文数: 0 引用数: 0 h-index: 0机构: 抚顺市第十五中学 北京信息科技大学中文信息处理研究中心论文数: 引用数: h-index:机构:
- [8] 一种基于词汇链的关键词抽取方法[J]. 中文信息学报, 2006, (06) : 25 - 30论文数: 引用数: h-index:机构:刘玉树论文数: 0 引用数: 0 h-index: 0机构: 北京理工大学计算机科学技术学院 北京理工大学计算机科学技术学院论文数: 引用数: h-index:机构:
- [9] 一种基于词共现图的文档主题词自动抽取方法[J]. 南京大学学报(自然科学版), 2006, (02) : 156 - 162耿焕同论文数: 0 引用数: 0 h-index: 0机构: 中国科学技术大学计算机科学技术系论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:
- [10] 基于语义的汉语文献主题词提取算法研究[J]. 吉林大学学报(信息科学版), 2005, (05) : 535 - 540论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构:论文数: 引用数: h-index:机构: