基于CRFs的领域爆发词识别的研究与实现

被引:12
作者
逯万辉 [1 ,2 ]
马建霞 [1 ]
机构
[1] 中国科学院国家科学图书馆兰州分馆/中国科学院资源环境科学信息中心
[2] 中国科学院研究生院
关键词
爆发词; 爆发特征; 条件随机场; 原型系统;
D O I
10.13833/j.cnki.is.2014.01.024
中图分类号
G254 [文献标引与编目];
学科分类号
1205 ; 120501 ;
摘要
通过对爆发词识别问题的研究和剖析,本文采用了基于条件随机场模型的方法进行爆发特征提取,在此基础上设计了频次、频率和词频文档比三个指标进行计算,选取镍钴产业专利文本为例进行了领域爆发词识别实验,并实现了爆发词识别系统原型的开发。
引用
收藏
页码:89 / 93
页数:5
相关论文
共 4 条
[1]  
CiteSpaceⅡ:科学文献中新趋势与新动态的识别与可视化[J]. 陈超美,陈悦,侯剑华,梁永霞.  报学报. 2009 (03)
[2]  
ThemeRiver: Visualizing thematic changes in large document collections. Havre, Susan,Hetzler, Elizabeth,Whitney, Paul,Nowell, Lucy. IEEE Transactions on Visualization and Computer Graphics . 2002
[3]   爆发词识别与主题探测技术研究综述 [J].
逯万辉 ;
马建霞 ;
赵迎光 .
情报理论与实践, 2012, 35 (06) :125-128
[4]   情报研究方法发展现状与趋势 [J].
冷伏海 ;
冯璐 .
图书情报工作, 2009, 53 (02) :29-33