基于中文专利的新技术术语识别研究

被引:6
作者
谷俊 [1 ,2 ]
严明 [3 ]
机构
[1] 南京大学信息管理系
[2] 上海宝山钢铁股份有限公司
[3] 南京政治学院基础部
关键词
技术生命周期; 术语识别; 热点词元;
D O I
10.13833/j.cnki.is.2013.02.011
中图分类号
G350 [情报学]; G306 [专利研究];
学科分类号
摘要
首先利用ICTCLAS分词系统和停用词表抽取文档词元,通过改进的TFIDF模型计算词元权重并筛选出热点词元,再通过词间距测算对热点词元按顺序进行组配,经权重计算和阈值筛选后得到术语集,由专家人工判定识别出有效的新技术术语。最后给出了应用实例并进行分析,验证了方法的有效性。
引用
收藏
页码:144 / 149
页数:6
相关论文
共 9 条
[1]  
Automatic event generation from multi-lingual news stories. K Hui,W Lam. Proc of the First ACM/ IEEE2CS Joint Conf on Digital Libraries . 2001
[2]  
Combining semantic and syntactic documentclassifiers to improve first story detection. Nicola S,Joe C. Proc.Of the 24th AnnualInt’’l:ACM SIGIR Conference . 2003
[3]   互联网新闻报道中的突发事件识别研究 [J].
姚占雷 ;
许鑫 .
现代图书情报技术, 2011, (04) :52-57
[4]   基于子话题分治匹配的新事件检测 [J].
洪宇 ;
张宇 ;
范基礼 ;
刘挺 ;
李生 .
计算机学报, 2008, (04) :687-695
[5]   基于词元再评估的新事件检测模型 [J].
张阔 ;
李涓子 ;
吴刚 ;
王克宏 .
软件学报, 2008, (04) :817-828
[6]   企业竞争与反竞争情报中的专利分析研究 [J].
邵波 .
情报科学, 2006, (02) :235-238
[7]   一种基于动态进化模型的事件探测和追踪算法 [J].
贾自艳 ;
何清 ;
张海俊 ;
李嘉佑 ;
史忠植 .
计算机研究与发展, 2004, (07) :1273-1280
[8]  
Learning approaches for detecting and tracking news events. Yang Y,Carbonell J,Brown R,et al. IEEE Intelligent Systems: Special Issue on Applications of Intelligent Information Retrieval . 1999
[9]  
On-line new event detection and track-ing. Allan J,,Papka R,Lavrenko V. Proc.of SIGIR Conference on Research and Development in Information Retrieval . 1998