基于技术功效矩阵的专利聚类分析

被引:16
作者
陈旭
冯岭
刘斌
彭智勇
机构
[1] 武汉大学计算机学院
基金
国家自然科学基金重点项目;
关键词
专利聚类; 语义标注; 文本表示; 信息抽取; 信息可视化;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; G306 [专利研究];
学科分类号
摘要
专利文献蕴含着重要的技术、法律、经济信息,每年的出版量占世界各种图书和期刊的四分之一.随着专利数量的不断增多,对专利聚类分析显得尤为重要.我们主要研究专利聚类分析中的文本表示和结果可视化两个关键问题.首先将专利以技术功效对的方式表示,然后基于技术功效矩阵的进行专利聚类,最终形成一种多层次的专利地图.其实验结果表明这种方法比传统的向量空间模型的方法具有更高的效率和更好的聚类效果,并且其聚类结果的可视化更强的实用性和更好的扩展性.
引用
收藏
页码:526 / 531
页数:6
相关论文
共 5 条
  • [1] An IPC-based vector space model for patent retrieval[J] . Yen-Liang Chen,Yu-Ting Chiu.Information Processing and Management . 2010 (3)
  • [2] Structure clustering for Chinese patent documents[J] . Su-Hsien Huang,Hao-Ren Ke,Wei-Pang Yang.Expert Systems With Applications . 2007 (4)
  • [3] Visualization of patent analysis for emerging technology[J] . Young Gil Kim,Jong Hwan Suh,Sang Chan Park.Expert Systems With Applications . 2007 (3)
  • [4] Workshop on patent retrieval SIGIR 2000 workshop report[J] . Noriko Kando,Mun-Kew Leong.ACM SIGIR Forum . 2000 (1)
  • [5] Overview of patent retrieval task at NTCIR-6 workshop .2 Atsushi Fujii,Iwayama makoto,kando noriko. Proceeding of the Sixth NTCIR Workshop Meeting (NII Testbeds and Community for Information Access Research) . 2007