基于BP神经网络的专利自动分类方法

被引:12
作者
李生珍 [1 ]
王建新 [1 ]
齐建东 [1 ]
朱礼军 [2 ]
机构
[1] 北京林业大学信息学院
[2] 中国科学技术信息研究所
关键词
专利文件; 自动分类; 神经网络; 特征项; 国际专利分类;
D O I
10.16208/j.issn1000-7024.2010.23.056
中图分类号
TP183 [人工神经网络与计算]; G306.3 [制度与管理];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ; 1201 ; 1204 ;
摘要
提出了一种基于后向传播神经网络的专利自动分类方法。通过中文分词从专利文件集中提取特征项,并根据特征项在专利文件中出现的频率赋予其权重,从而将每篇专利文件表示为一个特征项向量。为取得较好的BP神经网络(BPN)训练效果,使用X2统计方法进行特征向量降维,并使用BPN专利分类器进行专利文件分类。用国际分类号为H02下的专利文件作为测试数据,取得了较好的分类效果。
引用
收藏
页码:5075 / 5078
页数:4
相关论文
共 7 条
[1]   专利文献的特点及其利用 [J].
王朝晖 .
现代情报, 2008, (09) :151-152+156
[2]   一种面向专利文献数据的文本自动分类方法 [J].
蒋健安 ;
陆介平 ;
倪巍伟 ;
孙志挥 .
计算机应用, 2008, (01) :159-161+167
[3]   基于IPC知识结构的专利自动分类模型 [J].
刘玉琴 ;
赖院根 ;
雷孝平 .
小型微型计算机系统, 2007, (12) :2295-2298
[4]   基于机器学习的文本分类技术研究进展 [J].
苏金树 ;
张博锋 ;
徐昕 .
软件学报, 2006, (09) :1848-1859
[5]   专利检索中的IPC和主题词识别方法研究 [J].
暴海龙 ;
李金林 .
北京理工大学学报(社会科学版), 2003, (05) :74-76
[6]  
神经网络控制.[M].徐丽娜编著;.电子工业出版社.2003,
[7]  
Intellectual assets management: from patents to knowledge.[J].Caterina Camus;Riccardo Brancaleon.World Patent Information.2003, 2