中文专利数据地址信息清洗框架及实现

被引:6
作者
路霞
吴鹏
王曰芬
张金柱
机构
[1] 南京理工大学经济管理学院
关键词
专利数据; 框架; 专利信息;
D O I
10.16353/j.cnki.1000-7490.2016.04.024
中图分类号
G306 [专利研究];
学科分类号
1201 ; 1204 ;
摘要
文章旨在构建中文专利数据清洗框架。采用文献分析法探究数据清洗概念框架,根据实地调查法进行专利数据清洗的需求分析,进而设计得到针对专利地址信息相关的中文专利数据清洗框架,针对专利地址信息处理提出相关算法,并利用对照法对该框架进行验证优化。采用UML建模技术构建专利清洗系统模型,实现中文专利数据清洗系统以验证本文专利数据清洗框架的有效性。
引用
收藏
页码:128 / 132
页数:5
相关论文
共 11 条
[1]   数据清洗研究综述 [J].
王曰芬 ;
章成志 ;
张蓓蓓 ;
吴婷婷 .
现代图书情报技术, 2007, (12) :50-56
[2]   基于IRPU算法的专利数据相似重复属性及记录检测方法 [J].
雷孝平 ;
张旭 ;
赵蕴华 ;
郑佳 .
现代图书情报技术, 2010, (12) :46-51
[3]   中文数据清洗研究综述 [J].
叶鸥 ;
张璟 ;
李军怀 .
计算机工程与应用 , 2012, (14) :121-129
[4]   数据清洗及其一般性系统框架 [J].
曹建军 ;
刁兴春 ;
陈爽 ;
邵衍振 .
计算机科学, 2012, 39(S3) (S3) :207-211
[5]   德温特专利信息清洗与标注模型研究 [J].
翟东升 ;
李倩 ;
张杰 ;
黄鲁成 ;
赵京 .
情报杂志, 2013, 32 (08) :150-154+203
[6]   德温特专利信息清洗与标注模型研究 [J].
翟东升 ;
李倩 ;
张杰 ;
黄鲁成 ;
赵京 .
情报杂志, 2013, 32 (08) :150-154+203
[7]   构建数据仓库过程中的数据清洗研究 [J].
刘喜文 ;
郑昌兴 ;
王文龙 ;
汤刚强 .
图书与情报, 2013, (05) :22-28
[8]   大数据环境下面向知识服务的数据清洗研究 [J].
蒋勋 ;
刘喜文 .
图书与情报, 2013, (05) :16-21
[9]   数据质量及数据清洗方法 [J].
宋金玉 ;
陈爽 ;
郭大鹏 ;
王内蒙 .
指挥信息系统与技术, 2013, 4 (05) :63-70
[10]   定量专利分析的样本选取与数据清洗 [J].
王永红 .
情报理论与实践, 2007, (01) :93-96