基于Spark的大规模数据全局去重方法、电子设备及介质

被引:0
专利类型
发明
申请号
CN202310439940.X
申请日
2023-04-18
公开(公告)号
CN116561110B
公开(公告)日
2025-12-16
发明(设计)人
邓凌风 张水勇 耿林 徐春香 王晖 余跃
申请人
鹏城实验室
申请人地址
518000 广东省深圳市南山区兴科一街2号
IPC主分类号
G06F16/215
IPC分类号
G06F16/22 G06F18/22
代理机构
广州嘉权专利商标事务所有限公司 44205
代理人
黄涛
法律状态
授权
国省代码
引用
下载
收藏
共 50 条
[1]
大规模数据集处理方法、装置、电子设备及存储介质 [P]. 
谢振家 ;
李业华 ;
徐志坚 ;
许汝全 ;
谢睿 .
中国专利 :CN119088868A ,2024-12-06
[2]
大规模语料去重方法、装置、电子设备及存储介质 [P]. 
李昂 ;
刘永恒 ;
孙裕道 ;
陈鸿基 ;
张凡 .
中国专利 :CN121029335A ,2025-11-28
[3]
大规模数据对象存储的重删方法、系统及设备 [P]. 
吴健辉 ;
李文祥 ;
陈元强 .
中国专利 :CN116756137B ,2024-05-31
[4]
基于机器学习模型的大规模数据存储去重优化方法 [P]. 
张一芠 .
中国专利 :CN119003504A ,2024-11-22
[5]
一种大规模数据关键特征提取方法、电子设备及介质 [P]. 
薛林桐 ;
杨绍杰 ;
陆鹏 .
中国专利 :CN118797315B ,2024-11-19
[6]
一种大规模数据关键特征提取方法、电子设备及介质 [P]. 
薛林桐 ;
杨绍杰 ;
陆鹏 .
中国专利 :CN118797315A ,2024-10-18
[7]
大规模数据的策略控制方法、装置、设备及存储介质 [P]. 
陈文 ;
徐一品 ;
韩智明 ;
刘树聪 .
中国专利 :CN115529197A ,2022-12-27
[8]
大规模数据的策略控制方法、装置、设备及存储介质 [P]. 
陈文 ;
徐一品 ;
韩智明 ;
刘树聪 .
中国专利 :CN115529197B ,2024-07-09
[9]
数据去重方法、电子设备、存储介质及芯片 [P]. 
罗隽 ;
陈贵龙 ;
鲍璐 ;
陈虹 .
中国专利 :CN120763149A ,2025-10-10
[10]
目标数据去重方法、电子设备及存储介质 [P]. 
胡元超 ;
杜伟 .
中国专利 :CN115421659A ,2022-12-02