基于统计规则的族群网页正文提取方法及系统

被引:0
专利类型
发明
申请号
CN202211200790.9
申请日
2022-09-29
公开(公告)号
CN115510307B
公开(公告)日
2025-07-15
发明(设计)人
陈通 展一鸣 李晓 王瑞霜 杨春 纪丽萍
申请人
山东亿云信息技术有限公司
申请人地址
250101 山东省济南市高新技术产业开发区舜华路2000号舜泰广场3号楼12层
IPC主分类号
G06F16/9532
IPC分类号
G06F16/334 G06F16/958
代理机构
济南圣达知识产权代理有限公司 37221
代理人
祖之强
法律状态
著录事项变更
国省代码
江苏省 常州市
引用
下载
收藏
共 50 条
[1]
基于统计规则的族群网页正文提取方法及系统 [P]. 
陈通 ;
展一鸣 ;
李晓 ;
王瑞霜 ;
杨春 ;
纪丽萍 .
中国专利 :CN115510307A ,2022-12-23
[2]
基于统计回溯定位的网页正文提取方法和装置 [P]. 
樊庆冲 .
中国专利 :CN102314520A ,2012-01-11
[3]
网页正文提取的方法及装置 [P]. 
陈发君 ;
刘忠 ;
黄金才 ;
朱承 ;
修保新 ;
程光权 ;
陈超 ;
冯旸赫 ;
龙开亮 ;
孟果 .
中国专利 :CN105718584B ,2016-06-29
[4]
基于聚集文本密度的网页正文提取方法及装置 [P]. 
刘忠 ;
陈发君 ;
黄金才 ;
朱承 ;
修保新 ;
程光权 ;
陈超 ;
冯旸赫 .
中国专利 :CN105740355A ,2016-07-06
[5]
网页正文提取比对方法及其系统 [P]. 
不公告发明人 .
中国专利 :CN105574066A ,2016-05-11
[6]
基于文本标签特征挖掘的网页正文提取方法 [P]. 
于富财 ;
文友枥 ;
陈西安 ;
袁进 ;
吴轶铭 ;
申洲 ;
汪辉 ;
鲁才 .
中国专利 :CN106339455B ,2017-01-18
[7]
一种基于正文节点特征的提取网页正文的方法和系统 [P]. 
杨永全 ;
翟世平 ;
魏志强 .
中国专利 :CN110851679A ,2020-02-28
[8]
网页正文提取的方法和装置 [P]. 
邹月明 ;
徐锐波 .
中国专利 :CN104462532B ,2015-03-25
[9]
基于预训练语言模型的网页正文内容提取方法及系统 [P]. 
岂凡超 .
中国专利 :CN118428321A ,2024-08-02
[10]
网页正文的提取方法和装置、网页预览方法和系统 [P]. 
梁捷 ;
赵闯 .
中国专利 :CN103425765A ,2013-12-04