一种改进的基于行块分布函数的网页正文提取方法

被引:0
申请号
CN202110270058.8
申请日
2021-03-12
公开(公告)号
CN115080891A
公开(公告)日
2022-09-20
发明(设计)人
陈嘉锴 戴宪华
申请人
申请人地址
510275 广东省广州市海珠区新港西路135号
IPC主分类号
G06F16958
IPC分类号
G06F16955
代理机构
代理人
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
一种基于文字分布特征的网页正文提取方法 [P]. 
袁武 ;
林子涵 ;
袁文 .
中国专利 :CN102915361A ,2013-02-06
[2]
一种基于正文节点特征的提取网页正文的方法和系统 [P]. 
杨永全 ;
翟世平 ;
魏志强 .
中国专利 :CN110851679A ,2020-02-28
[3]
网页正文提取的方法及装置 [P]. 
陈发君 ;
刘忠 ;
黄金才 ;
朱承 ;
修保新 ;
程光权 ;
陈超 ;
冯旸赫 ;
龙开亮 ;
孟果 .
中国专利 :CN105718584B ,2016-06-29
[4]
网页正文提取的方法和装置 [P]. 
邹月明 ;
徐锐波 .
中国专利 :CN104462532B ,2015-03-25
[5]
网页正文的提取方法和装置 [P]. 
王磊 .
中国专利 :CN105335382B ,2016-02-17
[6]
一种基于快速傅里叶变换的网页正文提取方法 [P]. 
王劲林 ;
李蕾 ;
李晔 ;
白鹤 ;
胡晶晶 .
中国专利 :CN101237465B ,2008-08-06
[7]
基于文本标签特征挖掘的网页正文提取方法 [P]. 
于富财 ;
文友枥 ;
陈西安 ;
袁进 ;
吴轶铭 ;
申洲 ;
汪辉 ;
鲁才 .
中国专利 :CN106339455B ,2017-01-18
[8]
一种基于HTML标签的网页正文提取方法及装置 [P]. 
刘迎春 ;
魏华峰 ;
方筠捷 .
中国专利 :CN102779169A ,2012-11-14
[9]
一种基于示例页面的网页正文提取方法 [P]. 
兰秋军 .
中国专利 :CN103699591A ,2014-04-02
[10]
基于统计规则的族群网页正文提取方法及系统 [P]. 
陈通 ;
展一鸣 ;
李晓 ;
王瑞霜 ;
杨春 ;
纪丽萍 .
中国专利 :CN115510307A ,2022-12-23