一种基于正文节点特征的提取网页正文的方法和系统

被引:0
专利类型
发明
申请号
CN201910947241.X
申请日
2019-09-30
公开(公告)号
CN110851679A
公开(公告)日
2020-02-28
发明(设计)人
杨永全 翟世平 魏志强
申请人
申请人地址
266100 山东省青岛市崂山区松岭路238号
IPC主分类号
G06F16951
IPC分类号
G06F169535 G06F4014
代理机构
北京工信联合知识产权代理有限公司 11266
代理人
姜丽楼
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
网页正文提取的方法和装置 [P]. 
邹月明 ;
徐锐波 .
中国专利 :CN104462532B ,2015-03-25
[2]
网页正文的提取方法和装置 [P]. 
王磊 .
中国专利 :CN105335382B ,2016-02-17
[3]
基于文本标签特征挖掘的网页正文提取方法 [P]. 
于富财 ;
文友枥 ;
陈西安 ;
袁进 ;
吴轶铭 ;
申洲 ;
汪辉 ;
鲁才 .
中国专利 :CN106339455B ,2017-01-18
[4]
一种提取网页正文的方法 [P]. 
赵亮 .
中国专利 :CN104573097A ,2015-04-29
[5]
一种基于文字分布特征的网页正文提取方法 [P]. 
袁武 ;
林子涵 ;
袁文 .
中国专利 :CN102915361A ,2013-02-06
[6]
网页正文提取的方法及装置 [P]. 
陈发君 ;
刘忠 ;
黄金才 ;
朱承 ;
修保新 ;
程光权 ;
陈超 ;
冯旸赫 ;
龙开亮 ;
孟果 .
中国专利 :CN105718584B ,2016-06-29
[7]
一种网页正文提取方法和装置 [P]. 
徐晓龙 ;
张志一 ;
张颍辉 ;
李健铨 ;
胡加明 .
中国专利 :CN118377950A ,2024-07-23
[8]
一种识别网页正文楼层的系统和方法 [P]. 
陈营营 .
中国专利 :CN102779170B ,2012-11-14
[9]
一种识别网页正文楼层的系统和方法 [P]. 
陈营营 .
中国专利 :CN104462394A ,2015-03-25
[10]
基于深度学习的网页正文抽取方法 [P]. 
陈前华 .
中国专利 :CN112667940B ,2021-04-16