基于多模态大语言模型的场景文本识别方法及装置

被引:0
专利类型
发明
申请号
CN202511299511.2
申请日
2025-09-12
公开(公告)号
CN120808329A
公开(公告)日
2025-10-17
发明(设计)人
李岩 李斌阳 林汉桂 舒言 付卓远
申请人
国际关系学院
申请人地址
100091 北京市海淀区坡上村12号
IPC主分类号
G06V20/62
IPC分类号
G06V20/70 G06V30/14 G06V30/262 G06V30/19 G06V10/82 G06N3/0455 G06F40/30
代理机构
北京天达知识产权代理事务所有限公司 11386
代理人
庞许倩
法律状态
公开
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
基于多模态大语言模型的场景文本识别方法及装置 [P]. 
李岩 ;
李斌阳 ;
林汉桂 ;
舒言 ;
付卓远 .
中国专利 :CN120808329B ,2025-12-16
[2]
基于场景分析的大语言模型安全识别方法及系统 [P]. 
高正杰 ;
范玉鑫 ;
郑涛 ;
宋馨宇 ;
廖敏 .
中国专利 :CN119474914A ,2025-02-18
[3]
基于场景分析的大语言模型安全识别方法及系统 [P]. 
高正杰 ;
范玉鑫 ;
郑涛 ;
宋馨宇 ;
廖敏 .
中国专利 :CN119474914B ,2025-03-25
[4]
基于大语言模型和多模态大语言模型的图表问答方法及系统 [P]. 
呼大永 ;
马灿 ;
李宇环 ;
孟鸽 ;
刘佳朋 ;
李亮 .
中国专利 :CN120031124A ,2025-05-23
[5]
基于大语言模型的文本结构识别方法 [P]. 
董正心 ;
苑爱泉 .
中国专利 :CN117436441A ,2024-01-23
[6]
一种基于跨模态大语言模型的场景文本检测与识别方法 [P]. 
王芳芳 ;
徐晓刚 ;
张国栋 ;
郑一伟 ;
王军 .
中国专利 :CN117851883A ,2024-04-09
[7]
一种基于跨模态大语言模型的场景文本检测与识别方法 [P]. 
王芳芳 ;
徐晓刚 ;
张国栋 ;
郑一伟 ;
王军 .
中国专利 :CN117851883B ,2024-08-30
[8]
基于优化多模态视觉与语言处理的场景文本识别方法 [P]. 
吴永贤 ;
朱泽森 ;
钟灿琨 .
中国专利 :CN120182958A ,2025-06-20
[9]
基于多模态大语言模型的多模态命名实体识别方法和装置 [P]. 
曹健威 ;
胡艳丽 ;
周庄易 ;
李宏阳 ;
孙英杰 ;
张馨予 ;
朱煜琛 ;
谭真 .
中国专利 :CN117688941A ,2024-03-12
[10]
基于大语言模型的识别训练方法、识别方法 [P]. 
葛君正 ;
陈其宾 ;
姜凯 ;
李锐 .
中国专利 :CN118520904A ,2024-08-20