基于跨模态标记融合的多模态图片理解方法及装置

被引:0
专利类型
发明
申请号
CN202511108054.4
申请日
2025-08-08
公开(公告)号
CN120611154A
公开(公告)日
2025-09-09
发明(设计)人
王怀照 杨秀武 欧阳晔
申请人
亚信科技(中国)有限公司
申请人地址
100193 北京市海淀区西北旺东路10号院东区19号楼1层101
IPC主分类号
G06F18/20
IPC分类号
G06N5/04 G06V30/148 G06F18/25
代理机构
北京市立方律师事务所 11330
代理人
谢玉斌
法律状态
授权
国省代码
北京市 市辖区
引用
下载
收藏
共 50 条
[1]
基于跨模态标记融合的多模态图片理解方法及装置 [P]. 
王怀照 ;
杨秀武 ;
欧阳晔 .
中国专利 :CN120611154B ,2025-12-23
[2]
基于离散余弦变换的多模态图片理解方法及装置 [P]. 
王怀照 ;
杨秀武 ;
王首峰 ;
欧阳晔 .
中国专利 :CN120877067A ,2025-10-31
[3]
基于视觉编码器组合的多模态图片理解方法及装置 [P]. 
王怀照 ;
杨秀武 ;
王首峰 ;
欧阳晔 .
中国专利 :CN120563872A ,2025-08-29
[4]
基于多模态大语言模型的视频理解方法及装置 [P]. 
褚旭 ;
谭志杰 ;
陈欣荣 ;
王冠宇 ;
王炳策 ;
刘元坤 .
中国专利 :CN120198838A ,2025-06-24
[5]
基于文本模态对齐的跨模态行人重识别方法及装置 [P]. 
章万千 ;
段柄宇 ;
吴大衍 ;
林政 ;
谷井子 ;
王伟平 .
中国专利 :CN118447530A ,2024-08-06
[6]
基于跨模态注意力机制的多模态数据语义对齐方法及装置 [P]. 
黄海松 ;
付盛伟 ;
刘超 ;
李宜汀 ;
马驰 ;
范青松 .
中国专利 :CN120724398A ,2025-09-30
[7]
基于脉冲融合的跨模态图文检索方法及装置 [P]. 
钟忺 ;
宗欣涛 ;
刘文旋 ;
袁景凌 ;
沈默思 ;
余肇飞 ;
黄铁军 ;
李政颖 .
中国专利 :CN120744149B ,2025-11-14
[8]
基于脉冲融合的跨模态图文检索方法及装置 [P]. 
钟忺 ;
宗欣涛 ;
刘文旋 ;
袁景凌 ;
沈默思 ;
余肇飞 ;
黄铁军 ;
李政颖 .
中国专利 :CN120744149A ,2025-10-03
[9]
基于多模态融合的智慧家庭场景理解与交互方法及系统 [P]. 
冷君阁 ;
李松 ;
孙宏霞 ;
程航 ;
刘洋 ;
郭保琪 ;
田云龙 ;
牛丽 ;
刘国强 ;
李春良 .
中国专利 :CN119398159A ,2025-02-07
[10]
多模态表示模型的训练方法、跨模态检索方法及装置 [P]. 
单斌 ;
尹维冲 ;
孙宇 .
中国专利 :CN114840734A ,2022-08-02