基于多粒度跨模态耦合的音频引导视觉分割方法及装置

被引:0
专利类型
发明
申请号
CN202510918328.X
申请日
2025-07-03
公开(公告)号
CN120953601A
公开(公告)日
2025-11-14
发明(设计)人
孙超 张俊博 杜博
申请人
武汉大学
申请人地址
430072 湖北省武汉市武昌区八一路299号
IPC主分类号
G06V10/26
IPC分类号
G10L25/18 G10L25/57 G06V10/22 G06V10/44 G06V10/80 G06V10/82 G06N3/045
代理机构
北京清亦华知识产权代理事务所(普通合伙) 11201
代理人
梁柏祺
法律状态
实质审查的生效
国省代码
湖北省 武汉市
引用
下载
收藏
共 50 条
[1]
基于跨模态协同修正的多模态场景分割方法及系统 [P]. 
荣学文 ;
郭怡馨 ;
陈振学 ;
刘成云 ;
李贻斌 .
中国专利 :CN117635943A ,2024-03-01
[2]
基于跨层级引导融合的多模态图像语义分割方法及系统 [P]. 
张辉 ;
杜瑞 ;
曹意宏 ;
别克扎提·巴合提 ;
钟杭 ;
毛建旭 ;
王耀南 .
中国专利 :CN118864866A ,2024-10-29
[3]
基于跨层级引导融合的多模态图像语义分割方法及系统 [P]. 
张辉 ;
杜瑞 ;
曹意宏 ;
别克扎提·巴合提 ;
钟杭 ;
毛建旭 ;
王耀南 .
中国专利 :CN118864866B ,2025-02-11
[4]
基于复合区分测度的跨模态多粒度幽默识别方法及装置 [P]. 
黄哲煌 ;
陈咏希 ;
谭安辉 ;
李进金 .
中国专利 :CN120822078A ,2025-10-21
[5]
基于时序跨模态设计Mamba的视听分割方法 [P]. 
诸葛云志 ;
龚思同 ;
张璐 ;
卢湖川 .
中国专利 :CN119672617A ,2025-03-21
[6]
一种基于跨模态引导交互融合的多模态命名实体识别方法 [P]. 
李代祎 ;
梁瑶瑶 ;
甘琤 ;
钱慎一 ;
吴怀广 ;
孙彤 ;
李佳 ;
庞延赠 .
中国专利 :CN120337928A ,2025-07-18
[7]
基于语义引导的多标签识别跨模态表示系统及方法 [P]. 
陈琳 ;
张汝荟 ;
尚明生 .
中国专利 :CN120877010A ,2025-10-31
[8]
基于跨模态融合的多模态人脸防伪检测方法、装置、设备及介质 [P]. 
钱鹰 ;
何岱蔚 ;
刘苏 ;
刘歆 ;
陈奉 ;
万邦睿 .
中国专利 :CN117437677A ,2024-01-23
[9]
基于跨模态标记融合的多模态图片理解方法及装置 [P]. 
王怀照 ;
杨秀武 ;
欧阳晔 .
中国专利 :CN120611154B ,2025-12-23
[10]
基于跨模态标记融合的多模态图片理解方法及装置 [P]. 
王怀照 ;
杨秀武 ;
欧阳晔 .
中国专利 :CN120611154A ,2025-09-09