基于多模态交互和时间语义聚合的视频描述方法及系统

被引:0
专利类型
发明
申请号
CN202211174007.6
申请日
2022-09-26
公开(公告)号
CN115512265B
公开(公告)日
2025-09-16
发明(设计)人
常发亮 李敏 刘春生 王彬 常致富
申请人
山东大学
申请人地址
250061 山东省济南市历下区经十路17923号
IPC主分类号
G06V20/40
IPC分类号
G06V10/82 G06V10/774 G06N3/084 G06N3/0464 G06N3/0442 G06N3/0455
代理机构
济南圣达知识产权代理有限公司 37221
代理人
黄海丽
法律状态
授权
国省代码
江苏省 常州市
引用
下载
收藏
共 50 条
[1]
基于多模态交互和时间语义聚合的视频描述方法及系统 [P]. 
常发亮 ;
李敏 ;
刘春生 ;
王彬 ;
常致富 .
中国专利 :CN115512265A ,2022-12-23
[2]
一种基于双向Transformer的多模态视频描述生成方法 [P]. 
李崇 ;
祁云嵩 .
中国专利 :CN120544093A ,2025-08-26
[3]
一种基于检索多模态辅助生成描述的视频描述方法 [P]. 
韩旭光 ;
刘斌 .
中国专利 :CN117998168A ,2024-05-07
[4]
基于跨模态特征强化与交互的多模态图像语义分割方法 [P]. 
韩静 ;
王川 ;
陈霄宇 ;
瞿超 ;
徐启涵 ;
蒋韫骋 .
中国专利 :CN115546489A ,2022-12-30
[5]
基于跨层级引导融合的多模态图像语义分割方法及系统 [P]. 
张辉 ;
杜瑞 ;
曹意宏 ;
别克扎提·巴合提 ;
钟杭 ;
毛建旭 ;
王耀南 .
中国专利 :CN118864866A ,2024-10-29
[6]
基于跨层级引导融合的多模态图像语义分割方法及系统 [P]. 
张辉 ;
杜瑞 ;
曹意宏 ;
别克扎提·巴合提 ;
钟杭 ;
毛建旭 ;
王耀南 .
中国专利 :CN118864866B ,2025-02-11
[7]
基于多模态特征融合的交通场景视频描述生成方法和装置 [P]. 
刘宏哲 ;
李铭兴 ;
张浩 ;
徐成 ;
潘卫国 ;
代松银 ;
徐冰心 .
中国专利 :CN115496134A ,2022-12-20
[8]
基于多模态特征的交互信息生成方法、系统及存储介质 [P]. 
陈锁 ;
顾文元 ;
张雪源 .
中国专利 :CN115309882A ,2022-11-08
[9]
基于多模态大模型的视频时间戳事件识别与推理方法 [P]. 
李晓辉 ;
熊佳庆 ;
牛冠冲 ;
杨清海 ;
施永鑫 ;
颜斌 ;
黄振江 .
中国专利 :CN119723431A ,2025-03-28
[10]
基于生活支援的多模态人机交互系统及方法 [P]. 
苏晓杰 .
中国专利 :CN117591636A ,2024-02-23