一种基于双向Transformer的多模态视频描述生成方法

被引:0
专利类型
发明
申请号
CN202510611366.0
申请日
2025-05-13
公开(公告)号
CN120544093A
公开(公告)日
2025-08-26
发明(设计)人
李崇 祁云嵩
申请人
江苏科技大学
申请人地址
212100 江苏省镇江市丹徒区长晖路666号
IPC主分类号
G06V20/40
IPC分类号
G06V10/25 G06V10/44 G06V10/62 G06V10/77 G06V10/80 G06V10/82 G10L15/26 G10L15/18 G10L25/57 G06F40/35 G06N3/045 G06N3/0464 G06N3/084 G06N3/096 G06N3/0985
代理机构
北京索邦智慧专利代理有限公司 11879
代理人
赵伟
法律状态
公开
国省代码
江苏省 镇江市
引用
下载
收藏
共 50 条
[1]
动态多模态视频描述生成方法 [P]. 
张兆翔 ;
郝王丽 ;
关赫 .
中国专利 :CN108200483A ,2018-06-22
[2]
一种基于检索多模态辅助生成描述的视频描述方法 [P]. 
韩旭光 ;
刘斌 .
中国专利 :CN117998168A ,2024-05-07
[3]
一种基于多模态融合的视频描述文本生成方法 [P]. 
刘辉 .
中国专利 :CN112069361A ,2020-12-11
[4]
基于多模态特征融合的交通场景视频描述生成方法和装置 [P]. 
刘宏哲 ;
李铭兴 ;
张浩 ;
徐成 ;
潘卫国 ;
代松银 ;
徐冰心 .
中国专利 :CN115496134A ,2022-12-20
[5]
基于多模态交互和时间语义聚合的视频描述方法及系统 [P]. 
常发亮 ;
李敏 ;
刘春生 ;
王彬 ;
常致富 .
中国专利 :CN115512265A ,2022-12-23
[6]
基于多模态交互和时间语义聚合的视频描述方法及系统 [P]. 
常发亮 ;
李敏 ;
刘春生 ;
王彬 ;
常致富 .
中国专利 :CN115512265B ,2025-09-16
[7]
基于多模态融合的报告智能生成方法及系统 [P]. 
李乐平 ;
李林雄 .
中国专利 :CN121052236A ,2025-12-02
[8]
基于多模态融合的可控视频生成方法及系统 [P]. 
李成华 ;
周生宵 .
中国专利 :CN119091362B ,2025-03-14
[9]
基于多模态融合的可控视频生成方法及系统 [P]. 
李成华 ;
周生宵 .
中国专利 :CN119091362A ,2024-12-06
[10]
一种基于多模态融合的小样本商品分类方法 [P]. 
杨赛 ;
杨慧 ;
周伯俊 ;
胡彬 .
中国专利 :CN114757255A ,2022-07-15