一种多模态掩码视频描述模型

被引:0
专利类型
发明
申请号
CN202510723186.1
申请日
2025-05-30
公开(公告)号
CN120751161A
公开(公告)日
2025-10-03
发明(设计)人
姚昊
申请人
一重集团天津智能控制有限公司
申请人地址
300457 天津市滨海新区天津经济技术开发区海星街
IPC主分类号
H04N19/70
IPC分类号
H04N19/85 G06T9/00 G10L19/02 G10L25/30 G10L25/57
代理机构
天津创智睿诚知识产权代理有限公司 12251
代理人
王海滨;田阳
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
基于动态记忆网络的跨模态视频描述模型 [P]. 
张萌萌 ;
徐成 ;
秦广军 ;
孙迪 ;
刘志 .
中国专利 :CN117496388A ,2024-02-02
[2]
一种基于全局时空的多模态视频摘要生成模型 [P]. 
王肃 ;
郑泽洪 ;
胡文心 .
中国专利 :CN117876936A ,2024-04-12
[3]
一种基于检索多模态辅助生成描述的视频描述方法 [P]. 
韩旭光 ;
刘斌 .
中国专利 :CN117998168A ,2024-05-07
[4]
一种基于双向Transformer的多模态视频描述生成方法 [P]. 
李崇 ;
祁云嵩 .
中国专利 :CN120544093A ,2025-08-26
[5]
一种基于大模型视频描述的多模态情感分析方法及系统 [P]. 
黄昌勤 ;
林振亨 ;
黄琼浩 ;
蒋云良 ;
王士进 .
中国专利 :CN117237774B ,2025-11-25
[6]
一种多模态人群计数模型 [P]. 
刘政怡 ;
吴伟 ;
檀亚诚 ;
唐彬 ;
方贤勇 ;
汪粼波 .
中国专利 :CN115359428A ,2022-11-18
[7]
一种可交互Transformer的多模态视频密集事件描述算法 [P]. 
陈国文 ;
杨昊 .
中国专利 :CN114461851A ,2022-05-10
[8]
一种基于多模态融合的视频描述文本生成方法 [P]. 
刘辉 .
中国专利 :CN112069361A ,2020-12-11
[9]
基于多模态大模型的无人机视频摘要语义描述方法及系统 [P]. 
卢万杰 ;
刘伟 ;
牛朝阳 ;
蓝朝桢 ;
胡涛 ;
李润生 ;
王世举 ;
吴亚杰 .
中国专利 :CN120411571A ,2025-08-01
[10]
一种多模态视频理解方法 [P]. 
王利民 ;
金力为 .
中国专利 :CN115129934A ,2022-09-30