利用视觉语言模型的实例级场景识别

被引:0
专利类型
发明
申请号
CN202410631660.3
申请日
2024-05-21
公开(公告)号
CN118587623B
公开(公告)日
2025-05-27
发明(设计)人
H·卡班达 B·布伦奇利 V·马哈扬 L·王
申请人
谷歌有限责任公司
申请人地址
美国加利福尼亚州
IPC主分类号
G06V20/30
IPC分类号
G06V10/82 G06V10/764 G06V10/80 G06N3/0455 G06N3/0475 G06N20/00
代理机构
北京市柳沈律师事务所 11105
代理人
金玉洁
法律状态
公开
国省代码
引用
下载
收藏
共 50 条
[1]
利用视觉语言模型的实例级场景识别 [P]. 
H·卡班达 ;
B·布伦奇利 ;
V·马哈扬 ;
L·王 .
美国专利 :CN118587623A ,2024-09-03
[2]
一种基于视觉语言模型和动态场景的危险环境识别方法 [P]. 
吴班 ;
张奕 .
中国专利 :CN120279499A ,2025-07-08
[3]
视觉语言模型的微调方法 [P]. 
高联丽 ;
刘可 ;
吴世涵 ;
曾鹏鹏 ;
张继 ;
吕新昱 ;
宋井宽 .
中国专利 :CN120148037A ,2025-06-13
[4]
基于视觉语言模型的遥感场景图预测方法及系统 [P]. 
任琰 ;
蒋秉川 ;
徐道柱 ;
孙龙 ;
赵星亮 ;
王笑 ;
宋卓恒 ;
吴浠瑗 ;
张潇文 .
中国专利 :CN120012919A ,2025-05-16
[5]
一种基于视觉语言模型的变电站视觉的场景描述方法 [P]. 
刘志鹏 ;
刘远超 ;
刘全 ;
陈元建 ;
雷东 ;
王欢 ;
周建 ;
吴超 ;
黄以诚 .
中国专利 :CN117786588A ,2024-03-29
[6]
语音识别语言模型 [P]. 
阿舒拓史·A·马勒高恩卡 ;
甘努·萨蒂施·库玛 ;
盖德·K·M·乔尔特 .
中国专利 :CN103262156A ,2013-08-21
[7]
基于实例驱动视觉语言大模型的细粒度视频异常检测方法 [P]. 
丁健刚 ;
李伟 ;
黄高杰 ;
杜贻泉 ;
裴莉莉 ;
崔宁宁 .
中国专利 :CN121214289A ,2025-12-26
[8]
基于视觉语言模型的金丝猴面部识别方法 [P]. 
许鹏飞 ;
尹爽 ;
孙哲 ;
张旭 ;
邓鑫 ;
郭竞 ;
郭松涛 ;
何刚 ;
聂卫科 .
中国专利 :CN118865441A ,2024-10-29
[9]
基于视觉语言模型的交通场景理解增强方法、系统、设备及介质 [P]. 
范佳琦 ;
吴建华 ;
褚洪庆 ;
高炳钊 .
中国专利 :CN121191105A ,2025-12-23
[10]
使用扩散模型监督视觉语言模型训练的方法 [P]. 
戴平阳 ;
纪荣嵘 ;
曹刘娟 ;
孙震 .
中国专利 :CN120580446B ,2025-11-21