视觉知识的五个基本问题(英文)

被引:11
作者
潘云鹤
机构
[1] 浙江大学计算机科学与技术学院人工智能研究所
关键词
视觉知识表达; 视觉识别; 视觉形象思维模拟; 视觉知识学习; 多重知识表达;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
认知心理学早已指出,人类知识记忆中的重要部分是视觉知识,被用来进行形象思维。因此,基于视觉的人工智能(AI)是AI绕不开的课题,且具有重要意义。本文继《论视觉知识》一文,讨论与之相关的5个基本问题:(1)视觉知识表达;(2)视觉识别;(3)视觉形象思维模拟;(4)视觉知识的学习;(5)多重知识表达。视觉知识的独特优点是具有形象的综合生成能力,时空演化能力和形象显示能力。这些正是字符知识和深度神经网络所缺乏的。AI与计算机辅助设计/图形学/视觉的技术联合将在创造、预测和人机融合等方面对AI新发展提供重要的基础动力。视觉知识和多重知识表达的研究是发展新的视觉智能的关键,也是促进AI 2.0取得重要突破的关键理论与技术。这是一块荒芜、寒湿而肥沃的"北大荒",也是一块充满希望值得多学科合作勇探的"无人区"。
引用
收藏
页码:615 / 619
页数:5
相关论文
共 10 条
[1]  
Panel:cross-media intelligence .2 Zhuang YT,Jain R,Gao W,et al. Proc 25th ACM Int Conf on Multimedia . 2017
[2]  
Language models are few-shotlearners .2 BROWN T B,MANN B,RYDER N,et al. https://arxiv.org/abs/ 2005 14165 . 2020
[3]  
Engineering[P]. 英国专利:GB9929669D0,2000-02-09
[4]  
Two step joint model for drug drug interaction extraction .2 Tang SL,Zhang Q,Zheng TP,et al. https://arxiv.org/abs/ 2008.12704 . 2018
[6]  
Comprehensive information integration modeling framework for video titling .2 Zhang SY,Tan ZQ,Zhou Z,et al. Proc SIGKDD Int Conf on Knowledge Discovery&Data Mining . 2020
[7]  
Neural motifs:scene graph parsing with global context .2 Zellers R,Yatskar M,Thomson S,et al. Proc IEEE Conf on Computer Vision and Pattern Recognition . 2018
[8]   论视觉知识(英文) [J].
Yun-he PAN .
Frontiers of Information Technology & Electronic Engineering, 2019, 20 (08) :1021-1026
[9]  
Relation adversarial network for low resource knowledge graph completion .2 Zhang NY,Deng SM,Zhang W,et al. Proc Web Conf . 2020
[10]  
Scene graph generation by iterative message passing .2 Xu DF,Zhu YK,Choy CB,et al. Proc IEEE Conf on Computer Vision and Pattern Recognition . 2017