面向AI的数据管理技术综述

被引:44
作者
李国良
周煊赫
机构
[1] 清华大学计算机科学与技术系
关键词
数据管理技术; 人工智能; 声明性语言;
D O I
暂无
中图分类号
TP311.13 []; TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
人工智能技术因其强大的学习和泛化能力已被广泛应用于各种真实场景中.然而,现有的人工智能技术仍然面临着三大挑战:第一,现有的AI技术使用门槛高,依赖于AI从业者选择合适模型、设计合理参数、编写程序,因此很难被广泛应用到非计算机领域;第二,现有的AI算法训练效率低,造成了大量计算资源的浪费,甚至延误决策时机;第三,现有的AI技术非常强地依赖于高质量数据,如果数据质量较低,可能带来计算结果的错误.数据库技术可以有效解决这3个难题,因此目前,面向AI的数据管理得到了广泛关注.首先给出AI中数据管理的整体框架,然后详细综述基于声明式语言模型的AI系统、面向AI优化的计算引擎、执行引擎和面向AI的数据治理引擎这4个方面,最后展望未来的研究方向和所面临的挑战.
引用
收藏
页码:21 / 40
页数:20
相关论文
共 10 条
[1]
学习式数据库系统:挑战与机遇 [J].
柴茗珂 ;
范举 ;
杜小勇 .
软件学报, 2020, 31 (03) :806-830
[2]
基于机器学习的数据库技术综述 [J].
李国良 ;
周煊赫 ;
孙佶 ;
余翔 ;
袁海涛 ;
刘佳斌 ;
韩越 .
计算机学报, 2020, 43 (11) :2019-2049
[3]
Model Selection Management Systems[J] Arun Kumar;Robert McCann;Jeffrey Naughton;Jignesh M. Patel ACM SIGMOD Record 2016,
[4]
Memory Row Reuse Distance and its Role in Optimizing Application Performance[J] Mahmut Kandemir;Hui Zhao;Xulong Tang;Mustafa Karakoy ACM SIGMETRICS Performance Evaluation Review 2015,
[5]
The monte carlo database system[J] Ravi Jampani;Fei Xu;Mingxi Wu;Luis Perez;Chris Jermaine;Peter J. Haas ACM Transactions on Database Systems (TODS) 2011,
[6]
Online aggregation[J] Joseph M. Hellerstein;Peter J. Haas;Helen J. Wang ACM SIGMOD Record 1997,
[7]
Regression Shrinkage and Selection via the Lasso[J] Robert Tibshirani Journal of the Royal Statistical Society. Series 1996,
[8]
FCA attribute reduction in information systems Benítez-Caballero MJ;Medina J;Ramírez-Poussa E; Proc.of the IPMU 2018,
[9]
Predictive Analysis with SAP:The Comprehensive Guide Mac Gregor J; SAP Press 2013,
[10]
Integrating K-Means Clustering with a Relational DBMS Using SQL Carlos Ordonez; IEEE Transactions on Knowledge and Data Engineering 2006,