基于机器学习的洋岛玄武岩主量元素预测稀土元素

被引:6
作者
洪瑾 [1 ]
甘成势 [1 ]
刘洁 [1 ,2 ]
机构
[1] 中山大学地球科学与工程学院
[2] 广东省地质过程与矿产资源探查重点实验室
基金
国家重点研发计划;
关键词
机器学习; 随机森林; 洋岛玄武岩; 主量元素; 稀土元素;
D O I
10.13745/j.esf.sf.2019.7.3
中图分类号
P588.145 [];
学科分类号
摘要
地学共享数据库(如GEOROC、PetDB等)可为地球科学研究提供重要基础数据。然而,这些数据库均存在一个明显缺陷:样品的9种主量元素(SiO2、TiO2、Al2O3、CaO、MgO、MnO、K2O、Na2O和P2O5)均有准确数据,但稀土元素(rare earth elements,REE)数据大量缺失。鉴于REE在地球化学领域的重要作用,我们尝试为数据库缺失的REE值提供一个补全方案,即利用机器学习中的随机森林方法实现由9种主量元素预测REE值。以洋岛玄武岩(ocean island basalt,OIB)为例,把从GEOROC库中搜集到的1 283组OIB数据按8∶2的比例分为两组,其中80%的数据作为训练数据集用于建模,20%的数据作为测试数据集验证模型。比较了随机森林和多元线性回归方法对相同数据进行建模和预测的效果差异,发现无论是回归建模还是预测,随机森林方法都优于多元线性回归,且随着输入参数与输出参数之间关系的复杂化,这种优势更加明显。随机森林对测试数据集的预测效果整体较好,只是随着REE原子序数的增大,预测效果逐渐减弱。这一方面可能是因为原子序数大的REE与主量元素的关系更弱;另一方面可能是由于原子序数大的REE与主量元素的关系更加复杂。其次,随机森林方法预测的REE配分曲线与实际配分曲线吻合度较高,且预测所得配分曲线的区分能力较强,能够反映实际配分曲线之间的相对差异,这一点对推断地球化学过程尤为重要。随机森林方法随着训练数据的增多,其建立的模型也将越稳定,预测结果也会更精确。因此,随着数据库的不断完善,对数据库中REE值的预测也将更为可信、可行。
引用
收藏
页码:45 / 54
页数:10
相关论文
共 30 条
  • [1] 全球N-MORB和E-MORB分类方案对比
    第鹏飞
    陈万峰
    张旗
    王金荣
    汤庆艳
    焦守涛
    [J]. 岩石学报, 2018, 34 (02) : 264 - 274
  • [2] 大数据与数学地球科学研究进展——大数据与数学地球科学专题代序
    周永章
    陈烁
    张旗
    肖凡
    王树功
    刘艳鹏
    焦守涛
    [J]. 岩石学报, 2018, 34 (02) : 255 - 263
  • [3] 论地质研究中的因果关系和相关关系——大数据研究的启示
    张旗
    焦守涛
    卢欣祥
    [J]. 岩石学报, 2018, 34 (02) : 275 - 280
  • [4] 洋岛和洋底高原玄武岩数据挖掘:地球化学特征及其与MORB的对比
    陈万峰
    王金荣
    张旗
    刘懿馨
    马骊
    焦守涛
    [J]. 地质学报, 2017, 91 (11) : 2443 - 2455
  • [5] 全球新生代安山岩构造环境有关问题探讨
    刘欣雨
    张旗
    张成立
    [J]. 地质科学, 2017, 52 (03) : 649 - 667
  • [6] N-MORB、E-MORB和OIB的区别及其可能的原因:大数据的启示
    安屹
    杨婧
    陈万峰
    王金荣
    张旗
    潘振杰
    焦守涛
    [J]. 地质科学, 2017, 52 (03) : 727 - 742
  • [7] N-MORB和E-MORB数据挖掘——玄武岩判别图及洋中脊源区地幔性质的讨论
    王金荣
    陈万峰
    张旗
    焦守涛
    杨婧
    潘振杰
    王淑华
    [J]. 岩石学报, 2017, 33 (03) : 993 - 1005
  • [8] 大数据时代数据库信息系统安全风险评估技术分析
    曾建国
    [J]. 信息安全与技术, 2015, 6 (09) : 27 - 28
  • [9] 大数据时代[M]. 浙江人民出版社 , 迈耶-舍恩伯格, 2012
  • [10] Variable selection and prediction of uniaxial compressive strength and modulus of elasticity by random forest[J] . S.S. Matin,L. Farahzadi,S. Makaremi,S. Chehreh Chelgani,Gh. Sattari.Applied Soft Computing . 2017