人工智能是大数据天体物理时代的万能钥匙吗?
目前为止,机器学习,尤其是深度学习的唯一真正成功之处是在给定大量人类注释数据的情况下,能够使用连续的几何变换将空间X映射到空间Y,然而至于为什要从X映射到Y还需要科学家自己把控。此外,从X映射到Y的具体细节也需要更深入的研究。 相关研究[9]已经尝试用谷歌的Deep-Dream[10]工具包研究星系团质量重构过程中对特定数据点的敏感性(图6),微软的InterpretML[11]工具包则专注于神经网络模型中各部分的逻辑关系和数据流向(图7),这两个尝试可以被看成“向黑盒子照入光”,帮助人们更好地理解其工作原理,当然结果仍很初步,离完全理解“黑盒子”还有很长的路要走。希望随着对机器学习工作逻辑研究的深入,人类能最终打开黑盒,让机器学习帮助科学家更好地探索宇宙。 图6. 应用深度学习算法基于星系团的光度信息重构星系团的总质量分布的过程中,星系团光度场中数据点对重构结果贡献的权重示意图。 左侧为星系团的广度分布(恒星粒子分布)[9],其中黑圈圈出星系团的中心星系的位置,红圈圈出星系团的成员星系;右侧为Deep-Dream[10]处理后的结果,黄色的区域代表对结果贡献比较大的数据点 。 图7. 机器学习模型解释软件InterpretML简介[11]。 04 总结:有效、有选择、有未来 大数据天体物理时代,机器学习能有效地帮助天文学家完成了海量数据的挖掘工作。但机器学习并不是万能的钥匙,不能盲目地应用机器学习去解决所有天文学问题,尤其是在问题范围不明确、数据体量不足以及数据质量不高的情况下。 另外,不可解释性是机器学习方法目前最大的短板,因此根据机器学习的结果下因果性结论的时候要尤为谨慎。已经有一些先驱性工作尝试解释机器学习结果与数据的因果关系以及机器学习模型内部的逻辑关系,希望随着此类研究的深入,人类能最终打开黑盒,让机器学习也能从事推理和抽象相关的科研工作。 不过话说回来,真到那个时候,天文学家又将扮演何种角色呢?会不会成为失业的人群?欢迎留下你的看法。 参考文献: [1] https://www.sdss.org/ [2] https://www.darkenergysurvey.org/ [3] https://www.euclid-ec.org/ [4] https://www.lsst.org/ [5] Dieleman, S. et al., Rotation-invariant Convolutional Neural Networks for Galaxy Morphology Prediction, 2015, MNRAS, Vol. 450, Issue 2, p.1141-1459 [6] Hocking, A. et al., An automatic taxonomy of Galaxy Morphology Using Unsupervised Machine Learning, 2018, MNRAS, Vol. 473, Issue 1, p.1108-1129 [7] Fluri, J. et al., Cosmological Constraints from Noisy Convergence Maps through Deep Learning, 2018, Physical Review D, Vol. 98, Issue 12, id.123518 [8] Ravanbakhsh, S. et al., Enabling Dark Energy Science with Deep Generative Models of Galaxy Images, 2017, AAAI-2017, Proceedings, id.14765 [9] Yan, Z. et al, Galaxy Cluster Mass Estimation with Deep Learning and Hydrodynamical Simulations, 2020, MNRAS, Vol. 499, Issue 3, pp.3445-3458 [10] https://github.com/google/deepdream [11] https://github.com/interpretml/interpret 作者简介 李楠 2013年在中国科学院大学年获得天体物理学博士,现中国科学院国家天文台副研究员,主要研究兴趣为机器学习在天体物理中的应用、应用引力透镜效应研究星系宇宙学问题。 (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |