摘要:機器學習在當今的諸多領域已經取得了巨大的成功.尤其是提升算法.提升算法適應各種場景的能力較強、準確率較高,已經在多個領域發揮巨大的作用.但是提升算法在天文學中的應用卻極為少見.為解決斯隆數字巡天(Sloan Digital Sky Survey,SDSS)數據中恒星/星系暗源集分類正確率低的問題,引入了機器學習中較新的研究成果–XGBoost (eXtreme Gradient Boosting).從SDSS-DR7 (SDSS Data Release 7)中獲取完整的測光數據集,并根據星等值劃分為亮源集和暗源集.首先,分別對亮源集和暗源集使用十折交叉驗證法,同時運用XGBoost算法建立恒星/星系分類模型;然后,運用柵格搜索等方法調優XGBoost參數;最后,基于星系的分類正確率等指標,與功能樹(Function Tree, FT)、Adaboost (Adaptive boosting)、隨機森林(Random Forest, RF)、梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)、堆疊降噪自編碼(Stacked Denoising AutoEncoders, SDAE)、深度置信網絡(Deep Belief Network, DBN)等模型進行對比并分析結果.實驗結果表明:XGBoost在暗源分類中要比功能樹算法的星系分類正確率提高了將近10%,在暗源集的最暗星等中比功能樹提高了將近5%.同其他傳統的機器學習算法和深度神經網絡相比, XGBoost也有不同程度的提升.
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社