近日,工業(yè)工程與管理系李勇祥副教授以第一作者在機器學習領(lǐng)域期刊IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI) 發(fā)表論文“Optimal Composite Likelihood Estimation and Prediction for Large-scale Gaussian Process Models”,探討了大規(guī)模高斯過程的一種分布式建模方法,為大規(guī)模GP建模提供了新的范式,可在多臺計算機上實現(xiàn)高效建模。

高斯過程模型的非線性建模和不確定性定量能力,使其成為現(xiàn)代數(shù)據(jù)科學和機器學習領(lǐng)域中的核心工具之一,并在很多領(lǐng)域的實際應用中發(fā)揮著關(guān)鍵作用。經(jīng)典GP建模方法由于單臺計算機的算力和內(nèi)存限制,無法滿足數(shù)據(jù)規(guī)模日益增長的大數(shù)據(jù)時代的建模需求。論文探討了大規(guī)模高斯過程的一種分布式建模方法,為基于分布式計算的 GP 建模提出了一種最優(yōu)混合似然函數(shù)(OCL),可最大限度地減少因分布式建模引起的信息損失;基于OCL提出了最佳線性無偏分塊估計(BLUBP),證明了其在分塊數(shù)據(jù)建模中具有最小的預測方差。研究為大規(guī)模GP建模提供了新的范式,可在多臺計算機上實現(xiàn)高效建模,同時獲得和經(jīng)典建模方法極為接近的準確性。
TPAMI作為機器學習人工智能領(lǐng)域最受關(guān)注的期刊之一,其影響因子在機器學習、人工智能、計算機視覺等領(lǐng)域的期刊中常年位居前列,最近一年的影響因子為23.6。
論文鏈接:https://ieeexplore.ieee.org/document/10301563
