9月26日,第五屆中國科技產(chǎn)業(yè)化促進會科學技術(shù)獎名單公布,我院工業(yè)工程與管理系王冬副教授團隊項目獲科技創(chuàng)新獎一等獎。

項目名稱:面向大規(guī)模人工智能集群的主動可靠性保障關(guān)鍵技術(shù)與應用
主要完成人:王冬、陸明、劉曉東等
項目簡介:人工智能大模型的發(fā)展推動了算力需求的指數(shù)級增長,智算中心作為支撐大模型訓練與推理的核心基礎設施,普遍面臨可用度低的痛點。在有限投資規(guī)模下,如何通過主動保障技術(shù)實現(xiàn)集群的高可靠性和高可用性,成為行業(yè)亟待解決的難題。面對智算中心復雜異構(gòu)計算環(huán)境,項目突破了多維故障智能監(jiān)測動態(tài)預警技術(shù)瓶頸,實現(xiàn)從“故障后響應”到“風險前預判”的范式升級;面向智算任務動態(tài)負載與異構(gòu)資源的自適應故障診斷機制,解決了傳統(tǒng)故障樹靜態(tài)建模失效問題;提出大規(guī)模智能計算資源規(guī)劃與調(diào)度關(guān)鍵技術(shù),破解資源效率與可靠性保障的矛盾。
中國科技產(chǎn)業(yè)化促進會科學技術(shù)獎是經(jīng)國家科學技術(shù)獎勵工作辦公室批準設立,面向全國的社會科技獎項,旨在表彰在科技創(chuàng)新和產(chǎn)業(yè)化領域做出貢獻的個人和團隊,2025年度共授予科技創(chuàng)新獎145項。
