題目:深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化問題中的應(yīng)用
時間:2025年12月23日 10:00-11:00
地點:機(jī)械與動力工程學(xué)院 F210會議室
邀請人:夏唐斌 教授(工業(yè)工程與管理系)
報告人簡介

張穎芊,荷蘭埃因霍溫理工大學(xué)副教授,現(xiàn)任荷比盧人工智能協(xié)會主席、歐洲大數(shù)據(jù)價值協(xié)會技術(shù)專家委員會委員,主要研究方向涵蓋面向決策場景的深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)、可解釋且公平的人工智能技術(shù),并聚焦這些技術(shù)在物流、交通運輸及先進(jìn)制造系統(tǒng)中的應(yīng)用。
報告摘要
深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化問題中的應(yīng)用,已成為人工智能與運籌學(xué)交叉領(lǐng)域的研究熱點。本次報告將介紹課題組近年來在該方向上的代表性工作,系統(tǒng)梳理面向組合優(yōu)化場景的深度強(qiáng)化學(xué)習(xí)方法體系:一是在線強(qiáng)化學(xué)習(xí),即智能體通過與代理環(huán)境實時交互,自主學(xué)習(xí)高效的決策策略;二是離線強(qiáng)化學(xué)習(xí),即智能體直接從固定數(shù)據(jù)集中訓(xùn)練策略,無需與環(huán)境交互;三是混合式方法,即利用強(qiáng)化學(xué)習(xí)動態(tài)引導(dǎo)局部搜索、遺傳算法等經(jīng)典啟發(fā)式算法的搜索過程。此外,報告還將簡要介紹若干強(qiáng)化學(xué)習(xí)在復(fù)雜現(xiàn)實決策場景中的成功應(yīng)用實踐項目。

