張穎芊副教授學(xué)術(shù)報告會
發(fā)布時間:2025-12-23   閱讀:1699

題目:深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化問題中的應(yīng)用

時間:2025年12月23日 10:00-11:00

地點:機(jī)械與動力工程學(xué)院 F210會議室

邀請人:夏唐斌 教授(工業(yè)工程與管理系)


報告人簡介

1765878768471359.jpg

張穎芊,荷蘭埃因霍溫理工大學(xué)副教授,現(xiàn)任荷比盧人工智能協(xié)會主席、歐洲大數(shù)據(jù)價值協(xié)會技術(shù)專家委員會委員,主要研究方向涵蓋面向決策場景的深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)、可解釋且公平的人工智能技術(shù),并聚焦這些技術(shù)在物流、交通運輸及先進(jìn)制造系統(tǒng)中的應(yīng)用。


報告摘要

深度強(qiáng)化學(xué)習(xí)在組合優(yōu)化問題中的應(yīng)用,已成為人工智能與運籌學(xué)交叉領(lǐng)域的研究熱點。本次報告將介紹課題組近年來在該方向上的代表性工作,系統(tǒng)梳理面向組合優(yōu)化場景的深度強(qiáng)化學(xué)習(xí)方法體系:一是在線強(qiáng)化學(xué)習(xí),即智能體通過與代理環(huán)境實時交互,自主學(xué)習(xí)高效的決策策略;二是離線強(qiáng)化學(xué)習(xí),即智能體直接從固定數(shù)據(jù)集中訓(xùn)練策略,無需與環(huán)境交互;三是混合式方法,即利用強(qiáng)化學(xué)習(xí)動態(tài)引導(dǎo)局部搜索、遺傳算法等經(jīng)典啟發(fā)式算法的搜索過程。此外,報告還將簡要介紹若干強(qiáng)化學(xué)習(xí)在復(fù)雜現(xiàn)實決策場景中的成功應(yīng)用實踐項目。


金平| 江油市| 涞水县| 黄浦区| 桂平市| 上虞市| 嘉义市| 枝江市| 孝义市| 泰来县| 定远县| 淄博市| 汨罗市| 皋兰县| 军事| 邹城市| 彭山县| 赤峰市| 盖州市| 西城区| 英吉沙县| 三河市| 澄迈县| 凤台县| 华容县| 溆浦县| 红安县| 石城县| 台山市| 晋中市| 富裕县| 稻城县| 丰县| 济阳县| 莎车县| 乌鲁木齐市| 弋阳县| 宣汉县| 广元市| 抚宁县| 聂荣县|