人才需求:
可以熟練使用python完成DQN或double DQN算法
需求描述:
1.有一段空調(diào)房間溫度和機組能耗的計算代碼(相當(dāng)于強化學(xué)習(xí)的游戲環(huán)境,我已經(jīng)用python搭建好了,具體需求可以線上溝通),可以通過外部環(huán)境參數(shù)和動作參數(shù)的輸入,輸出下一時刻的房間干球溫度、房間相對濕度和十五分鐘的設(shè)備總能耗。每日開始時的初始房間參數(shù)與室外相同。(即,通過四個逐時更新的環(huán)境參數(shù)和兩個逐時更新的狀態(tài)參數(shù),輸入兩個動作參數(shù),會得到兩個新的狀態(tài)參數(shù),這兩個新的狀態(tài)參數(shù)和四個新的環(huán)境參數(shù)構(gòu)成下一時刻新的狀態(tài))
2.通過對整個供冷季節(jié)的動作參數(shù)的輸入學(xué)習(xí),訓(xùn)練智能體double DQN模型
3.將訓(xùn)練好的模型保存,完成本地部署,使之能夠根據(jù)實時的外部環(huán)境參數(shù)和動作參數(shù),離線調(diào)用訓(xùn)練好的模型,自動尋找到最優(yōu)的動作參數(shù)。
4.結(jié)果展示,保證代碼可以在機主本地使用,以及代碼的使用調(diào)參培訓(xùn)和答疑。
合作方式:
開發(fā)方式:遠(yuǎn)程開發(fā)。
開發(fā)周期:2~3天