能源裝備、航空航天裝備、船舶裝備制造等領(lǐng)域的產(chǎn)品工藝結(jié)構(gòu)樹往往比較復(fù)雜,在車間生產(chǎn)組織和運(yùn)行中,具有同時(shí)需要考慮機(jī)加與裝配工藝且工序數(shù)多的情況,易形成大規(guī)模柔性綜合調(diào)度問題,而該類問題存在龐大的解空間,快速尋優(yōu)面臨著巨大挑戰(zhàn)。制造過程中,更需要及時(shí)響應(yīng)動(dòng)態(tài)干擾、高效有序地組織生產(chǎn),為此需要研究生產(chǎn)調(diào)度優(yōu)化方法,能夠靈活適應(yīng)大規(guī)模車間生產(chǎn)調(diào)度和動(dòng)態(tài)干擾環(huán)境,以提高企業(yè)質(zhì)量、縮短制造工期。因此,研究大規(guī)模柔性綜合調(diào)度問題具有重大的理論價(jià)值和實(shí)際工程意義,本文對(duì)此開展了如下工作:
(1) 建立了大規(guī)模柔性綜合靜態(tài)調(diào)度模型和考慮新產(chǎn)品到達(dá)與隨機(jī)工時(shí)的大規(guī)模柔性綜合動(dòng)態(tài)調(diào)度模型。本文以最小化最大完工時(shí)間和最小總拖期為優(yōu)化目標(biāo),考慮大規(guī)模柔性綜合作業(yè)車間中的工藝、機(jī)器柔性和總工序數(shù)的大規(guī)模等約束,構(gòu)建了大規(guī)模柔性綜合作業(yè)車間靜態(tài)調(diào)度問題模型,并在此基礎(chǔ)上建立綜合考慮了新產(chǎn)品到達(dá)和隨機(jī)工時(shí)兩種擾動(dòng)的動(dòng)態(tài)調(diào)度模型,為大規(guī)模柔性綜合調(diào)度問題建立數(shù)學(xué)模型。
(2) 構(gòu)建了基于D3QN算法的大規(guī)模柔性綜合調(diào)度模型框架。本文首先將大規(guī)模柔性綜合調(diào)度數(shù)學(xué)模型轉(zhuǎn)化為馬爾可夫決策過程,即設(shè)計(jì)狀態(tài)特征、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù),從工序和機(jī)器分別設(shè)計(jì)了2組矩陣表示的狀態(tài)特征和8組復(fù)合調(diào)度規(guī)則作為動(dòng)作空間;為了實(shí)現(xiàn)最小化最大完工時(shí)間和最小總拖期的權(quán)重優(yōu)化目標(biāo),根據(jù)機(jī)器利用率均衡和產(chǎn)品平均延誤率即時(shí)獎(jiǎng)勵(lì),并針對(duì)大規(guī)模柔性綜合調(diào)度問題,提出混合搭建的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)并進(jìn)行對(duì)比驗(yàn)證,最后通過與其他算法對(duì)比驗(yàn)證本文所提算法的有效性和優(yōu)越性。
(3) 提出了基于ID3QN算法的動(dòng)態(tài)調(diào)度框架求解大規(guī)模柔性綜合作業(yè)車間動(dòng)態(tài)調(diào)度模型。為了讓D3QN算法及時(shí)響應(yīng)動(dòng)態(tài)調(diào)度問題,本文在靜態(tài)調(diào)度算法的基礎(chǔ)上,從產(chǎn)品、工序和機(jī)器三個(gè)層面設(shè)計(jì)9個(gè)狀態(tài)特征,通過權(quán)重優(yōu)化目標(biāo)值的大小篩選出5組復(fù)合調(diào)度規(guī)則作為動(dòng)作空間,以提高算法的運(yùn)行效率。針對(duì)算法易陷入局部最優(yōu)的問題,引入經(jīng)驗(yàn)回放機(jī)制進(jìn)一步提升算法的精度和穩(wěn)定性,并通過實(shí)驗(yàn)驗(yàn)證了所提算法框架的優(yōu)越性與有效性。
(4) 將本文所提調(diào)度方法應(yīng)用于工程實(shí)例中,對(duì)某大型復(fù)雜產(chǎn)品生產(chǎn)作業(yè)車間進(jìn)行調(diào)度優(yōu)化,進(jìn)一步證明本文構(gòu)建的大規(guī)模柔性綜合調(diào)度數(shù)學(xué)模型和深度強(qiáng)化學(xué)習(xí)算法求解框架的有效性。