摘 要:基于門控循環(huán)單元(GRU)的神經(jīng)網(wǎng)絡(luò),構(gòu)建預(yù)測模型的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),訓(xùn)練和測試了 HL-2A 裝置等離子體水平位移系統(tǒng)響應(yīng)模型。測試結(jié)果顯示了該模型對 43%的樣本數(shù)據(jù)的擬合度超過 80%。把該網(wǎng)絡(luò)模型作為被控對象,使用基于徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的模型參考自適應(yīng)控制(MRAC)算法,設(shè)計了一個 HL-2A 等離子體水平位移的 MRAC 系統(tǒng)。仿真結(jié)果顯示,該控制系統(tǒng)的輸出響應(yīng)能快速地跟蹤各種輸入?yún)⒖夹盘枺刂破髂軌蜉^好地控制等離子體的水平位移并具有強的抗擾動能力。
本文源自付賢飛;楊斌;王世慶;, 核聚變與等離子體物理 發(fā)表時間:2021-06-30
關(guān)鍵詞:HL-2A 裝置;等離子體水平位移控制;位移響應(yīng)模型;門控循環(huán)單元;模型參考自適應(yīng)控制
1 引言
在托卡馬克放電運行過程中,等離子體位置控制是一項極其重要且十分基礎(chǔ)的工作[1]。目前,建立面向位移控制的等離子體響應(yīng)模型方法主要有兩種:一種是基于等離子體的剛性電流絲模型假設(shè)的機理建模,另一種是基于實驗數(shù)據(jù)進(jìn)行系統(tǒng)辨識的數(shù)據(jù)建模。常見電流絲模型的物理模型有 GradShafranov 大環(huán)徑比近似解模型[2]和 RZIP 模型[3],一般應(yīng)用上述線性模型與托卡馬克各線圈回路聯(lián)立,得到一多輸入多輸出(MIMO)的狀態(tài)方程,用于控制器的分析和設(shè)計,此類模型已在 TCV[4]、 JT-60U[5]和 FTU[6]等裝置上得到了實驗驗證。機理建模雖然能很好地反映控制量與等離子體各參數(shù)之間的物理關(guān)系,但為了滿足控制器的設(shè)計要求,在建模過程中需要進(jìn)行大量的理想化假設(shè)和線性化的展開,此過程不但復(fù)雜,而且將不可避免地導(dǎo)致響應(yīng)模型與實際系統(tǒng)之間存在偏差。
在數(shù)據(jù)建模研究中,文獻(xiàn)[1]使用線性系統(tǒng)辨識理論獲得了 EAST 裝置等離子體垂直位移系統(tǒng)的滑動平均自回歸(ARMAX)線性模型;文獻(xiàn)[7]介紹了如何運用神經(jīng)網(wǎng)絡(luò)對等離子體位置模型進(jìn)行參數(shù)辨識。從工程應(yīng)用的角度出發(fā),利用實驗數(shù)據(jù)建模可以使模型盡可能地貼近實驗響應(yīng),同時降低建模的難度和模型的復(fù)雜度,進(jìn)而使模型更適于控制器的設(shè)計。但目前基于實驗數(shù)據(jù)的系統(tǒng)辨識方法,在辨識過程中對輸入信號要求極為嚴(yán)格,即要求輸入信號在辨識實驗中能夠激活系統(tǒng)的所有模態(tài),且這種傳統(tǒng)的方法在辨識中,往往只是基于某一次的實驗數(shù)據(jù)計算待辨識參數(shù),這使得數(shù)據(jù)模型很難反映系統(tǒng)的全部特征。
深度學(xué)習(xí)中記憶能力較強的循環(huán)神經(jīng)網(wǎng)絡(luò) (RNN),適合于處理和預(yù)測時間序列中間隔和延遲相對較長的事件。考慮到 HL-2A 裝置放電的持續(xù)時間,一次放電實驗將形成成千上萬個等離子體位移采樣點,是一組前后依賴緊密的時間序列。因此利用 RNN 網(wǎng)絡(luò)理論,利用大量的 HL-2A 裝置放電的歷史實驗數(shù)據(jù)集訓(xùn)練出等離子體水平位移系統(tǒng)的網(wǎng)絡(luò)響應(yīng)模型,測試數(shù)據(jù)集的驗證結(jié)果顯示出了令人滿意的預(yù)測精度。最后,基于該網(wǎng)絡(luò)模型設(shè)計了一個能夠控制 HL-2A 裝置等離子體水平位移的模型參考自適應(yīng)控制器。
2 基于門控循環(huán)單元(GRU)的 HL-2A 裝置等離子體水平位移系統(tǒng)模型
2.1 基于 GRU 的等離子體水平位移預(yù)測模型
針對使用 RNN 對長序列建模時,容易出現(xiàn)梯度消失或梯度爆炸的問題, Hochreiter 和 Schmidhuber[8]通過引入門機制更新信息,提出了長短期記憶網(wǎng)絡(luò)(LSTM)。但 LSTM 的結(jié)構(gòu)較復(fù)雜,訓(xùn)練和預(yù)測的時間成本較高。Cho K 等人[9]通過對 LSTM 結(jié)構(gòu)的進(jìn)一步優(yōu)化,將門控單元由原來的 3 個改成 2 個,提出了基于門循環(huán)(GRU)的神經(jīng)網(wǎng)絡(luò),使模型的構(gòu)建和訓(xùn)練更為高效簡潔。如今,GRU 在許多序列建模任務(wù)中廣泛應(yīng)用,包括 Google 的自然語言處理任務(wù)[10],序列預(yù)測[11, 12]及序列分類[13] 等。在核聚變領(lǐng)域,文獻(xiàn)[14]使用 CNN-RNN 對受控核聚變中等離子體的破裂進(jìn)行了準(zhǔn)確預(yù)測。
為了實現(xiàn)對等離子體水平位移的準(zhǔn)確預(yù)測,綜合考慮離子體水平位移實驗數(shù)據(jù)與 GRU 網(wǎng)絡(luò)的特點,設(shè)計了以下拓?fù)浣Y(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò)。輸入的電壓時序數(shù)據(jù)首先流入第 1 層 BiGRU 層(一種雙向 GRU 網(wǎng)絡(luò)),從 BiGRU 層輸出的是長度不變且每個時間步記憶狀態(tài)已經(jīng)更新的序列;然后該序列流入第 2 層的 GRU 層,輸出的是最后一個時間步的新的記憶狀態(tài);前兩層的神經(jīng)元數(shù)目均為 180 個;為了降低神經(jīng)元之間連接的復(fù)雜性,防止過擬合的出現(xiàn),第 3 層設(shè)置為 Dropout[15]層,圖 1 顯示了在網(wǎng)絡(luò)訓(xùn)練過程中,有無 Dropout 層以及不同丟棄率下交叉驗證集與訓(xùn)練輸出的擬合情況,最終,丟棄率參數(shù)設(shè)置為 0.2,即隨機選擇前兩層 20%的神經(jīng)元進(jìn)行臨時刪除;為防止 BiGRU 層和 GRU 層疊加的不穩(wěn)定,第 4 層設(shè)置為全連接層進(jìn)行調(diào)節(jié),神經(jīng)元個數(shù)為 180;第 5 層接著設(shè)置為全連接層,神經(jīng)元的數(shù)目為 90 個;最后為輸出層,輸出擬合出的水平位移值。網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)如圖 2 所示。網(wǎng)絡(luò)的核心訓(xùn)練參數(shù)列于表 1 中。
2.2 評價指標(biāo)
由于利用 GRU 深度神經(jīng)網(wǎng)絡(luò)建立等離子體水平位移模型本質(zhì)上屬于回歸問題,為了更好地評價訓(xùn)練出的網(wǎng)絡(luò)模型,可從預(yù)測值與實驗值之間的偏差以及二者的一致性程度來評價該模型的預(yù)測效果。用均方根誤差(RMSE)和確定系數(shù)(R2 ) [16]作為評價指標(biāo)。RMSE 反映預(yù)測精確度,其值越小,表明預(yù)測精度越高;R2的值在 0~1 之間,刻畫的是預(yù)測值與實驗值之間擬合程度,其值越接近 1,表明擬合效果越好,公式分別為: 2 P 1 (- ) = n i Y Y RMSE n = ∑ (1) 2 p 2 1 2 1 (- ) =1- (-) n i n i Y Y R Y Y = = ∑ ∑ (2) 其中,Y 和YP 分別表示樣本的實測值與預(yù)測值;Y 表示實測值的均值。
2.3 數(shù)據(jù)預(yù)處理
HL-2A 裝置是帶偏濾器的大型磁約束聚變實驗裝置,其磁場線圈包括:環(huán)向場線圈和極向場線圈(歐姆線圈、垂直場線圈、水平場線圈和多極場線圈)等[16]。為了讓等離子體正常放電,并考慮到設(shè)備的安全性,使用閉環(huán)控制的方式進(jìn)行此次實驗。一共收集了 683 次等離子體放電實驗數(shù)據(jù),這些數(shù)據(jù)基本包含了 HL-2A 裝置等離子體位移的所有信息(偏濾器位形)。HL-2A 裝置的等離子體水平位移控制器是一個單輸入單輸出(SISO)系統(tǒng),在網(wǎng)絡(luò)訓(xùn)練時,將施加在垂直場線圈上的電壓作為網(wǎng)絡(luò)訓(xùn)練輸入量,將等離子體水平位移作為網(wǎng)絡(luò)訓(xùn)練輸出量,即將一次放電實驗中的垂直場電壓和水平位移作為一組樣本數(shù)據(jù),包含等離子體電流上升段和平頂段的 900 個采樣點,共 1800 個樣本點數(shù)據(jù)。
683 次放電數(shù)據(jù)分成兩部分,從中選取 80% 組成訓(xùn)練集,剩下的 20%組成測試集,即訓(xùn)練集為 546 次放電,測試集為 137 次放電,另再從測試集抽取 10%作為模型訓(xùn)練時的交叉驗證集,以防止過擬合的發(fā)生。為了減少網(wǎng)絡(luò)的訓(xùn)練時間和提高訓(xùn)練精度,將實驗數(shù)據(jù)歸一化到−1~1 之間,網(wǎng)絡(luò)訓(xùn)練完成進(jìn)行測試集的驗證時再反歸一化成原值[16]。
2.4 結(jié)果分析
使用 MATLAB 2019a 作為模型訓(xùn)練的工具,硬件環(huán)境配置為 Intel Core i5-6200U CPU@2.30GHz × 4、4G 內(nèi)存、64 位處理器,采用 GPU:NVIDIA GeForce 930M 加速運算,模型訓(xùn)練速度是單獨使用 CPU 時的 5.2 倍。使用了 683 次放電實驗數(shù)據(jù)訓(xùn)練圖 2 所示的 GRU 網(wǎng)絡(luò)模型。然后,用測試集對訓(xùn)練好的網(wǎng)絡(luò)模型進(jìn)行了驗證。隨機從測試結(jié)果中選 10 組樣本進(jìn)行對比分析。基于 LSTM 網(wǎng)絡(luò)預(yù)測與實驗實測的水平位移對比如圖 3 所示。
從圖 3 的 10 組位移對比數(shù)據(jù)可以看出,基于 GRU 網(wǎng)絡(luò)的等離子體水平位移模型對等離子體電流在上升段和平頂段的水平位移進(jìn)行了預(yù)測,持續(xù)時間 900ms。可以看出,R2值為 0.89~0.95,即擬合度為 89%~95%,表示水平位移的預(yù)測值曲線能很好地擬合到實驗值曲線。整個測試集的R2 值見圖4,擬合度高于 80%的樣本占整個測試集的 43%,擬合效果良好;同時,表示預(yù)測精確度 RMSE 的值都較小,圖 3 所示的 10 組測試樣本的 RMSE 值都小于 0.12,整個測試集的 RMSE 值見圖 5,可知測試集的 RMSE 指標(biāo)都在 0.4 以下,表明本文建立的基于 GRU 的等離子體水平位移模型精確度很高。
3 基于徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的模型參考自適應(yīng)控制
3.1 基于 RBF 神經(jīng)網(wǎng)絡(luò)的 HL-2A 裝置等離子體水平位移系統(tǒng)的模型參考自適應(yīng)控制系統(tǒng)
考慮到第一階段建立的 HL-2A 裝置等離子體水平位移模型是一個深度神經(jīng)網(wǎng)絡(luò)(net),被控對象不是狀態(tài)空間方程或傳遞函數(shù),不便于根據(jù)經(jīng)典控制理論設(shè)計出控制器。一個基于神經(jīng)網(wǎng)絡(luò)的控制系統(tǒng)設(shè)計相對簡單,不需要被控對象模型的任何先驗知識[18]。根據(jù)在自適應(yīng)非線性控系統(tǒng)廣泛應(yīng)用的徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)理論[19],設(shè)計了 HL-2A 裝置等離子體水平位移的模型參考自適應(yīng)控制 (MRAC)器[20~22]。
RBF 神經(jīng)網(wǎng)絡(luò)是一種輸入輸出非線性映射的單隱層三層前饋網(wǎng)絡(luò)[23~26],網(wǎng)絡(luò)結(jié)構(gòu)如圖 6 所示。
其中, [ ]T i x = x 為網(wǎng)絡(luò)輸入; [ ]T j h h = 為隱含層高斯基函數(shù)的輸出;y 為網(wǎng)絡(luò)輸出; [ ]ij c c = 為隱含層第 j 個神經(jīng)元高斯基函數(shù)中心點的坐標(biāo)向量;bj 為隱含層第 j 個神經(jīng)元高斯基函數(shù)的寬度;w 為輸出層的權(quán)值。
基于 RBF 神經(jīng)網(wǎng)絡(luò)和 MRAC 理論,設(shè)計的 HL-2A 裝置等離子體水平位移系統(tǒng)的控制器如圖 7 所示。
設(shè)理性跟蹤指令為 my t( ) ,則定義跟蹤誤差為: cmp et y t yt () () () = − (5) 網(wǎng)絡(luò)權(quán)值學(xué)習(xí)誤差指標(biāo)為: 2 c 1 () () 2 Et e t = (6)
控制輸入為 RBF 網(wǎng)絡(luò)的輸出: 11 2 2 m m u t hw hw h w ( ) = + ++ " (7) 由梯度下降法,網(wǎng)絡(luò)的學(xué)習(xí)算法為: c () () () () ( ) ( ) ( 1) ( ) ( ) j j jj j j Et yt wt et h w ut wt wt wt wt η η α ∂ ∂ Δ =− = ∂ ∂ = − +Δ + Δ (8) 其中,η 為學(xué)習(xí)速率;α 為動量因子;η ∈[0,1] , α ∈[0,1]。同理可得: c 2 c 3 ( ) ( ) (t) () () ( ) ( ) ( ) ( ) j j j ij j j j Et yt u bt et b ut b y t x c e t wh ut b η η η ∂ ∂∂ Δ =− = ∂ ∂∂ ∂ − = ∂ (9) ( ) ( 1) ( ) ( 1) ( 2) j j jjj b t bt bt bt bt η α = − +Δ + − − − ? ? ? ? (10) c c 2 ( ) ( ) (t) () () ( ) ( ) () ( ) ij ij ij i ij j j j Et yt u ct et c ut c y t x c e t wh ut b η η η ∂ ∂∂ Δ =− = ∂ ∂∂ ∂ − = ∂ (11) ( ) ( 1) ( ) ( 1) ( 2) ij ij ij ij ij c t ct ct ct ct η α = − +Δ + − − − ? ? ? ? (12)
3.2 仿真與結(jié)果分析
本次仿真控制實驗的步驟如下:
Step1: 選擇被控對象 net 與參考模型 m r y t yt () () = ; Step2: 選擇輸入信號 r y t( ) 和自適應(yīng)增益 γ=0.25; Step3: 采樣當(dāng)前參考模型輸出 my t( ) 和系統(tǒng)實際輸出 y t( ) ,計算誤差 c e t( ) ; Step4: 根據(jù)公式(4)和(5)計算u t( ) ; Step5: t th → + ,返回 step3,繼續(xù)循環(huán)。
單位階躍響應(yīng)的仿真輸出響應(yīng)如圖 8 所示,仿真結(jié)果顯示,基于 RBF 神經(jīng)網(wǎng)絡(luò)的 HL-2A 裝置等離子體水平位移的 MRAC 系統(tǒng)可以快速跟蹤到單位階躍信號,將等離子體控制到期望位置,且超調(diào)時間很短,同時控制電壓信號較穩(wěn)定,變化幅值小,表明控制系統(tǒng)對垂直場電源的要求低。
考慮到 HL-2A 裝置等離子體水平位移控制系統(tǒng)在實際的操作中,等離子體水平位移除了會受到垂直場線圈磁場的約束控制作用外,還會受到其他極向場線圈磁場和等離子體電流等的干擾,加之實驗環(huán)境中的其他不確定因素也會對等離子體水平位移產(chǎn)生一定的干擾。因此,在輸入的電壓控制信號中疊加一定比例的高斯白噪聲干擾信號,仿真結(jié)果顯示,MRAC 控制系統(tǒng)的位移輸出信號依然能很好地跟蹤到參考信號,與加入干擾信號之前跟蹤曲線相比,穩(wěn)定性良好,說明本文設(shè)計的控制系統(tǒng)有很強的抗擾動性,仿真結(jié)果如圖 9 所示。
目前,HL-2A 裝置的等離子體水平位移控制采用的是基于 PD 調(diào)節(jié)的反饋控制方式[17]。為了更全面評價 MRAC 系統(tǒng)的性能,本文也使用了 PD 反饋控制的方法對等離子水平位移模型進(jìn)行了仿真實驗,兩種控制方式的響應(yīng)結(jié)果如圖 10 和圖 11 所示。可以看出,MRAC 系統(tǒng)的響應(yīng)速度更快,PD 反饋控制的延遲稍大。在控制電壓信號上,MRAC 系統(tǒng)和 PD 反饋控制一樣,對垂直線圈控制電源的要求都較低。
4 結(jié)論
目前 HL-2A 裝置在等離子體位移控制方面,是從物理原理出發(fā)建立線性響應(yīng)模型,不能很好地反映放電實驗中等離子體的真實位移。從工程應(yīng)用出發(fā),等離子體位移數(shù)據(jù)在時間和空間上具有一定的關(guān)聯(lián)性,而深度神經(jīng)網(wǎng)絡(luò)中的 GRU 網(wǎng)絡(luò)在處理長時間序列具有很大的優(yōu)越性,不僅能在時間軸上自主關(guān)聯(lián)序列中的信息,還具有較強的記憶學(xué)習(xí)能力。
結(jié)合深度學(xué)習(xí)框架中的 GRU 網(wǎng)絡(luò),利用 HL-2A 裝置的歷史實驗數(shù)據(jù),設(shè)計一個基于 GRU 的 HL-2A 裝置等離子體水平位移模型。通過測試集對訓(xùn)練出的水平位移模型進(jìn)行驗證,并使用 RMSE 和 R2兩個指標(biāo)對模型進(jìn)行評價,測試集樣本的 RMSE 值都在 0.4 以下,表明建立的水平位移模型輸出的位移數(shù)據(jù)序列精確度較高;擬合度高于 80%的樣本占比 43%,即 137 組測試樣本集中有 59 組樣本的擬合度高于 80%,擬合效果最好的可達(dá) 97%,表明模型輸出的位移曲線與實際的位移曲線擬合度很高,從而驗證了從實驗數(shù)據(jù)出發(fā)建立等離子體位移模型的可行性、有效性。
RBF 神經(jīng)網(wǎng)絡(luò)在非線性系統(tǒng)控制方面有很大的優(yōu)越性,結(jié)合 RBF 神經(jīng)網(wǎng)絡(luò)和 MRAC 理論,以訓(xùn)練好的等離子體水平位移預(yù)測模型網(wǎng)絡(luò)為被控對象,設(shè)計出了 MRAC 系統(tǒng)。通過施加階躍響應(yīng)信號和高斯白噪聲,響應(yīng)曲線表明系統(tǒng)均能很快的跟蹤目標(biāo)信號,且系統(tǒng)能自動地跟蹤控制器的參數(shù)變化,進(jìn)行自適應(yīng)調(diào)整。與目前的 PD 反饋控制方法相比,MRAC 系統(tǒng)的響應(yīng)特性更好,抗擾動性更強,能滿足高參數(shù)等離子體物理實驗對控制器精度要求。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >