摘要: 針對(duì)現(xiàn)有機(jī)械手移動(dòng)偏差控制技術(shù)存在的軌跡控制不連續(xù)、復(fù)雜度高、綜合效率低等問題,以機(jī)器學(xué)習(xí)和深度學(xué)習(xí)為基礎(chǔ)提出一種混合神經(jīng)網(wǎng)絡(luò)控制算法。分析機(jī)械手各關(guān)節(jié)、連桿的空間坐標(biāo)轉(zhuǎn)換關(guān)系,以 RBF 為基礎(chǔ)構(gòu)建混合神經(jīng)網(wǎng)絡(luò)模型,選用逆多二次函數(shù)作為模型的激活函數(shù),分別確定中間隱層和輸出層的權(quán)值; 引入 LSTM 長(zhǎng)短記憶算法,利用 LSTM 算法的輸入門、遺忘門和輸出門結(jié)構(gòu)設(shè)計(jì),抑制坐標(biāo)數(shù)據(jù)訓(xùn)練時(shí)出現(xiàn)的梯度膨脹問題,并給出精確的軌跡修正指令。仿真結(jié)果表明: 提出的混合神經(jīng)網(wǎng)絡(luò)算法采樣點(diǎn)軌跡偏差均值為 0. 02 mm,VARP 值趨近于 0,具有更好的自動(dòng)控制穩(wěn)定性和更高的控制效率。
關(guān)鍵詞: 混合神經(jīng)網(wǎng)絡(luò); 機(jī)械手; 自動(dòng)控制; RBF 神經(jīng)網(wǎng)絡(luò); LSTM 算法
唐翠微 機(jī)床與液壓 2021-11-28
工業(yè)機(jī)械手自動(dòng)化控制是一項(xiàng)集機(jī)械制造、控制工程、計(jì)算機(jī)科學(xué)、傳感器技術(shù)、仿生學(xué)、人工智能等技術(shù)于一身的前沿技術(shù)[1-2]。隨著現(xiàn)有工業(yè)機(jī)械手控制技術(shù)的不斷發(fā)展,在許多高溫、高壓、高輻射性及污染性較強(qiáng)的惡劣環(huán)境下,機(jī)械手能夠替代人工完成作業(yè)任務(wù)[3]。對(duì)比早期的工業(yè)機(jī)械手,現(xiàn)有工業(yè)機(jī)械手不僅在小型化、輕量化及控制精度上有了本質(zhì)改善,且制造成本也大為降低[4],使得工業(yè)機(jī)械手能夠應(yīng)用到工業(yè)生產(chǎn)線,提高產(chǎn)品生產(chǎn)和加工的效率[5]。伴隨著新一輪技術(shù)革命的到來(lái),工業(yè)機(jī)械手控制技術(shù)正朝著集成化、模塊化、智能化的方向發(fā)展,并且機(jī)械手控制技術(shù)與人工智能、機(jī)器學(xué)習(xí)、遠(yuǎn)程控制等技術(shù)結(jié)合緊密程度不斷提高[6-7],工業(yè)機(jī)械手的應(yīng)用領(lǐng)域也朝著高精度的方向發(fā)展。
機(jī)械手移動(dòng)軌跡自動(dòng)控制是機(jī)械手的核心研究問題。現(xiàn)有的軌跡控制方法主要包括曲線擬合控制、模糊推理控制、PID 控制等。其中曲線擬合方案通過(guò)對(duì)多項(xiàng)式序列權(quán)值的優(yōu)化調(diào)整[8],實(shí)現(xiàn)對(duì)機(jī)械手行進(jìn)軌跡的修正和自動(dòng)控制,但曲線擬合很難滿足機(jī)械手行進(jìn)軌跡的連續(xù)性,且修正局部曲線時(shí)容易導(dǎo)致相鄰段的軌跡出現(xiàn)偏差; 模糊推理控制算法在軌跡控制中先將輸入指令轉(zhuǎn)換為模糊量,再基于模糊規(guī)則得到清晰的輸出控制量,該種方式適合于指令集較為復(fù)雜的機(jī)械手系統(tǒng)[5],但模糊控制算法的模糊規(guī)則及隸屬度函數(shù)的確定極為復(fù)雜,制約了該控制方法的進(jìn)一步推廣使用; PID 控制是一種使用范圍十分廣泛的控制算法[9],PID 控制器具有結(jié)構(gòu)簡(jiǎn)單、控制效率高等優(yōu)點(diǎn),但由于誤差積分的引入容易引起積分飽和[10]和控制量飽和[11],進(jìn)而降低對(duì)機(jī)械手整體的控制精度。隨著人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的不斷發(fā)展,它們與機(jī)械領(lǐng)域的結(jié)合緊密程度不斷提高,本文作者將多種神經(jīng)網(wǎng)絡(luò)算法進(jìn)行深度融合,提出一種混合神經(jīng)網(wǎng)絡(luò)算法,用于機(jī)械手移動(dòng)軌跡的控制,以彌補(bǔ)現(xiàn)有控制算法的不足,改善控制精度。
1 機(jī)械手空間運(yùn)動(dòng)學(xué)分析
機(jī)械手的結(jié)構(gòu)相對(duì)復(fù)雜,連桿和關(guān)節(jié)之間具有強(qiáng)耦合性和高度非線性特征,在機(jī)械手負(fù)重移動(dòng)過(guò)程中還有很多不確定因素對(duì)移動(dòng)軌跡造成影響。機(jī)械手末端執(zhí)行器在設(shè)定好的程序控制下,沿指定軌跡移動(dòng),機(jī)械手關(guān)節(jié)和連桿的移動(dòng)及空間坐標(biāo)轉(zhuǎn)換以末端執(zhí)行器為基礎(chǔ)做出適時(shí)調(diào)整[12-13]。機(jī)械手由多個(gè)連桿和關(guān)節(jié)組成,關(guān)節(jié)及連桿復(fù)雜的坐標(biāo)變換可以通過(guò)齊次坐標(biāo)來(lái)表示[14-15]。機(jī)械手運(yùn)動(dòng)過(guò)程中各連桿參數(shù)和關(guān)節(jié)的空間坐標(biāo)關(guān)系見圖 1。
機(jī)械手運(yùn)動(dòng)齊次坐標(biāo)系中包含的 4 個(gè)核心參數(shù)分別為 θi、di、Li 和 βi,當(dāng) 4 個(gè)核心參數(shù)確定以后,相鄰連桿和關(guān)節(jié)之間的空間位姿關(guān)系和相對(duì)坐標(biāo)即確定。4 個(gè)參數(shù)的內(nèi)涵見表 1。
當(dāng)表 1 中的各項(xiàng)參數(shù)被確定后,即可確定關(guān)節(jié) i - 1 和關(guān)節(jié) i 之間的空間坐標(biāo)關(guān)系,而關(guān)節(jié) i 的空間坐標(biāo)變換矩陣 Gi 參數(shù)變量表示為 Gi = cosθi - sinθ1 cosθi sinθisinβi βicosθi sinθi cosθicosβi - cosθisinθi βisinθi 0 sinθ1 cosθi di 0 0 0 1 ???????????? ( 1) 坐標(biāo)變換矩陣是機(jī)械手正向運(yùn)動(dòng)、逆向運(yùn)動(dòng)求解的基礎(chǔ),機(jī)械手關(guān)節(jié)空間坐標(biāo)與笛卡爾空間坐標(biāo)的轉(zhuǎn)換過(guò)程見圖 2。
以六自由度機(jī)械臂為例,機(jī)械手的正向運(yùn)動(dòng)學(xué)方程表示為0 6F: 0 6F= G1·G2·G3·G4·G5·G6 = 0 1F( θ1 ) 1 2F( θ2 ) 2 3F( θ3 ) 3 4F( θ4 ) 4 5F( θ5 ) 5 6F( θ6 ) ( 2) 通過(guò)設(shè)定每個(gè)關(guān)節(jié)的初始位置,并將各參數(shù)輸入變換矩陣,即可計(jì)算出機(jī)械臂末端執(zhí)行器的軌跡坐標(biāo)。逆向運(yùn)動(dòng)是已知笛卡爾空間坐標(biāo)系,求解各關(guān)節(jié)、連桿坐標(biāo)的過(guò)程。逆向求解的過(guò)程更為復(fù)雜,但機(jī)械手末端執(zhí)行器的軌跡點(diǎn)坐標(biāo)值與各關(guān)節(jié)變換矩陣的乘積相等,聯(lián)立方程組可以求出機(jī)械手運(yùn)動(dòng)過(guò)程中的空間坐標(biāo)。在實(shí)際計(jì)算中由于解方程組的方法過(guò)于復(fù)雜,常用求變換矩陣的逆矩陣方法獲得最終的結(jié)果,先依次求出關(guān)節(jié) 1 和關(guān)節(jié) 2 的逆矩陣,再向右與 G-1 6 相乘: G-1 2 ·G-1 1 ·0 6F·G-1 6 = G3·G4·G5 ( 3) 由于笛卡爾空間矩陣和機(jī)械手移動(dòng)矩陣恒等式關(guān)系的存在,可依次求出機(jī)械手各關(guān)節(jié)的旋轉(zhuǎn)角度與連桿空間移動(dòng)距離。
2 混合神經(jīng)網(wǎng)絡(luò)模型的建立
工業(yè)機(jī)械手移動(dòng)過(guò)程的控制屬于一種典型非線性控制,盡管經(jīng)典 BP 神經(jīng)網(wǎng)絡(luò)系統(tǒng)具有較強(qiáng)的自學(xué)習(xí)能力,但其在參數(shù)選擇及數(shù)據(jù)訓(xùn)練中存在收斂慢、映射能力弱等不足。近年來(lái),隨著人工智能和機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展和進(jìn)步,各種新的深度學(xué)習(xí)算法在數(shù)據(jù)計(jì)算能力、學(xué)習(xí)能力和訓(xùn)練能力等方面已經(jīng)有了較大的突破。本文作者將 RBF( Radial Basis Function,徑向基函數(shù)) 神經(jīng)網(wǎng)絡(luò)和 LSTM( Long Short - Term Memory,長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)) 進(jìn)行深度融合,其中 RBF 能夠?qū)⒉杉降漠?dāng)前機(jī)械手各關(guān)節(jié)、連桿的空間坐標(biāo)數(shù)據(jù)輸入徑向基函數(shù),實(shí)現(xiàn)移動(dòng)坐標(biāo)數(shù)據(jù)從低維到高維的轉(zhuǎn)換,輸出標(biāo)準(zhǔn)化的、與理論軌跡偏差更小的控制指令; 而 LSTM 能夠從原始機(jī)械手移動(dòng)坐標(biāo)數(shù)據(jù)中提取到時(shí)序特征,以更準(zhǔn)確地傳達(dá)指令,并更好地修正機(jī)械手末端執(zhí)行器軌跡。混合神經(jīng)網(wǎng)絡(luò)模式在結(jié)構(gòu)設(shè)計(jì)上以 RBF 為基礎(chǔ),其中輸入量 P、輸出量 Q 和輸入偏移 B 分別如下: P = p1,p2,···,pn [ ] T ∈ Rn Q = q1,q2,···,qm [ ] T B = b1,b2,···,bm [ ] { T ( 4) 設(shè) ω ∈ Rn×m 為中間隱含層到輸出層的權(quán)值,函數(shù) φi ( p) 為混合神經(jīng)網(wǎng)絡(luò)隱含層內(nèi)第 i 個(gè)節(jié)點(diǎn)所對(duì)應(yīng)的激活函數(shù),第 i 個(gè)節(jié)點(diǎn)對(duì)應(yīng)的中心值為 ci。混合神經(jīng)網(wǎng)絡(luò)中間隱含層設(shè)計(jì)以 RBF 神經(jīng)網(wǎng)絡(luò)為主體,就能夠保持中心點(diǎn)徑向?qū)ΨQ,通過(guò)控制輸入量與中心點(diǎn)距離,調(diào)整激勵(lì)函數(shù)的激活值。混合神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)設(shè)計(jì)見圖 3。
在徑向基函數(shù)的選擇方面,混合神經(jīng)網(wǎng)絡(luò)以逆多二次函數(shù)作為激活函數(shù): φi ( pi ) = 1 ( p 2 i + η2 ) 1 /2 ( 5) 輸入混合神經(jīng)網(wǎng)絡(luò)模型的機(jī)械手空間位移樣本,首先經(jīng)過(guò)聚類處理確定數(shù)據(jù)的中心點(diǎn),再通過(guò)激活函數(shù)和模型擴(kuò)展系數(shù)確定輸入數(shù)據(jù)與中心點(diǎn)的距離。輸入數(shù)據(jù)的訓(xùn)練過(guò)程步驟: 步驟 1,利用激活函數(shù)確定輸入數(shù)據(jù)隱含層節(jié)點(diǎn)的中心值。步驟 2,確定聚類中心后,計(jì)算已輸入的機(jī)械手空間位姿坐標(biāo)值與聚類中心的距離 ‖pi - ci‖。步驟 3,基于最小距離原則對(duì)數(shù)據(jù)進(jìn)行分類,當(dāng)滿足如下條件時(shí),得到的訓(xùn)練數(shù)據(jù)為滿足控制條件的輸入數(shù)據(jù): φi‖pi - ci‖ = min‖pi - ci‖ ( 6) 當(dāng)滿足條件 ci ( i + 1) ≠ ci ( i) 時(shí)輸入數(shù)據(jù)點(diǎn)的聚類過(guò)程結(jié)束。步驟 4,當(dāng)混合神經(jīng)網(wǎng)絡(luò)中間隱含層節(jié)點(diǎn)擴(kuò)展系數(shù)確定以后,再分別計(jì)算輸出層的權(quán)值 ω。
3 算法融合與機(jī)械手移動(dòng)軌跡的控制修正
RBF 神經(jīng)網(wǎng)絡(luò)模型與經(jīng)典 BP 算法、CNN 算法等一樣,在反向傳播計(jì)算中易出現(xiàn)梯度爆炸的情況,為此本文作者利用 LSTM 算法對(duì) RBF 模型進(jìn)行優(yōu)化,構(gòu)建一種混合神經(jīng)網(wǎng)絡(luò)模型。LSTM 具有很強(qiáng)的記憶性,能夠有效解決輸入數(shù)據(jù)訓(xùn)練和學(xué)習(xí)中的時(shí)序排列問題,并提取機(jī)械移動(dòng)軌跡的波動(dòng)特征,實(shí)現(xiàn)軌跡的修正和糾偏。LSTM 引入了門的機(jī)制來(lái)解決梯度下降問題,LSTM 神經(jīng)網(wǎng)絡(luò)算法模型包含了輸入門、遺忘門和輸出門,LSTM 門的結(jié)構(gòu)設(shè)計(jì)如圖 4 所示。
圖 4 中 ξt 作為混合神經(jīng)網(wǎng)絡(luò)的遺忘門,決定了在 t 時(shí)刻輸入數(shù)據(jù)特征狀態(tài)的保留情況,其取值區(qū)間在 0 ~ 1 之間,當(dāng) ξt 值為0 時(shí)表示完全遺忘,ξt 值為1 時(shí)代表完全保留: ξt = φt ( wξ·pit + bξ ) ( 7) 式: φt 為混合神經(jīng)網(wǎng)絡(luò)模型在 t 時(shí)刻對(duì)應(yīng)的激活函數(shù); wξ 為遺忘門 ξt 對(duì)應(yīng)的權(quán)重矩陣; bξ 為與遺忘門對(duì)應(yīng)的偏置。輸入門 it 決定了在 t 時(shí)刻,混合神經(jīng)網(wǎng)絡(luò)中間隱層能有多少狀態(tài)單元 Jt 被保留: it = φt ( wi·pit + bi ) Jt = ξt·Jt -1 + pt ( 8) 式中: Jt -1 為上一期狀態(tài)單元。LSTM 算法中的當(dāng)前記憶與上一期的長(zhǎng)期記憶 Jt -1 組合,形成了新的單元狀態(tài)。經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò)訓(xùn)練和數(shù)據(jù)迭代后,輸出值 qt 表示為 qt = ot·tanhJt ot = φt ( wo·pit + bo ) ( 9) 輸入的空間位姿數(shù)據(jù)、移動(dòng)數(shù)據(jù)經(jīng)混合神經(jīng)網(wǎng)絡(luò)模型精確計(jì)算后,當(dāng)前的移動(dòng)軌跡與理論軌跡偏差及線速度、角速度偏差指標(biāo)被反饋到控制中心,并重新給出新的移動(dòng)指令。考慮到機(jī)械手軌跡的跟蹤控制至少需要調(diào)整線速度和角速度兩個(gè)變量,機(jī)械手末端執(zhí)行器整體被看做一個(gè)質(zhì)點(diǎn),機(jī)械手在 t 時(shí)刻移動(dòng)的線速度 vt 為機(jī)械手移動(dòng)方向的切線速度; 而機(jī)械手移動(dòng)的角速度 ωt 為單位時(shí)間內(nèi)的關(guān)節(jié)旋轉(zhuǎn)角度: ωt =Δθ /Δt ( 10) 軌跡移動(dòng)自動(dòng)化控制的目的是在下一個(gè) t+1 時(shí)刻尋找與理論運(yùn)動(dòng)控制向量 ( vt+1,ωt+1 ) T 偏差最小的空間坐標(biāo)集合,即: lim ( Δvt,Δωt ) T →0 ( 11) 在混合神經(jīng)網(wǎng)絡(luò)模型控制下,能夠隨時(shí)監(jiān)控和反饋笛卡爾坐標(biāo)系下機(jī)械手的實(shí)時(shí)位姿,通過(guò)混合模型中間隱層對(duì)輸入坐標(biāo)數(shù)據(jù)空間位姿的計(jì)算和判斷,確定軌跡局部偏差值范圍,再通過(guò)參數(shù)運(yùn)算、逆向求解計(jì)算出在機(jī)械手關(guān)節(jié)空間的當(dāng)前坐標(biāo)值。模型給出糾偏后的參考運(yùn)動(dòng)軌跡,能夠保證局部坐標(biāo)系下軌跡偏差最低,機(jī)械手移動(dòng)過(guò)程動(dòng)態(tài)糾偏始終存在,LSTM 計(jì)算上一個(gè)時(shí)間周期狀態(tài)單元與當(dāng)前周期狀態(tài)單元的狀態(tài)偏差,自動(dòng)控制輸出結(jié)果的偏差,以達(dá)到控制機(jī)械手動(dòng)態(tài)全局軌跡的目的。
4 仿真分析
4. 1 實(shí)驗(yàn)準(zhǔn)備與參數(shù)設(shè)定
為進(jìn)一步驗(yàn)證混合神經(jīng)網(wǎng)絡(luò)算法在機(jī)械手軌跡修正方面的效果,以本地某汽車制造企業(yè)的焊接機(jī)械手為研究對(duì)象,實(shí)地測(cè)量和記錄了機(jī)械手的各項(xiàng)工作參數(shù)及焊接過(guò)程中焊道接縫的軌跡出現(xiàn)的偏離情況。以工業(yè)機(jī)械手的真實(shí)工作參數(shù)為基礎(chǔ),并借助 MATLAB 仿真系統(tǒng)模擬焊接機(jī)械手的工作過(guò)程。焊接機(jī)械手的實(shí)物圖及 MATLAB 軌跡模擬仿真分別如圖 5 和圖 6 所示。機(jī)械手與末端執(zhí)行器臨近的兩個(gè)關(guān)節(jié) ( 關(guān)節(jié) 5 和關(guān)節(jié) 6) 、連桿運(yùn)動(dòng)過(guò)程對(duì)末端執(zhí)行器的影響最大,以規(guī)劃和控制該段軌跡為例驗(yàn)證提出的基于混合神經(jīng)圖 6 基于 MATLAB 的機(jī)械手運(yùn)動(dòng)模擬網(wǎng)絡(luò) 算 法 的 自 動(dòng) 控 制效果。機(jī) 械 手 末 端 執(zhí)行器 的 初 始 點(diǎn) 坐 標(biāo) 為 ( -20,- 10,16) cm,機(jī)械 臂 軌 跡 自 控 控 制前,關(guān) 節(jié) 5 和 關(guān) 節(jié) 6 的齊 次 坐 標(biāo) 系 的 參 數(shù)設(shè)定見表 2。
4. 2 實(shí)驗(yàn)結(jié)果與分析
從機(jī)械手關(guān)節(jié) 5 到末端執(zhí)行器的規(guī)劃路徑上,隨機(jī)選取 15 個(gè)樣本數(shù)據(jù)點(diǎn),觀測(cè)經(jīng)過(guò)混合神經(jīng)網(wǎng)絡(luò)算法修正控制后實(shí)際軌跡與理論軌跡之間的偏差。為了使評(píng)判結(jié)果更為客觀,同時(shí)引入了傳統(tǒng)的曲線擬合控制、模糊推理控制和 PID 控制參與對(duì)比。軌跡糾偏結(jié)果見表 3。
采樣點(diǎn)數(shù)據(jù)統(tǒng)計(jì)結(jié)果顯示: 多個(gè)采樣點(diǎn)軌跡與理論值比較,混合神經(jīng)網(wǎng)絡(luò)算法自動(dòng)控制后實(shí)際軌跡與理論值偏差均值較小,遠(yuǎn)低于 3 種現(xiàn)有控制算法,能夠更好地滿足企業(yè)焊道要求; 而從 VARP 值的統(tǒng)計(jì)結(jié)果來(lái)看,混合神經(jīng)網(wǎng)絡(luò)算法 VARP 值精確到 0. 01 后趨近于 0,而曲線擬合方法和 PID 控制方法的 VARP 值分別為 0. 02,表明機(jī)械手軌跡經(jīng)過(guò)自動(dòng)化控制后,局部仍有較大的偏差。機(jī)械手被廣泛應(yīng)用到工業(yè)領(lǐng)域,除了考慮移動(dòng)軌跡的控制精度以外,工作效率也是衡量機(jī)械手性能的重要指標(biāo)之一。將仿真迭代次數(shù)設(shè)定為 60 次,觀測(cè)優(yōu)化前和優(yōu)化后關(guān)節(jié) 5 和關(guān)節(jié) 6 運(yùn)動(dòng)時(shí)間的變化,見圖 8 和圖 9。
焊接機(jī)械手移動(dòng)過(guò)程中基于混合神經(jīng)網(wǎng)絡(luò)算法優(yōu)化后,關(guān)節(jié) 5 和關(guān)節(jié) 6 的移動(dòng)時(shí)長(zhǎng)分別減少了 0. 530 s 和 0. 495 s,對(duì)于企業(yè)而言,能夠顯著提高批量作業(yè)的效率。
5 結(jié)束語(yǔ)
隨著人工智能技術(shù)、機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展和進(jìn)步,以神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)為代表的智能算法越來(lái)越多地被應(yīng)用到工業(yè)制造領(lǐng)域。在機(jī)械手軌跡自動(dòng)控制和偏差修正中,本文作者將 RBF 神經(jīng)網(wǎng)絡(luò)與 LSTM 算法進(jìn)行了深度融合,利用 LSTM 長(zhǎng)短記憶結(jié)構(gòu)門的設(shè)計(jì),抑制神經(jīng)網(wǎng)絡(luò)隱含層數(shù)據(jù)訓(xùn)練中出現(xiàn)的梯度膨脹問題,提高軌跡定位的精度。仿真實(shí)驗(yàn)結(jié)果也證明: 混合神經(jīng)網(wǎng)絡(luò)自動(dòng)控制算法,對(duì)于軌跡偏差糾正和機(jī)械手工作效率提高具有良好的改善作用。
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >