科學(xué)家研發(fā)出新型類腦學(xué)習(xí)方法
人工智能迫切需要借鑒生物系統(tǒng)中的微觀、介觀、宏觀等多尺度神經(jīng)可塑性融合計(jì)算機(jī)制,以啟發(fā)實(shí)現(xiàn)更加高效的類腦連續(xù)學(xué)習(xí)算法,消除人工神經(jīng)網(wǎng)絡(luò)因采用反向傳播(Backpropagation,BP)等人工學(xué)習(xí)方法而導(dǎo)致的廣泛災(zāi)難性遺忘現(xiàn)象。生物系統(tǒng)中常見的多巴胺、5-羥色胺、血清素、去甲腎上腺素等神經(jīng)調(diào)質(zhì)物,往往經(jīng)由特定的腺體釋放(圖1A),遠(yuǎn)程彌散、投射到一定范圍內(nèi)的目標(biāo)神經(jīng)元群體,并根據(jù)調(diào)質(zhì)濃度水平的不同,對(duì)局部的神經(jīng)元、突觸等多種微觀可塑性產(chǎn)生復(fù)雜的調(diào)制影響(圖1B)。
受到該生物神經(jīng)調(diào)制機(jī)制的啟發(fā),中國(guó)科學(xué)院自動(dòng)化研究所研究員徐波團(tuán)隊(duì)與中國(guó)科學(xué)院院士、腦科學(xué)與智能技術(shù)卓越創(chuàng)新中心高級(jí)研究員蒲慕明,以及臨港實(shí)驗(yàn)室研究員李澄宇等,通過建模多巴胺、乙酰膽堿等全局神經(jīng)調(diào)制可塑性(Neuromodulation Plasticity)、局部時(shí)序依賴可塑性(Spike Timing-Dependent Plasticity,STDP)等多尺度神經(jīng)可塑性機(jī)制,整合得到一種基于神經(jīng)調(diào)制依賴可塑性的新型類腦學(xué)習(xí)方法(Neuromodulation-Assisted Credit Assignment,NACA)。該方法參考了大腦中復(fù)雜的神經(jīng)調(diào)制通路結(jié)構(gòu),并以期望矩陣編碼的形式對(duì)神經(jīng)調(diào)制通路構(gòu)建數(shù)學(xué)模型(圖2A),在接受刺激信號(hào)后產(chǎn)生不同濃度的多巴胺監(jiān)督信號(hào)并進(jìn)一步影響局部突觸和神經(jīng)元可塑性類型(圖2B)。NACA支持采用純前饋的流式學(xué)習(xí)方法訓(xùn)練脈沖(Spiking Neural Network,SNN)和人工(Artificial Neural Network,ANN)神經(jīng)網(wǎng)絡(luò)(圖2D、E),通過全局多巴胺的彌散支持與輸入信號(hào)同步,甚至先于輸入信號(hào)的正向信息傳播,再加上選擇性的對(duì)STDP的調(diào)整,使得NACA表現(xiàn)出明顯的快速收斂和緩解災(zāi)難性遺忘優(yōu)勢(shì)。
在兩類典型的圖片和語音模式識(shí)別任務(wù)中,該團(tuán)隊(duì)從準(zhǔn)確率和計(jì)算成本兩方面對(duì)NACA算法進(jìn)行評(píng)估,并在SNN中選取了E-prop和BRP兩種全局學(xué)習(xí)算法作為對(duì)比,在ANN中則以TP(Target Propagation)和BP算法作為對(duì)比對(duì)象。在圖片分類(MNIST)和語音識(shí)別(TIDigits)標(biāo)準(zhǔn)數(shù)據(jù)集上,NACA均實(shí)現(xiàn)了更高的分類精度(約1.92%)和更低學(xué)習(xí)能耗(約98%)。在驗(yàn)證了靜態(tài)分類任務(wù)的擬合能力后,該研究重點(diǎn)測(cè)試NACA算法在Class-CL上的連續(xù)學(xué)習(xí)能力,并將神經(jīng)調(diào)制擴(kuò)充到神經(jīng)元可塑性范圍(圖3A、B)。在五大類的連續(xù)學(xué)習(xí)任務(wù)中(包括連續(xù)MNIST手寫數(shù)字、連續(xù)Alphabet手寫字母、連續(xù)MathGreek手寫數(shù)學(xué)符號(hào)、連續(xù)Cifar-10自然圖片、連續(xù)DvsGesture動(dòng)態(tài)手勢(shì)),NACA算法相對(duì)BP和EWC算法,具有更低的能耗且可緩解“災(zāi)難性遺忘”問題(圖3C-G)。
研究顯示,NACA是一類生物合理的全局優(yōu)化算法。這種采用宏觀可塑性來進(jìn)一步“調(diào)制”局部可塑性,可被視為是一種“可塑性的可塑性”(Plasticity of Plasticity)方法,與“學(xué)會(huì)學(xué)習(xí)”、“元學(xué)習(xí)”(Learn to Learn)等有直觀上的功能一致性。該算法同時(shí)在SNN和ANN的優(yōu)化問題中獲得了性能和計(jì)算成本上的優(yōu)勢(shì),更在連續(xù)學(xué)習(xí)這一更貼合生物生存環(huán)境和實(shí)際應(yīng)用場(chǎng)景的動(dòng)態(tài)任務(wù)范式下發(fā)揮重要作用。這些純前饋學(xué)習(xí)、低訓(xùn)練能耗、支持動(dòng)態(tài)連續(xù)學(xué)習(xí)等綜合特征,也將有望進(jìn)一步引導(dǎo)新型類腦芯片的設(shè)計(jì)。
相關(guān)研究成果以A brain-inspired algorithm that mitigates catastrophic forgetting of artificial and spiking neural networks with low computational cost為題,在線發(fā)表在《科學(xué)進(jìn)展》(Science Advances)上。研究工作得到中國(guó)科學(xué)院戰(zhàn)略性先導(dǎo)科技專項(xiàng)(A類)、上海市市級(jí)科技重大專項(xiàng)、臨港實(shí)驗(yàn)室專項(xiàng)、中國(guó)科學(xué)院青年創(chuàng)新促進(jìn)會(huì)等的支持。
圖1.?大腦中的神經(jīng)調(diào)制。(A)四種神經(jīng)調(diào)質(zhì)及其通路;(B)非線性神經(jīng)調(diào)制;(C)神經(jīng)調(diào)制多樣化局部可塑性。
圖2.?NACA計(jì)算模型。(A)神經(jīng)調(diào)制通路建模和群體期望編碼;(B)多類局部可塑性;(C-E)NACA算法整體流程及在SNN和ANN中發(fā)揮作用。
圖3.?NACA算法在Class-CL任務(wù)中的表現(xiàn)。(A、B)神經(jīng)調(diào)制同時(shí)影響局部神經(jīng)元和突觸可塑性;(C-G)NACA與EWC、BP等性能對(duì)比。
來源:中科院


本文系作者 @TIMEDOO 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉(zhuǎn)載。