時間:2021-09-24
2021世界機器人大會第一天線下主論壇——“領(lǐng)航峰會”群星璀璨,產(chǎn)、學、研各領(lǐng)域大咖齊聚首,共話巔峰,為機器人未來發(fā)展領(lǐng)航。
峰會現(xiàn)場,世界工程組織聯(lián)合會主席、中國電子學會副理事長龔克上臺發(fā)言,演講主題為《新趨勢:AI+機器人》。以下為龔克副理事長演講內(nèi)容全文整理。
各位老師、各位同事、各位朋友,大家上午好!我的標題還有一個副標題“門外漢的思考”,王天然老師是真正門內(nèi)的,我只是門外漢。人工智能發(fā)展戰(zhàn)略研究院是中國工程院和天津市合作在南開大學的一個智庫機構(gòu),就是研究戰(zhàn)略的,不是研究具體技術(shù)。2017年國務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》是一個中長期規(guī)劃,時間是2017年到2030年,我們觀察的是規(guī)劃進展過程中有什么問題,特別關(guān)注和實體經(jīng)濟的結(jié)合是怎樣的,所以中間也會涉及到工業(yè)和機器人。前面的幾位發(fā)言者都認同一個趨勢,就是AI和Robot的結(jié)合,王耀南和John Hennessy都有談到這一點,下面我談一談我的看法。
趨勢是一個時間軸的概念,按照總書記的話來講,社會發(fā)展史上人類經(jīng)歷了農(nóng)業(yè)革命、工業(yè)革命,正在經(jīng)歷信息革命。我們現(xiàn)在說的智能化其實是信息革命的一個階段,信息自古就有,信息革命是從數(shù)字化開始發(fā)動起來的,網(wǎng)絡(luò)化將其提升到了一個非常重要的階段,現(xiàn)在進入一個新的階段就是智能化階段,我認為這是信息化革命中的一個新的階段。信息革命和工業(yè)革命有什么不一樣呢?工業(yè)革命是拓展人類的體力,信息革命則是增強人類的腦力。機器人最早出來也是解決體力問題的,因為機器本來就是解決體力問題的,但機器人是從解決體力加上腦力融合起來。機器人從剛開始就是有一點智能的,現(xiàn)在只不過智能化的水平處于提高階段,剛開始要是一點智能沒有的話就是一個機器,只是Machine而不是Robot,Robot就是帶有一點智能的。
那么智能化是誰在推動呢?人工智能是引領(lǐng)這一輪科技產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù),具有溢出性、帶動性很強的頭雁效應(yīng),這句話是習近平總書記說的,代表我們國家對智能化的重要判斷。什么是AI呢?其實AI有不同的概念,我的理解是分為人工和智能兩個方面:智能是經(jīng)濟學習形成的一個自主的感知、認知和決策能力,感知和決策能力沒有問題,但我特意加上這是學習形成的。一個孩子生下來哪怕大腦特別發(fā)達,如果不讓孩子學習,關(guān)起來只吃飯,那不會有什么智能。人工智能就在于這個智力是依托于一個人工設(shè)計的裝置,通過人工設(shè)計的算法、人工直接或者間接提供的數(shù)據(jù)進行學習。目前這個裝置運用得越來越多,就是Robot,智能要在這個裝置上發(fā)揮作用。
這些年來人工智能的研究不斷增長,今年早些時候我們做了統(tǒng)計,2018年以來不斷增長,這些研究論文涉及到的應(yīng)用領(lǐng)域也在不斷拓展。新一代人工智能有幾個關(guān)鍵技術(shù),大數(shù)據(jù)智能、群體智能、人機混合智能、自主無人智能、跨媒體智能都在向前發(fā)展,而這些在發(fā)展的過程中要解決人工智能發(fā)展的幾個瓶頸問題。John Hennessy剛才特別強調(diào)機器學習要依賴大量的數(shù)據(jù)和大量的算力,數(shù)據(jù)的可用性和質(zhì)量問題就是現(xiàn)在新一代人工智能面臨的第一個大的問題。大量數(shù)據(jù)的獲得不是那么容易的,目前Infinite Net大概有5000個圖在上面,每個Object都有很多的圖,這些都是互聯(lián)網(wǎng)搜集起來的,而且是眾包的形式做了標注,有的時候上一個軟件可以識別哪個是貓、哪個圖里有燈桿,其實都是幫他們在做這個圖的標注。一般的企業(yè)沒有那種能力獲得這么大量的數(shù)據(jù),花不起那樣的成本去做這種標注,甚至由于數(shù)量特別大,用的算力也特別大,所以這是我們碰到的第一個特別重大的瓶頸。
剛才John Hennessy提到能量的瓶頸,人類折算成功率的話大約是20W,機器至少是它的1000倍,就是現(xiàn)在我們用的機器學習,李世石和Alpha-Go下棋的時候,Alpha-Go是花了3000美元的電費,可想而知電量有多大。目前我們在這方面已經(jīng)有了一定進展,比如TB3自然語言的預訓練模型,利用大量數(shù)據(jù)、大量算力,由我們主要的平臺企業(yè)事先訓練好,這些是關(guān)于自然語言處理的模型,可以達到人類的程度,有了這個模型以后就是開源的,去年8月份這個模型完全開源,我們現(xiàn)在做自然語言處理的這些公司就可以在開源的基礎(chǔ)上利用特殊場景的特殊語音資料做詳細說明,比如加上云南話和廣東話,那么就不需要特別大的數(shù)據(jù)量、特別大的計算量。去年北京元智研究所的清華團隊發(fā)表了比這個參數(shù)還要大的模型,達到1750億個參數(shù),也就是175GB的參數(shù),任何一個復雜函數(shù)可以用無窮多的簡單函數(shù)的級數(shù)精確進行模擬,這個無窮多就是參數(shù),只要參數(shù)足夠多就可以足夠逼近,但這里計算量和代價非常大,有了預渲染模型門檻就可以降低。
算法需要加速,過去我們說計算機是CPU的天下,但這次人工智能計算就讓CPU有些不適應(yīng),因為人工智能的大量計算都是處理圖形,用不著CPU那么多邏輯的計算,用的是矢量和向量計算,所以就出現(xiàn)向量計算的GPU,Google還有Tensor Processing張量計算,包括NPU神經(jīng)網(wǎng)絡(luò)計算,這些新的硬件的產(chǎn)生不僅加速了計算的速度,而且降低了計算的能耗,使其有很大的進展。因為這是一個新的藍海,所以在這里,我國有些企業(yè)比如寒武紀和華為就打破了原來在CPU長期形成的壟斷性的英特爾一統(tǒng)天下,日本做了很多CPU都撼動不了,但這次硬件加速器有了新的進展。
目前也有出現(xiàn)一些新的算法,自動駕駛系統(tǒng)是一個非常復雜的機器人系統(tǒng),去年有一個重要的研究成果發(fā)表就是來自MIT維也納工業(yè)大學、奧地利科技學院的團隊用19個類腦神經(jīng)元實現(xiàn)了控制自動駕駛汽車,替代了數(shù)百萬個神經(jīng)元,使得計算量大大下降,能耗也大大下降,這在去年10月份的《自然》雜志發(fā)表。目前我們將其叫做ANN就是Artificial Neural Network,SNN是Spiking Neural Network,相當于一個脈沖,現(xiàn)在輸入進來的是實數(shù),各個層次中間傳輸?shù)臋?quán)重也都是實數(shù),脈沖的話涉及到到達時間,這個時候權(quán)重就可能會帶上延時,也是和人腦的情況更加接近,所以這是類腦神經(jīng)元。其實SNN最早出現(xiàn)和CNN幾乎是同時的,之所以在過去那些年沒有能夠做得這么好,主要是以CPU為主的計算機不適合計算SNN的網(wǎng)絡(luò),現(xiàn)在我們有了新的網(wǎng)絡(luò)以后就起來了。
圖中是中國人做的一項很重要的工作,去年在《Nature》發(fā)表,就是清華大學儀器系團隊做的芯片,也是使用了SNN,現(xiàn)在是自行車在跟隨、避障、轉(zhuǎn)彎、加速,跟隨人的速度,這些就是使用SNN和ANN融合的芯片,28×28毫米的大小。有的人說一輛自行車不用這么復雜,沒錯,不用SNN也可以平衡這個自行車,并不是說只有它才能平衡自行車,但我們用原有的人工神經(jīng)網(wǎng)絡(luò)做平衡自行車和現(xiàn)在芯片上實現(xiàn)ANN和SNN的結(jié)合,上限是什么樣子?恐怕將來就不是控制SNN,可以做得更好,所以這個叫做Dual Control,這是最重要的,自行車并不是那么重要。
類腦計算把SNN引進以后,由于這種特點,過去的幾年一直跟硬件的設(shè)計是緊密聯(lián)系在一起的,所以總是做一個軟硬結(jié)合的設(shè)計,缺少通用性,也是去年發(fā)表了一篇比較重要的文章,又是清華大學的團隊,這個團隊是計算機團隊,也是和機械學院的團隊緊密結(jié)合,提出一個理論就是類腦計算的完備性?,F(xiàn)在我們做CPU計算的時候不會擔心寫一個程序CPU執(zhí)行不了,因為使用的程序都是具有完備性的程序,CPU是具有完備性的硬件,總是可以執(zhí)行的,效率可能高也可能低,但是可以執(zhí)行,不會覺得某個軟件硬件不能執(zhí)行,前期的類腦計算就有這個問題,必須和硬件緊密結(jié)合設(shè)計。這個團隊中間提出了一個編譯層,現(xiàn)在的計算機把軟件和硬件分開的中間就是編譯層,《自然》雜志評價說完備性新概念推動類腦計算,對類腦系統(tǒng)存在的軟硬件緊耦合的問題是一個突破性的方案,我們認為這是AI近幾年比較重要的進展。
除了這些以外還有一個重要進展,就是使用新器件,叫做相變存儲器。我們說神經(jīng)網(wǎng)絡(luò)計算反復調(diào)整的是什么呢?就是輸出,本來應(yīng)該是貓,但輸出的不是貓,看一看跟貓有多少差距,然后是Backwards Propagation,反向調(diào)整的過程非常耗時耗力,通過隨機調(diào)整函數(shù)使得能量和效率大大提高。這是北大去年做的工作,去年發(fā)表出來以后也非常有影響。
我們看到無論是算法、理論、硬件和基礎(chǔ)器件,這些年都有重要的進步,盡管還沒有達到最終突破的階段。一方面是幾個關(guān)鍵技術(shù),另一方面是幾個瓶頸問題,新一代的人工智能器件正在向前發(fā)展,使得功能更強、效率更高,也有出現(xiàn)ANN、SNN結(jié)合這樣的新體系。
我們從產(chǎn)業(yè)上可以看到什么呢?過去三年我們研究院一直選擇以人工智能的解決方案為主業(yè)的企業(yè),去年有2205家,我們來看這些企業(yè)的資金是哪里來的,如果投資的話到哪里去,就是一進一出兩條線,可以連接到投資者和被投資者,同時也要看人才是哪里來的,要是跳槽的話到哪里去,所以根據(jù)資金、技術(shù)和人才關(guān)系聯(lián)系到背后有200多家大學、100多個研究所,參加1000多個會議,涉及到400多個聯(lián)盟,3741家投資者,地級以上政府的500多條政策,涉及到1000多個地級以上政府產(chǎn)業(yè)園,連成一個密密麻麻的圖,我們叫做價值網(wǎng)絡(luò)圖。
過去三年中我們看到了什么呢?2018年連接度最高的是BAT三個平臺,也是在這里起著非常明顯的重要作用,華為就已經(jīng)突出出來了,富士康也突出出來了,我們從這張圖可以看到和實體經(jīng)濟的結(jié)合越來越緊密,一些原來不是以這個為主業(yè)的企業(yè),由于采用人工智能技術(shù)正在其中起到越來越重要的作用,希望將來新松也可以在里面扮演一個非常重要的角色。
我們在新一代人工智能的理論、方法、器件的基礎(chǔ)上,五大技術(shù)都在向前發(fā)展,加上智能基礎(chǔ)設(shè)施建設(shè)、人才、法律、政策標準,我們正在構(gòu)建一個智能社會。
剛才說的是AI,再來說一說Robot。為什么要關(guān)心Robot?我們研究院提出培育高端高效的智能經(jīng)濟,主要是四條:大力發(fā)展人工智能的新興產(chǎn)業(yè),包括智能軟硬件、物聯(lián)網(wǎng)傳感器、智能終端、虛擬現(xiàn)實、智能運載和智能機器人,其中對智能機器人專門有一段規(guī)劃的描述,這是導致我們關(guān)心智能機器人發(fā)展情況的一個原因。大力發(fā)展智能產(chǎn)業(yè),其中特別提出智能制造,總書記在兩院大會上的講話就提到要以智能制造為主攻方向促進人工智能技術(shù)和實體經(jīng)濟的結(jié)合,而在智能制造中智能機器人又變成非常重要的角色。我們認為智能機器人和智能制造是工業(yè)和人工智能緊密結(jié)合的一條主線。
什么是機器人?我其實是非常困惑的,我是1970年進工廠當車工,直到1978年3月上大學,干了將近八年的車工,我們的車間基本上就是五六種產(chǎn)品,年復一年、日復一日,一天三班倒地干活,所以當時我看卓別林的《摩登時代》特別有同感。當時說的是資本主義把人變成機器,我想社會主義好像人也和機器差不多,整天重復做這種勞動,所以我最早理解的機器人是一個像機器那樣工作的人,后來我才知道機器人恰恰是讓人重新成為人,發(fā)展更好的東西讓人還原成人,而不是像機器那樣簡單地干活。八十年代初我出國留學,拿到ARV的獎學金,然后有一次讓我們這些外國留學生報名參加自動化工廠,我覺得這樣很好,這是一個機器人車間,當時我就提出第一個問題,機器人在哪里?他們說這就是機器人,我一下子才明白,機器人不是像人一樣的,這些就叫機器人。
ISO對機器人的定義是什么呢?工業(yè)機器人是一種具有自動控制、操作、移動功能,完成各種作業(yè)可編程的操作機,所以機器人不是人,是工具,因此才叫做Robot,特別是疫苗機器人最好叫做智能化醫(yī)療機械,不然醫(yī)生覺得聽著不是很順,好像要代替他們。
人工智能會出現(xiàn)什么問題呢?剛才說過圍欄式生產(chǎn),最早機器人不是圍欄式的,因為出了意外事故造成了死亡,所以有能力之憂,到底能不能可靠、安全、穩(wěn)定、敏捷、精確、靈活地完成各種各樣不同的任務(wù),協(xié)同起來完成任務(wù),高能效、零碳排地完成各種任務(wù),能不能保證受控,此外還有對成本的擔憂,對造成人的失業(yè)的擔憂,以及會不會把我們?nèi)祟惤o滅了。就像以前捷克的主席說要到我們那里開會,就說我們是機器人的故鄉(xiāng),我說Robota是什么意思?他說最開始是干重體力勞動的奴隸,我說機器干的其實就是這個,而且干得特別好。
要想解決這些問題,機器人需要增智,提高智力發(fā)育,但增智有一個前提,就是必須上網(wǎng),不上網(wǎng)就沒有大數(shù)據(jù),沒有大數(shù)據(jù)就很難和人工智能結(jié)合,而且還要立德,就是要有道德,我們現(xiàn)在要把這種倫理植入系統(tǒng),做到可檢測、可檢驗,不只是寫在紙上的。
要想做到二者結(jié)合,信息技術(shù)和制造技術(shù)深度結(jié)合,原來信息工業(yè)化本來說的就是這些,這種融合體現(xiàn)在體現(xiàn)在以機器人為載體,以工業(yè)互聯(lián)網(wǎng)為基礎(chǔ),進入制造業(yè)互聯(lián)網(wǎng),新一代人工智能和實體經(jīng)濟深度融合。
這條曲線是大家都比較熟悉的,左邊講的是人,縱軸是智力,橫軸是環(huán)境,小的時候智力很小,隨著年齡增長可以達到很高的智力水平,智能機械的智力在一個確定的環(huán)境下可以達到越來越接近人的智力,如果環(huán)境越來越開放、越來越不受控的話,各種智能機的智力就越來越下降。
人是怎么智力增長的呢?不是隨著歲數(shù)簡單增長,而是在這個過程中實踐學習,通過經(jīng)驗逐漸增長,現(xiàn)在我們的智力系統(tǒng)就是通過引入學習,也在破這條逐漸下降的曲線,逐漸能夠適應(yīng)各種不同的工作環(huán)境,那么就需要這樣一個增長。
還有一個問題就是人機共融,機器本體的行為能力需要加強,需要更加敏捷,同時智能技術(shù)、智能水平要匹配人的水平,行為水平也要匹配人的水平,這樣才能跟人協(xié)同,如果機械動作可以匹配人,但智力不如人的話就不行,有的時候可能會出事故,或者只是智力達到了人,但動作特別不好的話也很難和人協(xié)同。
傳統(tǒng)的人工智能技術(shù)是做問題求解、定理證明、模式識別,就是專家智能、人機博弈,是在一個非行為空間起作用,也有確定性的因素和規(guī)則下的推理,現(xiàn)在我們正在突破。Robot是有行為能力,就是需要動的,約束條件有非預知性和動態(tài)性,操作和合作對象可能也存在隨機性,這個時候就要實時魯棒,這跟傳統(tǒng)人工智能是有差別的,我們就需要人工智能向前發(fā)展,讓機器人的智能發(fā)育和人工智能的發(fā)展相互配合起來。
這些是我們學校的研究工作,實際上要求類人的人工智能形成一個研究發(fā)育機理,包括研究對意圖的理解和行為決策能力,就是讓人工智能和機器人相向而行,共同支撐我們的智能制造,實現(xiàn)人工智能和實體經(jīng)濟的深度融合。
以上就是我對這些趨勢的理解,不對的地方請大家批評指正。