ChatGPT呼嘯而來的近兩年,市場的大共識是AI即未來。但大概念之下,諸多命題爭議并未收斂:開源還是閉源?商業如何閉環?Scaling law的天花板在哪里?通往世界模型與AGI的途徑是否唯一?AI最終是否會失控?
這些討論中蘊含一個關鍵命題:Transformer機制是否是永遠的主導范式?
從全球AI從業者的行動來看,Transformer架構已經吸附了巨量的資本和人才,讓挑戰這一“鐵王座”的任務變得格外艱巨。然而,科技爆發如同自然進化和物種演進,沒有變異就沒有進化的原動力,缺乏多樣性往往意味著生態的脆弱,因此,「甲子光年」始終在尋找挑戰這一“鐵王座”的孤勇者。
這一次,我們迎來了RockAI巖芯數智。這家隸屬于巖山科技的新銳公司剛剛成立一年多,但早在2024年初便發布了非Transformer架構的Yan架構大模型,并在9月將其迭代至具有多模態能力的Yan1.3模型,實現了在手機、電腦,甚至樹莓派等廣泛設備端上的無損部署。
當前,大部分人工智能從業者所置身的是一場“由OpenAI提出概念,Meta負責開源,國內市場專注應用”的技術接力賽,但RockAI CEO劉凡平放棄了這條路。
在行業持續加碼數據和算力的軍備競賽中,劉凡平致力于基礎理論層創新,他認為,算法仍有機會在2024年實現革命性突破。在OpenAI等巨頭投入海量資源,旨在開發如神明一般無所不能的人工智能時,劉凡平堅信,行業不需要“造神”,也足以抵達AI巨變的另一種可能——群體智能。
本文,甲小姐對話RockAI巖芯數智CEO劉凡平。
1.“如果投入的資源和結果不成正比,那一定是在某個環節出了問題,我們認為這個環節就是算法”
甲小姐:在全球人工智能行業的聚光燈下,擺在AI從業者面前的是兩條路:一是不斷加大資金、能源和數據的投入追趕OpenAI等領先者的“造神”之路,二是尋找新的路徑。為什么RockAI選擇了后者?
劉凡平:我們也曾走在第一條路上,但到了2021年初,我意識到Transformer架構無法支撐我走得更遠。它在算力消耗、數據處理等方面存在諸多問題。因此,我們決定走一條全新的路,開發一種更優秀的模型。
眾所周知,人工智能的發展離不開三大要素:數據、算法和算力。其中,數據和算力都是有限的資源。我們不能依賴有限的資源來創造更偉大的成就,這種投入的成本也高得難以估量。“造神”工程對于現階段的我們來說越來越難。
如果投入的資源和結果不成正比,那一定是在某個環節出了問題,我們認為這個環節就是算法。當然算法的突破并非一蹴而就,我們需要在漫長的過程中不斷挑戰底層邏輯來實現創新。
甲小姐:目前市場在算力和數據方面投入越來越多,是什么讓你堅信當前的主要癥結仍在于算法?
劉凡平:我舉個例子,你知道人類大腦的功率是多少瓦嗎?
甲小姐:30瓦。
劉凡平:沒錯,30瓦不到,而一臺GPT服務器的功率遠超于此。人類僅憑20多瓦的功率就能產生更高級的智能——這表明,人類的聰明程度并不與算力直接相關。
在數據層面,我們訓練Transformer大模型通常需要10TB的數據。然而從小學到博士,我們學習的數據總量遠低于10TB。為什么人類能在如此低的數據量和算力下產生智能?我們認為是因為機器缺乏合適的算法。因此,算法才是核心。
從人工智能的發展來看,Transformer架構誕生于2017年,但在此之前我們已經進入了大數據時代,RNN、LSTM等模型在當時也很優秀,但總有更優秀的模型來替代它們。所以,盡管Transformer架構在當下很優秀,它也并不能代表未來。
甲小姐:不得不承認,Transformer在此時此刻是主導性范式。全世界和你持有相同觀點的人有多少?
劉凡平:挺多的。獲得圖靈獎的深度學習三巨頭(楊立昆、本杰奧和辛頓)在不同場合都提過現有模型架構的一些問題。今年上半年英偉達舉行GTC大會時,《Attention is All You Need》論文的作者之一也提到我們需要比Transformer更好的架構。
甲小姐:在今年5月的甲子引力大會上,我詢問了包括朱嘯虎、傅盛等嘉賓關于Transformer是否是“鐵王座”的問題。大家的觀點是,也許它并非最佳,但也看不到第二條出路。如果你要重新定義主流范式,那達到什么程度時,會讓你覺得這條路跑通了?
劉凡平:我們已經成功驗證了我們的技術路線,Yan架構大模型在某些方面已經超越了Llama3的表現;特別是在訓練效率、成本控制及推理吞吐量等方面,都展現出了明顯的優勢。
其次,我們的追求是讓每個人都能享受到AI帶來的便利,讓更多設備用上AI。現階段我們也達到了這樣的狀態,我們最低在樹莓派上就可以運行——相當于家里的機頂盒都可以用上大模型。這會讓每一個覺得大模型很遙遠的人都感受到它近了。
我們9月發布的Yan 1.3是完全在設備端運行的版本。最近舉行的開放日活動上,我們展示了搭載Yan1.3的多種設備,包括無人機、機器人、樹莓派、手機、AIPC等。Yan1.3還具備了多模態交互的能力,它能夠處理文本、視覺和音頻輸入,同時提供文本和音頻輸出,從而實現人機交互的過程。
甲小姐:在這么多終端上的多模態部署是如何實現的?
劉凡平:以樹莓派這類開發板為例,它不僅能被應用于家庭中的機頂盒,還能被集成到冰箱、洗衣機等多種家電產品中。這表明我們的技術可以廣泛應用于家庭和工作場所等多種環境。
但是把傳統的Transformer架構集成到這些設備上存在很多困難。目前主流的做法,如模型的量化、裁剪和蒸餾等,雖然可以將大模型壓縮來適應小型設備,但這些方法可能導致模型失真。失真是指在模型壓縮過程中,原始模型中的參數值被簡化為近似值,例如π被簡化為3.14。大量的參數縮減可能導致模型性能的顯著下降,從而影響實際應用的效果。我們希望實現無損部署,把自主學習能力衍生下來。
甲小姐:怎么做到從有損到無損的部署?
劉凡平:我們改變了Transformer的Attention機制。 在GTC大會上,有演講者提到,即使是執行簡單的計算任務,如2+2,傳統AI模型中的所有參數都會參與運算。然而人類的大腦并非這樣工作。你開車的時候會集中注意力在路面信息上,這時大腦中的視覺皮層會被大量激活,而當你在晚上睡覺時閉上眼睛思考問題,視覺皮層的活動就會減少,因為這時不需要處理視覺信息。
這個例子說明,人腦在處理不同任務時,只有相關的神經元會參與運算。基于這一原理,我們也在我們的AI模型中實現了類似的類腦機制。我們希望模型在執行特定任務時,只有與該任務相關的參數參與運算。
這不意味著其他參數沒有意義,而是它們在不同的條件下才會被激活。這樣的設計模擬了人腦的工作方式,使得模型在處理信息時更加高效和有針對性。
甲小姐:你用類腦機制規避了Transformer那種暴力性的投入。但大腦是很難被理解的。我也不知道睡前半夢半醒的狀態下,我的哪些腦細胞被激活了,哪些參數被壓抑了。我們都還沒有完全理解我們的大腦,你如何做到類腦?
劉凡平:我們的途徑是類腦智能,而不是復制一個真正的大腦。人類大腦已經演化出一套高效的機制和反應方式,我們可以將這些特性整合到我們的AI模型中。這些模型應該借鑒大腦的最佳特性來提高性能和效率。說得更直白一些,Attention機制的早期理念也包含類腦的元素,但它沒有按照完整的類腦方式去實現。既然生物界已經有很好的方案,我們為什么不引用?
甲小姐:Transformer有意地讓渡了很多人為設計,是為了更好地泛化到不同的場景中。在面對高度復雜的端側環境或應用場景時,如何確保你們的機制具備類似transformer的泛化能力和適應性?
劉凡平:類腦分區激活的過程完全是模型自我形成的,沒有外部的人為干預。神經元的激活模式完全由模型根據其所處環境自主決定,從而在底層技術上確保了這一機制的自然性和適應性。
我們的理念是讓機器直接與現實世界交互并從中學習,這比單純依賴于人工準備的數據集進行訓練更為有效。正如兒童通過與社會的實際互動來獲取知識和技能一樣,機器也需要置身于真實的環境中實現更加豐富和深刻的學習體驗。因此,我們要使更多的設備能夠承載這些先進的模型,并將其廣泛部署到千家萬戶之中,從而允許它們在多樣化的應用場景中不斷學習和完善自身。從技術和數據的角度來看,更真實的數據有助于推動模型變得更聰明。
甲小姐:具體到端側,Yan模型是如何在機器人、無人機這種設備下體現你所說的這些特征的?
劉凡平:比如在無人機應用場景中,我拿著甲小姐的照片給無人機看,指示它識別并尋找甲小姐是否位于室外的某個地方,比如操場或運動場。無人機就能夠理解我的指令,自動起飛,前往指定區域內搜索甲小姐并拍照。再比如集體拍照環節,我可以跟無人機說,等到我招手或者集體起跳的時候再拍照。這種感知能力是傳統模型達不到的。
甲小姐:可是,你把這樣的智能做到無人機和路由器里,我也并不會認為無人機活了,或者路由器活了,他們和我們直覺里的“智能”不太一樣。
劉凡平:但是你會感覺到它的智能,因為它確實解決了你的實際問題。原來空調是沒有智能的,現在我們隱約感覺到它有了智能,包括冰箱也是。大家正在適應這個過程,而我們在做的是加速這個過程,幫助我們通往人機共融共生的智能時代。
未來智能體的數量會遠超人口總數的很多倍。這一比例變高不是壞事,它意味著人能獲得的服務越來越好,生產效率也越高。
2.“相比于單體智能,群體智能才是智能的本質”
甲小姐:你選擇了一條hard模式的創業路。通常創業公司會乘著時代紅利加強創新成功的概率,但你要挑戰最主流的范式,在基礎理論層做創新。你認為RockAI可以脫穎而出的“法門”是什么?
劉凡平:RockAI致力于底層邏輯的創新,核心目標是實現群體智能。群體智能由多個能夠自主學習的智能單元組成,它們通過環境感知、自我組織、相互交流和協同合作來完成復雜任務,并在復雜環境中實現整體智能的提升。
從螞蟻到狼群,再到人類社會,都存在邁向群體智能的過程。通過這種方式,我們可以更有效地利用資源,實現智能的全面提升,而不僅僅依賴單一的技術創新或概念。
甲小姐:你剛才說過“造神式”的人工智能投入產出比不合理,你所做的群體智能是否僅僅是因為資源有限才退而求其次的戰術選擇?
劉凡平:并非如此。相比于單體智能,群體智能才是智能的本質。比如我們體內的一個白細胞對于免疫系統來說沒有意義,但一群白細胞就能產生免疫作用。狼群也通過相互協作來捕食獵物。人類社會也早已證明,在追求最高智能的過程中,還是要依靠群體的智慧。我們所有的成果,包括前沿科技,航空航天等等,都是群體智能的成果。
甲小姐:群體智能和傳統的云端協作有什么區別?
劉凡平:云端協作中有一些任務在設備端完成,有一些在云端完成。人類社會中也有群體智能。假設在辦公室里,每一個人是獨立的個體,云相當于公司,每個人會遵守公司的一些制度。我們所理解的群體智能中的端和云,是價值的傳遞和能力的對齊與理解。
甲小姐:OpenAI的核心是造出強大的“單一神明”,可以解決我所有的問題和疑惑,成為我的助理。而你要做的是智能的集體,每一個單體在協作機制下涌現出更符合自然法則的智能體系?
劉凡平:是的。OpenAI造出的“神”需要人的信仰與崇拜,它會加速信息不公平。我們更希望每個人都能公平地獲得信息。
為什么要追求OpenAI的模式,創造一個所謂的“神”?從更高的維度來說,為什么我們要尋找單一最聰明的智能體?一個小孩長到10歲左右,他的知識面可能還不夠廣泛,但我們能判斷出這個孩子有潛力。這說明我們更看重孩子的學習能力,而不是他出生時的聰明程度。智能體最重要的是與社會進化同步的能力,而不是它絕對的聰明程度。
甲小姐:OpenAI的做法可能代表工程師特有的一種野心。工程師都喜歡造物,都想扮演造物主。
劉凡平:但是人類無法創造這類生物,因為更有價值的東西不是創造生物,而是以人類為中心去創造價值。我們應該以人為中心,而不是以神為中心。
甲小姐:人造神具有一種神秘感,讓這個賽道更性感,可以讓估值沖上百億甚至千億美金。如果OpenAI宣傳的是要做輔助人類拍照的工具,就不可能支撐它今天的市值。而你是在祛魅,直接說我們可以降低30%成本甚至更多,實現多模態的終端智能等等。這可能意味著你的創業之路沒有神秘光環護法。
劉凡平:我們需要的不是神秘光環,而是實現我們的群體智能。這才是最核心的——其他的光環如果不能轉換成為社會服務的價值,我們認為沒有意義。
甲小姐:行業很多人選擇蹲守、后發、追趕,而你本來也可以不用辛苦地扛大旗,等群體智能的行業領導者出現了,你再跟進就可以。你為什么要選擇自己突破一個全新的范式?
劉凡平:我們已經在跟隨了,行業老大就是大自然。生物界已經給了我們明確答案。
甲小姐:這讓我想到幾年前我和達特茅斯會議的參與者特倫斯·謝諾夫斯基的對話。他當時也告訴我,當我們無路可走的時候,就回歸自然。我們可以遵循自然的機制,而不是在腦海中杜撰一個烏托邦。
他的觀點有點類似“道法自然”的東方哲學,而西方哲學更強調個人英雄主義和英雄敘事,比如漫威中的超級英雄,往往以改變世界、重塑秩序的個人力量為核心。
劉凡平:群體智能中也有個人英雄,但這些角色是動態變化的。比如在產業領域,甲小姐可能更擅長;當話題轉向計算機科學,另一位成員更了解技術細節,他就成為新的中心節點——這種角色的轉換體現了群體智能的重要特征:中心點的去中心化。它不僅僅依賴于個體的專業能力,更重要的是如何靈活調整角色以適應不同情境下的需求,從而實現整體效能的最大化。
甲小姐:在具體實現群體智能的過程中,RockAI把群體智能的實現分為創新型基礎架構、多元化硬件生態、自適應智能進化、協同化群體智能四個階段,確定這四個階段的條件和標準是什么?
劉凡平:我們已經實現了第一個自主架構模型,多元化的硬件生態系統也已構建完畢。在自主學習與自適應進化方面,一個關鍵特性是“訓推同步”,即訓練與推理過程能夠同時進行,這類似于人際交流:當我表達觀點時(推理階段),同時也通過傾聽你的介紹來進行自我學習(訓練階段)。因此,系統能夠在執行任務的同時不斷優化自身性能,實現持續的學習與改進。“訓推同步”不僅是模型自我完善的核心機制,也是驗證其自主學習能力的有效方式。將邊學習、邊輸出、邊討論的理念融入整個過程中,就可以顯著加速系統的成長速度和知識積累效率。
甲小姐:從執行角度來看,哪些是你確定已經完成的事情,哪些未來還有留白和風險?
劉凡平:對于架構我們完全確定,另外自主學習與自適應智能進化代表的第三階段也在我們實驗室里運行到比較好的狀態,明年會正式對外發布。目前正在挑戰的是第四階段,也就是機器與機器之間如何協作的過程。人類的信息交流是通過語言,但語言溝通需要時間成本,機器溝通的效率會更高,我們還在探索如何通過最高的效率實現相互合作,預計2026年會進入群體智能階段。
甲小姐:我可否理解為,你相信智能的本質不是在運動場上比誰跳得高,而是人類作為一個集體,在這項運動上可以達到什么程度?在這條路上你的勝算有多大?
劉凡平:我們非常有信心,100%。
甲小姐:為什么?
劉凡平:2020年底,我在一個AI和機器人的大會上講完自己大模型的內容,一位行業大佬拍著我肩膀說,你走錯路了,但我當時很堅定。等到ChatGPT火起來的時候,我們的模型早已交付。所以我相信自己的判斷力。隨著我們的模型在社會上投入應用,越來越多廠商接觸到我們,從自我認可到外部認可的過程已經開始顯現。
3.“2024年到2025年,基礎算法的變化一定會發生”
甲小姐:ChatGPT之所以讓人驚艷,是因為它做出的產品讓人覺得“像人”。從智能的本質來說,很多人認為智能有沒有意識、怎么想不重要,只要它看著像智能,聽著像智能,用著像智能,它就是智能。而你選擇的道路,讓智能看起來并不“像人”。
劉凡平:我不太認同“像人”是唯一標準。我覺得智能還是源自物理世界,它是從物理世界逐步衍生出來的。大家心中感受到的智能只是表象。第一,每個人的感覺不完全一樣。第二,現在大家用ChatGPT的頻率也不一定有剛發布時那么高了。
甲小姐:Transformer的作者之一表示,要想讓人工智能真正邁進,你得做到顯著優秀,讓人一看就知道。他也因此認為,當前業界發展還過于靜態,一直留在原點。你怎么評價他的觀點?
劉凡平:他提到要顯著被看到,這個觀點我認同。但另一方面,智能化存在演進的過程,他說的靜態也許是相對的。就好比我們人在船上,我相對于船,我是靜態的,但相對于岸邊的人,其實我在運動。也許他作為業內人士看到的內容相對靜止,但宏觀世界已經在向前。
甲小姐:業內有一些和你們類似的架構或者團隊,比如去年發布的RWKV和Mamba模型被稱為Transformer的強勁對手,包括最近MIT推出的LFM架構,據稱在性能上已經超越了Llama3.2。你有沒有關注他們?
劉凡平:他們也是我們關注的一部分,但是從實踐效果來說,我們現階段比較樂觀,因為我們底層架構的原理比他們先進很多。
甲小姐:從某種意義上來說,你現在可能要呼喚競爭對手,因為需要更多非Transformer路線的孤勇者把這個大方向點亮。
劉凡平:有可能他們也在呼喚我們。
甲小姐:很多人跟我說市場已經非常卷了。你認為國內大模型研發是否也陷入模式化的困境?如何避免國內人工智能行業走向加拉帕格斯時刻(指孤立的生態系統遵循獨立范式,一旦有外來范式或者物種加入,原有的體系變得異常脆弱)?
劉凡平:困境是存在的,Transformer現在的確陷入這樣的怪圈里面。目前國內和國外的狀態,我覺得可以比喻成一場技術的接力賽:OpenAI提出概念,Meta負責開源,而國內則專注于應用。這并非我們追求的方向。
甲小姐:沒錯,很多人都在蓄勢待發地等著當“第二名”。我在2024年5月的甲子引力大會上也提到,AI已經變成了一場明牌游戲——一旦先行者跑通了,驗證了,后來者的速度就加快了。從結果看,AI很像是一場“me too”競爭:你一旦有,我馬上有。
劉凡平:但這是一場多樣化的比賽,我們不應該僅僅看到Transformer,并且Transformer現在的困境也和太多人投入在上面有關。
甲小姐:幾年前,關于人工智能的討論還充滿了自信與熱情,人們積極探討真智能的定義及對未來的憧憬。現在我感到許多人似乎放棄了獨立思考,轉而依賴OpenAI來設定智能標準和技術突破的方向。每當OpenAI預告GPT-5的重大進展,公眾便翹首以盼;若GPT-5遭遇挑戰,OpenAI推出GPT-4o和o1之類的新模型,大眾的關注點又迅速轉移。
劉凡平:問題在于,為什么我們要等OpenAI呢?事實上在OpenAI創業之初,它并不是主流。當時Transformer架構的Bert是主流。而現在的OpenAI是不是當年的Google Bert?為什么現在不能再產生新的路線?我認為 follow OpenAI不是一條合理的路,而且也不適合我們國內的產品。
甲小姐:每個時代的技術自有屬于它的代際使命。我想知道你對人工智能行業發展的判斷,第一是關于人工智能在2024年的預測,第二是對5年后人工智能的預判,最后是關于人工智能的終極預判。
劉凡平:我內心一直有明確的答案。2024年,人工智能還會發生很大變化,核心體現在算法層面,我相信很重要的算法很快就會誕生。就像剛剛獲得諾貝爾物理學獎的辛頓,他很早就用FF算法挑戰過自己提出的反向傳播算法,而反向傳播是現在人工智能最關鍵的底層算法。像他一樣的很多人都看到了改變底層算法的必要性。2024年到2025年,基礎算法的變化一定會發生,可能還會更快,因為前沿的研究者都意識到了這一點。
5年以后,不管硅谷或者國內會有什么預判,通用人工智能的水平一定遠遠超過現在的水平。
至于終極的形態,我還是認為會走向群體智能。只有走向群體智能,才可能真正邁向更廣泛的大眾化人工智能。
甲小姐:你的三個判斷很具體,尤其算法在2024年內就可能迎來重要的革新,這件事被大量媒體忽略了。還有什么是你想分享的?
劉凡平:我想強調的是,從我個人和團隊的創業歷程來看,創新才是科技公司的本質,而不是一味地follow。follow這條路有它的價值,但不能改變太多。我們相信基礎層的創新能對應用層和未來的市場價值帶來巨大的改變,所以我們愿意去做一家創新的科技企業。