“不是要推出一個‘超級應用’,而是要不斷地幫助更多人、更多企業打造出數百萬‘超級有用’的應用。”
這是百度創始人李彥宏在昨天百度世界大會上發表的對于當前大模型技術浪潮的認知與態度。
過去兩年,大模型浪潮風起云涌,百度主要在做什么?底層技術上主要有兩件事:
第一是RAG(Retrieval-augmented Generation)——檢索增強。百度是國內最早強調檢索增強技術的公司,到今天這一技術已經成為行業共識。李彥宏認為,過去24個月大模型行業最大的變化,就是基于檢索增強技術基本消除了幻覺。
第二是iRAG(image based RAG)——檢索增強的文生圖技術。百度在今年年初決定解決這一問題,讓文生圖也能消除幻覺,從而在影視作品、漫畫作品、連續畫本、海報制作等領域落地。
此外,李彥宏還發布了One More Thing——秒噠,一個無代碼編程、多智能體協作、多工具調用的軟件,實現人人都是程序員。
相比底層技術,AI應用受到更多人的關注。李彥宏認為,我們即將迎來AI應用的群星閃耀時。
李彥宏看好兩大AI應用方向。第一個是智能體,這是AI應用的最主流形態,包括公司類、角色類、工具類、行業類;另一個是產業應用,涵蓋了制造、能源、交通、政務、金融、汽車、教育、互聯網等眾多行業。
構建智能體需要調用大模型API。半年前,百度文心大模型的API日調用量是2億。李彥宏當時認為,如果這一數字能在一年之內翻10倍,也就是從2億漲到20億,那么他就認為大模型這件事就做成了。今天,百度公布了最新數據:文心大模型的API日調用量超過15億,已經非常接近20倍的目標數字。
百度的大模型戰略背后體現了李彥宏怎樣的思考?在百度世界大會之后,甲子光年創始人&CEO張一甲、硅星人創始人駱軼航采訪了李彥宏,來解讀李彥宏心中的AI應用。
1.為什么說應用來了?
張一甲:過去一年,人工智能是全行業最火的賽道和技術方向,我們每天都看到非常多的產品和技術進展,百度可以聊的事情也非常多。為什么今年百度世界大會的主題定為“應用來了”?
李彥宏:從去年起,我一直在強調,模型本身并不直接創造價值,只有當模型被用來開發各種應用,并在不同場景中找到產品市場契合點(PMF),價值才能真正實現。如果說2023年大家還在努力提升模型的能力,那么未來所謂的“可用”,就是真的有東西用,應用的“用”。
過去一年,行業普遍存在焦慮:超級應用究竟在哪里?創業者的機會何在?有人甚至認為模型技術的迭代速度已經放緩,而超級應用尚未出現,這該如何是好?因此,我們提出了“應用來了”的概念。我認為,我們可以分享我們的探索、努力、工具和找到的路徑方法;同時,也可以介紹他人在我們平臺上創造的有價值成果,幫助更多人找到自己的發展道路和方向。
張一甲:百度在人工智能方面是全棧式布局,從芯片到框架、模型、應用都有。但今天你主要講了iRAG、智能體、零代碼。為什么挑選這幾個事情作為重點?它們之間的關系是什么?
李彥宏:我們是自上而下的視角。從應用需求出發,確定需要的模型,進而確定模型所需的框架,以及框架所需的芯片,逐步深入。例如,我們今天發布的iRAG,就是因為應用需要生成準確的圖像,比如公司的logo不能變形或顏色失真,這就需要精確的多模態能力。經過近一年的努力,我們認為這項技術已經實用,因此首先介紹。
我今天上午提到的邏輯是,過去兩年RAG的出現讓大語言模型變得實用,有效控制了幻覺生成,使其在B端場景中得到應用。多模態技術要實用,也需要準確性和可控性,即我要求你準確,你就不能出錯。有了這種能力,應用空間才能拓展。
拓展后,我們尋找應用場景。智能體分為四種類型,產業應用基于我們與公司的合作,看如何在具體業務場景中提升效率,實現實際收益。
最后,我提到的無代碼多智能體協作還是一個期貨,預計明年一季度試用,但我認為這是一個偉大的創新。目前,硅谷和美國都非常重視輔助代碼生成,既有基礎模型公司,也有創業公司投入數億美元。他們的邏輯是,美國缺乏工程師,而工程師成本高昂,年薪可達幾十萬甚至上百萬美元。如果能幫助工程師提升效率,比如將原本兩小時的工作縮短到一小時,他們就是這種思路。但我們的想法是,能否進一步降低大模型的應用門檻,讓非程序員也具備編程能力。即使是計算機專業的本科畢業生,編寫兩三百行代碼也不成問題,但在整個人群中,這仍是少數。我們希望數億勞動力也能具備這樣的能力。
隨著基礎模型和智能體能力的提高,我們可以將這些能力整合,讓普通人,即使是不懂代碼的人,也能擁有程序員的能力。想象一下,當數億甚至數十億人都具備這種能力時,對創造力的激發,是輔助代碼生成工具無法比擬的。那些工具只是讓頂尖人才更高效,而我們希望讓更多人擁有頂尖人才的能力,這意義更為重大。因此,我們將主要精力放在這個方向上。
張一甲:其實工程師、程序員群體恰恰是對大模型、人工智能最有主動性、積極性探索的群體。百度做布局的時候,好像繞過了最活躍核心的群體,直接希望下沉到普通的不會寫代碼的群體。為什么不是先在最活躍的程序員群體中,激活這個離果實最近的群體需求,而是做這么普惠的事情?
李彥宏:也不是直接下沉,客觀的講,我們也有代碼輔助生成工具叫Comate,現在百度內部一萬多工程師,大約30%的代碼是大模型生成的。但是它賦能的只是現在這一小比例的群體,這個產品也對外售賣,也有不少客戶用這個東西,對于提升工作效率的作用已經比較明顯了。
但這是兩個不同的賽道,我覺得意義更大的是另外一個賽道,這邊幾萬行,幾十萬行代碼才能干一件事兒;但是我這邊幾百行代碼能干另外個事兒,但它真的能讓幾億、十幾億人都可以干了,意義不太一樣。
駱軼航:無代碼是“只要會說話就能開發應用,不需要會編程語言”。這句話會不會多多少少造成誤導,讓大家覺得這個門檻真的已經降得很低了,真的已經這么容易嗎?
李彥宏:這還是兩個不同的track。在那些最復雜的應用場景,可能確實不僅要考慮應用,還要考慮模型的能力,還有剛才講的模型精調,數據標注等等,確實大量大量的工作仍然在可預見的未來是需要的。但另一方面,也使得很多相對沒有那么復雜的應用,在過去看來還不是那么容易的事兒,在今天看來,你不是程序員也好,花幾分鐘時間就能做出來了。
這一條賽道也是一個逐步發展的過程,我不希望大家有誤解,明年一季度所有程序員能干的事兒你就全部能干了,不會這樣一蹴而就的。但是它是非常非常有希望的賽道,我今天能夠寫兩百行代碼,一年以后可能能寫兩千行代碼,再過三年可以寫兩萬行代碼,這個能力會逐步發展出來,那它會讓更多人的創造性給激發出來。
2.基礎模型兩年發布一個大版本就夠了
駱軼航:今天上午你的演講沒有提到這兩個詞:一個是AGI,一個是Scaling Law,現在不講這兩個詞的AI類主題演講和活動幾乎已經不存在了。你對這兩個詞是不是有什么看法?是AGI太遠,Scaling Law卡住了?
李彥宏:確實不是故意的。可能是它們沒有跑到我心里,讓我覺得說這兩個東西足夠重要,在百度世界大會上一定要提一提。AGI這個詞,就像一千個人心目中有一千個哈姆雷特。我如果再講百度怎么定義AGI,無非就是又增加了一種定義。即使跟別人不一樣,也沒有多大價值。既然主題是“應用來了”,咱就關注應用。至于說更加長期的東西,我們還是在沿著這條路在做。但把這些東西講得更完整或者更深入,我覺得只對非常小比例的人有價值,更大比例的人只是多知道了一種AGI的定義,意義是不大的。
張一甲:今年,GPT-5沒有發布,OpenAI發了GPT-4o和o1模型,看起來可能是一個分杈樹上的成果,或者是微創新成果。所以,大模型基礎技術的進步是不是在放緩?
李彥宏:我覺得還是取決于你從什么角度看這個問題。如果當做一個學術項目,北極星指標就是「哪一年或者哪一月能實現AGI」,可以說技術進步的速度有所放緩。但我的視角更多是從應用角度看的,大模型的技術進步到底產生了什么應用。這個角度來說,我認為技術進步的速度不僅沒有放慢,而且有變快趨勢。
過去幻覺現象非常普遍。現在不管用哪個AI助手,問一些相關的問題,比如,這個酒店游泳池有多長?過去在網上搜索這個答案,官網沒有,攜程或者某個用戶評論區有這個信息,但你得找半天。現在大模型直接給你答案,這個答案能不能信呢?能信。就是因為像RAG這類技術的提升。
過去兩年,我認為大模型在邁向實用的過程當中,發展出來的能力仍然在以一個比較快的速度增長,所以你能夠看到我們今天看的調用量上升那么快。為什么要調用,因為它有用,它在各種具體的場景當中產生了價值。
另外一個角度來講,反而是基礎模型不能夠迭代特別快。如果老在變,那做應用的人就無所適從了,該做什么我不知道,我剛做了兩個月,你又升級了,把我做的沖掉了,白做了,我又得重新適應一遍新的規則之類的,我覺得可能兩年一個大的版本是一個比較合適的節奏。
駱軼航:所以我們不能等模型進化到AGI的階段再去做應用。
李彥宏:沒有必要。
駱軼航:o1是另外一個深度思考的維度,這個維度本身對于做應用有沒有一個更好的促進作用?
李彥宏:非常有意義。百度大概是從去年第四季度開始在朝這個方向做,我們沒有把它叫做強化學習、o1什么的,我們就說智能體。智能體有什么功能呢?反思、進化、使用工具,這些能力都是今天o1努力的方向,和傳統意義上大語言模型的方向確實不一樣。
我剛才講了,開發者可能已經逐步適應了怎么在大語言模型上開發應用,突然搞出來一個新的方向,又得適應一遍。其實我們也很希望大家趕緊適應這種新的思維邏輯,怎樣慢思考,調用工具。但這有大家學習和適應的過程,今天雖然我們發了多智能體協作這些東西,但讓一個開發者開發一個多智能體協作的應用,其實難度還是很高的,成本很高,反應速度很慢,各種各樣的能力怎么調用,有一個接受的過程。我很看好,但是我們得逐步逐步得讓大家學習這種新的能力,接受然后再把它利用好。
3.不做Sora,但非常看好多模態
張一甲:年初Sora發布,多模態成為了今年為數不多的炸點,有非常多的公司冒出來卷Sora,這個事情百度怎么看?百度做不做Sora?
李彥宏:我覺得Sora和多模態是兩個事兒,Sora本質上是在任意場景下的視頻生成能力。這件事情非常有意義,與此同時又非常難。它的本質是基本可以預測未來,可以預測到下一個10秒畫面變成什么樣子。無人駕駛是一個特殊場景的視頻生成,我現在開到這兒了,那我下一秒怎么開,會看到什么樣的景象,如果你都能解決的話,那無人駕駛不用做了,都可以靠那東西做出來。正因為是這么大的一件事兒,所以我覺得它需要很長很長時間才能夠做出來,而且成本很高。
但是我們今天講的多模態,實際上是解決另外一類型的問題。比如數字人不是純語言模型,生成的文字要用語音表達出來,語音表達的時候口型要能對得上,手勢應該做什么,我如果轉頭了,側面的圖像能不能跟正面保持一致等等,看起來都是一個比較簡單的事情,但是你仍然需要解決。靠任意場景下生成視頻的東西,不一定能把這事兒解決得很好。
我要解決剛才說的這些東西,把這些簡單的多模態東西解決了,就能夠有很好的應用場景。我用簡單的方法,就能夠做到,那我為什么不呢?先把這些事兒解決了,讓這個應用能夠跑起來,這是我們的思路。有一種誤解,就是百度不做Sora就是百度不做多模態。我們非常非常看好多模態,我們也在多模態上有非常長期的多年投入,在真正有應用場景的地方,我們的多模態能力是非常強的。
張一甲:是不是iRAG就是百度走向多模態重要的一項基礎技術?
李彥宏:是的,它是我們在開發各種各樣應用過程中遇到的一個障礙,必須把障礙搬走之后,我才能再往前走。
張一甲:iRAG是一項基礎技術,接下來iRAG準備怎么用?往哪個APP上用?還是以什么樣的形式走向終端應用?
李彥宏:終端應用應該是大家群策群力,每個人根據自己的實際需求,在已經了解的場景怎么更好地使用它。我能夠想到的,其實今天舉了不少車的例子。車這個行業你們非常清楚,很依賴市場推廣,他們在做市場推廣的時候非常非常講究。如果出一款新的車型,我要拍攝非常漂亮的畫面,照片也好,視頻也好,要花很多錢。拍一張車的圖片,最少得幾千塊錢,上萬塊錢;而它要拍好多張圖片,還要拍視頻等等。過去要五千塊錢做的事兒,現在五分錢就能做出來,如果能做出來就可以大量做。
今天的例子,車飛越長城,那個東西不可能靠拍攝的,車飛不起來。但是車飛起來的話,好看不好看?確實好看。在這種市場宣傳的場景,非常有用。我既要保持車該有的東西必須得有,不變的東西不能變,但是它又能夠放飛人們的想象,真正有創造力的故事情節能夠出來,那肯定會更吸引人。所以,在幾乎所有的創作場景,iRAG都非常有價值。
駱軼航:今天上午,你有一個非常重要的論斷,就是過去兩年大模型基本上消除了幻覺。幻覺有的時候是涌現的伴生品,那么消滅了幻覺,會不會殺死了進一步涌現的能力?
李彥宏:這就需要我們這些從業者不斷的創新,我既要消滅幻覺,還要能夠保持你的涌現能力、創造力。其實國外很多人講,基礎模型將來能夠具備諾獎獲得者的智力水平,那是極大的創造力迸發,這確實是努力方向。但與此同時,它的這種副作用,就是幻覺要能夠控制。
張一甲:技術的角度來講,讓它減少幻覺變得非常精準,和它給我們帶來很多的想象力,這兩個事情本質上是矛盾的嗎?
李彥宏:有一定的矛盾,但它是可以解決的。我覺得至少是可以逐步解決的。我遇到問題的話,總會想辦法。我希望鼓勵什么東西,我在這方面要加強,不鼓勵什么東西,要用其他的手段去進行控制。
4.真正的legacy就是,我信AI
駱軼航:中國AI有兩派人,理想主義者和現實主義者,理想主義者追求模型的不斷進化和進展;現實主義者更重要看用到模型的能力做了多少具體的事情。您今天的演講沒有大詞,沒有基座模型的進展,甚至不提文心一言和文小言這幾個字,更多的是應用。我想知道您是從哪個時間點開始越來越傾向于變成一個AI發展的現實主義者了?
李彥宏:其實講模型能力,我也可以講一個小時甚至時間更長,我也不認可自己就是純AI現實主義者。我們沒有講的,并不表明我們沒有做。事實上,百度很多的研發資源還是投在了外界看來基礎的能力或者理想主義者看重的東西。我們在做,我們不斷地在這方面加大投入、付出努力。我只是覺得,沒有必要把這些只有極少數人才能夠聽得懂或者說才會appreciate的東西到處去講。我需要到處去講的是,更多的人,幾千萬人,幾億人確確實實能夠用得到的東西,我希望多講。
張一甲:今天你有一個很大的篇幅講智能體、自由畫布,現場看大家很興奮,自由畫布這個idea怎么誕生的?它是百度對于多模態應用的一種終極的想象嗎?
李彥宏:其實還是基于需求。這個事情最早是因為百度有一個產品叫文庫,文庫最早是找現成的文檔,并不是做生成的。在生成式人工智能技術出現前,文庫已經出現了。但是當有了生成式AI,我們發現人們最根本的需求,不是找一個現成的文檔,而是為了創作自己的內容。
我們怎樣能夠基于現成的文檔,或者哪怕沒有現成的文檔,能夠讓他更好的創作,這條路走下去就是最早文庫的重構。后來我們又發了單獨的產品叫橙篇,現在又推自由畫布,是一步一步基于讓人們能夠更加方便地創作內容,或者說也不僅僅是創作,是communicate your ideas,怎么能夠把心里的想法更方便,更準確的表達出來,不管語音也好,圖像、文字也好。這個過程我們怎么enable這些用戶,做這些事情。
駱軼航:一般比較大的公司做創新,最大的負擔是Legacy,而創業公司能夠沒有負擔得往前跑,但自由畫布恰恰是建立在百度的Legacy基礎之上。所以怎么看過去的一些積累?這個事兒的幫助是什么?
李彥宏:根本原因還是到底信什么?一旦你從這個視角考慮問題的話,都很好解釋了。百度信AI,不是今天才信,也不是兩年前信,是十幾年前就信這個東西。所以文庫的改造也好,或者說非常堅決的做一些在大家看來是全新的東西,或者說沒有太受legacy的束縛。更或者說,我們真正的legacy就是我信AI,一旦你把這個東西當成legacy,這些東西其實就都很好解釋,我就是在做我多年前一直想做的事。
5.超級應用一定會有,只是時機未到
張一甲:去年開始,我們都不斷地在暢想或者期待,能夠出現一款超級應用。但是為什么今年并沒有出現超級應用?
李彥宏:我認為會有,只是現在時機沒有到。之所以大家覺得該出來了,但是還沒出來,是因為大家很容易拿這波生成式人工智能和上一波移動互聯網或者上上一波PC互聯網相比。說那個都是火了幾年以后,我們就已經比較明確的能夠看到超級應用的出現。但其實你注意到,當生成式人工智能起來的時候,我們對外一直講這是一場新的工業革命。
如果你看作工業革命的話,應該回去比較,當時電力革命發生的時候,這個超級應用是什么?過了多少年出來的?當時蒸汽機革命出現的時候,它的超級應用是什么?是怎么出來的?那些東西可能更具有可比性。
駱軼航:它不是長在一個設備上的一款APP或者一個軟件,可能是更基礎設施的東西是一個超級應用。
李彥宏:沒錯。
張一甲:比如電力革命,并不是說某一個爆款的產品把工業革命掀起來了,而是變成基礎設施以后,電燈、電話、電視、電報,各式各樣百花齊放成就了一個時代,所以你今天說,相比超級應用更重要的是“不斷賦能數百萬超級有用的應用”。這句話是你想到的嗎?
李彥宏:應該是我最先說的。
張一甲:這一字之差,其實內涵非常大。
李彥宏:對,確實就是代表我們的理念,或者說代表我們真正關注的點。
張一甲:百度一方面自己做應用,一方面也在大力推廣智能體生態,賦能非常多的用戶和開發者,在百度平臺上做應用。未來如果出現了真正的超級應用,最有可能是百度自己做出來的,還是開發者做出來的?百度的未來,更像是一個應用公司還是平臺公司?
李彥宏:我認為更有可能是開發者做出來的。我內部也講同樣的話,我們做的應用,我們同時做十款應用或者最多一百款應用,外界可能有一萬個創業公司在試各種各樣不同的賽道,所以你想一萬對一百,哪一個做出來的可能性更大?一定是外界做出來的可能性最大。
張一甲:概率來講也是來自開發者。
李彥宏:對,我們主要精力還是放在做工具,做基礎平臺,讓大家更容易的在這上面開發應用。
6.百度從來沒有對標過OpenAI
駱軼航:OpenAI一方面開“開發者大會”,給開發者提供一些工具和API,一方面自己推進模型往前走,哪怕一個小的功能,也殺死一批創業公司,以至于現在唯一有超級應用影子的AI應用就是ChatGPT。所以百度自己的核心要做的事情是什么?以及它和開發者的關系上,完全不想做另一個OpenAI?
李彥宏:說實話沒有想過這個問題。
張一甲:是不是百度從來沒有把OpenAI當做自己的對標?
李彥宏:沒有。
駱軼航:但是模型本身上會拿它當做參照。
李彥宏:對,我們還是很關注它在做什么事情,但確實沒有想過,要不要成為它。
張一甲:基因角度講,百度也從來不是OpenAI?
李彥宏:不是,不是。這并不表明,我們是一個純粹的現實主義者,其實我覺得我們也挺理想主義的。當你的夢想是讓幾億人、十幾億人都具備程序員的能力,這個又需要很多年大手筆投入的時候,這難道不是一種理想主義嗎?
7.智能體與搜索結合拓展了搜索邊界,而不是替代或者分流
張一甲:你把一個工具做到了千家萬戶,讓所有人都可用,本身也是一個巨大的藍圖和理想。關于應用,之前你的對外分享提到,從Copilot到Agent,到AI worker,智能體會是AI應用的終極形態嗎?還是過渡階段?
李彥宏:這個問題應該放在時間線的坐標軸上看,拉長這個時間線的話,肯定Agent是過渡形態。但是這個過渡形態我的判斷會持續比較久的時間,即使是AI worker出現以后,它跟智能體還是會長期并存的關系,有些東西可以完全自動化了,有些東西還是需要通過人和AI或者說跟虛擬人的協作來完成,還是分不同的場景。
張一甲:智能體也會存在分發和流量入口的問題,跟傳統的搜索,以及現有的產品矩陣之間會不會有流量爭搶、競爭的關系?
李彥宏:我們想象的分發的機制或者流量入口,比較類似于現在的百度搜索。在百度里搜相應的詞,你出來就有可能是一個智能體,你跟這個智能體,就像跟一個律師在線問答一樣,可以進行很多輪的互動,我們看到有好幾十輪的互動,有一個用戶跟AI的智能體不斷地問。
駱軼航:搜索公司是不是更容易做好AI智能體和很多更好的AI應用的框架?
李彥宏:應該是。大語言模型跟搜索本身很近,我們搜索一直在處理目前語言文字的東西,這是為什么我們可以很快推出來文心一言。另一方面,你有那么多智能體的時候,還是說怎么能夠跟人的需求高效的匹配起來,人有了這種需求以后,上哪兒接觸到這些智能體,最高效的連接還是一個搜索。
張一甲:每個智能體有多輪的對話和具體的功能,好像很多功能點進入到了一個又一個深井里面,進入到一個更深的、實用的場景里面去,會不會對原來百度的搜索的界面進行了某種分流?
李彥宏:準確的講,不算分流,這個更多是打開了新的可能性。傳統的搜索確實屬于像快消品一樣,即時滿足你的需求、給你答案。而智能體需要多輪交互,特別復雜的需求,需要一輪一輪的交互澄清,最后幫你解決問題,甚至需要調用工具解決。這些問題,傳統搜索要么解決得不好,要么壓根解決不了,這兩者的結合拓展了搜索的邊界,不是一個完全的替代或者分流。
駱軼航:過去搜出來的是網站,現在搜出來的是智能體。
張一甲:最終的流量還是集中在以百度搜索為核心的主陣地,而不是我們分發成很多APP,別的入口?
李彥宏:APP還是移動互聯網時代的理念,一方面智能體是一個更好的,滿足過去滿足不了的需求,這種新的形態;另一方面,大家這么關注分發,其實還是互聯網思維導致的,你想一下,今天我舉的像百勝中國、智能招聘這些例子,它關注的不是分發,它自有的場景,我怎么能夠更加高效、更加低成本、更加快速的做到那些事情,這樣的例子是很多很多的。
張一甲:這里面會存在一些商業顧慮嗎?比如由于很多智能體的存在,讓我們原有的商業搜索蛋糕被稀釋了,有這樣的隱憂嗎?
李彥宏:沒有,我覺得現在根本沒有必要考慮對現有商業模式的沖擊,因為你一旦打開了更多的可能性給自己的用戶、給自己的客戶,創造了新的價值的時候,你總能找到新的商業模式。我今天展示的調用量的圖,你想想如果調用收費的話,那這種漲法是可以收到很多錢的。
駱軼航:比起很多同行,文心一言并不是API降價上非常激進的玩家,是什么導致了文心大模型最近兩個月調用量的陡升?
李彥宏:其實我們價格非常有競爭力的,甚至有些模型是大家可以免費調用的,相當于算力送你了。更重要的是,可以說是開發者群體的覺醒,他逐步意識到了可以用模型來做出什么應用來,這是為什么我們今天強調“應用來了”,當過去一開始曲線相對沒有那么陡峭,相對那么平的原因是因為絕大多數人還不知道大模型能做什么,一旦它知道了之后,那需求其實是足夠旺盛的。
駱軼航:所以這個曲線也不僅是針對百度和文心大模型的,是針對整個行業的。
李彥宏:對。
8.應用驅動就是第一性原理
張一甲:人工智能是一個大的概念,里面涉及到的技術門類和產品迭代的方向又非常多,作為百度的掌舵者,每一天面對這么多的進展,你的底層思維是什么?怎么決定做什么、不做什么?取舍過程中,有沒有背后思考的第一性原理?
李彥宏:就是應用驅動。這個和美國很多公司做法很不一樣,美國很多公司一直都夢想要做顛覆性的技術,要多少年之內做成什么什么樣子。我更多希望盡早接觸場景及接觸應用,在這個過程當中大家遇到的最多的問題,就是我們優先解決的問題。
很多美國同行,他們做法是當做一個science,我有一個終極目標,就想盡各種辦法解決它,我們這邊當做我要解決的問題,這個問題可能用工程的方法也可能用其他的方法、用數據這些驅動,最后解決下來。但是你看現在諾貝爾獎都授給公司CEO了,為什么呢?很多非常有意義的,即使是從science的角度很有意義的事,最后是靠工程的方法解決出來。所以做工程不丟人,做工程很有可能是比科學更早發現機會、發現規律的。其實飛機也是,飛機先飛上天了,人們才開始研究,原來有一個東西叫空氣動力學。
張一甲:我們談工程落地的時候,會涉及到非常多具體的需要解決的問題。你怎么決定你的重心投入聚焦的地方?
李彥宏:任何一個企業家都應該具備的能力,你面臨的機會,面臨的挑戰總是很多很多,總是數不清的,你就是要有能力,去粗取精,去偽存真,最后沉淀下來,排出來,自己要做的事情,并且腳踏實地的把這些問題解決掉。
張一甲:關于人工智能技術本身其實還是存在一些分歧。百度投入下一代技術研發的時候,你們是all in一個方向走,還是會形成多條線,同時在往前推?
李彥宏:這是我們內部不斷討論的問題。說實話現在沒有確定的答案,或者說這個答案不斷在推演,不斷修正過程中,任何一個公司的資源都是有限的,你不可能什么都做,并且什么都做得很好,所以一定要有取舍,我經常說所謂戰略就是取舍,我們內部不斷在做這樣的取舍,技術模型有很多需要發力的地方我到底做什么,不做什么?先做什么后做什么?這是每天我們都在討論的問題,可能今天給你的答案跟三個月以后給你的答案又不一樣了,但是你說是不是只做一件事情,肯定不是,我們是多條線做的。
張一甲:你怎么定義什么叫做自己想要的人工智能?那每天面對各種信息,怎么保證自己看到的是真相?
李彥宏:對,我也看到各種各樣的說法,但是我還能看到很多別人看不到的東西,公司內部,我們在最前沿的模型訓練過程當中,到底遇到了什么問題,到底哪不滿意,我能看到很多這種別人看不到的東西。因而,我也可以根據這些我所看到的信息綜合起來,最后決定什么是真相,什么是重要的,什么是我們緊急的,要解決的問題。
我剛才也講了,對我們來說并不希望基礎模型不斷變,我認為大的版本,比如兩年左右發一個大的版本就可以了,這中間要讓開發者適應,讓他明白基礎模型到底有什么能力,我基于這個能力到底能夠做出什么東西來,基礎模型變化太快,其實對于整個生態我認為不是好事情。
張一甲:像去年那種天天經常有模型迭代進展,動不動技術棧就要變了的情況,可能并不是人工智能走進我們生活當中一個比較健康的節奏和方式?
李彥宏:它在最早期的時候有這樣的現象和規律是應該的,因為剛開始出來確實太不成熟了,沒法基于它做應用,如果兩年、三年了,還這樣,那整個生態其實是會比較亂。我們把注意力應該放在閉環怎么走完,而不是不斷解鎖能力。2024年大家有一點急功近利了,大家都帶找所謂的“超級應用”,但是真正的應用,現在已經可能有幾十萬上百萬的應用了,只不過不是移動互聯網時代的超級應用。
張一甲:在你看來,無論是一個猛子使勁在基礎能力上往前沖,還是一味期待非常酷炫的人盡皆知的超級應用,都不是一個正常的發展態勢?
李彥宏:對,不是本質。你看蒸汽機的發明過程,也是經過了幾十年后來出來熱力學第二定律之類的,電力也是。電燈、發電廠,最后像流水線之類的,這些都是因為有了電以后,才演變出來的新的業態。
駱軼航:科學家在一個AI公司里面,應該扮演的角色是什么?是驅動、輔助,還是什么環節的角色?
李彥宏:科學家應該提供的是vision,他應該看的比工程師更遠一些,你看這一輪大語言模型的爆發,其實背后的vision就是你剛才講的Scaling Law。有人看到了,我只要加算力,我只要用更多的數據來train這個模型,就會出現智能涌現,他是先有了這樣的想法,才去做這些事兒的,這些事兒從正的角度想的,之所以越來越多的教授創業或者是加入更大的公司去,是因為創業能夠拿幾億美元,你在學校拿那些東西就幾百萬美元,全美所有的大學加起來,涌現不出一個GPT3.5。在大廠里頭,幾萬片,甚至十萬片的東西已經出現了,在這么大規模上去做,顯然比別人更早的知道,未來是什么樣子。這些年技術發展可以說是新的特色,不光是一種想法,剛才講了vision,要跟資源相結合,我只有有這么多資源的時候,我才能證明這個想法到底是對的還是錯的。
有些人感興趣的是相對比較science的東西,沒問題,有價值。有些人感興趣的是,怎么在市場當中找到一個創造價值的地方,我覺得也是需要的。這個世界就應該這么多樣化,大家不同的人有不同的愛好,不同人有不同的信仰,最終才是有意思的世界。
張一甲:2024年已經快到尾聲了,如果展望明年,你覺得人工智能可能的下一個里程碑事件是什么?
李彥宏:我覺的在各個層面都會有一些漸進性的變化,比如說基礎模型的能力會提升,更多的應用會出來,尤其像多模態相關的,無論是基礎能力也好,還是應用也好,可能會被更多的人所感受到。我們講四層架構,在芯片層面、在框架層面、在模型層面、在應用層面,這四層還都會有相應的進展,甚至我覺得進展會很快。那么有了那些東西之后,上面還能夠長出來什么樣的可能性,其實還是挺令人期待的。
張一甲:你最期待發生什么?比如說今天如果你打開手機,看到關于人工智能的很多新聞,你腦海當中會有一個聲音說,我很期待今天發生了一個什么樣的事情,證明我們的判斷是對的,或者給我們這個行業再來一個非常大的動能的加持?
李彥宏:我們其實不是在做一個猜謎游戲,實際上是先有了一個vision,再去實現這個vision。如果你問我最期待的東西,我還是期待像秒噠這樣的產品,它能夠寫越來越多的代碼,能夠做越來越復雜的問題,讓越來越多人不懂代碼的人、能力沒有那么強的人,具備金字塔尖那些人的能力,我覺得這是明年,也是更長期的技術理想。
9.AI人才的流動是很正常的
駱軼航:我們聊一些輕松的議題。諾貝爾物理學獎得主Geoffrey Hinton曾經差點加入百度,Dario Amodei也在百度實習過。
李彥宏:他(Dario Amodei)是百度正式員工,JimFan在百度實習過,Andrew Ng也曾經是百度非常重要的科學家。
駱軼航:發散的說,如果這些人現在都在百度,百度是個什么樣的公司?聚焦一點的話說,很少有公司像百度這樣,一個中國公司在全球的AI發展人才節點,資源節點和技術節點扮演過這么重要的角色,百度未來還能不能再繼續扮演這個角色?
李彥宏:其實這個事也蠻有意思的。Geoffrey Hinton最終選擇加入Google,并非因為我們不愿意出更多的錢,而是他個人更傾向于留在美國。盡管他未能加入,我們依然渴望吸引真正的大咖加盟百度,因此后來我們邀請了吳恩達(Andrew Ng)。吳恩達加盟的原因相對簡單:當時他在Google負責Google Brain項目,希望購買更多GPU,但Google認為成本過高。我們則表示,只要他來,GPU隨便買,于是他便加入了我們。他的到來,如同Dario Amodei——原斯坦福的學生,Dario Amodei加入后推薦了Jim Fan來實習,這樣的連鎖效應,一代代地吸引了優秀人才。
這些人才雖然后來因為種種原因離開了百度,但這對整個行業來說是健康的人才流動。他們找到了新的起點,同時百度也培養了一批杰出的人才。外界可能會因為某個人的離開而有所報道,但如果他們留下,卻鮮有報道,這并非因為他們不夠優秀。實際上,百度內部有許多默默無聞卻極其優秀的AI專家,只是因為他們未曾離開,外界才不得而知。
對于我們而言,一方面,許多公司的創始人和不少互聯網公司的CTO都是從百度走出去的,我其實很高興。這不僅意味著我們對社會有所貢獻,也樹立了百度的技術品牌形象。今天,一個應屆畢業生加入百度時會思考,這些離開百度的人在這里做了什么,他們能從百度獲得怎樣的學習和成長機會,這對于吸引新的優秀人才是非常有益的。這些人才往往能在百度腳踏實地地工作,并創造出成果。我認為,那些尚未成名的年輕一代,才是我們最寶貴的財富。
張一甲:是不是可以理解為,在今天這樣一個逐漸強調落地應用的年代里,人工智能往前發展,并不像當年那樣非常依賴個別的明星大牛、科學家去驅動,而更像是實打實的撲在一線去摸索需求,去解決工程問題?
李彥宏:其實都需要,這些大牛我們需要他能夠看到五年十年以后,很可能某一個方向特別有前途的。但是光看到不行,你得把它做出來,得匹配相應的GPU算力資源,得有一大幫工程師。一開始做這個東西可能要100塊錢,怎么把它變成一塊錢就能做出來。一開始做推理要10個小時,怎么10分鐘做出來,這些問題解決了,你的vision才能變成現實。
駱軼航:百度怎么在整個全球AI格局中,更加體現它的技術前瞻力?我們曾經體現過,現在體現真的比當時難,因為我們是一家中國公司。
李彥宏:總是有解法的。中國畢竟有14億的人口,中國本身就是一個很大的市場,中國人總體來講對于先進技術其實是歡迎的,是愿意接受的。有了這樣一個環境,我們總是可以做出很多創新的,只不過這個創新,也許不是從底層往上走,而是從最上層往下走,我認為一樣可以走通的。
張一甲:在我們今天這個節目的結尾,對我們所有在關注百度世界大會和關注人工智能方向的朋友們,你有沒有什么總結、寄語給大家分享?
李彥宏:其實我還是想說,人工智能很像是一次新的工業革命,這意味著它不是三五年就結束,不是一兩年就出現“超級應用”的過程,它更像是三五十年對于整個社會的方方面面一個非常徹底的重構。在這個過程當中,我們既需要耐心,又需要大的投入,同時需要不斷的傳播這種火種,讓越來越多的人,越來越多的組織和公司,能夠理解這件事情對他們的意義,并且很好的利用這些新的技術能力,給自己的組織、自己的公司創造出來更多的價值。
駱軼航:需要長期主義、理想主義和現實主義的三結合。
李彥宏:對,三者結合。