福利在线小视频_成人日韩在线视频_91免费视频污_最新视频 - x88av_一级全黄肉体裸体全过程_亚洲欧美日韩网站_久久99爱视频_成人黄色一级大片_亚洲综合在线一区二区_老司机午夜av_97在线免费视频观看_一区二区三区 欧美

登錄甲子光年
其他登錄方式
登錄即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
找回密碼
獲取驗(yàn)證碼
注冊(cè)甲子光年
獲取驗(yàn)證碼
注冊(cè)即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
綁定手機(jī)號(hào)
獲取驗(yàn)證碼
登錄即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
完善資料
登錄即表示你已閱讀并同意
《甲子光年用戶(hù)注冊(cè)協(xié)議隱私政策
微信登錄
掃描二維碼 | 授權(quán)登錄甲子光年
英偉達(dá)市值蒸發(fā)創(chuàng)紀(jì)錄,DeepSeek掀起AI算力革命意味著什么?
作者:王藝 2025-01-28

AI領(lǐng)域的Killer App(殺手級(jí)應(yīng)用)出現(xiàn)了。

國(guó)產(chǎn)DeepSeek-R1模型發(fā)布不到一周,就讓發(fā)布不到12天的DeepSeek App沖到了蘋(píng)果APP store國(guó)區(qū)和美區(qū)免費(fèi)總榜的第一名。

DeepSeek也引爆了海內(nèi)外的社交網(wǎng)站,相比DeepSeek-R1剛發(fā)布時(shí)的大量技術(shù)分析和圈內(nèi)討論,這次更多是用戶(hù)的實(shí)際使用體驗(yàn)——DeepSeek破圈了。

游戲科學(xué)創(chuàng)始人、CEO,《黑神話(huà):悟空》制作人馮驥直呼:“DeepSeek,可能是個(gè)國(guó)運(yùn)級(jí)別的科技成果。”

微軟CEO薩提亞·納德拉(Satya Nadella)在X上發(fā)帖稱(chēng):“隨著人工智能越來(lái)越高效,越來(lái)越容易獲得,我們將看到它的使用率急劇上升,成為我們用之不盡的商品。”而網(wǎng)友則直接給他留言:“這要?dú)w功于DeepSeek。”

我們跟很多人聊過(guò)Killer App,也設(shè)想過(guò)Killer App產(chǎn)生的條件和場(chǎng)景,從第一性原理來(lái)說(shuō),Killer App的出現(xiàn)離不開(kāi)模型能力的爆發(fā)。

但模型能力爆發(fā)后,如果普通人用不到也很難稱(chēng)之為Killer App,比如需要付費(fèi)才可使用接入了OpenAI o1模型的ChatGPT。DeepSeek-R1對(duì)標(biāo)的就是OpenAI o1,而DeepSeek-R1開(kāi)源、免費(fèi)。

DeepSeek的爆火告訴所有人,一個(gè)會(huì)思考、夠聰明、易使用且免費(fèi)的AI應(yīng)用就是Killer App。

在甲辰龍年的末尾,DeepSeek給AI行業(yè)添上了畫(huà)龍點(diǎn)睛的一筆。

但英偉達(dá)CEO黃仁勛的年怕是過(guò)不好了,截至美東時(shí)間1月27日上午11點(diǎn),英偉達(dá)股票一度下挫超過(guò)13%,市值蒸發(fā)約4650億美元,創(chuàng)了美股市值蒸發(fā)紀(jì)錄。

DeepSeek的技術(shù)特點(diǎn)「甲子光年」在《DeepSeek才是“真正的OpenAI”?》一文中有過(guò)分析。其實(shí)在性能和開(kāi)源之外,DeepSeek更讓硅谷震驚的,是其R1模型通過(guò)重新設(shè)計(jì)訓(xùn)練流程,在保持高準(zhǔn)確性的同時(shí)顯著降低了內(nèi)存占用和計(jì)算開(kāi)銷(xiāo),僅用了少量的低端GPU(以A100為主)就實(shí)現(xiàn)了高端GPU(以H100為代表)才有的性能,這為原來(lái)以算力為核心邏輯驅(qū)動(dòng)的大模型行業(yè)開(kāi)辟了新的道路。

硅谷科技圈反應(yīng)過(guò)來(lái)了,X上不少網(wǎng)友驚呼:DeepSeek是在戳美股泡沫啊,是在革英偉達(dá)的命啊!

一位名為Kakashiii網(wǎng)友發(fā)表暴論:“英偉達(dá)的一切都將開(kāi)始瓦解。”目前,該帖文閱讀量已超過(guò)130萬(wàn)次。

一旦大模型企業(yè)不再囤卡,不再搞算力的軍備競(jìng)賽,英偉達(dá)的“壁壘”還會(huì)牢固嗎?


1.進(jìn)擊的DeepSeek

kakashiii的話(huà)并不是危言聳聽(tīng)。

一直以來(lái),Scaling Law(規(guī)模法則)都是大模型發(fā)展的核心定律,大廠之間算力的軍備競(jìng)賽也從未停止。微軟、谷歌、Meta、亞馬遜等大廠分別擁有幾十到上百萬(wàn)塊H100,馬斯克也多次表示算力決定生死,為旗下的xAI搭建了10萬(wàn)卡的訓(xùn)練集群。

但是DeepSeek展現(xiàn)了“神秘的東方力量”,其在最近的一個(gè)月內(nèi)接連發(fā)布了DeepSeek-V3基座模型和DeepSeek-R1系列推理模型。

其中,DeepSeek-V3僅用2048塊英偉達(dá)H800 GPU和557.6萬(wàn)美元的成本,便完成了6710億參數(shù)模型的訓(xùn)練,而同等規(guī)模的GPT-4訓(xùn)練成本高達(dá)10億美元;

DeepSeek-R1則通過(guò)重新設(shè)計(jì)訓(xùn)練流程、以“少量SFT數(shù)據(jù)+多輪強(qiáng)化學(xué)習(xí)”的辦法,在提高了模型準(zhǔn)確性的同時(shí),也顯著降低了內(nèi)存占用和計(jì)算開(kāi)銷(xiāo)——百萬(wàn)輸入 tokens 1 元(緩存命中)/ 4 元(緩存未命中),每百萬(wàn)輸出tokens 16元,大約是 OpenAI o1運(yùn)行成本的三十分之一。

可以說(shuō),算法結(jié)構(gòu)的優(yōu)化,讓DeepSeek實(shí)現(xiàn)了完全的“降本增效”,直接對(duì)AI行業(yè)“堆砌算力”的既有模式發(fā)起了沖擊。

「甲子光年」分析,這一技術(shù)路徑的革新將帶來(lái)兩大影響。

AI初創(chuàng)企業(yè)生存模式將會(huì)轉(zhuǎn)變。一些依賴(lài)高價(jià)GPU集群的AI企業(yè)可能因成本劣勢(shì)破產(chǎn),導(dǎo)致二手市場(chǎng)GPU供給激增,中小AI企業(yè)將會(huì)更傾向去購(gòu)買(mǎi)更便宜的低端GPU。

硬件需求也將迎來(lái)結(jié)構(gòu)性轉(zhuǎn)移。從去年開(kāi)始,以訓(xùn)練為主導(dǎo)的算力需求就在向推理側(cè)轉(zhuǎn)移,而今后,這種趨勢(shì)還將繼續(xù),大量中小AI企業(yè)將不再訓(xùn)練基座模型,轉(zhuǎn)而投向DeepSeek這樣的開(kāi)源模型的懷抱。英偉達(dá)在訓(xùn)練市場(chǎng)的地位也將面臨價(jià)值重估。


2.躍躍欲試的AMD


DeepSeek的技術(shù)突破意外成為AMD挑戰(zhàn)英偉達(dá)的“杠桿”。

1月25日,AMD宣布在其Instinct MI300X GPU上集成了全新的DeepSeek-V3模型,并與SGLang集成。這意味著AMD將聯(lián)合DeepSeek共建ROCm開(kāi)源框架,通過(guò)優(yōu)化推理性能和英偉達(dá)爭(zhēng)奪市場(chǎng)份額。

ROCm(Radeon Open Compute Platform)是AMD開(kāi)發(fā)的一個(gè)開(kāi)源軟件平臺(tái),旨在為高性能計(jì)算(HPC)、人工智能(AI)和機(jī)器學(xué)習(xí)(ML)提供支持。它允許開(kāi)發(fā)者在AMD的GPU上運(yùn)行并行計(jì)算任務(wù),類(lèi)似于NVIDIA的CUDA平臺(tái)。

此前,美國(guó)初創(chuàng)云基礎(chǔ)設(shè)施企業(yè)TensorWave就與AMD的合作,通過(guò)利用AMD的硬件和ROCm軟件平臺(tái),為AI用戶(hù)提供更為便捷和高效的計(jì)算解決方案。

TensorWave聯(lián)合創(chuàng)始人兼CEO達(dá)里克·霍頓(Darrick Horton)去年10月告訴科技媒體TechCrunch,AMD MI300X的價(jià)格要比英偉達(dá)H100便宜得多,而且基準(zhǔn)測(cè)試顯示,MI300X在運(yùn)行(但不訓(xùn)練)AI模型時(shí)性能超越了H100,特別是在Llama 2這樣的文本生成模型上。

就在AMD宣布在其Instinct MI300X GPU上集成了全新的DeepSeek-V3模型后,TensorWave官方X賬號(hào)就轉(zhuǎn)發(fā)了AMD人工智能和嵌入式營(yíng)銷(xiāo)負(fù)責(zé)人布萊恩·馬登(Bryan Madden)的評(píng)論“如果您想訪問(wèn)MI300X集群,請(qǐng)與我們的朋友TensorWave聯(lián)系”。

DeepSeek的出現(xiàn),進(jìn)一步削弱了硬件綁定效應(yīng),再加上DeepSeek以MIT協(xié)議開(kāi)源模型權(quán)重,允許開(kāi)發(fā)者自由修改,昇騰、寒武紀(jì)、摩爾線(xiàn)程等其他芯片廠商也將有機(jī)會(huì)將DeepSeek集成到自己的平臺(tái)中,這些都對(duì)英偉達(dá)CUDA生態(tài)造成了潛在威脅。

更值得一提的是,DeepSeek采取的開(kāi)源策略正在加速生態(tài)分化。通過(guò)發(fā)布基于Qwen、Llama開(kāi)源模型的六個(gè)蒸餾“小模型”,DeepSeek支持在非CUDA的環(huán)境中進(jìn)行模型微調(diào);HuggingFace還發(fā)起了Open-R1項(xiàng)目,進(jìn)一步推動(dòng)了技術(shù)擴(kuò)散。


3.危與機(jī)并存的英偉達(dá)

Kakashiii發(fā)表的“英偉達(dá)的一切都將開(kāi)始瓦解”的觀點(diǎn)也遭到了不少人的質(zhì)疑。

亞馬遜云科技零售和消費(fèi)類(lèi)電子產(chǎn)品生成式人工智能主管邁克爾·康納(Michael Connor)就評(píng)論道:“強(qiáng)大的顯卡在訓(xùn)練和推理中都是必需的,即使使用 DeepSeek。”

一直比較看好英偉達(dá)的花旗分析師阿提夫·馬利克(Atif Malik)認(rèn)為:“雖然 DeepSeek的成就可能是開(kāi)創(chuàng)性的,但我們質(zhì)疑的是,如果沒(méi)有使用先進(jìn)的GPU對(duì)其進(jìn)行微調(diào)或通過(guò)蒸餾技術(shù)構(gòu)建最終模型所基于的底層LLMs,DeepSeek的成就就不可能實(shí)現(xiàn)。”

馬利克同時(shí)分析,雖然美國(guó)公司在最先進(jìn)AI模型方面的主導(dǎo)地位可能會(huì)受到挑戰(zhàn),但美國(guó)獲得更先進(jìn)芯片的機(jī)會(huì)是一個(gè)優(yōu)勢(shì),因此他預(yù)計(jì)領(lǐng)先的AI企業(yè)不會(huì)放棄更先進(jìn)的GPU。

“因?yàn)檫@些GPU在規(guī)模上能提供更具吸引力的$/TFLOPs(一個(gè)衡量計(jì)算性能性?xún)r(jià)比的指標(biāo)) 。”馬利克說(shuō),“我們認(rèn)為,星際之門(mén)(Stargate)等最近宣布的AI資本支出就是對(duì)先進(jìn)芯片需求的回應(yīng)。”

Panoptes Group前創(chuàng)始人、人工智能研究員、現(xiàn)牛津大學(xué)在讀博士JundeWu就表示,很多人擔(dān)心DeepSeek的低成本訓(xùn)練會(huì)沖擊顯卡市場(chǎng),但他認(rèn)為是利好。

他的觀點(diǎn)之一是,很多人認(rèn)為模仿DeepSeek就不需要那么多卡了,但其實(shí)DeepSeek-R1的低成本訓(xùn)練方法也是可以Scaling的。在DeepSeek出來(lái)之前,其他大模型用PRM(Process Reward Model)的時(shí)候,由于需要額外的卡訓(xùn)練PRM模型來(lái)監(jiān)督推理過(guò)程,已經(jīng)觀察到Scaling Law失效、邊際效應(yīng)遞減了,但是DeepSeek的出現(xiàn)證明了多一張卡、性能就成正比提升,這對(duì)顯卡市場(chǎng)顯然是一種利好。

他的觀點(diǎn)之二是,很多人認(rèn)為DeepSeek做的是推理,但其實(shí)DeepSeek-R1是通過(guò)后訓(xùn)練,來(lái)訓(xùn)練模型有更強(qiáng)的推理能力,這種訓(xùn)練和預(yù)訓(xùn)練對(duì)顯卡的需求沒(méi)有本質(zhì)區(qū)別。

因此,JundeWu認(rèn)為,未來(lái)對(duì)顯卡市場(chǎng)和Scaling Law最大的威脅不是模型,而是數(shù)據(jù)。

還有業(yè)內(nèi)人士分析,雖然訓(xùn)練消耗的算力較少,但是由于智能的持續(xù)升級(jí)和相應(yīng)的用戶(hù)需求上升,推理模型也會(huì)需要更多的算力;另外,DeepSeek的技術(shù)將導(dǎo)致模型能力走向分化,只有那些擁有高端GPU的人才有能力創(chuàng)建更復(fù)雜的模型。

除了社交網(wǎng)絡(luò)上的討論,在更為私密和專(zhuān)業(yè)的小圈子里,對(duì)于此次DeepSeek-R1的爆紅和其對(duì)英偉達(dá)生態(tài)的影響的討論則更為理性。

「甲子光年」獲得的一份來(lái)自“拾象”的《DeepSeek-R1閉門(mén)學(xué)習(xí)討論》文件紀(jì)要中,就有參會(huì)者表示,DeepSeek-R1只是站在巨人的肩膀上取得的成功,但探索大模型最前沿的技術(shù)需要的時(shí)間和人力成本還要高很多,R1的出現(xiàn)并不代表以后的訓(xùn)練成本會(huì)同時(shí)降低。

「甲子光年」分析,短期內(nèi)英偉達(dá)仍握有三大優(yōu)勢(shì):

  • 高端芯片的統(tǒng)治力:預(yù)計(jì)2025年英偉達(dá)從Blackwell架構(gòu)產(chǎn)品線(xiàn)獲得的收入有可能會(huì)超過(guò)市場(chǎng)的預(yù)期,超過(guò)Hopper架構(gòu)創(chuàng)造的記錄,最多可達(dá)到2100億美元的水平,而且大型云廠商的訂單已覆蓋未來(lái)數(shù)年產(chǎn)能。


  • CUDA生態(tài)壁壘:90%的AI開(kāi)發(fā)者依賴(lài)CUDA平臺(tái),遷移成本極高。


  • 供應(yīng)鏈控制:臺(tái)積電CoWoS(一種先進(jìn)的半導(dǎo)體封裝技術(shù))產(chǎn)能優(yōu)先分配英偉達(dá),2025年預(yù)計(jì)英偉達(dá)占據(jù)CoWoS總需求的63%,表明其在采用CoWoS技術(shù)方面的領(lǐng)導(dǎo)地位。

DeepSeek掀起的AI算力革命,并不是要替代英偉達(dá),而是迫使行業(yè)重新思考算力投入的性?xún)r(jià)比。

模型進(jìn)化帶來(lái)的算力革命,這其中有著太多不確定,但唯一確定的是:AI算力的“軍備競(jìng)賽”邏輯,正在被中國(guó)公司的算法創(chuàng)新改寫(xiě)。


  • 90017
  • 0
  • 0
  • 0
評(píng)論