DeepSeek帶火的MaaS究竟是不是門(mén)好生意
一邊說(shuō)利潤(rùn)率可以高達(dá)545%,另一邊說(shuō)“部署后一個(gè)月虧損4億”,近日,關(guān)于部署DeepSeek到底是賺錢(qián)還是虧錢(qián)的事在網(wǎng)絡(luò)上引發(fā)了一場(chǎng)爭(zhēng)論。3月1日,DeepSeek在開(kāi)源周的終歸,公布其模型理論上的成本利潤(rùn)率可以高達(dá)545%,在人們?yōu)榇梭@嘆的同時(shí),AI基礎(chǔ)設(shè)施企業(yè)潞晨科技創(chuàng)始人尤洋發(fā)出了不同聲音,他的一則“部署DeepSeek月虧4億”的發(fā)言讓其成為輿論風(fēng)暴的中心。潞晨科技隨后宣布停用DeepSeek的行為,也讓人們重新審視MaaS(模型即服務(wù))這一商業(yè)模式。
何為MaaS服務(wù)?為何提供MaaS服務(wù)的企業(yè)存在“用戶越多虧損越多”的現(xiàn)象?MaaS是一門(mén)好生意嗎?
如果大模型是煤炭,MaaS就是電廠
MaaS的出現(xiàn),是一種商業(yè)范式的轉(zhuǎn)變。
要想使用大模型,對(duì)于個(gè)人用戶來(lái)說(shuō),除了使用模型的APP、網(wǎng)頁(yè)版,還可以自己下載DeepSeek等開(kāi)源模型部署到本地,享受更私域的定制化服務(wù),但這類部署可能存在運(yùn)行不穩(wěn)定等情況。對(duì)于企業(yè)用戶來(lái)說(shuō),這種不穩(wěn)定是無(wú)法接受的,因此MaaS的需求就產(chǎn)生了。
所謂MaaS,就是將模型部署到企業(yè)端提供給用戶使用的服務(wù)。MaaS服務(wù)商部署好模型后,提供API接口,企業(yè)用戶可以通過(guò)API接口直接調(diào)用,按token計(jì)價(jià)。MaaS模式可提供專業(yè)的模型部署,讓模型運(yùn)行更快,企業(yè)按token調(diào)用不僅可以享受更好的服務(wù),穩(wěn)定性和并發(fā)性高,而且成本更低。
“如果大模型是煤炭,那么MaaS就是電廠,它將煤炭變成了人人可以方便使用的電。”王鐵震解釋,“不用MaaS也可以,那就需要自己蓋發(fā)電機(jī),成本高,一些比較大的項(xiàng)目用 ‘發(fā)電機(jī)’是沒(méi)法做的。”王鐵震表示,未來(lái)每一個(gè)企業(yè)用戶每天可能會(huì)“燒掉”幾億token,作為標(biāo)品的MaaS將成為越來(lái)越重要的基礎(chǔ)服務(wù)。
云廠商是提供MaaS服務(wù)的一大主力,因?yàn)閷?duì)于它們來(lái)說(shuō),提供MaaS服務(wù)為其原有服務(wù)增加了一個(gè)新的項(xiàng)目,可以更好地利用閑置算力。以往企業(yè)按時(shí)間向云廠商租借算力,一個(gè)2小時(shí)的計(jì)算任務(wù)需要租賃2小時(shí)時(shí)長(zhǎng)的8張A100本地計(jì)算卡。“由于算力需求波動(dòng),GPU利用率可能只有50%。”Hugging Face工程師王鐵震表示,這種模式導(dǎo)致算力被大量閑置在“等用戶”的過(guò)程中。
作為連接大模型底層算力和下游應(yīng)用的中間層,類似潞晨科技這樣的AI Infra(AI基礎(chǔ)設(shè)施)企業(yè)也是MaaS服務(wù)商的另一類主力。AI Infra廠商所做的工作涵蓋了數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、部署和應(yīng)用整合等,將原始算力資源加工成符合用戶需求的“成品菜”。
自身沒(méi)有模型的廠商要想經(jīng)營(yíng)MaaS商業(yè)模式,離不開(kāi)開(kāi)源模型。MaaS的產(chǎn)業(yè)鏈格局分成三大板塊,一是創(chuàng)造模型的企業(yè)將模型發(fā)布在如Hugging Face這樣的開(kāi)源社區(qū);二是MaaS服務(wù)商將模型從Hugging Face上下載、部署、優(yōu)化,做好并發(fā)調(diào)度等管理;三是應(yīng)用開(kāi)發(fā)企業(yè)調(diào)用token。因?yàn)橛辛碎_(kāi)源模型,MaaS的商業(yè)模式才成立,所以在DeepSeek這樣的開(kāi)源模型爆火后,助推了一把MaaS,成為了MaaS服務(wù)商的流量密碼。
據(jù)報(bào)道,國(guó)內(nèi)極早部署DeepSeek的AI Infra企業(yè)硅基流動(dòng)自上線DeepSeek R1/V3推理服務(wù)后,流量增長(zhǎng)了數(shù)十倍。
雖然帶來(lái)了流量,但這個(gè)商業(yè)模式現(xiàn)在到底能不能帶來(lái)盈利,大家的意見(jiàn)顯然不太一致。
月虧4億的重點(diǎn)成本是算力
盡管DeepSeek稱他們的理論利潤(rùn)率達(dá)到了545%,但尤洋卻表示“月虧4億”。“滿血版的DeepSeek R1每日輸出1000億token,每月機(jī)器成本是4.5億,虧損4億,用戶越多虧損越多。”在尤洋發(fā)表這番言論后不久,3月1日,潞晨科技宣布一周后暫停DeepSeek API服務(wù)。
對(duì)于“月虧4億”的言論,尤洋在對(duì)媒體的回應(yīng)中表示,相對(duì)于火山云、阿里云等頭部企業(yè),“類似我們這樣中小型企業(yè)去強(qiáng)行燒錢(qián),使用第三方開(kāi)源模型做MaaS的話,肯定是面臨巨額虧損。”尤洋表示,“初創(chuàng)企業(yè)即使融了幾個(gè)億,可能還沒(méi)大廠一個(gè)月的營(yíng)銷(xiāo)推廣費(fèi)高。我覺(jué)得只使用第三方開(kāi)源模型以當(dāng)下的MaaS模式賣(mài)API的話,肯定是虧的。”
一位AI Infra從業(yè)者對(duì)澎湃科技表示,MaaS公司目前有兩種收費(fèi)模式:一是企業(yè)調(diào)用API,按token結(jié)算;二是月費(fèi)會(huì)員,例如OpenAI有Pro用戶、Plus用戶等。國(guó)內(nèi)MaaS公司以前者為主,按token結(jié)算實(shí)際上是按算力結(jié)算,“每秒鐘推理多少數(shù)據(jù)、輸出多少token,這其實(shí)和算力的價(jià)格完全綁定,重點(diǎn)成本就是算力。”在這種模式下,“客戶越多虧得越多其實(shí)也比較合理,因?yàn)槟壳皣?guó)內(nèi)模型的API都在降價(jià),本身價(jià)格比較低,譬如DeepSeek-R1官方售價(jià)是百萬(wàn)token 16元。”
該從業(yè)者解釋,如果MaaS企業(yè)只提供API服務(wù),沒(méi)有自己的模型、沒(méi)有足夠的算力,“頂多用幾十臺(tái)小集群來(lái)做,一定是虧的,做多少虧多少。”他認(rèn)為這主要由MaaS的商業(yè)模式所引起的,從OpenAI的營(yíng)收比例中可見(jiàn)一斑。“API只占OpenAI營(yíng)收的30%,70%的利潤(rùn)來(lái)自包月用戶。因?yàn)榘掠脩魧?shí)際上跑不了那么多算力,所以是賺錢(qián)的,利潤(rùn)率很高。”
“這就是為什么市面上為大模型公司供給服務(wù)器的‘裸金屬企業(yè)’的銷(xiāo)售模式一定不是一個(gè)很好的商業(yè)模式。”該從業(yè)者表示,token是銷(xiāo)售成本,對(duì)于MaaS企業(yè)來(lái)說(shuō),賣(mài)得越多虧得越多,因此對(duì)成本“特別敏感”。
寧愿虧錢(qián)也愿意先圈用戶
王鐵震同樣提到,算力成本是決定MaaS定價(jià)的重要因素。MaaS服務(wù)商的類別多樣,其算力來(lái)源也多樣,有的可能來(lái)自企業(yè)自身機(jī)房,也可能按小時(shí)向云廠商租賃,有的或來(lái)自閑置的算力中心。每家MaaS企業(yè)每小時(shí)的GPU成本不同,若使用國(guó)內(nèi)算力中心的閑置算力,那么只的成本就是電費(fèi)。算力成本的不同在很大程度上決定了提供MaaS這項(xiàng)服務(wù)能否賺錢(qián)。
此外,技術(shù)和市場(chǎng)競(jìng)爭(zhēng)等因素也會(huì)影響MaaS企業(yè)定價(jià)。他表示,前沿的技術(shù)有助于提升MaaS企業(yè)“煤轉(zhuǎn)電”的效率。業(yè)內(nèi)基于開(kāi)源技術(shù)提供服務(wù)、計(jì)算成本,“如果連開(kāi)源的Infra效果都達(dá)不到,基本上就出局了。”當(dāng)然,一個(gè)MaaS公司的部署如果有各種bug(漏洞),也會(huì)反映在成本上。
但每個(gè)人的認(rèn)知都有局限。由于行業(yè)并未充分開(kāi)源,不同背景的技術(shù)開(kāi)發(fā)者選擇不同路線,不在一個(gè)技術(shù)維度競(jìng)爭(zhēng),認(rèn)知不對(duì)齊,也就無(wú)法預(yù)估他人的成本。不過(guò),DeepSeek開(kāi)源Infra項(xiàng)目源代碼,幫助對(duì)齊認(rèn)知,“以前模型開(kāi)發(fā)者可能從未想到還能用CUDA一個(gè)沒(méi)有公開(kāi)的API才能把成本降下來(lái),現(xiàn)在拉齊認(rèn)知。”DeepSeek實(shí)現(xiàn)PTX編程,能夠直接和底層硬件發(fā)生交互的PTX一般被隱藏在CUDA的驅(qū)動(dòng)中。王鐵震表示,在確定的方向上“卷”就可以繼續(xù)把token價(jià)格打下去,技術(shù)迭代更快,促進(jìn)需求上漲。“對(duì)于工程師個(gè)人而言,既興奮,又覺(jué)得壓力變大了,因?yàn)檫€要學(xué)更多東西。”
王鐵震說(shuō),DeepSeek開(kāi)源提高了行業(yè)基準(zhǔn),促進(jìn)業(yè)內(nèi)進(jìn)一步降低API調(diào)用價(jià)格。“以前大家用開(kāi)源的大模型發(fā)現(xiàn)成本巨高,只能砸錢(qián)、砸補(bǔ)貼、買(mǎi)用戶。DeepSeek開(kāi)源后大家都用起來(lái),都開(kāi)始賺錢(qián)了。這時(shí)候有人就想,要不把價(jià)格再降一降,然后大家又不賺錢(qián)了,就開(kāi)始想下一代的技術(shù)重點(diǎn)。”因此,MaaS服務(wù)商要把服務(wù)賣(mài)出去,還要看競(jìng)爭(zhēng)對(duì)手的價(jià)格,“如果賣(mài)得明顯比別人貴很多,就算其他地方都很好也不行。”
雖然純賣(mài)API接口的賬怎么算也算不過(guò)來(lái),但大家爭(zhēng)先恐后接入DeepSeek也不單純是為蹭熱點(diǎn)。尤洋也表示,“如果它(MaaS)作為一個(gè)功能點(diǎn)提供到其他產(chǎn)品里,極終通過(guò)產(chǎn)品賺錢(qián),是有可能的。”他坦言,大廠的優(yōu)化手段和可選方案或許比中小型廠商會(huì)更好,可能收回更多成本。再加上大廠長(zhǎng)遠(yuǎn)的戰(zhàn)略性布局,即使短期內(nèi)有虧損,日后通過(guò)這些超級(jí)APP和其他業(yè)務(wù)也是可以消耗大量token的,再通過(guò)一些額外付費(fèi)或整體業(yè)務(wù)考慮,就可以把虧損補(bǔ)回來(lái)。
對(duì)于MaaS服務(wù)商來(lái)說(shuō),還可以為各行各業(yè)的企業(yè)用戶提供整體解決方案,如果將MaaS服務(wù)作為整體解決方案打包出售而非單純銷(xiāo)售API,就會(huì)獲得溢價(jià)。在業(yè)內(nèi)人士看來(lái),如果未來(lái)AI Infra企業(yè)的賺錢(qián)邏輯要改變,會(huì)從為垂直大模型廠商提供MaaS轉(zhuǎn)向?yàn)楦餍懈鳂I(yè)的用戶提供服務(wù),MaaS服務(wù)將走向更加垂直的領(lǐng)域,擴(kuò)大服務(wù)范圍,改變服務(wù)方式。
王鐵震表示,MaaS行業(yè)當(dāng)前處于早期無(wú)序競(jìng)爭(zhēng)格局,企業(yè)寧愿虧錢(qián)也愿意先銷(xiāo)售服務(wù)、收獲用戶,所以當(dāng)前的MaaS定價(jià)并不能完全反映實(shí)際成本。“國(guó)內(nèi)所有行業(yè)都在卷。如果一個(gè)行業(yè)不卷,可能是因?yàn)榇蠹叶紱](méi)有意識(shí)到這個(gè)行業(yè)有巨大潛力,卷起來(lái)之后就會(huì)凸顯出誰(shuí)才是這個(gè)行業(yè)真正的技術(shù)超前者。”在他看來(lái),國(guó)內(nèi)AI Infra行業(yè)還有巨大提升空間,“能看到未來(lái)這里面有巨大潛力,提高token輸出速度,降低token價(jià)格,加速技術(shù)進(jìn)步。”
3月11日,硅基流動(dòng)宣布,DeepSeek API升級(jí),DeepSeek-V3批量推理價(jià)格降低50%,3月11日-18日DeepSeek-R1批量推理價(jià)格降低75%,輸入價(jià)格1元/百萬(wàn)Token、輸出價(jià)格4元/百萬(wàn)Token。轉(zhuǎn)載自澎湃新聞