Kimi開始回本了

to C業(yè)務(wù)狂飆大半年的Kimi,開始在B端發(fā)力了。
八月尚未過半,兩則直接關(guān)聯(lián)其商業(yè)化進(jìn)程的消息,在市場(chǎng)中傳開:
二日,Kimi母公司月之暗面官宣Kimi企業(yè)級(jí)API正式發(fā)布。相較于覆蓋to C需求的通用模型,企業(yè)級(jí)模型推理API有著更高等級(jí)的數(shù)據(jù)安全保障和并發(fā)速率,用以支持企業(yè)內(nèi)部的復(fù)雜工作流和大規(guī)模的數(shù)據(jù)處理需求。
五天后,公司再次放出商業(yè)化動(dòng)作,宣布Kimi開放平臺(tái)的上下文緩存Cache存儲(chǔ)費(fèi)用降低50%,由10元/1M tokens/min降低至5元/1M tokens/min,價(jià)格生效時(shí)間為2024年8月7日。
這項(xiàng)技術(shù)實(shí)際上早在在7月1日就已通過開放平臺(tái)啟動(dòng)公測(cè),通過預(yù)存那些可能會(huì)被反復(fù)引用、頻繁請(qǐng)求的文本或數(shù)據(jù)等信息來給模型推理過程“降本增效”。
Kimi現(xiàn)今在B端謀求AI變現(xiàn)的動(dòng)作,絕非此前應(yīng)用內(nèi)上線“打賞功能灰度測(cè)試”那般仍有試探意味:
從企業(yè)級(jí)解決方案,到具體場(chǎng)景優(yōu)化,再到價(jià)格調(diào)整,月之暗面顯然是有備而來。
大模型應(yīng)用,向錢看
圈內(nèi)關(guān)于大模型應(yīng)用的立場(chǎng),在技術(shù)落地日漸密集的2024年清晰分成了兩派。
七月初在上海舉行的世界人工智能大會(huì)(WAIC)上,手握目前國內(nèi)最大規(guī)模AI應(yīng)用訪問量的百度CEO李彥宏在演講中談及了他對(duì)大模型應(yīng)用的看法:C端當(dāng)然要做,但大模型更有成果的應(yīng)用場(chǎng)景仍在B端。
圖源/AI產(chǎn)品榜
李彥宏認(rèn)為,在AI時(shí)代,“超級(jí)能干”的應(yīng)用,即那些能夠深刻影響產(chǎn)業(yè)、顯著提升應(yīng)用場(chǎng)景效率的應(yīng)用,其價(jià)值或許更為重大,它們所創(chuàng)造的整體價(jià)值遠(yuǎn)超移動(dòng)互聯(lián)網(wǎng)時(shí)代的某些“超級(jí)應(yīng)用”。
未來在醫(yī)療、金融、教育、制造、交通、農(nóng)業(yè)等領(lǐng)域,都會(huì)依據(jù)自己的場(chǎng)景的特點(diǎn)、獨(dú)特經(jīng)驗(yàn)、行業(yè)規(guī)則及數(shù)據(jù)資源等,定制化地開發(fā)出做出各種各樣的智能體。將來會(huì)有數(shù)以百萬量級(jí)的智能體出現(xiàn),形成龐大的智能體生態(tài)。
這種打法,可以算作現(xiàn)階段BAT等科技大廠的代表。
從硅星人統(tǒng)計(jì)的大模型相關(guān)項(xiàng)目中標(biāo)情況來看,百度今年中標(biāo)了包括醫(yī)療、金融、能源、環(huán)保和交通等多個(gè)領(lǐng)域的共計(jì)17個(gè)項(xiàng)目,其中不乏大型國企以及各行各業(yè)的頭部公司,金額也基本在百萬甚至千萬級(jí)別。
而初創(chuàng)公司代表,像百川智能王小川、月之暗面楊植麟,過去給外界的印象一直是堅(jiān)定的To C支持者。
AI助手百小應(yīng)的發(fā)布會(huì)上王小川就曾表示,to B業(yè)務(wù)并非百川主要仰賴的商業(yè)模式,在美國做to B是好生意,但國內(nèi)市場(chǎng)C端比B端“大十倍”。
月之暗面創(chuàng)始人楊植麟雖然沒有在公開場(chǎng)合過多談及公司的變現(xiàn),但也在幾個(gè)月前上海創(chuàng)新創(chuàng)業(yè)青年 50 人論壇的演講中表示,得益于Transformer架構(gòu)的提出、半導(dǎo)體產(chǎn)業(yè)發(fā)展,以及互聯(lián)網(wǎng)為AI積累下來的大量數(shù)據(jù),在世界上可能“第一次出現(xiàn)了這種 AI to C 的機(jī)會(huì)。”
對(duì)于是把Kimi做成to C的AI超級(jí)應(yīng)用,還是把名號(hào)打響后多點(diǎn)布局,楊植麟留過活扣:我們to B倒也不是說完全不做,但是我們可能最主要的肯定還是會(huì)去聚焦和發(fā)力這個(gè)C端。
大概是研判時(shí)機(jī)已到,堅(jiān)持to C許久的月之暗面,終于對(duì)to B“真香”了。
Kimi to B:技術(shù)和市場(chǎng)都已成熟
從最淺表的層面來說,做to B解決方案和之前在C端的Kimi相比,需要解決的首先一個(gè)問題就是:
對(duì)于付費(fèi)玩家,你的服務(wù)器不能有事沒事就宕機(jī)。
算力規(guī)模是個(gè)繞不開的話題:月之暗面用一年時(shí)間,把Kimi干到了大模型賽道內(nèi)流量和使用量的頂流(部分統(tǒng)計(jì)顯示,七月份Kimi和文心一言是國內(nèi)唯二月活超過千萬的主流大模型),但畢竟仍是初創(chuàng)公司,資源比起大廠不會(huì)特別富裕是顯而易見的。
很少聽說文心一言、通義千問出現(xiàn)用戶高峰導(dǎo)致算力不足的情況,但經(jīng)常用Kimi的用戶想必或多或少都被算力墻擋住過幾個(gè)回合的問答(最近似乎好些了)。
而企業(yè)客戶如果將Kimi作為常用的生產(chǎn)力工具,那么企業(yè)級(jí)API的服務(wù)器就必須保證的穩(wěn)定性和可靠性,確保在高負(fù)載情況下可以正常運(yùn)行。
結(jié)合此番降價(jià)的上下文緩存技術(shù)來看,除了隨著業(yè)務(wù)體量按需擴(kuò)大服務(wù)器規(guī)模之外,Kimi將另一項(xiàng)中心放在了對(duì)現(xiàn)有模型推理的“降本增效”上。
這項(xiàng)技術(shù)的費(fèi)用,通常是因平臺(tái)或服務(wù)提供商維護(hù)和提供緩存服務(wù)而對(duì)客戶收取。以網(wǎng)購類比,如果用戶經(jīng)常使用同一個(gè)購物網(wǎng)站、App,那么這個(gè)網(wǎng)站/App很可能就會(huì)在系統(tǒng)中單獨(dú)創(chuàng)建一個(gè)數(shù)據(jù)集,將用戶ID、購物車內(nèi)容、偏好設(shè)置信息存儲(chǔ)其中。
而在大模型的使用場(chǎng)景中,如果用戶向系統(tǒng)提交了一個(gè)請(qǐng)求,比如詢問一系列問題,或者給Kimi甩過去一篇萬字長(zhǎng)文本要求生成報(bào)告,大模型在處理請(qǐng)求時(shí)就需要理解用戶的查詢上下文,包括之前的問題、相關(guān)話題或者某些領(lǐng)域的特定信息。
這部分推理出的中間結(jié)果和計(jì)算出的關(guān)鍵信息往往在用戶后續(xù)的問答中會(huì)被反復(fù)提及(調(diào)用),將他們緩存起來以便后續(xù)請(qǐng)求時(shí)可以快速訪問,是一個(gè)相對(duì)節(jié)省算力資源的選擇。
并非是瀏覽器那種為了方便用戶登錄而記錄用戶名和密碼,這種緩存首先降低的是模型反復(fù)閱讀、推理所消耗的資源量,對(duì)結(jié)果生成效率也會(huì)有一定程度提升。利用緩存的上下文信息,大模型可以快速生成響應(yīng)或推薦內(nèi)容,而不需要從頭開始重新計(jì)算。從而對(duì)用戶提出相關(guān)問題或需要相關(guān)信息加速響應(yīng),減少浪費(fèi)時(shí)間的等待。
這種有助于提高系統(tǒng)的響應(yīng)速度和處理效率,同時(shí)保持對(duì)話或文本生成的連貫性和準(zhǔn)確性的緩存機(jī)制,對(duì)于提供流暢的用戶體驗(yàn)和優(yōu)化資源使用來說會(huì)相當(dāng)關(guān)鍵。
尤其在未來可能面對(duì)來自B端、更多的用戶和更集中的數(shù)據(jù)處理請(qǐng)求時(shí),快速響應(yīng)并高效處理的價(jià)值可能進(jìn)一步突出。
One More Thing
to B動(dòng)作頻頻的月之暗面,近期還喜提一筆來自鵝廠的大額融資。
市場(chǎng)消息顯示,騰訊參與了月之暗面最新一輪3億美元融資,完成后將使得公司市值升至33億美元,成為國內(nèi)大模型初創(chuàng)企業(yè)中估值最高的一家。
月之暗面并未對(duì)此事做出回應(yīng),但據(jù)稱有接近騰訊方面的消息源表示參投屬實(shí)。
至此,被譽(yù)為“新AI四小龍”的智譜AI、MiniMax、百川智能和月之暗面,四家公司背后的投資陣營都已有了騰訊及阿里巴巴的參與。
BAT中百度更多選擇做好自己,AT則繼續(xù)在通過創(chuàng)投多點(diǎn)下注。
初創(chuàng)公司忙于卷技術(shù)做應(yīng)用,而大廠們似乎已經(jīng)將注意力的一部分,放在了投資回報(bào)率,亦或是未來行業(yè)格局的話語權(quán)上。
本文鏈接:http://m.albanygandhi.com/news-23-528.htmlKimi開始回本了
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點(diǎn),本站不承擔(dān)任何法律責(zé)任。天上不會(huì)到餡餅,請(qǐng)大家謹(jǐn)防詐騙!若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。
科技部等三部門發(fā)文開展專項(xiàng)行動(dòng) 促進(jìn)科技類社會(huì)團(tuán)體發(fā)揮學(xué)術(shù)自律自凈作用
穩(wěn)外貿(mào)穩(wěn)外資稅收政策指引
能解國際奧數(shù)競(jìng)賽題的AI系統(tǒng)問世 接近人類破解復(fù)雜邏輯問題的最高水平
量子計(jì)算機(jī)“本源悟空”完成超3萬個(gè)運(yùn)算任務(wù)
?這家企業(yè)獲全國人工智能應(yīng)用場(chǎng)景創(chuàng)新挑戰(zhàn)賽總決賽一等獎(jiǎng)
2023年度科技部《政府網(wǎng)站監(jiān)管年度報(bào)表》
【征集】關(guān)于征集影響營商環(huán)境建設(shè)問題線索的公告
《綠色工廠梯度培育及管理暫行辦法》
北京培育建設(shè)國際消費(fèi)中心城市2024年工作要點(diǎn)
《北京國際科技創(chuàng)新中心建設(shè)條例》
靶向藥:代號(hào)TAK-788老撾莫博賽替尼一盒多少錢:售價(jià)在2399元,快速了解莫博賽替尼國際報(bào)價(jià)在多少
購買指南!請(qǐng)問印度格列衛(wèi)價(jià)格(價(jià)位)大概多少錢一盒:常規(guī)售價(jià)范圍在650~850元左右!2025年最新印度格列衛(wèi)代購優(yōu)惠售價(jià)只需要650元起代購中心最新解答!
如登春臺(tái):南昌青云譜區(qū)代還信用卡墊還,都在這信譽(yù)至上,多年經(jīng)驗(yàn)誠信
大吉大利:惠州惠城代還信用卡墊還,口碑商戶高效便捷服務(wù)
技術(shù):提現(xiàn)分付額度靠譜商家;分付如何快速提現(xiàn)
好學(xué)不倦:拼多多先付后用額度怎么套,推薦十個(gè)操作方法
淵明: 得物佳物分期額度怎么提出來 簡(jiǎn)單分享六個(gè)方法
篤行致遠(yuǎn):DY月付度怎么套出來,套出最新的三種方法分享
頂天立地:上海虹口區(qū)代還信用卡取現(xiàn),秒到賬(當(dāng)面秒結(jié)算)
勇往直前:羊小咩額度怎么套出來,試試12種操作流程