伴隨AI技術的升級發展,大模型價格迎來進一步下探空間。
北京時間6月11日,OpenAI宣布將o3價格下調80%;火山引擎披露最新區間定價方式,使客戶的大模型使用成本降至近三分之一,旗下視頻生成模型Seedance 1.0 pro每千Tokens僅0.015元,每生成一條5秒的1080P視頻只需3.67元,為目前行業最低。
對于OpenAIo3的降價,OpenAI 官方表示主要基于推理服務架構的全面優化。另有消息稱,OpenAI 正在謀求除微軟云之外,與谷歌云之間的合作,通過云平臺緩解算力壓力。火山引擎總裁譚待對第一財經記者表示,云業務對大模型發展一直是很重要的事情,因為它是數字經濟的底座,AI本身又能進一步擴大數字經濟的增長。對于大模型來說,除了較高成本的訓練要求,推理要求成本更高,且推理有波峰波谷區間,云平臺可以更好地適配更多硬件,將波峰波谷通過混合調度打平,進而降低成本。
作為云服務平臺,此次火山引擎也發布了一系列AI云原生產品及相關服務,但豆包系列模型的降價,據譚待披露,主要基于工程方面的優化,也包括了通過AI云原生服務中的ServingKit方案優化推理成本等。ServingKit是一款AI云原生推理套件,為企業提供從模型部署、推理優化到運維觀測的一站式解決方案。
具體降價策略上,火山引擎采用的區間定價策略主要聚焦企業使用量最大的0-32K輸入區間,32K表示模型可以處理并記住最多32000個Tokens(大語言模型處理文本的基本單位)的輸入。該區間內豆包1.6的輸入價格為0.8元/百萬Tokens、輸出8元/百萬Tokens,綜合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。同一區間內,深度思考、多模態能力與基礎語言模型統一價格。
此次豆包系列模型價格降低的原因包括客戶對Tokens調用規模快速增長、模型能力的快速提升、新場景被不斷解鎖等。以Tokens數量為例,對比今年5月火山引擎Tokens消耗構成和去年12月的數據,隨著深度推理模型的發布,AI工具的Tokens消耗在快速增長,五個月時間增長了4.4倍,其中AI搜索增長了10倍,AI編程增長了8.4倍。
現場,字節跳動技術副總裁洪定坤演示了字節旗下AI編程Agent產品Trae,他表示,模型能力的進步使得像Trae這樣的AI Coding類產品有了真正落地的機會,截至5月底,Trae月活用戶數已超過100 萬。目前字節跳動內部超過80%的工程師通過類Trae產品進行輔助開發。
AI編程系目前Agent賽道內最熱的垂類產品,所代表的是Agent智能化、自主化的性能趨勢。如果說2024年是中國大模型應用的元年,那2025年很可能是中國Agent落地的元年,譚待表示,Agent將逐步進入企業的各個業務流程,在這個階段,深度思考、多模態理解和工具自主調用是模型進化的關鍵方向。
據譚待歸納,PC時代的主體是Web,移動時代是APP,AI時代是Agent。Agent能夠自主感知、規劃和反思,完成復雜任務。軟件第一次從被動的工具變成主動的執行者。而大模型和Agent開發平臺正是這個時代的關鍵要素,模型需要做好強推理、多模態、低成本才能支撐好Agent的大規模應用。
另外,Agent生態的搭建離不開MCP等協議的完善,除了MCP,谷歌此前發布了相似屬性的A2A協議,此次火山引擎除了演示通過MCP進行模型調用,也演示了GUI(圖形用戶界面)形式的操作能力。此前智譜發布的Agent 產品便采用了基于視覺語言模型的GUI Agent模型。
譚待稱,MCP存在一定局限性,比如無法在每一個場景里都能找到對應的MCP Server(連接 AI 模型和外部數據源的關鍵組件)。MCP與GUI兩種方式的融合,可以實現更高效率的模型工具調用。
此外,火山引擎智能算法負責人吳迪對記者透露,火山引擎正在自研下一代MCP協議或者類A2A協議。目前火山引擎的MCP Hub已與AI編程Agent Trae、方舟體驗中心、Coze(字節旗下零代碼AI應用開發平臺)打通,可以一鍵選擇超過200個MCP服務。
幫企客致力于為您提供最新最全的財經資訊,想了解更多行業動態,歡迎關注本站。鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。