1月22日,百度正式發(fā)布并上線原生全模態(tài)大模型“文心大模型5.0”。該模型參數(shù)規(guī)模達到2.4萬億,采用原生全模態(tài)統(tǒng)一建模技術(shù),具備跨文本、圖像、音頻、視頻等多種模態(tài)的理解與生成能力。目前,個人用戶可通過文心APP、文心一言官網(wǎng)體驗,企業(yè)與開發(fā)者可通過百度千帆平臺調(diào)用。
根據(jù)百度公布的信息,在涵蓋語言與多模態(tài)理解的40余項權(quán)威基準綜合評測中,文心5.0正式版的能力已超越Gemini-2.5-Pro、GPT-5-High等國際先進模型,穩(wěn)居全球第一梯隊;其圖像與視頻生成能力亦達到垂直領(lǐng)域?qū)>P退,整體處于全球領(lǐng)先地位。此前,百度文心助手月活躍用戶已突破2億。

技術(shù)突破:原生全模態(tài)與高效架構(gòu)
百度集團副總裁、深度學習技術(shù)及應用國家工程研究中心副主任吳甜在發(fā)布會上強調(diào),文心5.0采用了與業(yè)界常見的“后期融合”不同的技術(shù)路線。其通過統(tǒng)一的自回歸架構(gòu),對文本、圖像、視頻、音頻等多源數(shù)據(jù)進行原生全模態(tài)聯(lián)合訓練,實現(xiàn)了多模態(tài)特征在統(tǒng)一框架下的深度融合與協(xié)同優(yōu)化,從而支持原生的統(tǒng)一理解與生成。
在模型結(jié)構(gòu)上,文心5.0采用了超大規(guī)模混合專家(MoE)結(jié)構(gòu),并具備超稀疏激活特性,激活參數(shù)比例低于3%。這一設計在保持模型強大能力的同時,顯著提升了推理效率。此外,模型通過基于大規(guī)模工具環(huán)境合成長程任務軌跡數(shù)據(jù),并采用端到端多輪強化學習訓練,進一步提升了其智能體與工具調(diào)用能力。
應用落地:讓模型在真實場景中創(chuàng)造價值
百度應用模型研發(fā)部負責人賈磊指出:“應用模型的價值不在模型里,而在應用里。”百度基于文心基礎(chǔ)大模型,構(gòu)建了面向產(chǎn)品級快速落地的矩陣模型(如文心Lite模型、視頻大模型、語音大模型)以及面向垂直場景的專精模型(如搜索、電商、數(shù)字人及行業(yè)大模型)。
賈磊重點介紹了三項前沿應用技術(shù)突破:
基于聲音Token的端到端合成大模型:通過創(chuàng)新的聲音表征與建模方式,實現(xiàn)高質(zhì)量語音合成。
5分鐘超越真人的直播技術(shù):僅需目標音色的少量樣本,即可合成出富有情緒、節(jié)奏與感染力的帶貨語音,效果超越真人。
實時交互數(shù)字人技術(shù):采用文本、語音、視頻三態(tài)Token聯(lián)動架構(gòu),實現(xiàn)流式控制與低延遲、高表現(xiàn)力的實時交互。此前引發(fā)關(guān)注的“百度羅永浩數(shù)字人”即基于此技術(shù)開發(fā)。
平臺支撐:千帆助力產(chǎn)業(yè)高效集成
為加速大模型在產(chǎn)業(yè)中的落地,百度千帆平臺提供了全面支持。據(jù)平臺產(chǎn)品負責人張婷介紹,千帆不僅提供文心5.0及超過150種全場景先進模型服務,還集成了包括百度AI搜索在內(nèi)的眾多工具與完整Agent開發(fā)工具鏈,結(jié)合企業(yè)級數(shù)據(jù)管理與服務,為企業(yè)打造全周期、多場景的穩(wěn)定運行環(huán)境,大幅降低Agent應用創(chuàng)新門檻。目前,千帆平臺上已累計開發(fā)超過130萬個Agents,其特色工具“百度AI搜索”日均調(diào)用量已突破千萬次。
全棧布局:深化“芯云模體”生態(tài)閉環(huán)
此次文心5.0的發(fā)布,標志著百度在推進AI技術(shù)深入真實行業(yè)與復雜場景方面邁出關(guān)鍵一步。作為國內(nèi)大模型領(lǐng)域的先行者,百度已形成從“芯”(自研AI芯片)到“云”(百度智能云),再到“!保ù竽P停┖汀绑w”(智能體應用)的全棧自研技術(shù)生態(tài)閉環(huán),持續(xù)探索并輸出賦能千行百業(yè)的AI解決方案。
在全球AI行業(yè)從技術(shù)快速發(fā)展轉(zhuǎn)向深度應用的關(guān)鍵階段,百度憑借文心大模型5.0在原生全模態(tài)與超大規(guī)模參數(shù)上的突破,正致力于推動AI超越以對話為主的形式,更深入地融入現(xiàn)實世界,創(chuàng)造實際價值。(來源:百度)
(注:此文屬于央廣網(wǎng)登載的商業(yè)信息,文章內(nèi)容不代表本網(wǎng)觀點,僅供參考。)
長按二維碼關(guān)注精彩內(nèi)容





