本報(bào)記者 袁傳璽
2月5日,百度智能云宣布在近日成功點(diǎn)亮了自研萬卡集群——昆侖芯三代萬卡集群。據(jù)了解,這也是國內(nèi)首個正式點(diǎn)亮的自研萬卡集群,百度智能云將進(jìn)一步點(diǎn)亮3萬卡集群。
百度智能云方面表示,未來一年,將是各種AI原生應(yīng)用爆發(fā)的黃金時期。自研芯片和萬卡集群的建成帶來了強(qiáng)大的算力支持,同時有效提升百度和客戶的資源整體利用率,降低大模型訓(xùn)練成本,為整個行業(yè)提供了新的思路和方向。
突破萬卡集群建設(shè)瓶頸
據(jù)了解,百度智能云此次點(diǎn)亮的昆侖芯三代萬卡集群,采用了先進(jìn)的昆侖芯P800芯片,該芯片在性能和能效比上均實(shí)現(xiàn)了顯著提升。據(jù)百度官方介紹,萬卡集群以超大規(guī)模并行計(jì)算能力著稱,能夠?qū)崿F(xiàn)極大幅度的效率提升。其訓(xùn)練周期不僅適用于千億參數(shù)模型,更能夠支持更復(fù)雜的任務(wù)和多模態(tài)數(shù)據(jù),為視頻生成類應(yīng)用的開發(fā)提供了強(qiáng)大的動力。
從技術(shù)細(xì)節(jié)上來看,萬卡集群的建設(shè)過程中面臨了諸多挑戰(zhàn),如硬件擴(kuò)展性瓶頸、芯片及集群功耗、模型分布式訓(xùn)練優(yōu)化等。然而,百度通過升級百舸AI異構(gòu)計(jì)算平臺4.0,成功解決了這些問題。
其中,百舸平臺不僅突破了卡間互聯(lián)的拓?fù)湎拗?,避免了通信帶寬成為瓶頸,帶寬有效性達(dá)到90%以上。同時,還通過創(chuàng)新性散熱方案解決了萬卡集群的能效與散熱問題。此外,百舸平臺還優(yōu)化了模型的分布式訓(xùn)練,采用高效并行化任務(wù)切分策略,訓(xùn)練主流開源模型的集群MFU提升至58%。
百度智能云方面表示,隨著國產(chǎn)大模型的興起,萬卡集群已從單純算力供給逐漸向“有效”算力供給過渡,通過模型優(yōu)化、并行策略、有效訓(xùn)練率提升、動態(tài)資源分配等手段,智能調(diào)度任務(wù)將訓(xùn)練、微調(diào)、推理任務(wù)混合部署,最大化提升集群綜合利用率,降低單位算力成本,從而真正發(fā)揮算力效能。
廣州艾媒數(shù)聚信息咨詢股份有限公司總經(jīng)理張毅向《證券日報(bào)》記者表示,從產(chǎn)業(yè)賦能的角度來看,萬卡集群的超大規(guī)模并行計(jì)算能力可以極大地提升模型訓(xùn)練效率,縮短產(chǎn)品迭代周期,這對于需要頻繁迭代和優(yōu)化的AI原生應(yīng)用來說至關(guān)重要。同時,萬卡集群還能夠支持多任務(wù)并發(fā)能力,通過動態(tài)資源切分,單集群可同時訓(xùn)練多個輕量化模型,進(jìn)一步提高了集群的綜合利用率。
國產(chǎn)算力加速推進(jìn)
隨著人工智能的迅速發(fā)展,算力的需求正在以幾何級數(shù)增長,然而算力緊張和高成本一直是限制行業(yè)進(jìn)一步發(fā)展的主要瓶頸。“算力尤其是AI算力已經(jīng)不再是一個單純的技術(shù)問題,它關(guān)系到國家經(jīng)濟(jì)、科技創(chuàng)新、軍事安全等多個領(lǐng)域的綜合競爭力。隨著AI技術(shù)的迅猛發(fā)展,算力的提升變得尤為關(guān)鍵。”光大證券研報(bào)指出。
為進(jìn)一步加強(qiáng)國產(chǎn)算力能力,我國政策正大力引導(dǎo)國產(chǎn)芯片的采購。如上海的“算力浦江”智算行動實(shí)施方案(2024—2025年),2025年要實(shí)現(xiàn)新建智算中心的國產(chǎn)算力芯片使用占比超過50%;《北京市算力基礎(chǔ)設(shè)施建設(shè)實(shí)施方案(2024—2027年)》則提出,2027年要具備100%自主可控智算中心建設(shè)能力。
同時,為進(jìn)一步打破算力瓶頸,除百度以外,已有多家廠商及機(jī)構(gòu)著手向萬卡集群領(lǐng)域拓展業(yè)務(wù)。根據(jù)《智算產(chǎn)業(yè)發(fā)展研究報(bào)告(2024)》顯示,在中國,超萬卡集群的智算中心已達(dá)十余個。中國電信在上海與北京兩大萬卡集群已成功投產(chǎn)運(yùn)營;中國移動位于呼和浩特、哈爾濱、貴陽的萬卡級別的智算中心已經(jīng)先后投產(chǎn)運(yùn)行;字節(jié)跳動在2023年就已建立起超過1萬張卡的Ampere架構(gòu)GPU(A100/A800)集群,此后還在建設(shè)大規(guī)模Hopper架構(gòu)(H100/H800)集群;此外,小米也正計(jì)劃建設(shè)一座GPU萬卡集群。
中國工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民表示,當(dāng)下構(gòu)建國產(chǎn)自主萬卡系統(tǒng)充滿挑戰(zhàn),但“至關(guān)重要”。他指出,國內(nèi)企業(yè)在芯片設(shè)計(jì)、制造等領(lǐng)域的不斷突破,將為國產(chǎn)算力產(chǎn)品的普及和應(yīng)用提供有力支持。
“萬卡集群通過通信優(yōu)化與容錯機(jī)制顯著減少了算力的浪費(fèi),實(shí)現(xiàn)了訓(xùn)練成本指數(shù)級下降。”張毅表示,隨著國產(chǎn)大模型的興起,萬卡集群逐漸從“單任務(wù)算力消耗”向“集群效能最大化”過渡,最大化提升集群綜合利用率,降低單位算力成本。
工信部信息通信經(jīng)濟(jì)專家委員會委員盤和林告訴《證券日報(bào)》記者,國產(chǎn)算力市場將迎來更加廣闊的發(fā)展前景,隨著技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,國產(chǎn)AI算力產(chǎn)品將在更多領(lǐng)域發(fā)揮重要作用。對于國產(chǎn)AI算力企業(yè)來說,未來需要繼續(xù)加大在技術(shù)研發(fā)和市場推廣方面的投入力度,努力提升產(chǎn)品性能和用戶體驗(yàn)。同時,還需要積極與國內(nèi)外企業(yè)展開合作與交流,共同推動國產(chǎn)AI算力市場的健康發(fā)展。
(編輯 才山丹)
中央經(jīng)濟(jì)工作會議定調(diào)2025 任務(wù)要點(diǎn)全面解讀
分析當(dāng)前經(jīng)濟(jì)形勢,部署2025年經(jīng)濟(jì)工作……[詳情]
版權(quán)所有證券日報(bào)網(wǎng)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報(bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日報(bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注