科技日報(bào)記者 崔爽
6月20日,華為開發(fā)者大會(huì)2025(HDC 2025)在廣東省東莞市舉行。
會(huì)上,華為常務(wù)董事、華為云計(jì)算CEO張平安宣布基于CloudMatrix 384超節(jié)點(diǎn)的新一代昇騰AI云服務(wù)全面上線,為大模型應(yīng)用提供澎湃算力;宣布盤古大模型5.5正式發(fā)布,自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)、多模態(tài)、預(yù)測、科學(xué)計(jì)算五大基礎(chǔ)模型全面升級。同時(shí),張平安還分享了盤古大模型在農(nóng)業(yè)、工業(yè)、科研等領(lǐng)域的豐富創(chuàng)新應(yīng)用和落地實(shí)踐,持續(xù)深入行業(yè)解難題,成就行業(yè)AI先鋒。
隨著大模型訓(xùn)練和推理對算力需求的爆炸式增長,傳統(tǒng)計(jì)算架構(gòu)已難以支撐AI技術(shù)的代際躍遷。華為云新一代昇騰AI云服務(wù)基于CloudMatrix 384超節(jié)點(diǎn),首創(chuàng)將384顆昇騰NPU(神經(jīng)網(wǎng)絡(luò)處理器)和192顆鯤鵬CPU(中央處理器)通過全新高速網(wǎng)絡(luò)全對等互聯(lián),形成一臺(tái)超級“AI服務(wù)器”,單卡推理吞吐量躍升到2300 Tokens/s(模型一秒鐘可以處理的字符數(shù)),與非超節(jié)點(diǎn)相比提升近4倍。超節(jié)點(diǎn)架構(gòu)能更好地支持混合多專家MoE大模型的推理,可以實(shí)現(xiàn)“一卡一專家”,一個(gè)超節(jié)點(diǎn)可以支持384個(gè)專家并行推理,極大提升效率;同時(shí),超節(jié)點(diǎn)還可以支持“一卡一算子任務(wù)”,靈活分配資源,提升任務(wù)并行處理,減少等待,將算力有效使用率(MFU)提升50%以上。
大會(huì)上,華為云發(fā)布盤古大模型5.5,模型在高效長序列、低幻覺、快慢思考融合、Agent(智能體)等特性上進(jìn)行升級,提升用戶體驗(yàn)。
會(huì)上,張平安還發(fā)布盤古醫(yī)學(xué)、金融、政務(wù)、工業(yè)、汽車五個(gè)具備深度思考能力的行業(yè)自然語言大模型,加速行業(yè)智能化,并將在6月底正式上線。
記者從會(huì)上了解到,華為云是華為公司面向開發(fā)者的統(tǒng)一底座,目標(biāo)是打造昇騰、鴻蒙、鯤鵬、歐拉等各項(xiàng)根技術(shù)的生態(tài)。如今,華為云開發(fā)者已超過800萬;華為云作為云底座,支持鯤鵬、昇騰、鴻蒙等生態(tài)的開發(fā)者總計(jì)達(dá)到1300萬。
為了給開發(fā)者提供AI時(shí)代的智能應(yīng)用開發(fā)體驗(yàn),華為開發(fā)者空間全面升級,提供的開發(fā)資源從基礎(chǔ)算力擴(kuò)展到AI原生應(yīng)用引擎、鴻蒙云手機(jī)等上層應(yīng)用。基于這些全新的開發(fā)資源,開發(fā)者可以便捷地調(diào)用算力、大模型、Agent工具等華為云服務(wù)來開發(fā)智能應(yīng)用。
此外,華為開發(fā)者大賽2025賽季也宣布正式啟動(dòng)。大賽首次設(shè)置昇騰AI全棧技術(shù)賽道,融合鴻蒙原生、開發(fā)者空間,邀請全球高校學(xué)子和技術(shù)精英們通過開發(fā)者大賽,勇闖智能新世界。
(主辦方供圖)