導讀:在華為開發(fā)者大會 HDC 2025 主題演講中,華為常務董事、華為云計算 CEO 張平安正式發(fā)布盤古大模型 5.5,自然語言處理(NLP)、計算機視覺(CV)、多模態(tài)、預測、科學計算五大基礎模型全面升級。
6 月 20 日消息,在華為開發(fā)者大會 HDC 2025 主題演講中,華為常務董事、華為云計算 CEO 張平安正式發(fā)布盤古大模型 5.5,自然語言處理(NLP)、計算機視覺(CV)、多模態(tài)、預測、科學計算五大基礎模型全面升級。
整理主要內容如下:
盤古自然語言處理 NLP 大模型:
全新的 718B 深度思考模型是一個由 256 個專家組成的 MoE 大模型,在知識推理、工具調用、數(shù)學等領域大幅增強,實現(xiàn)能力領先。盤古大模型是基于昇騰云的全棧軟硬件訓練而成的,這標志著基于昇騰架構可以打造出世界一流大模型。
盤古大模型 5.5 在高效長序列、低幻覺、快慢思考融合、Agent 等特性上進行升級,提升用戶體驗。例如,盤古提出了自適應快慢思考合一的技術,通過構建難度感知的快慢思考數(shù)據(jù)和兩階段漸進訓練,實現(xiàn)模型根據(jù)問題難易程度自適應地切換快慢思考,簡單問題敏捷回復,復雜問題深度思考,整體模型推理效率提升 8 倍。盤古深度研究 DeepDiver 通過長鏈難題合成、漸進式獎勵等關鍵技術,可以在網頁搜索、常識性問答等應用上獲得很高的執(zhí)行效率,如可以在 5 分鐘內完成超過 10 跳的復雜問答、生成萬字以上的專業(yè)調研報告等,大幅提升工作效率。
盤古預測大模型:
采用業(yè)界首創(chuàng)的 triplet transformer 統(tǒng)一預訓練架構,將不同行業(yè)的數(shù)據(jù),包括工藝參數(shù)的表格數(shù)據(jù),設備運行日志的時間序列數(shù)據(jù),產品檢測的圖片數(shù)據(jù)進行統(tǒng)一的三元組編碼,并在同一框架內高效處理和預訓練,極大地提升預測大模型的精度,并大幅提升跨行業(yè)、跨場景的泛化性。
盤古科學計算大模型:
華為云持續(xù)拓展盤古科學計算大模型與更多科學應用領域的結合。深圳氣象局基于盤古,進一步升級了“智霽”大模型,首次實現(xiàn) AI 集合預報,能更直觀地反映天氣系統(tǒng)的演變可能性,減少單一預報模型的誤差。重慶市氣象局針對成渝地區(qū)降水局地性強,且降水強度大的特點,基于盤古打造了“天資?12h”氣象大模型,提升災害天氣的日內預報預警能力。深圳能源采用盤古進行中短期風光水發(fā)電量預測,減少發(fā)電側棄電,提升能源開發(fā)效率。
盤古計算機視覺 CV 大模型:
華為云發(fā)布全新 MoE 架構的 300 億參數(shù)視覺大模型,這是目前業(yè)界最大的視覺模型,并全面支持圖像、紅外、激光點云、光譜、雷達等多維度、泛視覺的感知、分析與決策。另外,盤古 CV 大模型通過跨維度生成模型,構建油氣、交通、煤礦等工業(yè)場景稀缺的泛視覺故障樣本庫,極大地提升了業(yè)務場景的可識別種類與精度。
盤古多模態(tài)大模型:
全新發(fā)布基于盤古多模態(tài)大模型的世界模型,可以為智能駕駛、具身智能機器人的訓練,構建所需要的數(shù)字物理空間,實現(xiàn)持續(xù)優(yōu)化迭代。例如,在智能駕駛領域,輸入首幀的行車場景、行車控制信息和路網數(shù)據(jù),盤古世界模型就可以生成每路攝像頭的行車視頻和激光雷達的點云,能夠為智能駕駛生成大量的訓練數(shù)據(jù),而無需依賴高成本的路采。