生成式AI的爆發式發展正在重塑應用生態,并對算力基礎設施提出全新挑戰。進入2025年,DeepSeek的橫空出世加速了這一變革進程,同時也進一步凸顯了算力基礎設施面臨的挑戰。為助力企業應對新的挑戰,基礎設施相關產品和技術加快了迭代速度。
在5月7日舉行的2025聯想創新技術大會上,聯想圍繞基礎設施宣布了六項創新技術(包括AI推理加速算法集、AI編譯優化器、AI訓推慢節點故障預測與自愈系統、專家并行通信算法、“飛魚”仿生散熱設計與浸沒式制冷系統、算力服務“成本-效能”雙優運營系統)以及兩大重磅升級(聯想萬全異構智算平臺3.0、算力基礎設施),直指當前用戶在落地AI應用時最為關切的痛點,旨在幫助用戶升級基礎設施,早日實現AI算力賦能業務。
01
助力人工智能快速落地,加速AI價值的充分釋放
在人工智能向千行百業快速滲透的背景下,DeepSeek通過技術創新大大地降低了大模型的應用門檻,推動了AI普惠的進程,也標志著大模型逐步進入規模化落地新階段。中國信通院云計算與大數據研究所所長何寶宏稱其為“大模型2.0”階段。
此前人們追求的是更大參數規模的大語言模型,如今人們開始關注如何讓AI普惠,能以更高性價比讓大模型落地,而DeepSeek就是一個標志——一個從對大模型的探索轉向規模化應用的標志。
“此前人們追求的是更大參數規模的大語言模型,如今人們開始關注如何讓AI普惠,能以更高性價比讓大模型落地,而DeepSeek就是一個標志——一個從對大模型的探索轉向規模化應用的標志。”
中國信通院云計算與大數據研究所所長何寶宏在聯想AI算力基礎設施技術創新論壇暨春季新品發布會主題演講時表示。
中國信通院云計算與大數據研究所所長 何寶宏
隨著大模型2.0時代的來臨,大模型的應用邊界不斷突破,催生了AI繪畫、文本創作、代碼生成等顛覆性應用,推動AI從輔助工具向生產力平臺轉變。這一轉變導致算力需求結構發生根本性變化:傳統以推理為主的算力模式,被訓練與推理并重、且訓練算力占比持續攀升的新模式取代。
為應對需求的變化,作為AI應用的能力底座,算力技術也在不斷演進。聯想集團副總裁、中國基礎設施業務群總經理陳振寬在發布會上表示:“萬卡、十萬卡級算力集群的出現,要求在超大規模算力集群里,實現“算存網”能力的高效協同;而模型本地部署的應用潮流,又帶來對大模型一體機單機性能的極致要求。此外,如何獲得極致算力效率與能效也促使異構智算等技術創新快速取得突破。”
在這樣的時代背景下,陳振寬介紹,聯想正通過構建更強大、更高效、更穩定、更綠色的混合式基礎設施,助力混合式人工智能快速落地,加速AI價值的充分釋放。
具體舉措包括:
深度構建以計算力、存儲力、運載力為核心的AI基礎設施,打造覆蓋AI全場景、性能領先的AI算力產品組合;
持續升級聯想萬全異構智算平臺,融入四大技術創新,為高效算力提供強大支撐;
堅定擁抱生態,全面打造萬全生態,實現從芯片、系統再到應用的全棧能力整合,為客戶提供多種一站式AI解決方案。
02
四大創新技術,打造智算平臺差異化優勢
聯想萬全異構智算平臺就是上述戰略的落地手段之一。聯想萬全異構智算平臺是去年推出的一款算力管理平臺。針對大模型預訓練和傳統模型推理的算力訴求,聯想萬全異構智算平臺推出了五大技術,包括算力匹配魔方、超智融合調度、AI高效斷點續訓、聯想集合通信庫和GPU內核態虛擬化。
憑著這些創新,平臺獲得了22項核心發明,在多個應用案例中出創出佳績。不過,聯想并不滿足現有的成績,而是一直在打磨這一平臺,在今年的聯想創新科技大會上宣布重磅升級,推出了聯想萬全異構智算平臺3.0。
聯想萬全異構智算平臺的研發負責人、聯想中國基礎設施業務群戰略管理部總監黃山介紹,聯想萬全異構智算平臺3.0中新增的四大差異化技術就是為了助力眾多用戶在AI預訓練、后訓練、推理的過程中取得最高效、最穩定的算力。
01
AI推理加速算法集:通過實現MLA、投機推理等關鍵技術,結合聯想自己的混合精度量化和分布式并行技術,最大程度地發揮GPU效能,使AI推理性能相對業界最優方案保持20%以上優勢。
02
AI編譯優化器:自動替換低效算子、優化計算路徑并重新編譯,大幅簡化AI計算過程,節省算力和顯存資源,相比同類編譯器可降低訓練和推理計算開銷各15%以上。
03
AI訓推慢節點故障與自愈系統:通過異步實時狀態監測與全面故障分析,提前預知并自動化解決故障,將發現故障及自愈時間控制在百卡秒級、千卡分鐘級、萬卡十分鐘級。
04
專家并行通信算法:通過協同優化通信計算原語、訪存方式和網絡路由算法,減少通信延遲和帶寬占用,將推理延時降低至原來的1/3以下,同時將訓推過程中網絡帶寬利用率從50%提升至90%。
