據(jù)報(bào)道,DeepSeek公司近日正式發(fā)布了新一代大模型——DeepSeek-V3.1。該模型采用全新設(shè)計(jì)的“UE8M0 FP8 Scale”精度格式,專為國(guó)產(chǎn)AI芯片優(yōu)化,被業(yè)界視為中國(guó)大模型在底層算力標(biāo)準(zhǔn)上的一次重要戰(zhàn)略調(diào)整。消息一經(jīng)公布,便在半導(dǎo)體及人工智能領(lǐng)域引發(fā)廣泛關(guān)注和討論。
FP8技術(shù)是一種8位浮點(diǎn)數(shù)計(jì)算方法。相比傳統(tǒng)的FP16和FP32,F(xiàn)P8在降低能耗的同時(shí)大幅提升計(jì)算效率。其優(yōu)勢(shì)包括算力密度倍增、能耗顯著下降、推理速度提升超過(guò)40%,以及存儲(chǔ)需求減少50%至75%,為構(gòu)建高效AI算力生態(tài)提供了核心技術(shù)支撐。
DeepSeek提出的UE8M0 FP8是FP8技術(shù)的一種特殊實(shí)現(xiàn),通過(guò)“無(wú)符號(hào)+長(zhǎng)指數(shù)”設(shè)計(jì),將數(shù)值范圍擴(kuò)大32倍,更適合中文大模型的運(yùn)算需求。這一創(chuàng)新不僅顯著提升模型性能,還減少了對(duì)海外芯片的依賴,為國(guó)產(chǎn)芯片提供了更優(yōu)支持。
其中,被點(diǎn)名的潛在合作廠商包括華為、寒武紀(jì)、摩爾線程、海光信息及沐曦集成電路。國(guó)產(chǎn)芯片如海光深算三號(hào)DCU、沐曦曦云C600、摩爾線程MTT S5000等已支持FP8計(jì)算。華為昇騰910B和910C預(yù)計(jì)將在2025年第四季度支持原生FP8,而2026年可能推出的昇騰910D(暫定名)也將具備該能力,實(shí)現(xiàn)與DeepSeek大模型的深度協(xié)同。
業(yè)界普遍認(rèn)為,DeepSeek-V3.1的發(fā)布不僅是一次常規(guī)升級(jí),更標(biāo)志著中國(guó)在AI底層技術(shù)領(lǐng)域取得的重要突破。通過(guò)建立差異化技術(shù)路徑,中國(guó)有望在FP8標(biāo)準(zhǔn)上形成自主規(guī)格,推動(dòng)“芯片—模型—應(yīng)用”完整生態(tài)建設(shè),為AI算力自主化奠定堅(jiān)實(shí)基礎(chǔ)。這場(chǎng)低調(diào)而深遠(yuǎn)的算力革命正在悄然展開(kāi)。