據(jù)報道,DeepSeek公司近日正式發(fā)布了新一代大模型——DeepSeek-V3.1。該模型采用全新設(shè)計的“UE8M0 FP8 Scale”精度格式,專為國產(chǎn)AI芯片優(yōu)化,被業(yè)界視為中國大模型在底層算力標(biāo)準(zhǔn)上的一次重要戰(zhàn)略調(diào)整。消息一經(jīng)公布,便在半導(dǎo)體及人工智能領(lǐng)域引發(fā)廣泛關(guān)注和討論。
FP8技術(shù)是一種8位浮點(diǎn)數(shù)計算方法。相比傳統(tǒng)的FP16和FP32,F(xiàn)P8在降低能耗的同時大幅提升計算效率。其優(yōu)勢包括算力密度倍增、能耗顯著下降、推理速度提升超過40%,以及存儲需求減少50%至75%,為構(gòu)建高效AI算力生態(tài)提供了核心技術(shù)支撐。
DeepSeek提出的UE8M0 FP8是FP8技術(shù)的一種特殊實現(xiàn),通過“無符號+長指數(shù)”設(shè)計,將數(shù)值范圍擴(kuò)大32倍,更適合中文大模型的運(yùn)算需求。這一創(chuàng)新不僅顯著提升模型性能,還減少了對海外芯片的依賴,為國產(chǎn)芯片提供了更優(yōu)支持。
其中,被點(diǎn)名的潛在合作廠商包括華為、寒武紀(jì)、摩爾線程、海光信息及沐曦集成電路。國產(chǎn)芯片如海光深算三號DCU、沐曦曦云C600、摩爾線程MTT S5000等已支持FP8計算。華為昇騰910B和910C預(yù)計將在2025年第四季度支持原生FP8,而2026年可能推出的昇騰910D(暫定名)也將具備該能力,實現(xiàn)與DeepSeek大模型的深度協(xié)同。
業(yè)界普遍認(rèn)為,DeepSeek-V3.1的發(fā)布不僅是一次常規(guī)升級,更標(biāo)志著中國在AI底層技術(shù)領(lǐng)域取得的重要突破。通過建立差異化技術(shù)路徑,中國有望在FP8標(biāo)準(zhǔn)上形成自主規(guī)格,推動“芯片—模型—應(yīng)用”完整生態(tài)建設(shè),為AI算力自主化奠定堅實基礎(chǔ)。這場低調(diào)而深遠(yuǎn)的算力革命正在悄然展開。