界面新聞記者 | 梁寶欣
界面新聞編輯 | 林騰
AI推理芯片正成為人工智能行業(yè)新的涌入方向。
7月25日,2025年世界人工智能大會期間,界面新聞記者了解到,深圳云天勵飛(688343.SH)宣布全面聚焦AI推理芯片,圍繞邊緣計算、云端大模型推理、具身智能三大場景,目標(biāo)是國產(chǎn)算力“加速器”。
云天勵飛董事長兼CEO陳寧告訴界面新聞等媒體,2025年成為人工智能發(fā)展的重要轉(zhuǎn)折點——大模型技術(shù)達(dá)到新的成熟高度,模型調(diào)用成本顯著降低。AI從“專家工具”逐步演變?yōu)椤叭窕A(chǔ)設(shè)施”。AI正從訓(xùn)練時代邁入推理時代,預(yù)示著推理算力需求將迎來爆發(fā)式增長。
今年以來,以DeepSeek R1為代表的新一代大模型加速發(fā)展,推動AI產(chǎn)業(yè)的深度變革。中信建投證券研報指出,DeepSeek?R1在長CoT數(shù)據(jù)微調(diào)基礎(chǔ)上應(yīng)用強化學(xué)習(xí),除性能提升外,DeepSeekR1采用GRPO強化學(xué)習(xí)策略,專門優(yōu)化數(shù)學(xué)推理任務(wù),減少計算資源消耗,實現(xiàn)更低的成本。從推理成本來看,R1模型價格只有OpenAI?o1模型的幾十分之一,具有極高的性價比優(yōu)勢。
除此之外,中信建投證券研報還提到,三大增量助力推理算力需求加速,一是各家互聯(lián)網(wǎng)大廠加速AI與原有業(yè)務(wù)結(jié)合,二是Agent和深度思考推理的結(jié)合,三是多模態(tài)加速滲透。
陳寧表示,未來AI可能全面重塑我們身邊的各類電子產(chǎn)品——從智能耳機(jī)、智能眼鏡等可穿戴設(shè)備,到掃地機(jī)器人、冰箱等家用電器,再到電動汽車,幾乎所有電子設(shè)備的形態(tài)與功能都將被重新定義。這些設(shè)備將具備“主動工作”的能力,能像人類一樣開口交流,理解復(fù)雜指令、主動回應(yīng)需求甚至解決實際問題??梢灶A(yù)見,未來各類智能設(shè)備,也能通過更人性化的交互,實現(xiàn)功能的躍升與體驗的革新。而這一切場景的落地,都離不開AI 推理芯片的底層支撐。
推理算力需求的爆發(fā),核心依賴AI推理芯片——這是云天勵飛選擇聚焦該領(lǐng)域的關(guān)鍵背景。
從AI芯片的分類來看,根據(jù)所承擔(dān)任務(wù)的不同,可分為訓(xùn)練芯片和推理芯片。其中,推理芯片主要負(fù)責(zé)利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行推理預(yù)測,需綜合考量單位能耗算力、時延、成本等多方面指標(biāo)。
“雖然當(dāng)前AI推理芯片市場仍處于藍(lán)海階段,其市場規(guī)模相較于數(shù)千億美元的訓(xùn)練芯片市場仍較小,但預(yù)計未來三至五年內(nèi),AI推理芯片的增長速度將大幅超越訓(xùn)練芯片。”陳寧說。
針對各類應(yīng)用場景,云天勵飛已開發(fā)出?DeepEdge10C、DeepEdge10標(biāo)準(zhǔn)版、DeepEdge10Max?和?DeepEdge200?四款芯片。
據(jù)了解,2023年11月 ,云天勵飛正式發(fā)布面向邊緣人工智能的DeepEdge10系列推理芯片,其核心定位便是滿足邊緣端對千億參數(shù)大模型的部署需求,支持包括Transformer模型、BEV模型、CV大模型、LLM大模型等各類不同架構(gòu)的主流模型。
從技術(shù)底層來看,DeepEdge10系列芯片采用的是“算力積木”架構(gòu),通過D2D?Chiplet技術(shù)、C2C?Mesh技術(shù)和C2C?Mesh?Torus技術(shù),將多個標(biāo)準(zhǔn)計算單元像搭積木一樣,封裝成不同算力的芯片和多芯片互連的可擴(kuò)展計算系統(tǒng),覆蓋8T-256T算力需求,可實現(xiàn)7B、14B、130B、671B等不同參數(shù)量大模型的推理,賦能各類智算推理硬件產(chǎn)品。
云天勵飛CTO李愛軍表示,算力積木架構(gòu)實現(xiàn)了兩方面核心能力:一方面是算力的縱向拓展(scaleup),即在單個計算節(jié)點內(nèi)聚合更多算力——通過該架構(gòu),可在一個封裝內(nèi)最多集成8個算力積木,形成統(tǒng)一算力。這一架構(gòu)源于2020年對GPT等算法的分析,目前已在Edge10芯片上落地,實現(xiàn)了單個封裝內(nèi)集成8個積木、達(dá)成128T推理算力的單芯片成果。
另一方面是通過C2C?Mesh技術(shù)(結(jié)合Mesh互聯(lián)與Mesh?Torus技術(shù))實現(xiàn)算力擴(kuò)展:將多個節(jié)點首尾連接形成更大規(guī)模的算力池,從而支撐MoE架構(gòu)大模型的推理。
目前,DeepEdge10芯片平臺已成功適配DeepSeekR1系列模型、QwQ-32B模型及國產(chǎn)鴻蒙操作系統(tǒng)。
從經(jīng)營數(shù)據(jù)來看,2024年云天勵飛營收增長了81%;今年一季度,這一增速進(jìn)一步提升至160%。云天勵飛管理層表示,展望下半年,隨著AI推理算法的迭代、算力需求的攀升以及AI應(yīng)用的持續(xù)拓展,有信心繼續(xù)保持高速增長的態(tài)勢。