9月29日,DeepSeek-V3.2-Exp模型正式發(fā)布,V3.2-Exp在V3.1-Terminus的基礎(chǔ)上引入了DeepSeek Sparse Attention(一種稀疏注意力機(jī)制),針對(duì)長(zhǎng)文本的訓(xùn)練和推理效率進(jìn)行了探索性的優(yōu)化和驗(yàn)證。
目前,官方App、網(wǎng)頁(yè)端、小程序均已同步更新為DeepSeek-V3.2-Exp,同時(shí)API大幅度降價(jià)。在新的價(jià)格政策下,開(kāi)發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。
當(dāng)日更早時(shí)候,有AI業(yè)內(nèi)人士發(fā)現(xiàn),DeepSeek于開(kāi)源社區(qū)平臺(tái)Huggingface上架了DeepSeep V3.2-base的頁(yè)面,但很快刪除。另?yè)?jù)記者了解,智譜新模型GLM-4.6也將于近日發(fā)布,目前已可通過(guò)API接口調(diào)用。
9月29日晚,寒武紀(jì)在官方公眾號(hào)同步稱(chēng),公司已同步實(shí)現(xiàn)對(duì)深度求索公司最新模型DeepSeek-V3.2-Exp的適配,并開(kāi)源大模型推理引擎vLLM-MLU源代碼。開(kāi)發(fā)者可以在寒武紀(jì)軟硬件平臺(tái)上第一時(shí)間體驗(yàn)DeepSeek-V3.2-Exp的亮點(diǎn)。
近日,DeepSeek“小步快跑”,推進(jìn)模型迭代。9月22日晚,DeepSeek小助手在官方社群中稱(chēng),DeepSeek線(xiàn)上模型已升級(jí),當(dāng)前版本號(hào)DeepSeek-V3.1-Terminus。
8月21日,DeepSeek宣布發(fā)布DeepSeek-V3.1。據(jù)介紹,DeepSeek-V3.1的升級(jí)包含以下主要變化。一是實(shí)現(xiàn)混合推理架構(gòu),一個(gè)模型同時(shí)支持思考模式與非思考模式;二是更高的思考效率;三是更強(qiáng)的Agent能力,新模型在工具使用與智能體任務(wù)中的表現(xiàn)有較大提升。
值得一提是,此前,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的參數(shù)精度。其中,UE8M0 FP8是針對(duì)即將發(fā)布的下一代國(guó)產(chǎn)芯片設(shè)計(jì)。消息一出,當(dāng)日DeepSeek概念板塊火熱,不少?lài)?guó)產(chǎn)芯片產(chǎn)業(yè)鏈企業(yè)股價(jià)大漲。
編輯︱賀巧華
- 我們必須去競(jìng)爭(zhēng),黃仁勛:中國(guó)芯片僅落后美國(guó)“幾納秒” 關(guān)注!今日將舉行兩場(chǎng)重要發(fā)布會(huì) 藍(lán)黨魁候選人一視同仁?媒體從盧秀燕接待層級(jí)看出玄機(jī) 美防長(zhǎng)召集數(shù)百名美軍將領(lǐng)維珍尼亞州開(kāi)會(huì),消息指特朗普將出席 二十屆四中全會(huì),時(shí)間定了 華南理工大學(xué)教師撞斃18歲生日女生,今再傳車(chē)禍退休教師騎車(chē)被撞 王健林“限高”措施已取消 美商務(wù)部長(zhǎng)稱(chēng):希望芯片制造跟臺(tái)灣“五五分”,島內(nèi)網(wǎng)友炸鍋 藍(lán)軍新北市長(zhǎng)人選,吳子嘉點(diǎn)名他:2026將“雙北聯(lián)手作戰(zhàn)” 華南理工校內(nèi)車(chē)禍釀1死1傷,傳遇難女生當(dāng)天18歲生日











