DeepSeek的一次小更新 堪比宣布新模子
发布时间:2025-03-26 09:08
一个好新闻,时隔俩月, DeepSeek 终于更新了。就在昨天晚上, DeepSeek 一声不吭往 Hugging Face 上扔了个 DeepSeek -V3-0324 模子。模子参数 6850 亿,跟上一个版本的 V3 ( 6710 亿 )相差不年夜,采取 MoE 架构,还支撑了更开放的 MIT 开源协定。依据官方更新的版本阐明, DeepSeek -V3-0324 重要是针对推理才能跟前端开辟才能停止了增强,写风格格实现了跟 R1 对齐,别的另有一些其余方面的小优化。当初翻开 DeepSeek 官网,把深度思考形式关失落就能直接用上 V3-0324 。不外有一说一,固然 V3-0324 仅仅只是 V3 的小版本进级,并不是年夜伙儿等待已久的 V4 或许 R2 ,且官方账号也不宣布任何跟模子有关的信息。但也涓滴无妨碍, V3-0324 一上线,就有人说他的代码才能,直追克劳德。新版本的模子刚一上传,就登上了 Hugging Face 的趋向榜单。在外洋年夜模子竞技场 KCORES 的测评中, V3-0324 的代码才能得分 328.3 ,超越了一般版的 Claude 3.7 Sonnet 的 322.3 分,濒临 Claude 3.7 Sonnet 头脑链版本的 334.8 分,排名第三。图源 @karminski 牙医重点是,排名在后面的模子压根就没多少个开源收费的, V3-0324 堪称是桂林一枝。以是在 V3-0324 上线不到一天的时光里,就曾经有良多老哥急不可待上手测评了一波。这么说吧, V3-0324 在这些人手里,曾经成了拳打 o3-mini ,脚踢 Claude 3.7 Sonnet 的存在。经典的小球弹跳测试中,这位老哥把 V3-0324 、 o3-mini 跟 R1 拉了个横评。o3-mini 刚开端看着还不赖,但估量物理没学好,表面的六边形都转到垂直的地位了,球还不晓得往下失落。R1 的表示,也是有些让人摸不着脑筋。。绝对来说, V3-0324 天生的成果是表示最好的,这位老哥涓滴不惜啬对它的褒奖,说它 “ 表示得像独一排名第一的非推理模子 ” 。让 V3-0324 天生一个网页,模子一口吻写了 800 多行代码,运转的时间还不犯错,这什么气力不必多说了吧。在批评区底下,有人仅仅下达了编写登录页面的简略指令,并不任何其余的附加提醒,同样也天生了一个完全的登录页面。还说 V3-0324 在编码上,能跟 Claude 3.7 Sonnet 掰一掰手段。更别提其余的模子,性价比各方面比拟上去,当初 OpenAI 的 o1-pro 跟 GPT-4.5 ,都曾经不喷鼻了。横竖看了多少个网友的测试案例之后,世超对 V3-0324 的前端代码天生才能,曾经有了开端的断定。但不论咋说,没亲身上过手的货色,咱硬夸也有点心虚。以是此次世超也盘算简略试一试,看看 V3-0324 究竟有多能打。一下去,世超就让模子做了一个画板,提醒词是 “ 帮我用 HTML 代码构建一个画板,支撑鼠标绘制、橡皮擦功效跟色彩抉择 ” ,此次出战的模子是 V3-0324 跟一般版 Claude 3.7 Sonnet 。只能说,这把 Claude 3.7 Sonnet 博得很彻底。光是有取色器这一点,就甩了 V3-0324 不晓得多少个车尾灯。
购买咨询电话
400-123-4567