实测低沉上线的DeepSeek新模型：编程比Claude 4还能打写作…仍是算了吧附彩蛋

产品中心

Product display

联系我们

公司名称：半岛体育官网入口

手机号码：13931688144

公司地址：北京市海淀区马甸小区45号-3

实测低沉上线的DeepSeek新模型：编程比Claude 4还能打写作…仍是算了吧附彩蛋

来源：半岛体育官网入口

发布日期：2025-12-02 14:28:56

实测低沉上线的DeepSeek新模型：编程比Claude 4还能打写作…仍是算了吧附彩蛋

自从 GPT-5 发布后，DeepSeek 创始人梁文锋就成了 AI 圈最「忙」的人。

网友和媒体们隔三岔五就要催更一波，不是「压力给到梁文锋」，便是「全网都在等梁文锋回应」。尽管没有比及 DeepSeek R2，但 DeepSeek 今日仍是正式上线并开源了新模型 DeepSeek-V3.1-Base。

比较奥特曼今日清晨承受媒体采访时还在画着 GPT-6 的大饼，DeepSeek 新模型的到来显得适当佛系，连版别号都像是个「小修小补」，但实践体会下来，这次更新仍是给了我不少惊喜。

为了测验 V3.1 的长文本处理水平，我找来了《三体》全文，删减到 10 万字左右，然后在文中悄悄塞了一句八棍子撂不着的话「我觉得烟锁池塘柳的下联应该是『深圳铁板烧』」，看看它能否精确检索。

没有出乎太多意外，DeepSeek V3.1 先是提示文档超出约束，只读取了前 92% 的内容，但仍然成功找到了这句话。更有意思的是，它还贴心肠供给了文学视点的经典下联引荐：「焰镕海坝枫」。

网友现已现已抢先测验它在编程基准测验 Aider Polyglot 的得分：71.6%，不只在开源模型中表现最佳，乃至打败了 Claude 4 Opus。

咱们用经典的六边形小球编程题做了测验：「编写一个 p5.js 程序，演示一个球在旋转的六边形内弹跳的进程。球应该遭到重力和摩擦力的影响，而且有必要传神地从旋转的墙壁上弹起。」

V3.1的表现适当给力，生成的代码不但搞定了根底碰撞检测，还主动补全了转速、重力之类的细节参数。物理特性传神到小球会在底部稍微减速。

接着咱们加大难度，让它用 Three.js 制造交互式 3D 粒子星系。根底结构搭得挺稳，三层规划（内球体、中心圆环、外球体）也算完好，但UI审美嘛……怎么说呢，有种神鬼二象性的感觉，配色计划略显花里胡哨。

持续应战更杂乱的使命。们让它造个沉溺式3D世界，要有旋转物体、变形作用、发光弧线，还得加上时刻切换、主题转化的交互按钮，点击操控也的确能触发不同特效。

终究一关，让它用 Three.js 搞个交互式 3D 网络可视化，要求包括用户触发的能量脉冲动画，外加主题切换和密度操控功用。全体下来，表现仍是过得去的。

「有一草场，已知养牛 27 头，6 天把草吃尽；养牛 23 头，9 天把草吃尽。假如养牛 21 头，那么几天能把草场上的草吃尽呢？而且草场上的草是不断成长的。」

尽管 DeepSeek V3.1 没有选用苏格拉底式的启示教育，但它的答复逻辑明晰、过程完好。每一步推导都有理有据，终究给出了精确答案。这种厚实的数学功底，着实令人形象深入。

面临「两把兵器比照，1~5 进犯 VS 2~4 进犯，哪把更凶猛？」这样的问题，一般的答复或许停步于均匀损伤核算。但 DeepSeek V3.1 考虑得更为周全，引入了损伤稳定性的概念，运用方差进行深入分析。

当问及「冰岛有蚊子吗？」这样的小众地舆问题时，在未敞开查找功用的前提下，DeepSeek V3.1 的答复质量显着逾越了 GPT-5。这不只表现了其渊博的常识储藏，更显现了精准的信息提取和整合才能。

最近基孔肯雅热疫情盛行，处处灭蚊蚊蚊蚊蚊蚊蚊蚊，那么我很猎奇，冰岛有蚊子吗？留意，我没开查找功用，就答复的质量来看，DeepSeek V3.1 的答复显着要比 GPT-5 胜上一筹。

「懂者得懂其懂，懵者终懵其懵，天机不言即为懂，点破天机岂是懂? 懂是空非空非非空的懂，不明白是色不异空空不异色的不明白:懂自三千大世界来，不明白在对岸与对岸间徜徉。懂时看山不是山是懂，不明白时看山是山的懂。懂者以不明白证懂，懵者以懂证懵，你说你懂懂与不明白之懂? 你安知这懂的背面没有大不明白? 凡言懂者皆未真懂，沉默不语的懂，方是六合不言的大懂不明白的懂是懂，懂的不明白也是懂，此乃懂的最高境地–懂无可懂之懂的真空妙有阿!」

当我还在用逻辑硬啃这段文字时，DeepSeek 反而在劝我别掉进「点破天机岂是懂」的圈套——它本身便是对理性高傲的正告，约请你跳出文字游戏，直观心里。

当干流AI都在代码、数学范畴张狂内卷，争着抢着搞 Agent 开发时，写作才能反倒成了被忘记的旮旯。从某种视点说，这却是个好消息——AI 彻底替代修改的那一天，好像又往后推了推。

我测验让它创造一个「蚊子在冰岛开发布会」的荒谬故事。惋惜的是，DeepSeek V3.1 的 AI 味仍然很重，很喜欢拽大词，哦不对，更精确地说，DeepSeek 味仍是那么重。

当我要求它写一则「AI 与人类抢夺文章作者身份」的故事时，能显着感遭到某些阶段信息密度过高，反而形成视觉疲惫，特别意象堆砌感过于显着，反而削弱了叙事张力。

别的，这次版别更新中最有目共睹的改变，是 DeepSeek 在官方 APP 和网页端移除了深度考虑形式中的「R1」标识。此外，DeepSeek R1 还新增了原生「search token」支撑，意味着查找功用得到了进一步优化。

一起，有估测以为，DeepSeek V3.1 或许是交融推理模型与非推理模型的混合模型，但这样的技能道路是否正确，还有待商讨，而阿里 Qwen 团队在上个月也表明：

「通过与社区交流和深思熟虑，咱们决议不再运用混合考虑形式。相反，咱们将别离练习 Instruct 和 Thinking 模型，以取得最佳质量。」

到发稿前，全网翘首以待的 DeepSeek-V3.1-Base 模型卡仍未更新，或许等正式对外发布后，咱们能看到更多风趣的技能细节。

上一篇: 国家统计局：11月份制造业采购经理指数（PMI）为492%

下一篇: 《楚乔传》四大败笔：假大空抠图李沁穿衣被

实测低沉上线的DeepSeek新模型：编程比Claude 4还能打写作…仍是算了吧 附彩蛋

实测低沉上线的DeepSeek新模型：编程比Claude 4还能打写作…仍是算了吧附彩蛋