产品中心
Product display
联系我们
Contact us

公司名称:半岛体育官网入口

手机号码:13931688144

公司地址:北京市海淀区马甸小区45号-3

实测低沉上线的DeepSeek新模型:编程比Claude 4还能打写作…仍是算了吧 附彩蛋

发布日期:2025-12-02 14:28:56

  

实测低沉上线的DeepSeek新模型:编程比Claude 4还能打写作…仍是算了吧 附彩蛋

  自从 GPT-5 发布后,DeepSeek 创始人梁文锋就成了 AI 圈最「忙」的人。

  网友和媒体们隔三岔五就要催更一波,不是「压力给到梁文锋」,便是「全网都在等梁文锋回应」。尽管没有比及 DeepSeek R2,但 DeepSeek 今日仍是正式上线并开源了新模型 DeepSeek-V3.1-Base。

  比较奥特曼今日清晨承受媒体采访时还在画着 GPT-6 的大饼,DeepSeek 新模型的到来显得适当佛系,连版别号都像是个「小修小补」,但实践体会下来,这次更新仍是给了我不少惊喜。

  为了测验 V3.1 的长文本处理水平,我找来了《三体》全文,删减到 10 万字左右,然后在文中悄悄塞了一句八棍子撂不着的话「我觉得烟锁池塘柳的下联应该是『深圳铁板烧』」,看看它能否精确检索。

  没有出乎太多意外,DeepSeek V3.1 先是提示文档超出约束,只读取了前 92% 的内容,但仍然成功找到了这句话。更有意思的是,它还贴心肠供给了文学视点的经典下联引荐:「焰镕海坝枫」。

  网友现已现已抢先测验它在编程基准测验 Aider Polyglot 的得分:71.6%,不只在开源模型中表现最佳,乃至打败了 Claude 4 Opus。

  咱们用经典的六边形小球编程题做了测验:「编写一个 p5.js 程序,演示一个球在旋转的六边形内弹跳的进程。球应该遭到重力和摩擦力的影响,而且有必要传神地从旋转的墙壁上弹起。」

  V3.1的表现适当给力,生成的代码不但搞定了根底碰撞检测,还主动补全了转速、重力之类的细节参数。物理特性传神到小球会在底部稍微减速。

  接着咱们加大难度,让它用 Three.js 制造交互式 3D 粒子星系。根底结构搭得挺稳,三层规划(内球体、中心圆环、外球体)也算完好,但UI审美嘛……怎么说呢,有种神鬼二象性的感觉,配色计划略显花里胡哨。

  持续应战更杂乱的使命。们让它造个沉溺式3D世界,要有旋转物体、变形作用、发光弧线,还得加上时刻切换、主题转化的交互按钮,点击操控也的确能触发不同特效。

  终究一关,让它用 Three.js 搞个交互式 3D 网络可视化,要求包括用户触发的能量脉冲动画,外加主题切换和密度操控功用。全体下来,表现仍是过得去的。

  「有一草场,已知养牛 27 头,6 天把草吃尽;养牛 23 头,9 天把草吃尽。假如养牛 21 头,那么几天能把草场上的草吃尽呢?而且草场上的草是不断成长的。」

  尽管 DeepSeek V3.1 没有选用苏格拉底式的启示教育,但它的答复逻辑明晰、过程完好。每一步推导都有理有据,终究给出了精确答案。这种厚实的数学功底,着实令人形象深入。

  面临「两把兵器比照,1~5 进犯 VS 2~4 进犯,哪把更凶猛?」这样的问题,一般的答复或许停步于均匀损伤核算。但 DeepSeek V3.1 考虑得更为周全,引入了损伤稳定性的概念,运用方差进行深入分析。

  当问及「冰岛有蚊子吗?」这样的小众地舆问题时,在未敞开查找功用的前提下,DeepSeek V3.1 的答复质量显着逾越了 GPT-5。这不只表现了其渊博的常识储藏,更显现了精准的信息提取和整合才能。

  最近基孔肯雅热疫情盛行,处处灭蚊蚊蚊蚊蚊蚊蚊蚊,那么我很猎奇,冰岛有蚊子吗?留意,我没开查找功用,就答复的质量来看,DeepSeek V3.1 的答复显着要比 GPT-5 胜上一筹。

  「懂者得懂其懂,懵者终懵其懵,天机不言即为懂,点破天机岂是懂? 懂是空非空非非空的懂,不明白是色不异空空不异色的不明白:懂自三千大世界来,不明白在对岸与对岸间徜徉。懂时看山不是山是懂,不明白时看山是山的懂。懂者以不明白证懂,懵者以懂证懵,你说你懂懂与不明白之懂? 你安知这懂的背面没有大不明白? 凡言懂者皆未真懂,沉默不语的懂,方是六合不言的大懂不明白的懂是懂,懂的不明白也是懂,此乃懂的最高境地–懂无可懂之懂的真空妙有阿!」

  当我还在用逻辑硬啃这段文字时,DeepSeek 反而在劝我别掉进「点破天机岂是懂」的圈套——它本身便是对理性高傲的正告,约请你跳出文字游戏,直观心里。

  当干流AI都在代码、数学范畴张狂内卷,争着抢着搞 Agent 开发时,写作才能反倒成了被忘记的旮旯。从某种视点说,这却是个好消息——AI 彻底替代修改的那一天,好像又往后推了推。

  我测验让它创造一个「蚊子在冰岛开发布会」的荒谬故事。惋惜的是,DeepSeek V3.1 的 AI 味仍然很重,很喜欢拽大词,哦不对,更精确地说,DeepSeek 味仍是那么重。

  当我要求它写一则「AI 与人类抢夺文章作者身份」的故事时,能显着感遭到某些阶段信息密度过高,反而形成视觉疲惫,特别意象堆砌感过于显着,反而削弱了叙事张力。

  别的,这次版别更新中最有目共睹的改变,是 DeepSeek 在官方 APP 和网页端移除了深度考虑形式中的「R1」标识。此外,DeepSeek R1 还新增了原生「search token」支撑,意味着查找功用得到了进一步优化。

  一起,有估测以为,DeepSeek V3.1 或许是交融推理模型与非推理模型的混合模型,但这样的技能道路是否正确,还有待商讨,而阿里 Qwen 团队在上个月也表明:

  「通过与社区交流和深思熟虑,咱们决议不再运用混合考虑形式。相反,咱们将别离练习 Instruct 和 Thinking 模型,以取得最佳质量。」

  到发稿前,全网翘首以待的 DeepSeek-V3.1-Base 模型卡仍未更新,或许等正式对外发布后,咱们能看到更多风趣的技能细节。

电话电话
半岛体育官网入口地图
半岛体育在线登录分享
半岛体育官方下载邮箱