00:00 / 01:46
连播
清屏
智能
倍速
点赞10
00:00 / 03:01
连播
清屏
智能
倍速
点赞341
00:00 / 01:24
连播
清屏
智能
倍速
点赞3
00:00 / 01:32
连播
清屏
智能
倍速
点赞7
00:00 / 05:18
连播
清屏
智能
倍速
点赞19
DeepSeek v4、GPT 5.5,8 大模型编程实测 这两天,DeepSeekv4与GPT-5.5接连发布,为了直观观察不同模型前端编码能力,我让它们和目前编码能力较强的6个模型进行了一次横向实测对比。 本次测试,均开启最高思考模式,并使用完全相同的提示词: “开发一个单页 HTML 3D 飞行避障游戏,需同时适配电脑端和手机端。场景为无限生成的霓虹沙漠地平线。玩家控制一架尽量精致的飞机,通过左右方向键操作;手机端支持直接拖动飞机,以躲避障碍物并收集发光晶体。飞机加速时需具备基于 Three.js 的粒子拖尾效果。整体场景需明亮、细节逼真,游戏内文字使用中文。” 测试结果 1. DeepSeek v4 Pro 代码一次生成并成功运行,未发现明显 Bug。飞机建模精致,整体操作较为流畅。不足之处在于游戏不支持鼠标与屏幕触控,仅支持键盘操作。键盘方向与飞机实际移动方向相反。 2. GPT-5.5 代码一次生成并成功运行,未发现明显Bug。飞机与场景视觉效果较为出色。操作体验流畅,同时支持键盘、鼠标和屏幕触控。但生成耗时较长,接近 20 分钟。 3. Claude Opus 4.7 代码一次生成并成功运行,未发现明显Bug。整体操作较为流畅,但飞机与场景设计相对简单。游戏难度偏高,可玩性较差。 4. Kimi K2.6 代码一次生成并成功运行,未发现明显Bug。飞机与场景设计相对粗糙。键盘响应过于灵敏,可控性和可玩性较差。 5. Mimo V2.5 Pro 代码一次生成并成功运行,未发现明显Bug。飞机与场景设计相对简洁,操作体验较为流畅。飞机移动加入了翻转效果,增强了动态表现。同时代码生成速度较快。 6. GLM 5.1 代码生成过程中出现两轮Bug,经修正后可运行。飞机设计精致,操作体验也较流畅。但场景中没有障碍物,可玩性差。 7. MiniMax 2.7 代码一次生成并成功运行,未发现明显Bug。飞机与场景设计相对粗糙,操作体验尚可。但场景中出现了一个异常障碍物,会随着飞机飞行持续后退。 8. Gemini 3.1 Pro 代码生成过程中出现三轮Bug,经修正后可运行。场景设计简单,飞机主体不够清晰。同时,键盘控制过于灵敏,操控难度较高。 我为本次测试搭建了专门的体验网站:modeltest.caprompt.com。大家可以直接进入网站,亲自体验。 #模型测试 #DeepSeekV4
00:00 / 02:22
连播
清屏
智能
倍速
点赞2
00:00 / 04:15
连播
清屏
智能
倍速
点赞5