00:00 / 07:16
连播
清屏
智能
倍速
点赞1290
00:00 / 02:00
连播
清屏
智能
倍速
点赞15
00:00 / 00:58
连播
清屏
智能
倍速
点赞34
00:00 / 09:08
连播
清屏
智能
倍速
点赞444
Karminski2周前
Kimi-K2.6 前端/后端/Agent编程能力实测! 给大家带来刚刚正式发布的 kimi-k2.6 的正式版本的实测! 本次为了考验它的长程Agentic Coding能力, 我用 kimi-k2.6-code-preview 写了个 harness 游戏自动生成框架, 它可以根据给到的人设/场景/数值设计等规则, 自动生成关卡, 背景图片, 甚至配音! 其中框架驱动和草稿模型使用 kimi-k2.6, 文生图和生成语音由 kimi-k2.6 生成 prompt 后调用其它大模型生成. 最好玩的是, 我做了个"无头"版本的游戏cli接口, kimi-k2.6 能像玩互联网早期Mud游戏一样, 使用纯文本玩这个游戏, 每当它生成关卡之后, 他就可以直接进入游戏游玩一下, 来验证关卡设计得是否正确. 而内部设计又分为了对话生成skill, 脚本生成skill, 关卡生成skill, 游戏测试大师skill, 游戏资深玩家skill(由于检讨游戏性) 等等, 从而实现了让大模型自己写游戏自己玩! 每个关卡大概需要一个小时生成和验证, 如果并行验证应该还能更快一些(做多线程BFS/DFS). 另外本次依旧使用大家都熟悉的测试项目进行了前端/后端/Agent能力测试, 从测试来看, 复杂项目前端能力(建模, 空间理解, 物理模拟等)略有下降, 但后端和 Agent 能力有明显提升. 不过如果你是纯做网站的话, 可以用 kimi 网站上的的 k2.6 Agent 模式, 由于 Agent 能力足够强所以可以在这个模式下多步来提升生成的网站质量和交互体验. #kimi #kimik26 #moonshot #月之暗面 #kimicli
00:00 / 09:03
连播
清屏
智能
倍速
点赞1974
00:00 / 02:34
连播
清屏
智能
倍速
点赞2412
乂媒体2周前
你玩AI Agent,你的钱包同意吗? 我连KFC都不敢加蛋,你让我烧Token? 从对话助手进化到数字劳动力,说白了就是:AI开始抢我饭碗,还让我倒贴钱。 你没听说过Kimi Agent集群?300个子智能体并发跑4000步,PARL算法把信用分配玩得明明白白。我在这边单线程debug到凌晨三点,人家已经团队协作了——我头发不要面子? 开源圈更绝。OpenClaw小龙虾,社区贡献3286个技能,发邮件、控浏览器,全是自动化。结果呢?CVE漏洞一次爆10个。我连夜打补丁,一边吃泡面一边改log——这不叫开源,叫开坑。 Hermes学习循环你听说过吗?它记住了金鱼记忆痛点。我就不一样了,昨天写的代码今天就不认识了,git blame都救不了我。你说气不气? Codex从编程助手变数字同事,后台操控Mac,并行多智能体,还能持久化记忆。每周300万开发者,一半时间用来干非编码任务——我是不是该改行做产品经理? 但你别笑。Token计费一来,上下文膨胀到23万,自我修正跑几十轮,一天200美元API费就没了。我月薪才够烧几天? 影视圈也被AI漫剧炸了。Seedance 2.0出60秒电影级短片,Sora 2四天登顶,《Critterz》把3年压缩到9个月。Vibe Filmmaking——10集短剧3人10天,成本5594块。我996一个月,不如AI一键出片?特效师砍了75%,AI提示词导演我倒是想干,但HR说要五年经验——我上哪刷去? 最扎心的是Token黑洞。OpenRouter四周翻倍到13万亿,Kimi四档¥39-¥559,Claude Code最高$200/月。一家Agent创业公司,单用户日成本100-200美元——用贵的吃土,用便宜的奉劝退。 这不是赛博悖论?我写代码让AI干活,结果AI把我的攒的钱全烧成了Token。 最后问你:Computer Use、AutoGLM、Manus AI的20亿收购案,你还想追几个?Agent战国已开打,要么学会控Token,要么继续改bug养AI。 抬头看,头发又掉了几根。钱包空了,KPI黄了,Agent倒是跑得挺欢。
00:00 / 01:57
连播
清屏
智能
倍速
点赞0