00:00 / 00:39
连播
清屏
智能
倍速
点赞90
00:00 / 01:04
连播
清屏
智能
倍速
点赞NaN
实测翻车!千问3.5写个小游戏烧了我1000万Token! #大模型实测 #千问35 #避坑指南 #AI写代码 #Token刺客 一、实测背景:用千问3.5开发3D小游戏 1. 测试目的:通过TRAE平台,使用千问3.5生成一个3D滑雪小游戏,测试其代码生成能力和实际效果。 2. 生成结果:经过多次对话优化,最终生成了一个滑雪场小游戏,支持方向转动,但存在bug(如滑出屏幕外)。 二、严重问题:Token消耗惊人 1. Token消耗:整个开发过程调用138次,消耗超1000万Token。 2. 换算理解:100万Token约等于一本书,1000万Token相当于10本书的量。 3. 成本计算:按千问3.5定价0.8元/百万Token,消耗约8-10元。虽然单价低,但消耗量巨大,若换成高价模型则成本爆炸。 三、对比测试:谷歌Gemini 3表现 1. 同样提示词:使用谷歌平台生成同款滑雪小游戏。 2. 对比结果: - 运动逻辑:谷歌Gemini 3更还原滑雪场景,运动逻辑更真实。 - 画面表现:两者差距不大,但谷歌画面稍好。 - 成本优势:谷歌平台免费生成在线APP,无Token消耗压力。 四、模型排名:千问3.5实际表现 1. 查询平台:主流大模型竞技场排名(人工反馈评估)。 2. 排名数据: - 千问3.5(3397B):排名第20,超越GPT-4.5,但与头部差距明显。 - 亮点模型:豆包Seed模型排名第4,GLM-5排名第12。 - 榜首:Claude Opus 4.6。 结论:千问3.5声势虽大,但实测效果和排名均未达顶尖,与闭源模型仍有差距。
00:00 / 02:39
连播
清屏
智能
倍速
点赞17
00:00 / 00:28
连播
清屏
智能
倍速
点赞0
00:00 / 00:42
连播
清屏
智能
倍速
点赞10
00:00 / 00:33
连播
清屏
智能
倍速
点赞2
00:00 / 00:52
连播
清屏
智能
倍速
点赞0
00:00 / 00:53
连播
清屏
智能
倍速
点赞13
千问是一张王炸牌! 其实我之前也跟很多人一样,觉得阿里系不行了。做内容电商被抖音、快手、小红书追上,做搜索电商被京东、拼多多吊打。 做社交对标微信的来往、做图文对标小红书的逛逛、做视频对标抖音的鹿刻,估计这个大部分人都没听过。反正也都没做起来。感觉昔日一哥都快被挤下牌桌了。 吴泳铭上台之后,阿里这波改革简直太争气了!铁腕聚焦、断臂求生,直接甩出了千问这张王炸牌! 这才几天呀!2月6号我还在美滋滋抢25块钱的免单券呢!我用过千问之后真的离不开了,查出行、订机票酒店、找吃喝玩乐,我现在什么都问它。 我预感它真的会像当年的抖音一样, 彻底颠覆我们的消费方式。 以前买东西要搜、要翻、要对比评价, 现在你直接跟AI说需求, 它不是搜关键词,不是比价,不是看评价, 而是真的懂你、帮你决策、帮你选。 省时、省心、还精准。 上线没几天就1.3亿日活,直接可以跟头部AI battle!我是真的感受到,时代真的变了。 作为一个珠宝博主,我也感受到了巨大的压力。 我之前拍了600多条珠宝科普、鉴定视频,放到现在,这种号真的很难做起来。因为大家有问题,直接问AI就够了,它是有大数据模型的。不仅权威准确、还快。普通的知识科普,已经不稀缺了。 AI取代的,从来都是只会搬运知识的人, 取代不了有经验、有审美、有温度、有真实货源的人。 所以2026年我想得特别清楚: 一定要做小而美,不盲目扩团队; 产品一定要有特色,不做大通货; 更要给客户足够的体验感和情绪价值; 少拍科普,多拍我的生活、我的感悟、我的真实视角。 未来电商的核心, 不再是信息差,而是信任差、审美差、价值差。 AI一来,对我们做生意、做内容的人来说, 既是巨大挑战,更是巨大机会。 未来不再是谁懂更多知识, 而是谁更懂人、更懂美、更值得被信任。 真的很庆幸生在这个伟大的时代, 时代在变,我们也要跟着变。 跟上时代不算厉害, 成为时代里那个不可替代的人,才是真厉害。
00:00 / 03:26
连播
清屏
智能
倍速
点赞40
00:00 / 00:52
连播
清屏
智能
倍速
点赞0
00:00 / 01:45
连播
清屏
智能
倍速
点赞3
00:00 / 00:36
连播
清屏
智能
倍速
点赞0
00:00 / 01:01
连播
清屏
智能
倍速
点赞0
00:00 / 00:39
连播
清屏
智能
倍速
点赞299
00:00 / 00:30
连播
清屏
智能
倍速
点赞1
00:00 / 00:45
连播
清屏
智能
倍速
点赞0