粉丝4350获赞4.2万

你有没有这种感觉, herme 写的方案听起来很完整,但一落地,要么虎头蛇尾,要么中途跑偏。不是他不想做好,是他缺一个可靠的执行引擎。 具体表现是什么?第一,任务碎片化,做一半忘一半,永远再重新开始。第二,没有状态追踪,做到哪了,卡在哪了,他自己也不知道。第三,缺乏自我,纠错,错了继续跑,跑完才发现全废了。 superpowers 出场,它是 hermes 的 执行引擎,解决的不是做什么的问题,而是怎么可靠交付的问题。它把 ai 的 输出从随意发挥,变成一个闭环系统。 闭环分四步,第一步, plan, 拆解任务,理清依赖,排好优先级。第二步, execute, 一 步一步执行到底,不跳步,不遗漏。第三步, reflect, 做完复盘哪里卡了,哪里错了。第四步, improve, 把复盘结论固化成经验,下次更快更准, 循环往复,每次迭代都更强。 plan 阶段,解决三个问题,不忙动,不急着动手,先看清楚大局,不遗漏,把所有子任务依赖项都列出来,不高估自己,准确评估工时,不搞理想化排期。 x q 阶段,每个步骤都有状态记录,跑到一半断了也没关系,下次从断点继续。遇到异常不是一挂了之,而是补货记录继续。 reflect 阶段,不是简单说做完了,而是认真分析哪里做得好,哪里要改,下次注意什么。安装,只需要一起命令 scale install superpowers, 效果是可以量化的。同样一个复杂任务,有 superpowers 的 hermes, 交付速度提升三倍,反功率降低七成,不是五倍十倍那种虚标,是实测数据。 装完 superpowers, hermes 补上了执行层的最后一块拼图,现在它是真正能扛活的数字分身,能计划、能执行、能复盘、能进化。关注丁正新,下期讲 brain hermes 的 终身记忆系统。

最近全网在热议一件大事,就是马斯克旗下的 spacex 要上市了,六月十二日正式挂牌,那最高的估值达到了一点七五万亿美元, 折算下来大概就是十一万亿人民币,甚至超越了现在的苹果公司。那不少国内的朋友,他就动了心思,就不知道咱们身在国内能不能去参与。 其实实话告诉大家啊,咱们普通人也是可以参与的,但是如果说你在参与之前没有搞清楚下面这三个问题就盲目入场,那大概率是会吃亏的。第一个问题就是,呃,要警惕马斯克这三个字带来的估值溢价, 因为你投 spacex 其实不只是投资一家航天公司,航天企业更是在为马斯克的个人光环和流量在买单,而这种绑定明星创始人的个人光环的影响,往往是一把双刃剑。 呃,其实我们可以去参考特斯拉的情况,就可以一目了然了,在二零二二年的时候,特斯拉从高位一路南下,跌幅超过了百分之七十,所以说明星 ip 它是加分项,但同时也是最大的风险点。第二个问题呢,就是我们要理解一点,七五万亿美元估值是一个什么样的概念, 一家还没有正式上市的公司,就被市场给到了超越苹果的天价估值,其实在一定程度上相当于把未来好几年的这个上涨的空间提前的透支了。 那我们要知道啊,因为资本市场看的是预期,所以但凡顶着史上顶级估值上市的企业,其实往往意味着最好的行情早已经结束了。那么第三个问题呢,就是,其实我们看过往明星公司上市的真实表现,就拿二零一九年的这个网约车双巨头的乌本儿和来福车来说啊, 当年他们也是风光无量的,就和如今的这个 spacex 是 一样的万众瞩目,但是呃,他们的这个创始人同时也是行业内的顶尖人物, 可是上市之后他们这个结果其实是出人意料的。那么来福车呢?他开盘就一路下跌,首日跌幅就已经将近了百分之十五,紧随其后上市这个 uber, 他 首日的跌幅也将近了百分之八。但是你说是这两家企业他的实力不行吗?那当然不是了, 其实问题的根源很简单,就在于刚才说的这个第二个问题,就是说在上市之前,市场已经把所有的利好,乐观的预期全部都已经核算到你的这个价格里了, 所以等到正式挂牌的那一刻,那么立好彻底的兑现,后续自然很难在短期有很亮眼的表现。那么搞懂了这个可能存在的风险,我们再聊一聊 spacex, 它本身到底是靠什么赚钱的? 其实你可以把它理解成,嗯,太空版的物流公司和这个宽泰的运营商,它主要是做这个火箭发射和呃,卫星互联网这个业务 主要的客户是谁呢?就是苹果、谷歌、亚马逊这些全球的科技巨头。所以其实按照行业的规律来说啊,它上市之后大概率是会被纳入到纳萨科一百指数的。所以我我觉得咱们普通人来说啊, 不用去做短期的博弈,坚持长期的去定投才是更加稳妥的选择,这样既可以摆脱选股的焦虑,也可以慢慢的平盘股价的大幅波动。

今天我将介绍 i english 当中的 etp 是什么? etp 全称 english through pictures, 也就是通过图片来学英语,怎样去学呢?我给大家演示一下。 进入这个里面以后,里面你先是听到单词,然后要在图片当中把这个 king 找出来,这是图片中的样子,这是现实生活的样子,你看 king king 完了过后,你就进入下一个了, 他有什么作用呢?第一个,训练孩子的听力词汇,孩子不断的在听到这个单词,然后又与图片图片相对应以后,他当听到这个单词的时候,脑海当中就反映出这个单词对应的意思是什么。第二个,训练孩子的 英语思维,我们学英语呢,就是要有英语思维 a etp 呢,就是通过声音和图片来帮孩子建立英文思维,里面没有一个中文,孩子听到这个意思,这个声音,看到这个图片,直接脑海中就反映出这个英文了。 第三个,培养孩子的观察力和专注力,因为里面的图片还是比较隐蔽的,让孩子在认真的观察,专注的去找,才能够找到。第四个,培养孩子学习英语的兴趣, 我们传统学英语呢,就是枯燥的去记单词,而这个呢,让孩子单词不用记,在玩中就可以把单词给掌握了。第五个,培养孩子的一个容那个成就感, 因为它里面可以有各种比赛,一对一,一对一比赛,当你用时比别人短,完了过后,你就会可以得到一个金色的奖杯,还可以进行三对三的比赛,五对五的比赛,只要用时比别人短,你就可以赢了。 最近呢,我们全国也在进行第二届的 etp 大战,每到周末孩子都可以约起来做 etp 大战第六个, 第六个作用呢就是激励孩子更好的去坚持。我们 app 不是可不是可以一直玩的, 只有新用户在刚开始的前七天可以有六张券可以玩,等他玩了六张六次以后,要靠怎样子去玩了,需要他努力的去读英语才会有 券给他,每十分钟读十分钟才会给他一张券,才能够再进行玩。所以我们真正的把玩和游戏结合在了教育中,在玩中学,学中玩,赶快让你的孩子一起一起来玩 app 游戏吧!

们有一双鞋子从国外买的八九百,甚至没有国内的好,这话你你受得了吗?这双飘债应带货的 speak cat 啊!这双鞋子分为国内版和 国外版两个版本,一开始我是不知道的啊,因为这双鞋子一开始的时候很贵,而且官方控价也很离谱,大概就是六七百块钱左右。国内版是这样的,然后国外版的话,那时候是比较便宜,我买的订单看了一下,应该是六百多块钱。然后我最近发现这双赛车鞋的价格真的是值 直线下降啊,难道是朴彩英的代言合同快过期了,着急出库存吗?有一说一啊,确实,国内版现在的三四百块 钱的整体质感会比国外版好一点。这个白色的大 logo, 国外版也是起皮的材质,很容易脏污,国内版换成了荔枝纹的皮革,更耐造,而且更好打理。不过二指依旧有一个共同的缺陷啊,就是这双鞋子普遍反应就是 容易掉色的一个问题,特别是雨天,有的朋友反馈说下雨天,然后里面穿了个白袜子,一脱整个袜子都黑了。那至少到目前为止,我是还没有发现这样的一个现象,所以说买之前这一点一定要考虑好啊,尺码方面呢,正常码拍就可以了。

据路透社消息,中国 deep six 宣布,旗下旗舰大模型 v 四 pro 将永久降价百分之七十五, 我想这对用户来说是件好事。 i guess this is good for the customer。 但这也让人不禁质疑各家人工智能企业的估值水平。 ai companies though 深度求索,主打大模型服务,用户可以像调用 open ai 等平台接口一样使用它的模型。 just like you would with open ai or whatever else。 在 此之前,它的定价就已经低于 open ai, 也 anfrp 如今再度降价百分之七十五。 眼下大模型调用单价断崖式下跌,这也是我严重质疑这类 ai 企业估值的一大原因。 i highly question the valuations for these ai companies when you look at the cost of tokens absolutely。 我早前使用 openai 应用程序接口时,每千令牌的费用大约是五分之一美分。 it was something like it was like a fifth of a penny per thousand tokens right。 一 千令牌大致对应七百五十个单子,当时的收费标准就是如此。 that's basically where you were at right so。 也就是说,调用一万令牌成本大约只要两美分。 gonna cost you about two cents that type of。 如今在看 openai 以及众多同行,不仅模型性能持续迭代升级,使用成本更是降到了离谱的地步。 at this point, but the cost of the models has come down just to an insane degree。 目前 openai 的 输入令牌价格因为每百万令牌四十美分, something like 40 cents per million。 打个比方,一百万令牌的文本量差不多相当于整套指环王三部曲,再额外加上几本书的内容。 lord of the rings trilogy plus, a couple of additional books so you can 把这么多内容全部输入 open ai, 成本也仅需四十美分,这个价格低得惊人。要知道,这类服务是按照实际使用的令牌数量来计费的。 如果只是用来解答简短问题,区区四十美分就能实现海量问答。也正因如此,我实在无法理解为何这些 ai 企业能坐拥万亿美元的估值。 不妨算一笔账,输入百万令牌仅需四十美分,那要产生足以撑起万亿美元市值的营收平台,得承接多么庞大的调用量? how many tokens have to be inputted in their systems before they start getting revenue that makes a trillion dollars to begin with makes sense。 要知道,企业上市时的估值通常被视作齐在公开市场的最低估值。 company will ever be valued on the public market。 业内普遍预期估值后续只会上涨。想要达成对应营收目标,匹配万亿美元估值所需的令牌掉用量将是一个天文数字。 to make a trillion dollars make sense just is objectively insane。 与此同时,令牌单价还在持续走低, 中国的深度求索就是典型例子。如今他再度大幅下调令牌单价,行业已然陷入价格战。在这种形势下,万亿美元的估值根本站不住脚。 where i simply don't see how this holds up, you know a trillion dollar value。 关于这件事,基本情况就是这样。深度求索在声明中表示,旗下旗舰模型 v 四 pro 将永久降价百分之七十五,价格降至原价的四分之一。 该公司并未说明此次永久降价是否源于升腾九五零芯片供货量提升,这款芯片被用来充分释放 v 四模型的性能,这也是国内行业的一大现状。受相关限制,国内很多领域无法使用英伟达的硬件产品,因此华为等企业开始自主研发人工智能硬件。 如今,这类国产硬件正越来越多地应用到各大数据中心。随着国产硬件逐步落地数据中心,国内 ai 企业的发展步伐也会越来越快。 此次调价后, v 四 pro 接口调用价格调整为每百万令牌零点零二五元至六元,折合零点零零三五至零点八三美分。 根据使用场景区分定价,此前价格为每百万令牌零点一元至零点二四元。 声明中解释,令牌是 ai 模型处理文本的基本单位。简单来说,此次百万令牌的调用成本出现了大幅下调,而这背后一托的正是升腾芯片, 折算下来,最低每百万令牌仅需三分之一美分,最高也才零点八三美分。 不同功能的调用价格已有区别,比如图像识别功能,如今的大模型可以实现多种功能,不少模型都属于多模态,大模型能够胜任各类任务,既可以解析语音,也能识别图片。 不同版本的模型性能也存在差异, oppenai 也是如此,它推出了极速版、轻量版等不同类型的模型,其中轻量版体积最小,响应速度最快,与之相对的就是旗舰顶配模型。 上面所说的价格差异对应的就是不同版本模型,大家不妨仔细想想其中的逻辑 处理。一百万令牌的内容,也就是整套指环王三部曲,外加几本读物,最低成本只要三分之一美分。 the entire lord of the rings trilogy plus a couple of additional books for a third of a penny。 需要说明的是,这个低价对应的是极速版或轻量版模型,自然不是性能最强的旗舰版本。但即便是最高零点八三每分每百万令牌这个价格也低得超乎想象。 不难看出,人工智能的使用成本正在急剧下滑。 yeah! 也正因如此,我完全想不通问一美元的估值究竟从何而来? and as i say that's where i can't grasp where these trillion dollar valuations are even coming from。 再看商业模式,相比部分美国 ai 企业,国内同行的思路反而更加务实。 the chinese companies actually don't seem to have their heads quite so firmly up their asses as the american companies do。 美国企业即便把单价降到每百万令牌四十美分,也寄希望于智能体服务来拉动营收。 these agents 他们的设想是,这类智能体会持续不断地消耗令牌资源,如果只是单纯向 ai 提问,成本几乎可以忽略不计,花费甚至不到一美分,靠 这样的收费根本撑不起万亿美元的市值。所以他们把希望寄托在智能体上,让智能体在后台持续为用户提供各类服务。 to perform some services for you。 按照设想,这类智能体会产生海量的令牌调用需求, anfric 旗下的克劳德 claude 就是 一个例子,该公司曾封禁了一批第三方调用工具,原因就是这类工具会让智能体在后台长时间运行,疯狂消耗令牌,几乎让公司入不敷出。 it's just bankrupting and this is。 官方封禁相关工具的核心原因,这里存在一个现实问题,目前多数智能体的运行效率其实非常低下。 are so fundamentally inefficient? 道理很简单,当一项资源近乎免费时,很多爱好者会想方设法以最低效的方式去消耗它。 and you have all these geeks that want to play with it they are going to find the absolute least efficient way to burn as much。 但当用户逐渐理性摸索出智能体真正的使用场景后,实际的令牌消耗量并不会像预想中那么庞大。这也是 ai 行业估值逻辑的矛盾所在。每百万令牌低至三分之一美分,如何撑起万亿美元估值? is how do you get from a third of a? 即便按每百万令牌四十美分的价格计算,同样说不通。尤其是在令牌单价持续走低的大环境下,这套逻辑根本行不通,完全不符合基本的数学逻辑, 无异于强行把二加二算出一万亿的结果。实在难以理解,硬凑出一个万亿市值毫无道理。要知道,数学不是这么算的, two equal a trillion。 这违背了基本常识,道理就是如此。好了,说说你的看法吧,你如何看待?深度求索此次降价?要知道,部分场景下处理百万令牌的费用才三分之一美分。 million token processing at least again at for certain things。 那 你又怎么看待 openai? openai, 它的定价是每百万令牌四十美分, 你能想明白这样的定价要如何支撑万亿美元的估值吗?我是想不通。欢迎在评论区留下你的观点。

五月二十八日, anthropic 发布了 cloud opus 四点八。如果只看名字,这可能不是一条特别刺激的新闻,它不是 cloud 五,也不是传闻里更强的 missiles。 官方甚至没有把它包装成一次跨时代发布,而是很克制地说,这是相对前代一次温和但可感知的提升。 但我反而觉得,这正是 opus 四点八最值得看的地方,因为它说明大模型竞争正在从一个阶段进入另一个阶段。过去大家最关心的是谁更聪明,谁跑分更高,谁回答更惊艳。但现在, 真正的竞争开始变成,谁更可靠,谁更适合长时间工作,谁能在复杂任务里少犯错? 谁能在不确定的时候主动告诉你这里有问题? cloud opus 四点八这次升级,重点不是让 cloud 看起来更会聊天,而是让它更像一个能交付工作的 ai agent。 先把基础信息说清楚, cloud opus 四点八是 antropic 最新的旗舰 opus 模型 api, 名字是 cloud o p u s 四杠八,官方定位是复杂推理、长周期 agent 编程以及高自制度工作 价格没有变,还是每百万输入 token 五美元,每百万输出 token 二十五美元。上下文窗口在 cloud a p i a w s bedrock 和 vx a i 上市,一百万 token 最大同步输出一百二十八 k token。 it hub copilot 也开始支持 opus 四点八,但部分用户会看到逐步灰度上线。这些参数本身不难理解,但它们背后有一个更大的问题, 当 ai 不 再只是回答问题,而是要真正干活。它到底差在哪里?差的不是一句更漂亮的回答,而是三件事,第一,它能不能长期保持任务状态。第二,它能不能在复杂环境里正确使用工具。第三,它能不能发现自己哪里不确定,哪里可能错了。 opus 四点八的升级基本都围绕这三点展开。先看编程能力。官方数据显示, opus 四点八在多项编程和 agent benchmark 上超过前代。 github 的 早期测试也提到, 它在真实代码理解、代码生成、复杂问题处理和大代码库导航上比之前版本更进一步。但这里不要误解, 这不是一个所有榜单横扫的故事。 opus 四点八的意义不是它在每一项测试里都第一,而是它的能力更偏向真实工作流。 也就是说,它不是只会在一道题里写出正确答案,而是更擅长在一个真实项目里看代码、找关系、改文件、调用工具、跑测试,再根据结果继续修。 适合普通聊天模型是两种能力。聊天模型最怕答错, agent 模型最怕半路跑偏。因为真实任务不是一道题,而是一串行动。 中间任何一步判断错,工具用错,上下文丢失,最后都会变成一个看似完成,其实不能用的结果。所以 anthropic 这次特别强调了一个听起来不那么性感,但非常关键的能力 诚实。官方说, opus 四点八更愿意暴露不确定性,更少做没有证据支撑的判断。在他们的评估里, opus 四点八让自己写出的代码缺陷不被指出的溜过去的概率大约降到了前代的四分之一。这句话其实很重要, 因为现在 ai 最危险的情况往往不是他不会,而是他不会还说自己会。他没跑测试,但说测试通过了。他没读完材料,但给出完整结论。他中间工具调用失败了,但最后总结得向一切顺利。 在普通问答里,这叫幻觉,在真实工作里,这叫风险。所以 opus 四点八的诚实度提升,某种程度上比单纯跑分更值得关注。 一个能主动说这里不确定,这个输入有问题,这个结果需要验证的模型才更适合进入代码、金融、法律、企业流程这些高风险场景。 第二个重点是 effort control, 也就是努力程度控制。过去用 ai 很多时候只有一个粗暴选择,要么用快模型,要么用强模型。但真实工作不是这样的。 改一句标题,不需要深度推理,总结一封邮件,不需要拉满算力。但如果你让 ai 重构一个核心模块, 分析一份复杂财报,审查一份法律文件,他就必须花更多时间思考、验证和回看。 opus 四点八默认是 high effort, 用户可以调低 effort, 让它更快更省额度。也可以选择 extra 或 max, 让它在复杂任务上花更多 token 换更好的结果。这背后的趋势很清楚, 未来我们用 ai 不 只是选择哪个模型,还要给不同任务分配不同的思考。预算简单任务快一点,复杂任务深一点,高风险任务多验证几轮,这才是真正接近生产环境的 ai 使用方式。 第三个重点是 dynamic workflows, 这可能是这次发布里最能体现 anthropomorphic 方向感的东西。但 network workflows 是 cloud code 的 新功能,目前是 research preview, 它允许 cloud 先规划一个大任务,然后在同一个绘画里启动很多并行子 agent, 分 别处理不同部分,最后再验证输出并汇总给用户。这意味着什么? 过去你让 ai 改一个大项目,它通常向一个人坐在电脑前,从一个文件看到另一个文件,边改边猜边跑边修, 任务一大上下文就乱,状态就丢,最后很容易陷入反复调试。 dynamic workflows 更像是让 cloud 临时组织一支小团队,有的 agent 看模块依赖,有的 agent 迁移接口,有的 agent 跑测试,有的 agent 专门找问题,最后再把结果合并验证交付。 官方举了一个很激进的例子, cloud code 配合 opus 四点八,可以处理数十万行代码级别的迁移任务,并以现有测试套件作为验收标准。这其实说明了一件事, ai 编程的竞争已经不止是模型会不会写代码,而是系统能不能组织模型持续完成工程任务。这也是我认为 opus 四点八真正值得讲的原因,它不是一个单点能力升级,而是 anthropic 在 继续强化一套完整的 agent 工作方式。 模型负责推理工具负责行动,上下文负责记忆, effort control 负责分配思考预算, dynamic workflows 负责拆解合并型诚实度和评估机制负责把错误暴露出来,这些东西加在一起,才让 cloud 从一个聊天框逐渐变成一个工作系统。 当然, opus 四点八也没必要神话,它不是 missiles, anthropic 自己也说, missiles 级别模型还在更强安全措施之后才会面向更多用户,它也不是所有场景的最优解。 普通聊天。简单摘要,轻量客服用 opus 四点八可能太贵, dynamic workflows 也不适合小任务,因为并行子 agent 会带来更高 token 消耗。 所以更合理的判断是,如果你只是日常问答, opus 四点八不一定最值得用。但如果你做的是复杂代码、长文档分析、金融研究、法律审查、企业 agent, 或者任何需要长时间、多步骤可验证执行的任务, opus 四点八就非常值得关注。因为它反映的不是一个模型版本号变化,而是 ai 产品的重点正在转移,从回答得聪明转向执行得可靠,从单次输出漂亮转向长期任务稳定。从模型自己说完成了, 转向,系统能验证它真的完成了,这就是 cloud。 opus 四点八的核心价值。它不是最戏剧化的一次发布,但它很像一个信号 未来最强的 ai 不 会只是一个更会聊天的模型,它会是一个能规划、能调用工具、能组织子 agent、 能承认不确定、能接受测试检验的工作系统。而 opus 四点八就是 anthropic 朝这个方向迈出的又一步。

cloud opus 更新来了, answerphuback 发布了 cloud opus, 四点八,价格和四点七持平, 但这次它不是指变聪明了,而是更老实了,不确定会说不确定,代码有坑,也更愿意自己指出来,少一点应变答案。同时上线的还有 fast mode, 同一个模型输出最高快二点五倍, 不过这是溢价模式,只是比旧版 fast mode 便宜了不少。真正的大招是 cloud code 的 dynamic fork flows, 你 给他一个大任务,他会自己写工作流,拉起几十到几百个 sub agent 并行干活儿, 干完以后还会让另一批 agent 去复合挑刺儿收敛。官方拿 boom 迁移做案例,从 zig 到 rust, 约七十五万行代码,百分之九十九点八测试通过,十一天合并。 但官方也明确说了,这玩意非常非常烧头肯,所以它不是给你修小 type 用的,更适合大仓库迁移、安全审计、性能排查这种重活。以前是一个 cloud 陪你写代码,现在像是 cloud 拉了一整个工程小队来干活。关注我,带你了解更多 ai 资讯。


今天有妈妈跟我说,他们为了确保喊你慢听的第一步,那个听的环节能够扎实,他让孩子降低速度,反复听,然后把每一个单词都说给他姐妹姐妹姐妹,赶紧听,赶紧听,你这个加戏加的有点过头了,你这样会毁了他的兴趣的。 你把我们原本的很放松的听音频看图片的环节,变成了一个实打实的随时带着考核机制的英语听力检测题, 那样的话他会崩掉的,你会完全丧失了我们刷海尼曼本身的意义,就是我们本身是为了要在绘本当中,在分级当中逐级的去提升孩子的听力和阅读能力。你可倒好,你听了你就必须记住, 如,如果你没记住的话,你如果能够不能够复述出来,就说你没有听好,你这样的要求太有点过分,还有点变态 啊,不要这样,不要这样。另外呢,我们把就是把海尼曼的单词提前刷,你就可以降低海尼曼单词听的难度了。 第一个你不要,至于对于听带功力,第二个你把听的东西提前放置在那个能力星球里面,提前过一过就好了,他能听多少听多少,切记,切记盲目加戏,切记,切记盲目拔高标准, 不要把听读哈尼曼然后当成完全的阅读理解题和听力测试题,甚至你听一句要求他口述一句,有点没必要,甚至还有有一丢丢的偏执,甚至有一点点的变态,没有必要的。

anthropic 悄悄上线了 cloud opus 四点八,但这大次真正的信号不在模型本身,而在定价策略。一个模型拆成两个速度版本卖这件事比参数更新更值得关注。先看数字, oppo 四四点八标准版输入每百万 token 五美元,输出二十五美元。同时上线的 fast 版输入十美元,输出五十美元,正好是标准版的两倍,上下文窗口统一给到一百万 token。 从 overroute 的 上线记录看,标准版和 fast 版几乎同时挂出,前后只差两小时。 antropic 官方公告的发布时间是五月二十八日,这不是一次常规迭代,而是一次定价实验。拆开看这个策略在回答一个问题, 同一个模型能力,用户愿意为速度多付多少钱?标准版是和预算井对延迟不敏感的场景, fast 版瞄准需要实时交互的人,把这件事放进最近一周 openroute 的 变动里看,更有意思。 同一周内, quan 三点六二十七 b 输出涨价,小米 mike moov 二点五系列大幅降价, kimi k 二点六直接免费上线, 整个市场定价在剧烈震荡。 astropica 选这个时间点推双版本,像是在测试高端用户的付费弹性。我的判断是, oppo 四点八这次更新的核心不是能力越深, 而是商业策略的转向。 anthropic 在 用速度分层来试探不同支付意愿的用户群,这个模式如果跑通,其他厂商大概率会跟紧, 预算紧的先观望重度用户。 fast 版值得是,这个双版本策略,我会持续关注。


哈喽,你好,我是部导者杨宇,一个把复杂的 ai 知识讲的你也能明白。好,今天我们要讲的是算力啊,你可能在新闻上,在各大的 ai 主播上都能听到一个字叫做算力 好。那么算力怎么来的呢?你可以抽象的先把算力理解为一台汽车的发动机 好,也就意味着这个发动机的功率越大,那么它的速度越快,对应的 token, 也就是我们说的词源, 词源代表着大模型给你产生的结果,它分为很多细小的段去给你分成,不管是你的图形也好,还是你的视频也好,还有你的文字也好,它的这个最小的单位就叫词源, 那你可以把整个这个结果理解为一个拼图,这个拼图当中最小的一块,他就是一个,叫做磁源。好,那么有算力了之后,算力是怎么样去产生的?他是由我们的电 加我们的芯片。 好,怎么去理解芯片啊?各位的手机里面也有芯片啊,你每天这个芯片手机卡不卡,就是他的算力够不够,就是他的发动机够不够强, 发动机强会带来什么结果呢?这个结果他是每一块去运算的,他把整个结果拼出来拼图给你, 那么他从这拼到这,拼到最后,他是不是一个完整的结果?也就意味着算力越强, 它产生的结果的速度就越快啊。所以就为什么会有一些生成的视频要排很多个小时 啊?有些生成一段文字要很久,就是因为可能算力跟不上,那特别是一些在本地去部署大模型的朋友。好,那么继续关注我们,今天讲完之后,下期继续跟大家做一个分享。
