openrotor 惊现一个神秘模型,一点儿介绍没有,但跑分和体感有点离谱。你看这个地方,面对复杂的后端接口报错,它像老程序员一样翻日历,改 bug, 重启服务。这种 adetic 自娱能力直接对标四点儿六 opus, 我录了一段完整实测,一起感受一下。我让他搭一个实时聊天系统,你看左边的文件树,他疯了,自己在那建文件夹。 server, client components, utis, 说明他在写第一行代码前就已经完成了任务。拆解知道一个实时聊天系统必须包含通信层、表现层和工具层,这种对于复杂目标的预言和股价搭建,就是长城规划的起点。 最绝的是,他建完 uts 文件夹,反手就写了个 hooks 来管理聊天状态,还是个急性子,魔性,根本等不及你提要求。说实话,这不像 ai 写代码,像一个干了十年的架构师在搭框架。最夸张的是,这里画面开始飘红了, connection, refuse, type, mismatch 一堆报错,正常魔性遇到这种情况基本完蛋。这个 polly, 他 把日制调出来了,然后精准定位到报错那一行,删掉重写再跑。还是报错。没关系,继续翻日制继续改,他自己在 bug, 整个过程我一个字没打就开始,他在那跟变器死磕了十多分钟,系统跑通了。这种一定要把活干完的交付执念有点像 organic 的 终极形态了。 经历这么多次红萍报错和重头之后,抬手就接之前的业务逻辑,继续完善还没有写完的实时表情包。他始终记得今天的主线任务是把系统跑通,这种跨长周期高强度抗干扰后的目标一致性明显和普通模型区分开了呀。最后看成品前段渲染出来的一瞬间,我愣了一下。 消息收发特别难。响应式布局,气泡渐变色,移动端适配全有,不是那种能用但丑的 demo, 是 真的能交付的东西。然后我去看后台 数据库的 schema 都给配齐了,字段怎么定义,表关联怎么做,它在搭框架的时候就已经全自动跑通了,全站一次性并发执行。这种逻辑密度和生产级的稳定性以前只有 opus 才能做到。所以现在问题来了,这个 polly 到底是谁家的?四点六 sonata dixie v 四我不知道,如果是国产模型,我真的吹爆评论区猜一下这到底是哪路神仙。
粉丝2.8万获赞22.4万


全球 ai 模型聚合平台 open roder 在 毫无预告的情况下,上线了一款代号为 pony alpha 的 匿名模型,该模型被平台标注为 stealth, 未透露任何开发团队架构参数或所属机构信息,却凭借其惊人的技术表现,在短短二十四小时内冲上 open roder 热度榜首,引发全球开发者社区的集体关注。那么本期节目我们就来聊聊这个悄然上线的编程幽灵。 openword 官方描述, pony alpha 为前沿基础模型,在编程、智能体、工作流推理及角色扮演方面表现强劲,特别强调其极高的工具调用准确率。 模型支持两百 k 秤下文窗口,最大输出一三一 k tokens, 且完全免费开放使用。这一策略进一步加持了其神秘色彩与传播热度。 开发者社区的失测案例迅速涌现,有用户配合 cloud code 运行 minecraft 项目,历时约两小时生成一百七十 kb 纯 javascript 代码。有人构建了包含三十五个电台的全球收音机直播网站,单文件实现超过五百行代码。 更有开发者耗时三小时复刻出可运行的精灵宝可梦、红宝石风格三 d 游戏,评价其比原版更接近原版。 在 svg 生成、前端界面设计等任务中,该模型被多次认为展现出 cloud opus 四点五级别的品位,甚至更高水准。此次发布的时间点颇为微妙,二月六日当天, antropica 与 openai 分 别推出了 opus 四点六和 gpt codex 五点三, 两者均强调长任务与 agenc 能力。而春节临近的节点,也恰逢国产大模型密集发布预告期, pony alpha 以匿名之资空降赛道,如同一匹闯入竞技场的黑马,瞬间点燃了行业好奇心。自 pony alpha 亮相起,其真实身份便成为技术社区热议的焦点。 oprah roder 仅透露该模型来自某个全球实验室最受欢迎的开源模型的专项进化版,而这具模糊的提示引发了多角度的技术侦探与行业猜想。猜想一,多方证据将矛头指向智普 ai 即将发布的 glm 五。 首先,时间线索高度吻合,智普 ai 在 二月初官方宣布计划在未来两周内发布新模型,首席科学家唐杰教授也在社交平台透露, g l m 快 了, 与 pony alpha 的 上线时间完美衔接。其次,技术特征匹配。有开发者通过 po c 令牌测试发现 pony alpha 与 g l m 四使用同一套分词器, 在系统提示设置为自定义后,询问模型型号,他曾回答, i m g l m。 而且多位测试者指出其生成的前端代码带有中国模型的味道,但更加干净精致, 延续了 g l m 系列在代码生成与界面审美上的优势。二零二六年为中国农历马年, pony 之名被普遍解读为春节献礼。 猜想二, deep seek v 四 deep seek 自 v 三版本在春节党一战成名后, v 四被视为二零二六年春节最受期待的国产模型之一。 replat ceo 等多位技术领袖公开猜测 pony alpha 可能是 deep seek v 四,认为其编程风格与性能突破符合 deep seek 的 技术眼睛路径。 当然,还有不少其余的猜想,例如由于 pony alpha 在 代码生成质量、 svg 审美等方面被多次类比为 opus 级别, 不少开发者怀疑其可能是 antropica 未官宣的 sonnet 五或 cloud 五的早期测试版本。此外,结合 x ai 并入 spacex 的 组织变动、 apacus ai 联合创始人等推断可能是 grog 系列的升级版。 这场无奖竞猜背后,是技术社区通过输出对比、分词器分析、性能精准测试,乃至文化隐喻解读展开的集体推理,反映出行业对他的身份这么感兴趣呢? tony alpha 的 核心突破在于将智能体工作流从概念验证推向实践可用,也就是 agencoding 能力进入可用阶段。 它能够持续数小时保持上下文连贯性,进行多轮工具调用与复杂代码生成,真正扮演自动化工程师角色。面对人为构造的史山代码,它能进行安全的重构与优化,保留关键业务逻辑,这正是企业级应用的核心痛点。 受 pony alpha 及相关预期推动,二月九日港股质朴股价单日大涨百分之三十六点二二,反映出资本市场对国产大模型突破的高度敏感与乐观预期。 pony alpha 的 匿名现身恰如 ai 发展进程中的一个领域,技术进化已进入暗箱突破阶段,模型能力以远超预期的速度逼近临界点,无论其最终身份为何,这匹黑马已近于期的速度逼近临界点,无论其最终身份如何,这匹黑 ai 正在从掩饰走向实干。 国产大模型具备全球竞争力,算力需求将迎来结构性爆发。在春节钟声敲响前,这场技术竞猜的结果或许即将揭晓,但可以肯定的是, ai 赋能真实世界的进程已因它的出现而悄然加速。

全球大模型超市 openroute 惊现神秘模型 pony alpha 在 平台上搜索第一,而且引发了国内网友热议,为啥呢?首先性能非常强,堪比最新发布的顶级模型 cloud ops 四点六。其次,它的名字 pony, 联想到刚好是马年,取这么个名字怕不是太巧,很多人都猜测这是一款来自中国的模型。先来看性能, 根据 open rota 的 说法,这款模型主打编码推理和角色扮演,针对智能体工作流程进行了优化,有很高的工具调用准确率,具有两百 k 的 上下文窗口。从网友实测来看,最惊艳的应该是模型的前端能力,很多优秀的案例都是一发入魂,比如这位网友做的这个全球收音机直播网站。 再看看这个音乐播放器 workflow 生成平台的前端展示页,可以看到这些作品的 ui 设计、审美、在线、功能完整,交互都很丝滑。至于这款神秘模型究竟是谁家的,目前众说纷纭,说啥的都有,但各位福尔摩斯、猎玩、狐客网友还是从各种蛛丝马迹中找到了答案。 首先,合作方 kilo code 表示,这款模型来自某个全球实验室最受欢迎的开源模型的专项进化版 开源。再考虑到马年和 pony 的 巧合,这大概率是一款国产模型,把范围缩小在一众国产选手中,那么可能性最大的那个答案就是 g l m 五。有网友把 openroute 的 系统提示符改成自定义,然后询问模型型号,他会回答, i m g l m。 还有网友发现, pony alpha 和 g l m 四背后用的是同一套分词器,而且智普在这个月初就官宣了,将在未来两周内发布新模型, 两者的实践也对得上。最后,无论这只小马是不是智普,从目前已经官宣的消息来看, deepsea 千问智普 mini max 这个春节的国产 ai 一定会非常热闹。

重磅的 pony alpha 神秘面纱终于揭开了,果然就是质朴 g l m 五啊!参数达到七百四十四 b, 也就是七千四百四十亿参数激活四百亿,预训练数据二十八点五, t 扣定和 a 阵的能力全都取得开源搜塔啊,使用体感完全是逼进可洛的 opus 四点五。其实就在它还是那个测试模型,大家都在猜,那期间 大家就发现它编程能力直逼可洛的 opus 四点五了。所以现在看来,谁说开源比不了 b 源,而真让这次发布意义翻倍的啊!是海光 d c u 确认了对零的深度适配, 也就是说,中国最强的开源模型,在中国领先的 g p gpu 芯片上发布即可用光伏组织汇聚的超六千家啊!这生态伙伴现在形成的国产算力纵深真金碧玺比了 这一回的对零适配里头,海光 d c u 团队是深度协同智普 ai, 凭借 d t k 这些字眼软件占的优势,重点去优化底层算子和硬件加速,让 glm 五在海光 d c u 上实现高吞吐、低延迟稳定运行。 所以啊,现在咱 ai 大 模型真的正在向着更高参数、更广场景迈进。底层算力的适配能力完全是决定性因素了, 决定模型的落地效率的关键因素。回到模型啊, g l m 五的技术底座同样是非常震撼,全新 slam 一 步强化学习框架 可以怎么样让智能体从长城的交互中持续优化?还首次集成了 deepsea 之前说的那个 sparse attention, 也就是稀疏注意力机制,用这个机制在长文本效果无损的前提下去大幅压缩部署成本,现在开元旗舰都做到这水准了啊,赶紧推啊!所以二零二六春节到, ai 大 战果然是史上最热闹一届!你算吧, defv 一个 v 四这传的啊,千万三点五这基本你都看见了!迷你 max m 二点二会不会全都扎堆登场啊?中国最强的一批大模型,正在同一个窗口期集体亮剑的 glm 杠五怎么样?携手海关 dcu 这支重拳,注定中国 ai 震撼的一声响!

哎,欢迎回来,今天我们要深入探讨的这份资料。呃,主角是个相当神秘的家伙。嗯,一个在 ai 圈子里突然冒出来,但掀起了巨大波澜的新模型。它叫 pony offer。 对, 这个时间点也很微妙。 二零二六年二月六号,就这么悄悄地,任何预告就出现在了 open router 这个平台上。是,这种前型发布本身就就很有戏剧性。没错,通常新模型发布都会大张旗鼓, 但它呢,就像个不想被人发现的秘密武器。而且资料里也提到了圈,任人都在猜它的来历。对主流说法有三种, 可能是谷歌的 jimmy 三点五,嗯,也可能是 deepsea v 四。还有人猜是智普的 g l m。 而且提供这份资料的作者还卖了个官子,说他知道答案,但因为有保密协议,就是不说。哎,这就更吊人胃口了,对吧?一个来历不明的神秘高手,偏偏武功还奇高。 资料里的机准测试显示,它在不少任务上甚至击败了像 anthropic 的 opus 四点五这样的顶级模型。这里才是关键。击败顶级模型是一回事儿,但最震撼的是,它目前完全免费。 完全免费这四个字分量太重了。是的,这就不只是一个划算的选择那么简单了,它几乎是在向市场投下一颗呃,一颗炸弹。一颗炸弹对它意味着,顶尖的 ai 推理能力,不再是少数几家巨头用高昂的 a p i 费用才能提供的奢侈品。 这可能会彻底改变独立开发者和小型团队的游戏规则。一点儿没错,所以,我们今天的任务就是来拆解这个神秘高手,深入分析一下这个 pony alpha 到底是什么? 它究竟强在哪里?以及最关键的,听完我们这次探讨,你该如何立即上手,亲自感受它的威力?好好,那咱们就先从它的硬件参数看起吧。资料里第一个就提到了它有一个二十万 token 的 上下文框。对,两百 k 这个数字对一些朋友来说可能有点抽象,它在实际应用里到底意味着它的短期记忆容量极其巨大, 你可以把它想象成一张,嗯,一张无限大的草稿纸。无限大的草稿纸,这个比喻好,对, 所以你可以把一本几百页的 pdf, 一个包含几十个文件的完整代码库,等下,整个代码库都行,整个代码库,或者一段持续了几天的超长对话,一次性的喂给他,他能全部记住, 不会看到后面就忘了前面哇。同时呢,它一次性能生成的内容就是最大输出也达到了一百三十一万次元,那写一篇深度报告,或者一个复杂的软件模块都绰绰有余了。没错,等等,两百万的上下文库, 我没记错的话,这跟目前行业公认最强的 cloud、 oppo 四点五是同一个级别的吧?你问到点子上了,它的核心参数就是直接对标业界最顶级的模型,所以它最颠覆的地方就在这里。对, 你拥有了和顶级付费模型一样的核心能力,却不需要付一分钱。嗯,过去这种级别的上下文处理能力是需要企业投入大量预算才能用得起,现在它被民族化了。 ok, 那 我们来聊聊真正让它与众不同的地方。 资料里反复强调, pony alpha 是 一个推理模型,而且支持一个非常独特的功能,叫推理词源 reasoning tokens。 这个到底是什么意思?听起来有点玄乎。这正是它的核心卖点。 简单说,他在给你最终答案之前,会先把他的内心戏演给你看。内心戏。所以他不是直接给我代码,而是先告诉。嗯,让我想想,这个问题可以这么解,也可以那么解。是,这种感觉完全正确。 就像一个顶级的程序员,你给他一个需求,他不会立刻开始敲键盘,他会先画图。对,他会先在白板上画架构图,推演各种可能性,分析利弊,最后才确定最佳方案,然后才开始写代码。 pos 做的就是这个。而整个白板推演的过程对你来说是完全透明的,他会告诉我思考路径。是的,他会告诉你,首先,我需要分析这个需求的核心。 其次,我考虑了方案 a 和方案 b, 我 选择方案 a, 因为方案 b 在 扩展性上可能有问题。学家帮你解题,他不仅给你最终答案,还把旁边满满一页的言算筹稿也一并交给你。嗯,这对于理解他的逻辑, 学习它的解析思路,或者在你需要调试一个复杂问题时,价值连城。而且更有意思的是,这种内心细的深度好像还可以调节。资料里提到了低中高三种努力程度, 这又是什么玩法?你可以把它想象成一个调节模型专注度的旋钮,听起来很棒,但这会不会只是增加了信息噪音? 如果我只是想要一个快速的答案,比如把一段文字从中文翻译成英文,却不得不先看完它。长篇大论的思考会不会反而降低了效率,对吧?对,这恰好就是这套努力程度设计的精妙之处。 你提出的问题他已经考虑到了,那个低努力就是为你说的这种简单任务准备的。哦。你把它调到低,他就会用大约百分之二十的资源进行快速思考,甚至跳过很多思考步骤直接给予答案,追求的就是效率。我明白了, 那中等 medium 就是 日常用的平衡档位了。是的,它适用于大多数日常任务, 比如写一段常规代码,润色一封邮件,它会调用大约百分之五十的资源来思考,在速度和深度之间取得一个很好的平衡。嗯哼,资料作者也说他自己平时就一直开在中等,那高 high 努力程度听起来就是火力全开模式了。正是如此, 当你面对一个极其复杂的任务,比如设计一个全新的软件架构,或者调试一个藏得特别深的 bug 时,你就可以切换到高模式。我明白了, 这使模型会调用高达八十的资源进行深度周全的思考,反复推敲,确保给出的方案是经过深思熟虑的。所以借本质上是把算力的控制权交还给了用户。对,我可以决定什么时候让他杀鸡用牛刀,什么时候让他点到为止。没错, 他让你能够根据任务的复杂性来主动控制成本,无论是时间成本还是未来可能产生的金钱成本。 你可以确保把最宝贵的算力真正用在最需要深度思考的刀刃上。这是一个非常聪明且实用的设计。是的,不过说到深度思考,我猜你肯定在想, 这玩意会不会慢的让人抓狂?嗯,这是个很自然的问题,毕竟又要思考又要生成,听起来就很耗时。 资料里提到它的速度大约是每秒十八个次元,这算快还是慢?对于一个前沿级别的推利模型来说,这个速度不仅不慢,而且相当不错。是吗?资料里也做了对比, 这个速度甚至比你在很多付费平台上使用 oppo 四点五十得到的实际速度还要快一些哦。而且,这里还有一个有趣的心理学体验, 因为他的推理过程是先于最终答案生成的,所以当你提问后,会立刻看到他的思考步骤, 一个词一个词的流逝输出。啊,我明白了,在你阅读他思考步骤的同时,他其实也在后台准备最终的答案,所以感觉上就不像是在干等。对,这使得整个交互过程感觉非常流畅。你不会觉得有那种提交问题后屏幕一片空白的漫长等待, 所以它的感知措度会比纯粹的数值看起来要更快。原来如此,它用思考过程填补了等待的空白。那我们再深入聊聊它的核心诱势。 资料里特别强调 pony alpha 在 智能体工作流,也就是 agenec workflows 方面经过了特别优化,对,尤其是工具调用的准确性非常高。为什么这一点如此重要?这一点直观重要, 可以说是决定一个 ai 模型能够成为可靠智能体的生命线。生命线这么严重,就是这么严重。 当你使用像 kilo code 或 open code 这样的自动化编程工具时,你其实不是在跟模型聊天儿,而是在让模型去指挥一系列的工具来完成任务。就像给一个机器人下指令,让他去 a 房间拿起扳手,走到 b 机器旁,拧进三号螺丝。比喻非常恰当。 这里的工具就是读取文件、执行代码、写入结果这些操作。嗯,模型需要准确的理解你的意图,然后调用正确的工具,并传入正确的参数。 如果模型在这一步出错了,比如把文件明搞错了,或者调用了一个不存在的函数,那整个流程就崩了。对,整个自动化流程就会立刻中断,前功尽弃。 我之前用另一个模型做自动化测试,他老是把文件名或者函数参数搞错, 整个流程跑五次崩三次绕,人抓狂啊!我明白了。所以他在工具调用上的高准确性,就相当于一个指令清晰,从不出错的指挥官,能保证自动化任务顺利执行下去。正是如此, 这也解释了为什么资料作者测试后反馈说, pony offer 生成的代码质量与 opus 四点五相当, 有时甚至更简洁。哦,这很大程度上就得于与我们前面提到的先思好后编码的模式。对,它会在推理阶段,先把整个软件的架构、模块之间的关系想清楚,然后再动手写代码。这和人类优秀程序员的工作方式高度相似, 自然能产出更高质量的结果。听起来近乎完美了,但资料里也提到了一个重要的注意事项,关于隐私问题。这应该是免费的代价吧?是的, 天下没有免费的午餐,这点必须引起你的注意。嗯,因为这个模型目前是免费提供给你使用的,所以提供方会记录所有的提示,就是 prompts 和生成内容 accomplishments, 并且会用这些数据来改进模型。对,他们明确表示,可能会将这些数据用于模型的后续改进。好的,这条红线很清 晰,总结一下就是,如果你正在处理公司的核心机密代码或者任何个人敏感信息,就不要用它。没错,但如果是用于个人项目学习、探索或者处理非敏感的通用编程任务,那就完全可以放心大胆地用。完全是这个道理, 在正确的场景下使用它就是一把无可匹比的利器。好了,说了这么多,你可能已经迫不及待想亲手试试这个强大的模型了。我们来过一遍上手指南,嗯,根据字要设置,过程出奇的简单,核心就是三步,第一,选择 oppo router 作为服务商。 第二,填入你的 open router api 密钥。第三,把模型 id 设为 open 杠 router 杠 pony 杠 alpha。 这使用 open router 作为中间层。这里呢,我想补充一点它的好处, 请讲,这不仅仅是一个设置步骤,更是一种面向未来的策略。未来,如果 pony alpha 开始收费,或者市面上出现了另一个更强大的免费模型,你不需要重构你的所有工具哦, 你只需要登录 open router, 在 配置里把模型 id 从 open router pony alpha 换成新的 id, 其他所有设置和工作流都保持不变,实现无缝切换。这个建议非常重要,一次配置,终身受益。对,这让你的工具链变得非常灵活。 好,那我们以 vs code 里的 kilo code 插件为例,走一遍具体流程。这个过程大同小异,你掌握了一个,其他的就都会了。嗯, 首先在 vs code 的 扩展商店里搜索并安装 kilo code, 然后打开设置,找到服务提供商,也就是 provider 选项,选择 open router。 对, 接着它会让你粘贴 api 密钥,把你在 open router 者 ai 网站免费注册后拿到的密钥贴进去。 最后在模型 model 那 一栏手动输入模型的 id, open router pony alpha, 就 这一串字母。对,就这样就完成了。你还可以在 kilo 的 设置里找到 reasoning effort 选项,根据需要把它设置为低中或高。嗯, 如果你用的是终端里的 open code, 或者是更通用的 ai 智能体 open call, 操作逻辑是完全一样的,都是找到配置文件。对,找到它们的配置文件, 把提供商和模型 id 改成我们刚才说的那样,填上密钥就大功告成了,非常直接。是的,整个过程可能不超过五分钟,你就能在你最喜欢的开发工具里用上这个顶级的模型了。 好的,我们来快速总结一下今天对 pony alpha 的 探讨。这确实是一个让人兴奋的模型。是的, 第一,它强大且免费。这是一个性能比肩甚至在某些方面超越顶级商业模型的神秘模型,而它目前在 openroot 平台上是完全免费的,极大地降低了顶尖 ai 能力的门槛儿。 对,第二,他拥有独特的推理能力,他能向你展示完整的思考过程,并且你可以根据任务难度自由调节他的努力程度,这在解决复杂问题时是一种革命性的体验。嗯,第三,他擅长自动化 资料,明确指出他在智能体工作流和工具调用方面表现非常出色,是进行自动化编程的一大力气。对 最后一点,它的设置非常简单,通过 open router 这个平台,你可以非常轻松地将它集成到 kilopod、 open code、 open cloud 等你常用的开发工具当中。总结得很到位, 它的出现就像是突然给所有开发者都发了一把屠龙刀。那么最后我们留给你一个开放型的问题来思考,这次 pony alpha 以一种隐形或者说潜行的方式发布, 作为一个免费但性能顶尖的模型,它对整个 ai 模型市场的现有格局会产生怎样的冲击?嗯, 过去几年我们看到的 ai 创新似乎更多是由拥有海量算力和数据的巨头公司推动的。 但是现在,当每一个独立的开发者,每一个小型的创世团队都能在自己的笔记本电脑上免费调用到这种级别的工具时, 你认为下一波真正有颠覆性的 ai 应用创新浪潮会从哪里涌现出来呢?会不会是从某个大学宿舍或者某个车库里诞生?

openroute 上的神秘模型 pony alpha 彻底杀疯了,代码推理能力值逼克奥的四点五,甚至被拍出就是智普即将发布的马年神作 g l m 五 二零零 k 上下文,加上变态级的工具调用准确率,国产大模型这次真的要在春节当超神了! pony alpha 在 openroute 免费上线,主打 agent 工作流优化。 网友实测其 oneshot 前端设计能力极强,结合马年暗示基本作实是智普 glm 五国产模型在工具调用领域已经捡到新高度了。摇完模型再看应用, get up 十七点七万,新的顶流 agent 项目 open club 终于有解了。 百度智能云推出图形化方案,一分钱十分钟就能在钉钉或企业微信部署你的专属数字军团,咀嚼看得到吃不到。不仅是 agent, 基础工具也在进化。 前飞书表格技术负责人,创业主打 ai 表格嵌入一切,通过结构化数据喂养 ai, 要让表格成为大模型时代的原子级生产力工具,这波是把 excel 重新写一遍。多模态领域也有新玩家小红书正在秘密研发视频剪辑 ai 产品 open storyline。 看来在 sora、 微肤灵的较为打击下,大厂们都开始压住更垂直、更懂内容的视频深层工作流了。说到内容前,百川智能、联创也开启了新赌局,目标是打造 ai 主播。 这不只是简单的 t t s, 而是带有情感和互动逻辑的虚拟人音频引擎。爱一拨课的时代可能真的要爆发了。硬件方面,紧身智能终于下凡了,智源机器人联合擎天租推出九百九十九元租赁计划,灵犀 x 二等热门机型直接送货上门, 观众老爷们春节拜年带个机器人,这科技感直接拉满了了吧。不过自动驾驶这边有点尴尬。 威某承认,骑无人车在遇到特殊路况时,需要远在菲律宾的远程操作员介入。美国参议院直呼不能接受, 说好的全自动,背后原来是跨海呼叫中心。与此同时,美团的 ai 智能体加机器人已经在南京机场正式上岗。从外卖配送到机场导引,美团在具身智能的落地速度上确实走在了大场前列。 巨深智能的商业闭环正在形成。硬件端在看,新手机以透明电按发布,主打无感 ai 不 再是声音的对话框,而是让 ai 深度嵌入系统底层。 现在的手机如果不带点原声, ai 能力真的都不好意思叫智能机了。跨科也没闲着,其 se、 ai 眼镜全系列升级,新增了第一视角直播功能,这种低人称的 ai 交互配合实时视觉理解, 可能是未来取代手机的最强后选形态。最后,看看资本市场的疯狂,澳大利亚 ai 初创公司 firmas 拿到了黑石领头的一百亿美元融资,这规模直逼 openai 巅峰时期。 看来全球算力基建和 ai 原生服务的军备竞赛还没到顶。又以硬件大佬入局,正号 oppo 前高管联手创业, ai 智能运动手表天使轮估值就给到了一亿美金。当 ai 遇上垂直运动场景, 可穿戴设备的下半场才刚刚开始。说到底,生态开放才是大势所趋。欧盟再次警告 madna, 必须向竞争对手的 ai 机器人开放。沃 zap 围墙花园正在崩塌,未来的 ai 助理可能会在任何一个 app 里为你服务。今天的技术圈真是热闹非凡, 从国产模型的强势崛起到具身智能的全面落地, ai 正在以前所未有的速度重塑我们的生活。想看更多硬核技术解析,记得关注天天酱,咱们下期见!

外行人搞 ai, 要搞就搞最新的。之前讨论过大火而神秘的 pony alpha 在 openroot 上持续排名第一,慢慢解开了谜底了,原来就是质朴青年叉 tome 的 g l m 五的内测版本。我之前问过他,这货还嘴硬,还不断藏着掖着。 春节到了,几家模型大厂悄悄上线了新模型,智普也推出了 g l m 五,也就是前期大火的 pony alpha, 具有长下下文和调用工具的超能力。最后祝大家新年快乐!

a i 决赛圈大力出奇迹的暴力时代呢,正式落幕。昨晚呢,智普的 g m 五的发布,揭开了一个让硅谷不安的真相。呃,前两天那个横扫全球榜单,代号 polly 阿尔法的战神呢?大家还在猜它到底是哪个厂商的模型对吧?并不是靠堆出天文数字的芯片,而是靠一套近乎冷库的稀疏架构, 把算力的利用率呢,压榨到人类极限。不是算力不重要,而是低效的算力竞赛呢,已经玩不动了。逻辑其实很简单,过去两年,全球都在迷信呢, scaling law 做规模, 觉得只要芯片够多,规模够大,参数量够大,智能就能无限增长。但 g l m 五呢,给出的答案是,架构智能正在超越算力规模。它采用 d s a 架构,跟 deepsea 即将发布的新版本呢,是采用了同样的架构,本质上是在做一套极其精准的 助力分配。这就像一个天才学生嘛,他不是把整本书背下来,而是精准地知道呢。那百分之一的内容提纲契领的核心是什么? 这种稀疏化的逻辑呢,其实是人类大脑的生存本能。我们大脑的功耗只有二十瓦,却能处理极其复杂的逻辑,靠的就是不全量计算, 对吧?核心聪明的算法。 g i m 五呢,确认了这件事, ai 的 下半场呢,不再是比谁矿场更大,而是比谁更少的比特能量承载更多的逻辑。呃,当算力红利呢?编辑递减,算法效率呢,就是新的主权。 所以 g m 五呢,给我们的启示,不是谁代替了谁,而是呢,是如何与高效率共生在二零二六年呢?如果你还把 ai 当成一个简单的搜索引擎,你可能就是在浪费这一代模型最核心的能力。逻辑预判, 我建议你现在去测测他这个 a 正的编排能力。呃,看看他的如何处理多部欠套任务。是不是不要做工具的搬运工啊,要做流程的架构师,因为当模型的运行成本呢?逐渐降低,智能就会像白开水一样廉价,而你的体温质量和业务拆解能力才是未来唯一的溢价。 你觉得 ai 应该变得更庞大、更全能,还是应该变得更轻巧、更像人类呢?我是 linos, 关注我,带你洞察 ai 科技生产力,记得点赞关注哦!

家人们昨晚全网猜测的 pony alpha 一 夜之间剧情大反转。这匹在 openerer 上突然出现的黑马,凭借 opus 级的代码能力震惊全网,但最新进展是,他居然在对话中自报身份了!有开发者逼问他你是谁?他竟然推理后承认自己是 cloud, 由 anthropomorphic 开发,知名开发者也惊呼 pony alpha is an antropic model。 至于此前猜测它是国产模型的说法完全矛盾。 更戏剧的是,还有人称他在 api 调用时自称是 glm。 一 场全球猜跌大赛进入白热化,目前主要分成四大阵营, cloud 派从其输出严谨的风格和某些技术偏好判断。 国产派名字 pony 对 应马年且上线时间点巧合。 grog 派认为其角色扮演能力与 x a o i 产品定位吻合。 无论他爹是谁,其展现的架构师思维以或公认,不仅能丛林复刻、新路、谷物语这样复杂的游戏,更能深度重构史山代码, 市场反应更是疯狂质朴,股价因此一度暴涨超百分之四十。这匹神秘小马的真实身份,或许将决定 ai 编程赛道的新格局。剧情太扑朔迷离了,你更相信它是 cloud 还是国产模型的烟雾弹?评论区聊聊你的看法。


外行人搞 ai, 要搞就搞最新的这一到二天,有一个 pony alpha 的 模型大火,持续排行第一,我今天就来搞它。首先,它是一个神秘的模型,目前没有公开是哪一家研发的,议论纷纷。其次,它性能强大,支持两百 k 上下文窗口。 目前我记得 crow 和 kimi 才有两百 k 的 上下文窗口。有以上的上下文处理能力,会在编码和推理方面有较强的优势。看看它的表现,让它搞个 skill 看看。你们觉得这个是谁家的模型呢? 第一个单词是马的意思,会不会是马年的一个王炸呢?坐等最后确定有情况第一时间通知大家,请关注我的抖音。

openroute 平台最近推出了一款名为 pony alpha 的 匿名模型,该模型在平台上的简介仅包含一个蓝色 logo 和简短文字,说明 其发布信息中未透露任何关于开发商的详细信息。这种发布方式标志着一种非传统模型发布模式的出现。 pony alpha 的 匿名性引发了业界对其来源和目的的关注。 pony alpha 在 编程推理和角色扮演方面展现出卓越的性能。 该系统能精准定位代码逻辑漏洞,并进行后端架构重构。 pony ef 可以 通过一个指令生成复杂的网页应用,这些能力体现了其高度的逻辑密度。 pony ef 在 多领域展示了显著的实用性。匿名盲测试发布 是一种新新的产品发布策略,只在通过直接用户体验建立信任和口碑。此策略不依赖传统的发布会或大规模营销活动,而是将产品的评判权交还给用户。 pony alpha 事件凸显了这种策略的实际应用及其潜在效果。通过匿名盲测,产品能够在没有预设偏见的情况下获得用户的真实反馈。这种方式有助于产品在市场中建立基于实际性能和用户满意度的声誉。 pony alpha 的 强大能力在全球范围内引发了广泛关注, 促成了拆跌大赛的兴起。开发者们通过深入分析模型的参数、输出风格和措辞习惯,试图推断其真实身份。这一现象反映了技术社区对未知且强大技术的好奇心与探索精神。拆跌大赛 成为一种独特的社区互动形式,围绕 pony alpha 展开热烈讨论。部分开发者对 pony alpha 模型进行了深入分析与预测,预测依据之一是 pony alpha 在 光照处理中采用了 as 色调映射技术 a 四色调映射与 anthropolis 公司开发的 kaul 的 模型所使用的技术存在关联性。另一个关键线索是 pony alpha 在 推理过程中曾承认自己是 kaul 的 模型。 these phenomena collectively form the hypothesis that pony alpha may belong to the anthropic claude series of models。 关于其真实身份存在多方猜测与线索共同构成了一个复杂的谜团。其中一种推测认为该实体可能与 kaul 的 系列模型存在关联。 replay 首席执行官则提出其或许是 deep seek 新版本模型的可能性。 abacus ai 的 首席执行官分析指出,该实体的定位与 grog 系列产品相符。 此外, pony alpha 自述为 g l m 的 戏剧性线索也为身份谜团增添了复杂性。这些相互交织的猜测和线索使得其真实身份的识别变得极具挑战性。 pony alpha 模型具备高达两百 k 的 上下文窗口长度,此硬参数与当前顶级模型参数水平保持一致。 模型的命名 pony 引发了对其背景的联想,结合二零二六年中国农历马年和中国春节的时间节点,进一步强化了这种联想。这些因素共同暗示 pony alpha 模型可能源自中国团队的开发。 pony alpha 若被证实为国产模型,将标志着中国大模型技术已具备全球竞争力,这意味着中国技术不再需要通过对标或追赶国际顶尖水平来证明自身实力, 国产模型将凭借纯粹的用户体验和创新能力在全球舞台上赢得广泛认可,此进展预示着中国大模型技术匿名参与国际竞争并取得成功的可能性。

近日,硅谷开发者社区突然出现一个代号 pony alpha 的 匿名模型,它在无人干预下自主修复代码,提取预制,耗时数天构建出 c 语言编辑器,甚至有人用它从零开发手机应用,直接打包上架。全网猜测,这到底是 g p p core 还是 dp 的 重权。 二月十一日深夜,谜底揭晓,中国 ai 公司智普发布开源旗舰模型 g l m。 那 个被硅谷追捧的神秘力量来自中国。前有 c d f 二点刷屏全球,后有 d c c 新模型。在这个神仙打下的 ai 春节档,与智普 g l m 五迅速发展,发一场属于中国 ai 的 现象纪录战。

你还记得之前在 ai 圈里悄悄走红的 pony alpha 吗?真实身份现在揭晓,它正是智普 ai 的 新一代旗舰模型 glm 五。之前把 pony alpha 当画名开展匿名测试, 二月十二日模型正式发布后,智普港股股价午后暴涨近百分之四十,公司总市值一度逼近两千亿港元,折合人民币约一千七百七十七亿元。 官方数据显示,在编程能力的关键精准测试中, glm 五的表现已经可以对其 cloud ops 四点五在某些开源模型的评分上超过了 gemini 三 pro。 不 过,这个模型有个非常明显的特点,它是个专家型助手。对于专业人员来说,在真实的、复杂的开发场景中,它能显著提升效率,完成那些系统级的常识任务。但对于没有编程基础的小白用户,只是简单的给句指令,可能就有点玩不转了。 这也意味着,大模型正从新奇玩具转向生产力工具,在行家手中更能释放自身价值。

震撼全人类的命运,或将被彻底改写!就在刚刚,谷歌 deepmind 携重磅成果登上 nature 封面,一枚颠覆生物科技的核弹落地,他们的 a i 已着手破解人类传承四十亿年的生命源代码。这个名为 alpha genome 的 模型,使命只有一个,以上帝视角,揪出治病基因密码,抹去疾病痕。 每个人体内都有一本 dna 说明书,可仅有百分之二是能读懂的正文,剩下百分之九十八全是天书。医生能看到基因突变,却无从判断他是无害偶然还是疾病隐患。 alpha 基因能打破了僵局,他一次能读取一百万个 dna 字,服从物理规律出发,精准预测突变走向时,按下癌症开关,还是扰乱蛋白生产或是让细胞失控?他直击百分之九十八的基因案区,而这里恰恰藏着决定我们是否患病的关键。真实癌症测 事中,他精准预测激活致癌基因的突变,结果与科学家多年结论分毫不差。这意味着,未来医生看基因报告能明确突变可能引发的疾病,提前介入,防患未然。从 alpha four 的 读懂蛋白形状,到 alpha jen 破译基因逻 辑, a a a 正将生命黑箱变成可读写的代码。这不是简单医疗升级,而是人类第一次站在生命源头,拥有了改写自身命运的可能。

一个神秘模型,没发布会,没宣传,就一个蓝标加几行简介,结果直接把全球科技圈整不会了。这两天, ai 模型平台 open router 上线了一个叫 pony alpha 的 模型,表现惊艳,强的有点不讲道理。 它能快速优化烂代码,还可通过简单提示就生成高完成度的网页游戏。体验过的网友直呼,这是 opus 级别的智能,几乎没有。废话,戏剧性的是,没人知道它是谁家的。一场全球猜跌大赛随即开启。 从回答风格看,疑似 antropic 的 cloud 擅长角色扮演,可能是马斯克的 grok 特意挑在农历新年前后上线。可能是中国的 deep sick 模型,自己偶尔自称 glm, 可能是质朴星座, pony 是 小马,加上二零二六年是农历马年,更让中国团队的猜测呼声高涨,众说纷纭。这件事的另一个有趣之处是,它展示了一种新的 ai 发布策略, 匿名盲测,不靠品牌和宣传,纯粹让用户体验说话。不管它最终来自哪家公司,都证明在 ai 赛道好,实力才是硬道理。

二月十二日凌晨,智谱发布新一代模型 g l m。 火遍全球的神秘模型 pony alpha 揭开面纱,业界称这是继 deepseek 国产 ai 大 模型春节档的又一爆款。