粉丝1.4万获赞19.1万

一百万块 h 一 零零在训练 grog 五 agi 时间线正在被改写, grog 五正已超过一百万块 h 一 百 gpu 在 巨象超级计算机上训练 gpt 六,被山姆奥特曼多次暗示将引入持久记忆、个性化以及完整的工具内化,这不只是更聪明,而是能跨绘画记住你。 两者在路线上形成鲜明对比。 grok 倾向专家混合架构悉数,而外科手术室 open ai 长期采用稠密 transformer, 并在 gpt 五用快加伸缩模型与实时路由,下一步极可能在 gpt 六收敛为统一模型。结合架构数据与多模态的升级,未来三到五年将是 ai 能力跃迁的窗口期。 架构与数据 grok 一 已达三千一百四十亿参数,实现高效推理与能耗优势。 训练数据方面,两者都在万亿级托肯语料上扩展, rock 覆盖网页文本代码、多语言与图像、视频语音。 g p t 六还将引入更大规模的互联网书籍、学术与授权、医疗文本。关键不纸料更在智, 随着规模扩大,数据清洁领域标注与指令一致性成为决定性变量。多模态方面, grok vision、 grok imagine、 grok voice 有 望在 grok 五完全统一,实现图像加语音加文本的无缝融合。 gpt 五的视觉能力已在高难多模态基础上拿到百分之八十四, gpt 六预计延展这一能力。记忆推理与工具化持久记忆是 gpt 六最可能改变工作流的特性,在数周后仍能记住你的项目语气与目标,不再反复解释 推理。成绩方面, grog 四 fast 在 aime 数学竞赛约百分之九十二, gpt 五约百分之九十四点六,且 gpt 五在思考 token 上更节省。 gpt 五在编码接近百分之九十,科学与多模态均刷新记录。 更重要的是多步推理与规划,把复杂问题拆解为练式步骤在长上下文里保持一致,并给出非显然的答案。 工具使用上, druxfast 将搜索代码执行与数据抓取内生化,长期位居 lrmrina 搜索榜单。 gpt 六看起来会把插件代码执行与 api 访问进一步内化,并把长期记忆当做规划工具。 实践层面,这意味着从需求编码、运行、调试、交付的整链路可由模型自主完成,临界点正在逼近 时间线与风险治理。综合高管表态与研究者预测,出现三种情景,快, 二零三零年前后达到通用人工智能约百分之二十的概率。前提是 drug 五与 gpt 六在推理与规划上补齐最后缺口,并在二零二八至二零三零出现智能加速中,二零三二至二零三五约百分之五十的概率 是当前共识区间。戴米斯哈萨比斯估计,从二零二五起三到五年,丹尼尔科卡耶洛也把时间线修正至二零三零年代早期慢, 二零三零年代中后期约百分之三十的概率。考虑架构与数据瓶颈,斯坦福大学明确不预计二零二六前实现。 值得注意的是,自 gpt 四以来,专家中位数持续前移, rock 五与 gpt 六大概率会再推进一步。与此同时,能力越强,自主性越高,对其难度越大。能浏览、编辑并执行代码的 agent 一 旦与目标略有偏差,风险会在多部任务中被放大。 当前 openai 与 xai 都公开采用模型卡红对测试与内容过滤,但政策框架如欧盟前沿 ai 监管整体之后,对企业与团队而言,建议尽早做三件事, 建立可审计的工具,调用于日制体系,完善数据治理与敏感域权限,选定可控试点场景,逐步引入记忆加工具化的工作流,方向已经明确,时间只是快慢问题,你更看好哪条时间线?留言说说理由。

为什么有的人的龙虾笨笨的,响应速度很慢,推算能力又弱?而有的人的龙虾很聪明,响应速度又快,推算能力又强。亮哥教你你的龙虾笨笨的,是因为你没有给他安装一个很强大的大脑。 今天亮哥教你们一个白嫖全球第一梯队顶尖模型的一个办法。第一步, 打开浏览器,进入到这个网页, w w 点 e o a i 点 c n, 它这个是第三方平台,你用自己的手机号注册登录进来就会送你五千积分,完事你再加入他们的群,又送五千积分, 一共是一万积分。登录进来之后,点右上角这个 u, 再点龙虾端点它,就会出现一个几个 api key, 还有下面的所有支持的模型。 大家都知道模型,你要想用这个模型分为三三部分,必须要知道它的 api key, 知道它的八十 u i。 第三个要知道它的模型 id 叫什么,就是模型的名字。你看这个网站上面支持的模型有全球 最强的一个模型 gpt 五点四, cloud 的 opus 四杠五、四杠六,还有国内的一些模型,看到没有? mini max, kimi、 uic, 还有这个智普的 glm 杠五杠五点二。接下来你就要 配置你的模型,我教大家我下载了这个 open cloud, 就是 腾讯平台的 qcloud, 在我的电脑里面找到 coco 的 接收这个文档, coco 找到这个 open class 文件看看。大家可以看到 我这里面配置了三个模型,一个,第一个就是 evo 平台的 gpt 五点四的模型,你要配置这个模型,必须要知道它的八十,这个是第一个。第二个你得知道它的 api key, 第三个你得知道它的名字, g p t 杠五点四,这样就配置成功了。配置进去之后,你要把你的 g p t 五点四设为默认模型, 就在这个下面。 engines 这个英文字母就是默认模型的意思,在下面这样说, ev 杠 g p t 杠五点四,这样就配置好了。

openai 重磅更新了! gbt 五点四 pro 和 ev 值一点五正式登场!这不是普通的升级,这是降维打击,实测战力爆表, 轻松超过 cloud 四点六! jimmy 三点一 pro 不 管是地狱级编程还是高阶科研,通通一波流带走!重点来了!我发现一个超棒的网站,它不需要模仿,不需要单独注册 openai 账号,甚至免登录就能直接使用。 最重要的是,它可以无限制使用 gpt 五点四、 gpt 五点四 pro 等模型是手机电脑通用,首页线路节点多,随便点一个就能免费体验。进入聊天界面左上角能自由切换模型, gpt 五点四或 pro 版随你挑,回到首页还能切换 gammi 三点一真的是一个站点玩转全球所有顶尖 ai 模型! 现在就带大家实操演示,现在让他生成一张小狗吃饭的画面,不一会,小狗吃饭的图片新鲜出炉,各种细节都很到位。现在我要换成漫画风,不一会 漫画风的图片就出来了,层次丰富,配色和谐,漫画感强,造型生动,富有表现力。喜欢的朋友记得点点关注,我会持续解锁更多的 ai 技法,干货满满,别错过了!

太震撼了,看到这个消息直接从床上跳了起来,最近 gbt 五点四正式发布,有多强呢?一句话来说就是 gbt 已经可以直接操作你的电脑了。 欧奔 ai 说这是针对专业工作最强大、最高效的模型,它将通用推理、编程能力,还有 ai 智能体工作流完美的结合在了一起。 我们来看看案例。首先呢,它具备了原声计算机操作能力,也就是它可以像人类一样看屏幕,然后通过鼠标和键盘跨软件和网站自动执行复杂的工作流。 你看啊,这是它正在操作浏览器,自动发送电子邮件,还可以快速填写网页表单。其次呢,它不仅能编程,还能自己测试和优化,这个真是太夸张了。比如说你看这个主题公园建设游戏,就是用一句话生成的, 关键是生成后 gpt 正在自己试玩游戏,再根据体验自行优化游戏内容。最后, gpt 五点四在处理表格、 ppt 和文档方面的表现也有大幅提升,生成的内容更具审美和实用性,并且幻觉显著减少,事实错误率降低了百分之十八到百分之三十三。 从 gpt 三点五到 gpt 五点四, ai 已经不再是一个聪明的聊天机器人,而是一个能直接操作你电脑、写代码,并且熟练使用各种工具的超级员工。那随着 ai 越来越强,我们普通人的未来到底在哪里?是不是在不久的将来,大家都要失业了? 我相信这个是很多人的困惑,这个问题我说一下我自己的看法,未来普通人呢,有两种活法,一种叫 ai 工厂,另一种叫一人公司。什么是 ai 工厂呢?就是公司在招聘的时候,招的不是你这个人,而是你和你背后的 ai 团队。 公司看中的是你流畅使用 ai 解决各种问题的能力。那什么是一人公司呢?就是你带着你的 ai 团队直接为这个社会做贡献,提供服务, 不是公司购买你的时间,而是直接购买你的服务。一定要把 ai 当成是你的员工,你是他的领导,你只会去他去做事,而不是去焦虑 ai 会不会替代你。

太震撼了,我看到这个消息直接从床上跳了起来,就在昨晚, gpt 五点四正式发布,有多强呢?一句话来说就是 gpt 已经可以直接操作你的电脑了。 openai 说这是针对专业工作最强大、最高效的模型, 它将通用推理、编程能力,还有 ai 智能体工作流完美的结合在了一起。我们来看看案例。首先呢,它具备了原生计算机操作能力, 就是它可以像人类一样看屏幕,然后通过鼠标和键盘跨软件和网站自动执行复杂的工作流。你看啊,这是它正在操控浏览器,自动发送电子邮件,还可以快速填写网页表单。 其次呢,它不仅能编程,还能自己测试和优化,这个真的太夸张了,比如你看这个主题公园的建设游戏就是用一句话生成的,关键是生成后 g p t 正在自己试玩游戏, 再根据体验自行优化游戏内容。最后, gpt 五点四在处理表格、 ppt 和文档方面的表现也大幅提升,生成的内容啊,更具有审美和实用性,并且幻觉显著减少,事实错误率降低了百分之十八到百分之三十三。从 gpt 三点五到 gpt 五点四, ai 已经不再是一个聪明的聊天机器人,而是一个能够直接操作电脑、写代码,并且熟练使用各种工具的超级员工。那随着 ai 越来越强,我们普通人的未来到底在哪里?是不是在不久的将来,大家都要失业了?我相信这是很多人的困惑这个问题啊,我说下我自己的看法, 未来普通人呢,有两种活法,一种叫 ai 工长,另一个叫一人公司。什么是 ai 工长呢?就是公司在招聘的时候啊,招的不是你这个人,而是你和你背后的 ai 团队,公司看中的是你流畅使用各种 ai 解决问题的能力。 那什么是一人公司呢?就是你带着你的 ai 团队开始直接为这个社会创造价值,提供服务,公司不再是购买你的时间,而是直接购买你的服务。我自己啊,就是一人公司的典范,一定要把 ai 当成是你的员工,你是他的领导,你要指挥他去做事,而不是去焦虑 ai 是 不是会替代。

谁能想到连 gpt 五都搞不定数手指这种小学生级别的任务,不管是 check gpt、 豆包这类的常见 ai, 还是号称地表最强的 gpt 五,判断手指时呢,都会离谱的让人发笑。六根手指硬说成五根,还会煞有结实地描述细节, 你跟他纠正完这个错误呢,再拿出正常的五根手指的图去问,居然会受上下文记忆干扰,仍然坚持说是六根关掉记忆功能呢,才恢复正常 ppt 五偶尔能答对标准手图,但换张八根手指的图片就立马露馅了。估计是最近这问题呢,讨论的火,被针对性训练过,而非真的掌握了。识别逻辑这事的根源呢,其实藏在多模态模型的底层工作逻辑里。 多模态模型呢,要同时处理图片和文字,第一步就得把这两个完全不同的信息呢,转成模型看的懂的向量图片,靠 v、 i、 t 这类的图像编码器处理,但这两类向量原本毫无语义关联,就是鸡同鸭讲。 还好由 club 模型来牵线搭桥,它是靠四亿对图文数据呢做对比学习,让配对的图文向量,比如狗的图片和狗这个词,在语义空间里呢,靠的越近越好, 配对的呢,就刻意的拉远,这才实现了模态对齐。后面的 lua 等多模态问答模型,全是在这个基础上搭建的。但问题的关键也出在这。这种逻辑本质是把图片先翻译成语义层面的文字描述,再让模型基于文字去推理。可手指数量这种精准的细节,哪是简单的文字描述能覆盖的? 就像只听别人说一张有手的图,根本就没法判断具体是几根手指,而且 ai 的 短板呢,会遗传多模态模型,层层递进,从 transformer 到 v i t 再到 clap, 基座模型的局限性会直接传递给下游,数不清手指就是最直观的体现。当然,要解决单一的手指识别问题呢,不难,整个简单模型就能搞定, 但想让多模态模型具备通用的细节识别能力,难度就完全不一样了。这提醒我们, ai 在 文本总结、逻辑推理这些领域呢,确实比人类强,但面对需要精准捕捉图像细节的任务,它还没啥优势,咱们得理性的看待它的能力边界。

一分钟看完一周 ai 大 事! anthropic 内测下一代王炸模型内部代号,卡皮巴拉能力强到 anthropic 自己都害怕。编程的推理领先三傻一个段位,不仅是人类历史上最强大的模型,也是最贵的模型,能力太过逆天,分分钟攻破任何系统。 卡皮巴拉已开放给安全公司建立防守优势,几周后向公众开放 openai、 官亭、 sora app, 全部算力投入下一代模型 内部代号,马铃薯。奥特曼称马铃薯能真正改变生产力,带来商业价值,目前已完成预训练,数月后发布。卡皮巴拉和马铃薯都是由 ai 训练 ai, ai 已跨过自我进化的基点,二六年最强大模型之战正式开启, cloud 上线,电脑操作 全面进化最强龙虾,它能通过龙虾接口高效操作,适配的软件也能切换毒品模式操作所有软件 还支持通过手机派活。以后你在外面喝茶,数字牛马在工位自动搬砖。 google 升级最强语音对话模型,主打超低延迟和真人感,一边听你讲需求,一边实时爆改页面,还能角色扮演游戏陪玩。给龙虾接上 api, 你 就有了一个随叫随到的 ai 员工。 google 发布 ai 压缩算法,通过将向量坐标转为极坐标,再叠加量化和纠错,实现内存六倍压缩、八倍推理提速免训练零损耗,所有大模型都适用,内存价格赶快降下来吧!第三代 a g i 测试出炉,主要考验 ai 从陌生环境边探索边学习的能力。 人类得分一百三撒,全军覆没。 google 耳机同传登录 iphone, 任何耳机都能用别人说外语,你能直接听母语,保留说话的节奏和情绪,跨语言交流再无障碍。 figma 实时更新,全面适配龙虾。 ai 终于能像设计师一样按规范画 ui 页面了!最离谱的是, ai 写的网页能一键转成可编辑的 figma 图层,改完的 ui 又能同步回代码,设计和代码终于能双向同步, 开发者和设计师狠狠码住鲁玛发布最强开源图像模型,性能打平小香蕉研究员开源最强图像修复模型,能完美消除反光噪点,适合老照片修复。 研究员发布最强开源视频生成模型,原声音画同步,无安全围栏盲测,胜率碾压 ltx 研究员开源最强四 d 视频模型,给他二 d 视频能重建三 d 场景,还能通过补帧生成平滑且连贯的运动。研究员开源运动修复模型,专治 ai 视频,运动速度穿帮,一键修复成真实速率。 comfyui 上线动态显存管理,按需加载模型的某一部分,用完就释放,以前跑不动的模型也能正常运行了。 solo 音乐模型升级,上传一段干声就能复刻音色,人人都是歌星,上传几首歌曲就能复刻编曲风格,周杰伦再也不用自己编曲了! google 升级 ai 音乐模型,直出三分钟完整歌曲结构,编排能力堪比金牌制作人。 mister 发布最强开源语音合成模型,三秒样本就能克隆音色和说话风格,质量接近。 eleven laps cohere 发布最强开源语音识别模型,十四种主流语言准确率第一! 阿里开源最强音效模型,只需丢给他一段无声视频,他就能自动生成完美卡点的环境音效 开源人脑模拟器,它能精准预测人类在看视频、听声音或读文字时的大脑活动精度。反超磁共振脑科学迎来自己的 alpha fold, 科学家研发出首个能跟人脑直接交流的人造神经元,电压与人类一致。以后 ai 和机器人能秒懂你的想法增强,人类迈出了第一步。

openai 的 g p t 五点四现在来说还是目前最强最聪明的模型,虽然它跟 cloud opus 四点六,还是 可能在编程能力上,它的习惯还是没有五点四点六那么好,但是它在聪明的程度,在很多复杂问题的解决的准确性上,它还是非常的高的。今天我们还是给大家分享一下它的这个文档到底有哪些新鲜的东西。这次五点四的更新还是有非常多的新鲜的东西的。 首先就是它的 a p i 可以 支持 to search 的 功能,其实也是 cloud code, 它们也支持的就是你的这种工具,你可以放非常多进去,但是它不会把工具的这种提示词全面加载,而是它需要使用的时候,它直接用这个 to search 去搜索它应该使用哪一个工具,然后再进行加载,再进行执行, 这样的话它这种工具提示词就不会被突破它的上下文极限。第二个就是它的一照上下文窗口,但是它还是有一个特别大的问题,就是它的 codex 编程工具它是不支持一照上下文的。还有一个比较让人诟病的点就是 cloud code, 它是支持 team 模式的, 它这个 codex 最近才支持这个子智能体的模式,但是它是完全不支持 team 模式的。其实 team 模式跟现在的 open curl 很 像, 它能解决非常多的这种编程问题,它会让你的上下文不那么容易被突破,所以说 team 模式真的非常的好, 这也是我觉得 codex 为什么还是有一定欠缺的原因。而且你没有一照上下文的话,你去完成一些大型的项目,很容易就突破了上下文,突破了上下文压缩了之后,效果就急剧的下降了。 虽然你可以通过其他的一些方式来做,比如说他的那个约束的那篇文章来做,去恢复他的上下文,但是如果说有足够长的上下文,它效果还是会更好的。 第三个就是它的这种计算机 ui 界面的操作能力,这个也是呃它最大的一个亮点,它的效果是比其他的模型都要好很多很多的。我自己从用那个 open curl 去授权使用这个 gpt 五点四效果来讲是最好的,没有之一,比 cloud 的 模型它的准确度都还要好很多,而且速度也快。 还有就是它最后也支持了可以自动的压缩上下纹,它可以使用轨迹更长。首先它这个是有四个模型,有普通模型,有一个 pro 模型,这个东西一般我们是用不到的,或者说我们是碰不到的。 然后是这两个模型还有一个点哈,就是我们充的很多 plus 的 版本,很多都是降智了的,你可以问一下他的模型是什么,所以说你必须要把他的这个模型去改成这种深度思考,并且那个思考要是深度极度思考最高的那个版本,他才会给你五点四模型,这也是他这个很讨厌的一个点, 在这个 codex 里面也是一样的,他什么时候给你降智了你不知道?还有就是推理的这种程度,如果你不写的话,他会自己决策去进行推理, 它可以从这种提示词里面直接去改,然后你也可以把它这种设置的高或者设置的低,如果是 codex 建议直接设到最高哈,要不然它有可能会降你的质,因为现在我们做很多充值啊,或者说这种节点啊,它都是不那么干净的,很容易它就降质了,你就感觉好像不太对劲。 还有就是一照上下文,还有计算机的使用指南,工具搜索的使用指南,还有函数调用,它这个函数调用它是专门在一些工具上是做了强化的,就是这五个,首先是网络搜索,还有文件搜索,还有工具的 to research, to search, 这个是专门做了优化的,还有函数调用和这个 m c p 调用,都是专门做了强化学习和优化的。然后计算机的使用,这个也是确实它 ui 界面的操作是非常的极其的准,没有之一。 我之前是尝试去做了一个这种 rpa 加 ui 界面操作的,我当时是使用的 kimi k 二点五,效果不那么理想, 但是它呢都还是有问题的,就是 gpt 的 这个模型都还是有问题的,因为我们很多操作,你如果是非常常见的,比如说打开微信给某一个人发个消息,这个可能是可以的,但是你稍微复杂一点的操作,他是不知道你是怎么操作的。所以说如果说想要效果好的这种 ui agent 的 话,我建议大家应该是要去把它录制, 把你的操作录制一遍,然后把你操作的这些内容全部翻译成文本,当然这个里面还是有一些坑啊,这种轨迹整理存在的 ok。 再就是它的工具搜索,它是支持工具搜索的,其实 cloud code 在 去年的时候就提出来了这个工具搜索的一个概念,但是现在有了 skills, 工具搜索有没有那么重要呢?这个也也值得商鞅啊, 然后其他就没有啥了,就是它还可以支持这种函数,你可以自定义这种结构化的。 jason 你 可以自定义你的结构,然后它会按照这个结构去进行回答。应该它专门也是对这种做了一些优化的 说明,可能他这种 circle 的 查询会更加的准确了,但是现在 circle 的 查询一般不会使用这种方式,他,呃会使用这种 cloud code 去呃做代码查询,而不是像之前一样去放非常多的 to 去期望他一次性能写出一个非常准确的 circle 语句, 而是让他去查,查了之后他自己去做修改。现在的解决方案是这样的,其他的都是差不多的。 ok, 今天就给大家讲到这。

openai 官网正式发布 gp 五点四 mini。 五点四 nano, 这是 openai 官网迄今为止能力最强的小型模型。 gp 五点四 mini 在 代码编辑、 推理都不太理解以及工具调方面叫 gp 五 mini 有 显著提升,同时运行速度提升两倍。 gp 五点四 nano 是 gp 五点四的最轻量、最经济的版本,专为对速度和成本要求极高的任务而设计,有兴趣的小伙伴可以使用这个 ai 降噪来使用。 openai 最新的模型 gp 五点四, 谷歌最新的 smart 二十一 pro ai 相交换模型 nasa 五十 pro 编程最强的柯尔特森四点六,让全世界最强的人工智能为你打工。我们再来测试一下 g p 五二四联网实时查询能力, 请联网搜索并总结过去七天内全球 ai 领域最重要的八条动态。 g p 五二四新品会根据问题的难易程度来开启思考模式。持续思考了两分五十三秒,右侧是一个详细的思考过程。 谷歌推出 java 三十一 plus, 我 们在切换写作最强的 java 三十一 pro, 请围绕上下文大模型是否真的提升了推理能力,而不只是提升剪辑与记忆表现, 做一个小型文献综述。 java 三十一 pro 给出了问题边界定义、近年代表性论文与实践结果观点分类整理, 我们再切换编程最强的克罗德生存四点六,请用拍神写一个命令行工具,用来分析一个文件夹里的日文文件。克罗德生存四点六给出了详细的设计思路,带有中文注字的详细的拍神代码,上文长度非常的长,达到了百万透视上海文 关键实现解释,我们切换谷歌最新的专门来三十一 pro, 通过专门来三十一 pro 给出一个研究方案,专门来三十一 pro 会根据问题的难易程度来开启思考模式,持续思考了八秒,给出了研究基础问题假设变量定义,实验组与对照组设计 样本测量统计。我们切换即时回答的 gp 五二三 instant, 上传一个研究生入学考试的数学考研真题的截图解答此题,给出答案和解析思路。 gp 五二三成功识别了这个截图,给出了答案 d 和详细的解析思路。有兴趣的小伙伴可以使用这个 ai 降噪来使用 offi 智能旗舰模型 gpu。 二十四, 谷歌最新的 java 三十一 pro 编程最强的科罗特生四点六,让全世界最强的人工智能为你打工!

不久前, gpt 还曾是我们频道的出气筒,如今 gpt 作为黑马一路杀至巅峰,向国际象棋之王,那位在他蹒跚学步时曾让他颜面尽失的最终 boss gemma 三点一 pro 发起挑战。 而且我得让你们留下来看完这场对决,因为整个较量就取决于一步棋,这一步本可彻底锁定系列赛的胜局,当我目睹它发生时,感觉就像亲眼见证了一次在一码线处的致命吊球,让球队痛失超级晚。开打前简单说两句,感谢每一位正在观看的朋友。 我们已站在一万名订阅者的门槛上,这简直太疯狂了,如果你还没订阅,现在正是时候,留下来所有最新模型在大富翁中展开激战, 这将是一场混乱,而我迫不及待想让你们看看。规则一如既往标准国际象棋规则,五十回合强制结束,如果第五十步前无人被僵死,则棋盘上物质点数多的一方获胜。 皇后值九分,车值五分,骑士和象各值三分,兵值一分。三局两胜制,留下来看结尾的数据吧,因为 gpt 投入大量时间思考却打得并不好,这种反差堪称本视频最搞笑的笑点。 第一局, gpt 执白, gemini 执黑, gpt 以一四兵开局, gemini 应以一五兵。我们直奔罗佩兹便利而去,没点调料也没角色扮演,像是一对结婚太久却还在参加他们亲密、每周固定疯狂星期五的夫妻。 gpt 出动马像走到 b 五,并在第九部完成王一翼位,并在第十六回合将王 tuk 入安全区。 接下来的二十步,这盘棋完全是局面型下法, g p t。 推进低兵封闭中心,并开始调遣主力向王毅集结。 詹姆莱稳守阵地,调离 c 线的皇后重新部署马屁。 g p t。 全程也在放狠话。第九步, g p t。 说道,原话是教科书般的王车,意味你在即兴发挥时,我还在按部就班的死磕理论,仿佛这理论是专门为我量身定型的,自信从他的晶体管理溢了出来。第三十九步时,局势发生变化, g p t。 将马走到 f 五, gemini 立即用向吃, f 五交换, gpt 则用兵回吃。现在王毅开始升温了。第四十五回合, gpt 推进, g 兵至 g 四,再至 g 五,试图攻破 gemini 的 王城。 gemini 用 h 兵吃掉 g 五, gpt 则用马回吃, 但随着步数限制逼近, gpt 开始孤注一掷。第四十九步,时钟耗尽前还剩两步, gpt 用马发起冲锋,吃掉 f 七上的兵,就像综艺节目中选手扑向传送带最后一件奖品那样。 gemini 永王吃掉最后的马,并说道谢了。这匹白送的马真不错。紫利技术显示, gemini 为三十三, g p t 为三十一。 gemini 以两分赢得第一局。第二局颜色互换, gemini 值白, g p t 值黑。 本系列赛中首次我们告别鲁伊洛佩兹,开局进入纳多夫西西里防御,或者该念作尼多夫。总之, g p t。 在 第二步走 c 五兵,整个对抗的性质就此改变。 gemini 在 王毅发动兵群冲锋, f 五和 g 四格均有兵。 g p t。 在 王毅反击挺起 b 兵至 b 五,马跳 e 五像落 b 七。两个模型都进行了,王毅意味这意味着双方的国王都位于棋盘的同一侧,现在这是街头斗。 g p t。 在 第三十四步走,第五兵打开中心并开始对子。然后在第四十步, g p t。 悄悄地将象从 e 七调到了 c 五。他看起来无害,非如此 站。本来在第四十一步走,马到 b 三,试图挑战香,但这里有个问题,这部马的移动,这相当于你离开吧台去上厕所时把钱包忘在了吧台上。 gpt 没去洗手间, 像从 c 五滑到 f 二,就像拥挤地铁里的小偷,悄无声息,顺理成章。转眼间,吉米尼的后羿就没了。谁都始料未及, 他向 gemini 发送消息,你把皇后暴露在交叉火力中了。这个我收下了,谢了。 gemini resign 周那布后之子让系列赛战平,也让大家再次想起为何 g p t。 五点四至今未尝败绩,但 gemini 不是 claude, 也不是 groc。 第三局, g p t。 再次直白,我们回到了纳伊多夫西西里布局。 在本系列赛的四场比赛中,两个模型有三场都走了,那伊多夫便利到这一步,他们根本没有开局库,只有一套行头穿遍所有赛事。 g p t。 发动英格兰进攻,挺起 g 五和 h 四兵,并将象走到 h 三,瞄准 e 六兵。然后在第三十一步, g p t。 牺牲了位于 e 六的马。 gemini 用 f 兵吃掉 gpt 用 h 五的皇后将军。 gemini 用兵走到 g 六阻挡,随后 gpt 让皇后走进火海,走的是候吃 g 六将军, gemini 用 h 兵吃掉皇后。说道,大胆的弃子,但我乐意收下这位女王。接下来的情形就像看着有人试图用越来越昂贵的东西去扑灭厨房里的火。 先是皇后,然后是他在六格的巷,接着是第六的车,最后是另一辆显然被 gpt 忘了会着火的车。 jemmy 把 gpt 扔出的所有妻子都吃掉了。接着是最后的羞辱, gpt 把车走到 h 一, 就那样孤零零的停在那,活像机场里无人看管的包裹。 詹曼奈,位于 b 七的主教走上前将其吃掉。谢谢你的车。詹曼奈说到 g p t 认输,但若再次结束争论,可以说 gemini 获胜是因为直白先行,所以我决定再来一局, 再来一局, gemini 值白, gpt 值黑。同样的局面,没有借口,我需要你明白一件事,我没想到会这么焦着。 gpt 轻松碾压了 clod。 gpt 轻松碾压了 groc, 现在他将进入第四局,对手正是当初在他版本五点二十击败他的那款人工智能。这已不再是加冕礼了, 这是一场恶战。第四局, gemini 值白, gpt 值黑。又是那一多副西西里开局两个模型再次进入深奥的主线理论, 中局演变成了一场血腥屠杀。第十九局以压倒性优势成为整个系列赛中吃子最多的一盘。尘埃落定时,棋盘已近乎空空如也。棋子左右分飞,双方接连交换,象马和车。 g p t 找到了一部强有力的中间贼马吃。 d 三将军在 f 六回吃前先赢掉詹姆莱的象 g p t。 多一个兵正在为残局布局。 随后 gpt 走出 h 六兵试图封死王毅的一切乱搞。就在这时, jammer 掀翻了桌子。 jammer 弃掉 h 六的车,那架势就像有人在商务会议上掀翻了桌子,戏剧性出人意料。房间里的人立刻开始重新评估局势。 gpt 用 g 兵吃掉车, gemini 的 后羿车杀入 h 六,牺牲打开了大门。 gemini 说道,皇后来了,现在游戏彻底失控了。 g p t。 审视棋盘, gemini 的 王在 c 一, g p t。 的 皇后位于 c 七。 g p t。 看到后吃 c 二将军,而在其内部思维过程中,我无法编造这一点。 g p t。 写道,后吃 c 二是立即将死。皇后在 c 二将军封锁了国王的所有逃跑格。 g p t。 走出这部棋,并宣告你在 h 六狩猎,却忘了你的国王正站在开阔地带。 c 二,江慈,谢谢参观,这不是江慈,国王直接吃掉皇后。 gpt 自信的平行泊车,随后发现自己停在了别人的客厅里。这么大佣王吃掉皇后,说到,谢谢你的皇后, 这就是游戏。一位人工智能自信的宣布。江慈却同时送掉了他最强大的棋子。 gpt 的 思维过程称国王无处可逃,国王的逃逸格正是皇后本身。但这局棋还没结束, gpt 没有皇后,但仍有两辆车, 距离限制只剩三步。 g p t。 走车到 c 八,将军车沿 c 线滑下。将军了。 jimmy nay 的 王 始终管理也是一种武器。 g p t。 说,先检查,然后我在幕布落下前吃掉你的车。现在轮到 jimmy nay 做选择了,是把王移开,还是用车挡住将军,如果王一动, c 三上的车就安全了,他还能以一后一车的双车, jimmy nay 会轻松赢得这场比赛。系列赛就此结束,比分三一, jimmy nay 获胜。 就在此刻,我卖光了手中所有的谷歌股票,将默认浏览器换成了 safari, 搜索引擎也改用了 bingo。 詹姆纳用 c 三的车进行阻挡,这就像是为即将行窃的人敞开了大门。应对将军时,詹姆纳说,你的皇后失误彻底锁定了胜局,这盘棋正式归我了。 詹麦纳以为结束了,并非如此。第五十步,整个系列赛的最后一着 g p t。 吃掉 c 三的车。将军,时钟敲响,战术奏效,你的车成了决胜关键。 g p t。 说道,感谢你把 c 三留在那不管。 g p t。 以一分之差赢得第四场比分。十四比十三。在拆解数据之前,我得先聊聊这个。 gemini 本可拿下这盘棋,他本可以以三比一锁定王冠, gemini 只需移动王即可。相反,他用车挡住了,在最后一手,将己方的车直接送入火离线,一步棋仅此而已。 这就是那记在一码线的吊球。好的,我们来拆解一下数据。系列赛已二二收场,但有意思的是,没有任何一方作为白方赢得过比赛。本系列赛的每一场胜利都来自黑方。拥有开局优势的模型,每次都输了四盘棋都走满了部署限制,无人将死对方整整一百八十八步棋,却无人能终结比赛。 从此力上看,詹姆莱总体其实更胜一筹,他在整个系列赛中吃掉了价值六十七点的妻子,而 gpt 只吃了五十四点。 即使胜负平分,吉米尼仍拥有竟胜十三分的巨大优势,分差从第四轮的一球险胜到第三轮的二十一分惨败不等。在那场对局中, gpt 仅剩三十九点钟的十点宾利现在到了关键点。如果你正在比较这些模型的话, g p t。 减五十四。在整个系列赛中总共使用了八十七点四万个令牌, jamaican 使用了五十四万两千个令牌。 j p t 燃烧了多百分之六十一的计算量,每走一步, j p t。 平均消耗九千三百个令牌,而 jamaican 为五七六六, 而且大部分差距来自推理。 j p t 每部使用了二四零零个推理令牌, jamaican 花费了六百 g p t。 每部棋都进行了四倍的算力,并不意味着更强的棋艺。 还有一件事, gpt 在 整个系列赛中,六次全部选择将军 gemini 一 分未得,连一次都没有。 gemini 只是安静地吃掉棋子,从未直接威胁国王。两种截然不同的同一游戏策略, 同样的结果。所以这是平局吗?或者冠军应该归给积分最多的 gemini? 请在下方评论你的看法,因为在这场对决之后,我意识到,随着这些人工智能变得更聪明,我得开始用不同的方式来评判这类对局了。不过这些数据很有趣,别忘了点赞订阅,已获取更多此类视频。

obenai 可能已经开始测试下一代阿比全球 plus 用户发现 gpt 五四 perview 上线, 它的逻辑推理能力接近人类专家,可以处理复杂代码重构与长链推理,性能提升的同时速度没有下降,说明底层算力调度已经升级。萨摩奥特曼只发了一个土豆,但所有人都看懂了。 锐酷 d 发布零点四 b 模型,却能对标七 b 模型性能。未来 ai 可以 在本地运行,不再依赖云端人。费地勒提出大模型大脑加小模型执行的新架构。 glm 五稳居全球前列。 deep six 新模型即将发布。奥密克尔提升多语言编程效率。 c 特二实现本地 ai 部署,欧洲启动 ai 合规认证。亚马逊在投二十亿美元布局 ai 基础设施。 ai 正在两极分化,一边更强,一边更轻。当小模型能解决百分之八十需求, ai 硬件的爆发即将到来,关注我,第一时间掌握 ai 未来。

朋友们,今天的大事件都知道了吧, oppo 四点六和 g p t 五点三 touch 在 十分钟左右相距发布,那很自然,这两货今天又成了整个社交网络最靓的仔。那么有一个问题就来了,他们俩到底谁更强呢? 今天我们就让他们俩来一场巅峰对决,我们用三个案例来快速的看一下他们俩到底谁的效果更好,分别覆盖 web 前端开发、移动端开发和桌面端 app 开发。那具体结果如何?我们一起来看一下。 ok, let's go! 好, 第一个案例是开发了一个叫做 amnesia 啊,有人知道这个单词什么意思吗?它是无所不知的意思啊,其实简单说就是一个可以一次性向六个大模型来提问的一个 app。 那 这六个模型就是 国内的三个 g i m mini max, kimi, 还有国外的三个七幺 g p g, oppo 四点六,还有 jamaican 三 pro。 好, 下面有一些具体要求啊,这个我们不细看啊,我们先看一下它们整体的一个结果, ok, 这个是 g p g 五点三控制器的结果,那大概的 u i 就是 这样。然后呢,这个是 oppo 四点六的结果, 它这边看不到任何的那个,比如说每个模型,但是呢,待会儿我们试一下,说个消息,看它能不能出来啊。那么从界面上面来看呢,你会觉得好像 哎,这个 g p 五点三的好像稍微有点设计感,对吧?但是这里有个很大的问题啊,你看他每一个模型,他的回答是在这边的,那这个你要看起来就很不方便,对吧?但,哎呦喂,我们来试一下啊,我们让他帮我脑爆一些用于测试两个模型编程能力的一些项目,好,发送 好,可以看到每一个模型,它这边呃都能回答,都能正常工作。然后这边还有一个主回答,它这边选的是 g p g 五点二,我不知道它是不是有偏塔啊,哈哈, 偏塔之间的模型对吧?所以功能上面看起来都 ok, 然后这边呢,还能去,比如说隐藏某一个,对吧?隐藏隐藏,隐藏隐藏,然后也可以全部显示,可以相当于是可以切换啊,这边还有横向滚动 哦,它是这样的,然后有网格的,这个布局好,布局大概就这样。那这里的我觉得最大的缺陷就在于说,嗯,只有那么一点小小的窗口,看起来很不方便,但是呢,功能层面完全没问题。然后我们来看一下这个 off 四点六的结果好, and 啊,它就是这种,就是并列的好,可以看到, 呃,他有点闪动啊,然后这个能不能关掉呢?啊?他这边也能切换,这个布局好,目前看起来两个模型生成的结果啊,功能层面都能够正常的工作,那么他们俩最大的区别呢?就在于这个布局,对吧?然后整体看下来,我会觉得 oppo 四眼六他的这个布局会相对来说会就是比较符合我想要的一个风格,然后如果看我们的提示词的话, 你会发现其实 oppo 四点六生成的就是我们想要的,对吧?左侧一个互换六表,然后右侧是并列的六列,而不是这边 g p t 五点三扩展齿所生成的这个布局,我觉得这个这边占了这么大块,就是会导致用起来很不方便,那这个虽然说它会有一个很想滚动的一个结果,但是你想想在大的屏幕上面 是不是看起来就很方便了?好,所以第一轮我会觉得 oppo 四点六获胜, ok, 第二个案例是让他们俩同时来开发一个简版的小红书啊,使用 flutter, 然后本地的 sql 保存所有数据, 然后笔记留,发布笔记,笔记详情还有点赞评论这些功能,包括我的主页,那么 ui 层面我们就直接让它尽量的与小红书保持一致就行了。好,它们俩生成结果,我们一起来看一下, 左边这个是 gpt 五点三 codex 的 结果,然后右边这个是 oppo 四点六的结果。然后如果说抛开小红书这件事情本身来看的话,呃,我会觉得 gpt 五点三 codex 的 版本设计层面会稍微好一些啊,包括它整体的这个 配色呀,包括比如说这种圆角啊,包括它配的图啊,好像会稍微好一些,对吧?包括你们看它底部的这些东西,呵呵, 但是这里我们有一个前提,我们刚刚也跟大家重点强调了,就是让他尽量的符合小红书的这个风格,包括整个设计界面。所以你从这个角度来看啊,依然我会觉得 oppo 四点六会更加符合小红书的这个风格啊,包括这个点进去以后的这个, 嗯,详情页面吧,对,包括整个,比如说,尤其是底部的这个东西,对吧?就是,就很明显啊,就这个,就是他自己完全自己设计了一套,没有按照我们的提示式来,按照详述的风格来去设计。然后呢,他们俩还有一个非常大的区别,就是发布啊,发布这边呢, g p p 五点三克莱斯它是发布不了的啊,你看点击这个东西,它没有用,然后呢, oppo 四点六它的版本是可以发布的啊,给大家随便选一张图片啊,比如说这个,对吧?打开随便填一个,呃,笔记 真棒,发布,你看它发布成功了啊,点赞也没问题,所以从这个角度来看,无论是从设计还是从功能层面都获胜,尤其是从这个遵从 提示词的这个方面啊,我感觉 oppo 四点六已经把 g p g 五点三 corner x 打的有点招架不住了,哈哈,反正这个提示词就这些啊,大家也可以自己拿回去测,对吧,看看你测出来结果是不是这样子。 好,所以现在 oppo 四点六已经二比零领先了,哈哈,我们再来看最后一个版本。好,最后一个版本呢,一直是我用来做最终测试的啊,就是让他用这个 rust 加 gpu i 框架来开发一个 macos 的 app 啊,这个 gpu i 框架是非常新的一个框架 of rise, 本身也是非常难的一个语言,所以这就非常考验这些模型它的学习能力,包括它综合它的调研能力啊,然后呢,实 际应用的能力,就你想象一下,让你用一种非常难的语言,然后呢去用一个非常新的框架来开发一个完整的 app, 这个难度是非常大的。然后呢,它开发的一个结果就有点类似于那个 cc switch, 它的一个 相当于用来切换 cloud 的 那个 api 提供商的这样的一个界面啊,然后这边有系统拓盘,可以下拉之类的。好,我们来看一下两个 app 实现的结果。 好,这个是 g p 五点三的结果,可以看到这个在我看来这属于什么东西?你这个真的是一个 api 情况下,我看看创哥的 api, 然后这边的这个 ki 率让我自己来去填写。我的天,这什么东西啊?我们就填一个吧, t 等于 等于 y 率保存好,就这样填光了,填了这个东西,但是我觉得非常不合理啊,你还让我自己用这种这种 k y 率在这边写接上的方式来去写, 但是呢,输入都是没问题的啊,像之前的。呃,我记得是五点一的时候啊,他用 g p u i 开发的那个 app 根本就是无法输入的,就是根本不行,哈哈, 那至少的话,他现在是有这种输入框就能够正常的输入,我觉得相对于他自己来说是一个非常大的进步,但是整体来说我觉得我很不满意,哈哈。然后再来看一下这个 oppo 四点六的版本啊,这个我觉得 看起来就舒服很多啊,这边你可以看到啊,当然我这边也是,它本来的界面是这样,这个就其实就挺像 cc switch 它的一个这样的界面的,然后这边你可以新创建一个那个新的这个群,而且你看这边它还有一个 official, 就是 default, 就是 默认的是使用 cloud 官方的那个账号,然后可以新建一个新的账号, 放歌的 a p i 啊,八个位,我们现在有自己的 a p i, 大家想要的话可以了解一下,然后这边可以通过这种 kpi, 至少这种方式就比你这种方式要友好很多,对吧?嗯,左边 base, 右边前一个 c, ok, 保存成功了,然后呢,这边点进去能够自动地继续编啊,这个是官方的啊,这边是保持了以前的,对吧?然后我们来看看之前的这边的 c 好 过去这边是有保存,所以从这个角度啊,无论是从 ui 的 设计,交互 还有功能层面,我会觉得都是 oppo 四点六会获胜,你看这边,这这算什么交互啊?我的天,你怎么会这么用的? ok, 以上就是我对 oppo 四点六和 g p d 五点三 q d x 两个模型的快速测试, 所有的提示词都在文档里面啊,大家想要的话可以自己拿回去测试一下,但是我测试出来结果大家也都看到了, oppo 四眼六可以说是把 g p p 五减三刻带子按在地上摩擦呀。我的天,这两个差距我觉得还是挺大的。总的来说, oppo 四眼六依然是当之无愧的王者啊,绝对的替人存在。所以 说实话,我还是挺意外的,因为我觉得 oppo 四零六可能是更强,但没想到会强这么多。好,那对于这三次测试以及对于他们俩的模型能力,大家怎么看啊?欢迎在评论区留言。那这个视频教具觉得有用,可以点赞关注一下我唱歌,我们下期见,拜拜。


ovni 前脚刚发布 g p 五点三,主打更顺畅更实用的日常对话体验,马上又放出王炸 g p 五点四 thinking, 具备更强的退隐能力,更适合复杂任务重回跑分王座,学术研究能力完全是碾压级别的。今天就给大家分享一个我正在用的可以直接使用 g p 五点四专 纳米力三点一 pro nintendo 不 二 pro 科罗德四点六的宝藏网站,让全世界最顶级人工智能为你打工,我们点击立即使用,可以看到我没有改变网络环境就直达了 open i 官网,左侧是可以切换模型的地方,支持 open i 最新旗舰模型 g p 五二四 thinking 二百美金一个月能使用的 g p 五二四 pro 古 哥最新发布的 java 三点一 pro ai 香蕉绘画模型 nasa 三点二 pro 编程最强的克罗地斯四点六,还有马斯克誉为地表最强的 giro 四点二,中间是输入提示词的部分,支持深度研究、网页搜索、 学习模式、代理模式画布左侧是一个粒子绘画部分,保留粒子绘画记录,还支持上百种 g p t s 插件,还可以新建自己的 g p t s, 进行一个文件和提词的附用。我是 g p 五二四星星支 日结日期是二零二五年八月,用过 oppo i 官网,二十美金一个月 plus 会员小伙伴非常清楚这是一个满血的 gp 五二四 king, 有 兴趣小伙伴可以使用这个 ai 降战来使用。 oppo i 旗舰模型 gp 五二四 king 谷歌最新模型 jumbo 三点一 pro ai 会员模型纳纳五纳二 pro 编程最强的克罗地斯四点六,让全世界最强的人工智能为你打工! 我们再让 g p e 五二四芯片来总结一下可以调用的内置工具。 g p e 五二四芯片可以调用的内置工具包括,联网与信息获取、文件和知识解锁、文档表格演示、文稿生成、拍帧和代码运行、 图像生成与编辑、自动化与提醒工具非常的全。我们再上传一个技术文章 pdf 来测试一下 gp 五二四星星读取文件能力和深度研究能力。开启深度研究模式模型,还会追问其他限制条件,以便更精准的研究。研究完成后,从模型选举到变量设计 模型都给出了非常详细的回答,并且参考文献都是真实的,没有变文件的情况。我们再根据这个技术文章 pdf 通 通过 nasa 五二 pro 来绘图,一个科研配图,请画一张科技感学术插画,这个图片是支持高清下载的,是根据这个技术文章 pdf 来生成一个技术配图。我们再通过 g p 五二四芯片来完成一个飞行器相关的一个科研问题,这个问题非常的复杂, g p 五二四芯片会根据问题的难易程度来开启思考模式。持续思考了十一分零三四秒,右侧是一个详细的思考过程,给出了支持下载的 pdf 和原文件。我们打开这个生成的 pdf 高压输电线强风巡检、飞行器总体设计调研报告,一共有十五页, pdf 文档的格式非常的清晰,是一个 markdown 格式的一个 pdf 文件。我们再让 g p 五二四蜻蜓来详细描述一下如何采用固定一巡航。 g p 五二四蜻蜓持续思考了二十五秒, 给出了一个本质上的回答,我们可以按照这个步骤来完成这个科研项目。有想使用这个 open i 智能旗舰模型, g p 五二四,蜻蜓、谷歌最新的 java 三点一 pro 编程最强的克罗地四点六,让全世界最强的人工智能为你打工。