不是这大半夜的, google 直接扔了 gemini 三点一 pro, 也没打算让大家活儿啊,推理能力直接翻倍!十六项测试里头拿十三个第一, 又回到 ai 的 最强位置了。推理测试 a g i, 测试百分之七十七点一的得分,比上一代翻了一倍。这个测试叫二 k a g i 杠二,专门考验 ai 能不能去解答从没见过的逻辑题,被公认为是 ai 领域最难的考试之一。百分之七十七点一,听起来 好像只有七十多分,但是排名第二的 clod opus, 没错,就是现在比较公认的真神只有六十八分。而且不光这一项,科学推理百分之九十四点三,编码任务 s w e 八十点六,智能体长城测试百分之三十三点五。总之,十六项指标里头拿十三个第一, demo fork, 然后价格继续怎么样? 同样测试的情况下,花不到对手一半钱的,也就是说维持原价啊!但是有一个数据啊, 怪不得呢,谷歌 ceo 劈柴,赶紧来发帖宣传,说了三点一 pro 是 核心推理质的飞跃,大家赶紧去试一下,而且你想想,谷歌是不是给大家玩低调? 都定了今年 i o 的 开会时间了,也就是五月份要进行大更新,所以现在先给你一个点一,这就意味着到五月很可能就给你 gemini 三点五或者 gemini 四了,直接干飞了的某波儿。
粉丝174.5万获赞3892.9万

昨天谷歌发布了新的模型哈基米三点一 pro, 如果我们只看名称的话,就会发现他只提升了零点一,那是不是能力也只是提升了一点点呢?并非如此,这次更新虽然是一个非常小的版本,但是他的整个推理能力有了一个非常大的跃升。而且我们看他官方展示的例子,只能说明官方很懂啊,他知道自己模型的强势点在哪,就是前端视觉, 所以他们展示的是一个视觉方案。那么这只是卖家秀,接下来呢,将给大家展示买家秀是怎么样的。 首先来到战备贷官网,不管你是什么账号,都可以进行使用,只不过额度不相同。就比如说我现在是一个免费的账户,点击右下角可以切换到 pro 模型,它默认使用的就是三点一,一个经典的小游戏,让它加上了音乐, 我与板栗仔不共戴天,就是我这个免费账户,只用它生成了这一个案例,然后就已经达到了限额。然后是我的 pro 账号,让它生成了一个动画 svg, 展示一只穿轮滑的鸵鸟,我觉得还是非常让人满意的,只不过这个行走动作呢,有点奇怪,像是倒着走一样。 只要你是付费用户呢,你这个额度其实就非常多,可以一直去用,但是相应的他也学会了 open 那 一套,对一些账户呢,给你随记录邮也就降至免费版,虽然次数少,但他肯定不会给你降至,原因呢,就是因为他肯定要让你看一个非常好的效果,然后你才会愿意花钱去购买他们的套餐。至于你已经购买的了,我就随便给你路由,一会让你好用,又让你不好用。 这个就比较烦人了,学坏。给大家看一下我其他的生成效果,重复了很多次,有的降智了,有的不降智。就比如说这个,当我点击皮卡丘的时候,他会有一个闪电。 我靠,但是有些时候他做的还挺好看的。你比如说一个精灵球,我去释放,然后会出来一个皮卡丘,它整个质感是不错的,只不过耳朵的位置错了。我也可以去继续跟他聊天,让他去纠正,他是可以纠正的。我测试过 制作一个赛车飞速行驶的 svg 动画,那它呢?就会自动帮我们进行设计,去思考应该怎么做。那最终结果是这样的,你可以看一看,是完全可以用的,非常的惊人。 但是因为我刚睡醒啊,有点起床气,没有那么激动。什么意思?在同样的提示词下,拆 gps 的 表现就非常的糟糕。而 cloud 的 欧帕斯四点六同样非常惊人,完全可用的状态。那国产模型里边 dbc 老师生成的呢?也是非常幽默,那可以看一下是飞驰。 哇哦,那现在我们再来看 jimmy 生成的这个,这样对比之下,我们就能发现他的细节比上面两个模型要好非常多。不过这个时候呢,可能有朋友要质疑, 那你生成个 svg 有 什么用啊?就只是看着好看,好像没什么用。拜托,这是 svg 啊,他是一个矢量图,这个意思是不管我们放大多少倍,他都是没有像素点的。就比如说,我们可以直接把这一段矢量图放在我们的网站中,我之前他制作一个精致的赛车网站,把 svg 动画当做头图展示, 直接让他来进行生成,这网站虽然生成了,但是说实话,配色整体的感觉是非常丑陋的,所以呢,我让他变得高级优雅,有设计感。这几个词呢,几乎已经被他训练在里边了,他一检测到这个词他就知道了啊,你想要一个那样的, 我就给你个那样的过礼盒了。属于是现在我们再来看这个风格呢,就变得非常高级了,包括这个车的颜色呢,也进行了重新设计。 哎呀我靠,艺术,这就是艺术。我这里呢还让他做了一个小小的演示动画,就是先是一个手机,然后变成赛车在赛道上跑,然后赢。我看一下 整个动画呢,可以说是非常流畅而且很巧妙。这个模型对于一些三 d 效果呢,做的也是非常不错。就比如说我让他制作了一个图书的网站, 然后是三 d 悬浮的书,然后可以这样去滑动去选,还让他制作了一个三 d 的 赛车游戏,你可以注意一下这个车上面的灯光反射做的非常好啊,还有这个碰撞, 每撞一下速度就会减慢,撞三次就死亡了。然后就是经典重现 mac os 系统,哇,整个图标的设计呢,也变得非常好看了哈,挺可爱的。 还有这个小游戏对赢家 x 贪吃蛇,这能放大吗?还可以全屏细节,还能在系统设置里面呢,去设置壁纸。 哎呦,总之这个版本的更新呢,前端依旧是非常的强劲,那至于后端,我们有更好的选择,高的欧巴斯, openid, 酷拽的都是不错的。 至于 jimmy 的 话,就写写前端吧,他们好像是要在前端的路上一去不回了,要走到头,依旧牛大了,依旧无敌,非常的寂寞。各位如果感兴趣的话,可以下去自己试上一试, 得出自己的结论,不要看我怎么说,也不要看别人怎么说,好不好用你用不用,最终呢还是自己来决定的。那以上呢,就是本期视频的全部内容了, 对你的帮助和这个视频做的还不错的话,欢迎给个一箭三连,有什么想看的内容呢,也可以在评论区留下你的足迹。那最后祝大家新年快乐,今天已经初四了,年都跑远了,给大家拜个晚年。依旧祝各位晚年幸福,晚年安康,我们下期再见!拜拜!

大家好,就在刚刚谷歌发布了其最新的模型 jimmy 三点一 pro, 这导致我现在凌晨四点前给大家在这在录视频拍解读。 虽然这次看起来只是一个零点一版本的更新,但其实熟悉 jimmy 的 朋友知道,这也是 jimmy 的 首次,这种命名更新其实也可以代表这次的一个重大升级。 三点一的设计书中主要是为了处理那些简单回答无法解决的复杂人物。首先我给大家先看一下数据,但是数据我觉得不是我们这个视频的重点,我们这个视频主要聚焦于 官网那些 showcase 的 一些展示,我们先带大家看一下官网展示的第一个 showcase, 其实这个案例就是基于代码的动画,我们可以看一下 jimmy 三跟 jimmy 三点一,它动画的一个质量 其实差距很多,我们就拿这个来看,可能之前就是简单的一个色块接一个色块,到现在有渐变,有场景, 到其实他有一定的审美,从之前这种特别简单的效果,到现在有结构,我觉得这个 case 更清晰一些,之前就是一个简单的月亮,到现在其实它结构会变得更多,包括这种其实画面的丰富度会上来很多。 我觉得我给大家打开中文,我们一起来更直观的观看一下。首先就三点一 pro 可以 直接根据文本提示生成可用于网站的动画 svg, 其实做设计的朋友都非常了解 svg, 它就是一个文件格式非常小,清晰度非常高的一个格式。如果我我觉得这一块我们核心要看的是 jimi nike 三跟 jimi nike 三点一的一个对比的一个效果,现在我们可以通过文本直接去生成,其实我觉得这效率会高很多。那我们现在来看看第二个 case, 其实这个 case 简单来说就是它可以把一些非常复杂的数据变成可视化的东西。然后 我们看一下第三个 case, 其实这是一个交互设计的一个 case, 简单来说就是三点一 pro 可以 能够生成非常复杂的这种呃,三 d 动画,它不仅能生成视觉代码,还能构建一些沉浸式的体验。用户可以通过手部、头部去跟踪鸟群, 并聆听根据鸟群运动而变化的生成式配乐。这对于设计师来说吧,其实能非常快速的构建一个非常复杂且感受非常多重的 demo。 我 们可以大概先看一下。 after seeing a video of a starling murmuration i was inspired to ask gemini 3.1 pro to code a simulation of one for me the model created this cloud of voids that interact in similar patterns to a real flock of birds i then asked the model to make the simulation interactive so i could move the birds with my hands i also asked the model to create music that would change according to the movement of the meringue all of the features in the simulation can be controlled including the behavior of the birds and even the environment i was stunned at how beautiful the final result was。 到达了我们最后一个 case。 我 觉得最后一个 case 是 跟设计师最相关的吧,也是最好玩的一个 case, 就是 他现在三点一 pro 可以 将一些文学主题转换成功能性的代码。让 jamie 奈为呼啸山庄去设计一个作品集网页的时候,他没有简单地去总结小说, 而是理解了作品那种忧郁大气的情绪基调,并将其转化为一个现代简约的网页设计,精准捕捉了本质。最后其实就是 jimmy nike 其实现在可以在 as studio 都可以使用,甚至我们熟悉的 notebook 也是可以使用的。大家可以在评论区讨论一下你有什么根据新的模型能力,有没有什么你可以想到新的好玩的一些 case, 我 们可以在评论区一起交流。

每天分享一个宝藏软件,今天教大家安装的是 jamming 三点一 pro, 一 款谷歌最新发布的全球 ai 大 模型,支持手机、平板电脑,只需三步即可轻松获取。 首先点我视频右下角这个箭头分享复制一下,接着去商店找到这个,打开一秒后它会弹出一个文件包,没有弹出就在首页搜索小纯工具,跳转后找到这个同款文件,保存安装就可以了。

昨晚,谷歌扔出 jimmy 三点一 pro 突袭硅谷,在各领域刷爆搜查的同时,还做到了加量不加价。 这次的测试表现有点掀天花板的意思。在人类最后的考试中, jimmy 三点一 pro 零工具辅助拿下百分之四十四点四,把 gbt 和 cloud 甩在身后。在二 kgi 二基础测试里,他也直接砍下百分之七十七点一的验证分数,推理表现是 jimmy 三 pro 的 两倍还多。 量化测试有了,再来看实际应用效果。同样的提示词下,三 pro 画的题弧跟七巧板一样,三点一 pro 已经能清晰勾勒出腿的轮廓。互动可视化方面,它能轻松搭建航天仪表盘,实时显示国际空间站的当前位置,也能一次到位编写出三 d 交互的两鸟群,用手势就能操控。 还有很亮眼的创意编程,把抽象的感觉编成具体的代码。比如这个为呼啸山庄搭建的作品集网站,就展现了很符合文字情绪的视觉风格。更 nice 的是性能翻倍,价格没咋涨,接替定价跑一次 ark a j i 二任务不到七块钱, 是 jimmy 三 deep think 的 十分之一,性能只差几个点。连姚顺宇也发文推荐了 jimmy 三点一 pro, 并表示更好的还在后面。看来马年的大模型战场要抓紧时间热身了。

谷歌深夜又放王炸啊! jemmy 三点一 pro 正式登场,他的整体智力得到了史诗级提升,专门为 伊布,不信来看看他和上一代模型的直接对比。同样是生成 s b g 史量动画,曾经的模型只能做简单的扁平移动,而 jemmy 三点一 pro 直接拉满细节,无论是质感拉满的液压开关,还是跟随使得转动眼睛的变色龙,甚至是骑自行车, 动态效果简直丝滑到离谱!除了写代码做动画,他还给电商人带来了一个超级黑科技后魅力 photo 书。只需要上传一张极其普通的商品白纸图, 选中你想要的场景模板,一键点击生成,几秒钟就能直接出炉。极其逼真的专业级摄影大片, 轻松提升你的营销质感,而且目前在部分地区已经免费开放, ai 的 进化速度真的太疯狂了!你觉得这个三点一 pro 的 表现能打几分?评论区告诉我,记得点赞关注!

ai 编程新王来了!谷歌 gemini 三点一 pro 发布才六小时,各种逆天测试案例涌现,我来给大家盘点一下这款模型,专治各种简单答案不够用的复杂难题,是真正的智能体任务和复杂工程底座。首先是三 d 空间推理能力, 它能直接设计并生成一台三 d 打印机的完整模型,从结构到细节一气呵成。还有人用它搭建了一个超逼真的城市规划应用,你看这模型处理复杂地形, 规划基础设施,模拟交通流量,最后生成的可塑化效果简直像真的一样。关键是这不是简单的图片生成,而是真正的空间建模。还有开发者让他设计了一套双叉臂悬挂系统,包括独立双叉臂设计, 动态避震器,通风盘式刹车,甚至还有实时运动学仿真。有人直接下指令给我像素级完美复刻一个台北幺零幺。还有微缩的周边城市,车子大楼,行人路灯全都要结果呢?你这边吃着年夜饭,他那边就已经在搭建了。

谷歌揭秘的三点一 pro 刚发布不到二十四小时,各种逆天实测直接刷屏,咱们来盘点六个有趣的案例。首先,这个兄弟直接造出了一个谷歌地球和军方情报系统的结合体,他不仅能实时追踪天上的无人机和卫星,甚至还接入了真实的街头监控。他还套了个军工 u i 的 外皮, 红外热成像、老式滤镜,一应俱全。第二个,这兄弟用它搭建了一个城市规划器,你只要丢给他一块复杂地形,他能像老工程师一样,自己规划地下管道、网络和基础设施,把动态交通流给你模拟的清清楚楚。这不是图片,而 是 jamie 手托出的一个沙盘,三 d 世界。第三个,有人直接用 jamie 三点一徒手捏出了一个三 d 的 小鸟群落模拟器模型,自己推演出了鸟群飞行的复杂物理法则, 生成了一个能根据你的手势实时互动的鸟群环境。它还配上了声势音效,鸟群运动背景音乐也跟着实时变化。第四个,还有个设计师用它做了一个带有完整交互和设计的网站落地页界面。三点一对设计细节和动画的理解非常透彻,这对网页设计师来说是疯狂的升级。第五个,还有开发者 用一句话直接手托出一个航天级飞行仪表盘,直接把地狱难度的复杂数据做成可量化 u i。 第六个,不需要任何三维软件,它就能凭空推演并生成一套带有真实物理受力的复杂机械结构,我们直接可以翻地打印使用。


嘿,朋友们好,谷歌刚刚发布了他们最新的 ai 模型 gemini 三点一 pro, 今天咱们就来好好聊聊,深入挖一下他到底有什么真本事。 怪你?听听这个开场白,真的是气势十足啊,这不仅仅是一个普通的发布会,这简直就是在向全世界宣布,我们又是第一了。 当然了,话可以说的很漂亮,但咱们得看真凭实据这个说法到底靠不靠谱,他背后又有什么样的技术在支撑呢?好,我们今天就来一探究竟。 要想搞清楚他是不是真的领先,咱们就得看硬核数据,所以咱们先从最核心的部分,也就是他的智商智能水平开始看起。 五十七分,嗯,光听这个数字,你可能没什么概念,对吧?毕竟任何一个分数都得有个参照物才有意义。那这个分数在 ai 界到底算个什么水平呢? 你看这么一对比,感觉就完全不一样了, gemini 三 pro 拿了五十七分,而和它同级别的那些模型平均分才二十六,这可不是领先一点半点,是直接翻了一倍还多。这张图可以说是非常直观的展现了它的领先地位。 好了,总分领先我们看到了,但这个智能具体强在哪呢?一个模型真正的厉害之处,还是要看它在具体任务上的表现。所以咱们再往细了看, 这一张表就很有意思了,我们可以看到它在好几个特别硬核的领域都是第一名,比如说考验它自己写代码解决问题的智能体编程,还有需要严密逻辑的难题,而它都拿下了。 除了这些,他还有几个关键的进步,我觉得特别重要的一点是,他胡说八道的概率,也就是我们常说的幻觉,一下子降低了三十八个百分点,这意味着他变得更可靠了,同时他在编程和处理图文结合任务上的表现也几乎是统治级的。 好的,说完了他有多聪明,咱们再来聊聊另一个非常现实的问题,要用上这么强大的性能,得花多少钱呢?也就是他的速度和成本。 你看,这就厉害了,他不光聪明,而且还又快又便宜,每秒能处理一百零七个词源, 这速度相当可以了,但关键是它的运行成本还不到主要竞争对手的一半。嗯,不到一半听起来还是有点模糊,咱们得看个具体的数字,对吧?这样感受才最直接。 这张表就很说明问题了,你看,要完整地跑完我们前面说的那套智能指数测试,用 gemini 三点一 pro 需要花八百九十二美元,那它的对手呢?像 opus 和 gbt 的 最新模型,成本直接就超过一千七百八十四美元了, 这性价比一下就出来了,简直就是用一半的钱办了最顶尖的事。 ok, 我 们聊了这么多数据和分数,可能还是有点抽象,那这些强大的能力放到现实世界里到底能干点什么呢?我们来看几个具体的例子。 在看例子之前,咱们得先明白一个概念,叫上下文窗口,说白了就是他一次能记住并处理多少信息。 杰米尼三点一 pro 是 一百二十八 k, 这是什么概念呢?大概就相当于一百九十二页 a 四纸的内容,这记忆力够强吧?这就让它能处理特别复杂的任务。 第一个例子就特别酷,你可以直接用文字跟它说,我想要个什么样的动画,它就能直接给你生成一段代码, 这段代码放到网站上就是动画了,最牛的是因为它是代码而不是视频,所以不管你把动画放大多少倍,它都一样清晰,而且文件还特别小。 这个例子就更金阶了,他能直接连接到网上公开的非常复杂的实时数据,然后给你做成一个仪表盘,你看他就把国际空间站的实时轨道给可示画出来了,这可不是画个图那么简单,背后需要处理大量的数据和接口。 这个就更好玩了,它不光能生成一个超级复杂的成千上万只两鸟飞舞的三 d 动画,还能让你用手去跟它互动,你的手一动,鸟群的飞舞形态就变了,连背景音乐都会跟着变。这已经不是简单的生成内容了,而是在创造一种沉浸式的体验。 好了,我们从智能成本还有实际应用里里外外把 gemini 三点一 pro 看了个遍,那么是时候来给它打个分儿,做个总结了。 所以总的来说,它的优势非常明显,智能水平顶尖,写代码特别强,而且还超级省钱。当然了,它也不是完美的。报告也坦诚地指出了,在模拟真实世界去完成一些复杂任务的时候,它的表现目前还不是最强的,还有进步的空间。 谷歌团队自己这句话其实就很好的总结了他们的目标,他们想做的就是打造一个更强大的基准,一个能又来解决过去那些非常棘手的复杂问题的新起点。 那么今天我们聊到这,你看人工智能正以这么惊人的速度变得又聪明又便宜, 这就不禁让人想,当这样强大的工具变得越来越普及的时候,我们的世界会发生什么样的变化?下一个将被我们攻克的难题又会是什么呢?这个问题就留给大家一起思考了。

二零二六年二月二十日,谷歌官方宣布全新大模型真意三 d pro 全面上线,面向企业用户、开发者开放接口。新版本在复杂推理、数学计算、代码编写、成文本理 解等核心能力上实现翻倍提升,多模态理解、精度、响应速度、逻辑连贯性全面优化,直接对标 g p t。 四点五顶级版本, 全球 ai 大 模型竞赛进入寒热化阶段。 jimmy 三点一 pro 的 核心升级集中在推理效果与场景式配合。谷歌通过优化模型架构、精简计算逻辑、强化 知识图,让模型在处理高难度逻辑编程任务、长篇文档分析时准确率大幅提升,同时延迟显著降低。企业用户可以用更低成本的 ai 能力实现智能客服内容删除、数据分析、自动化办公、场景落地,个人用户也能通过相关 app 体验 到更聪明、更听话的 ai 助手,无论是写文案、做表格、学知识,还是解决问题效率都能大幅提升。在全球大模型赛道上,中美厂商呈现双线领跑格局, 谷歌 openai mate 专注通用大模型突破,而国内百度、阿里字节、智谷 ai mini max 等厂商则在垂直溶解、快速时代部分领域已经达到国际一流水。 zion 零三点一 pro 的 升级,也会倒逼国产大模型加快研发节奏。五、在推理速度上、下文程度、多模态能力上的持续追赶。二零二六年,大模型不再是炫技和科技,而是融入各行各业的基础领域。 ai 大 模型的快速迭代,正在深刻改变个人的工作、 自我知识的报告、学习可以用 ai 一 对一,创作可以用 ai 提供灵感, 这艾瑞米三点一 pro 的 上线,意味着 ai 成为辅助工具,向专业伙伴助力, 能处理更复杂、更专业的任务。随着技术不断成熟, ai 使用成本会持续下降,最终实现全民互惠。二零二六年,注定上 ai 全面落地的每一个人都能感受到人工智能带来的变化。

jimmy 三点一昨天晚上更新了,然后有些同学呢,做了一个社交平台余情扒取的以及余情分析的一个工具,所以希望可以给很多的数据分析师, a 产品经理,包括运营的同学,包括还有创业的老板们,然后可以给你们一些思路,在三个小时之内如何做好一个市场需求分析的一个脚本工具,我们 可以后期的话无限次去附用这个工具。目前来说, jimmy 三的实现效果基本上都是一次完成的,不需要去耗费太多的时间成本和人力成本, 就可以得到一个完整的市场需求分析报告了。对,那么这个工具是如何实现的? gmail 三这个模型对于我们现在来说工作效率提升来说有多大的帮助?我们接下来可以看一下这个视频,等一下关闭, 那我先把它关掉,终止,终止之后,然后老师我现在启动了。这里面我稍微解释一下,它是用 jimmy 三点一 pro 的 这个模型 web coding 的 方式在自己的电脑本地写了一个 python 脚本,爬虫的 python 脚本所有的数据全部都是封装到我们自己的 电脑里边,封装我们自己的服务器里了,我们点击进入之后,然后它会自动加载,加载所有的脚本,加载脚本之后,然后我们这里可以选择平台。我,我这里就以抖音为例吧,选择抖音,然后我们选择关机是搜索,我们可以选择水球泡, 然后我们这里选择选择采集数量,我这里就采集十个吧,因为刚才二三十个可能有点长。这里边我还得再解释一下,就是他之前呢有测试过去爬取的最大的数量是三十万条数据,十五分钟的时间我们同时进行并发,也是完全 ok 的。 开始采集之后,然后他会自动打开浏览器, 他会自动登录我的登录,我给他的这个账号登录好之后,然后他就会开始检测本地的一些配置,有错误的话或者有什么他会自动去进行修复, 然后我这边要下判断是否要继续执行,因为他中间可能会出现一些问题吧,这里面可能会出现的问题其实就是对于很多国内的一些 平台来说,我们需要去先有一个账号进行登录,如果不登录的话,其实我没有办法获取到它的 qq 数据,唯一需要人去做一下判断,就是这么一个动作,就登录一下账号。但是一般的像平台我们登录一次,像浏览器都会有记录吗?所以那相当于就是我们登录一次,后续的话其实就不需要再有 人为的任何其他操作,他就开始工作,开始自动去刷这个浏览器,他就开始去搜水球泡的所有的内容。 老师你看他就自动打开了这些这些一个一个抖音视频, 打开抖音视频之后,他就会通过 h 就 html 上面的标记,然后开始刷里面的评论, 如果没有评论他就会,他就会直接跳过有评论,然后他就开始往下刷,这里他已经已经锁定评论了,然后他就把这里这些这个视频的评论都划去了。现在的逻辑就是按照抖音的他的他的一个排排序之后排序来的,后面的话我还会给他加上按热度,按最新或者按任何的任何的一些一些排序来进行 采集的数据,结果是在这里他会被清,就比如说抖音,然后我们刚才采集的在 data data 里面采集的水球泡在这里, 它的数据结构叫 command, 所有的数据都是以 json 的 格式保存在这里,这些 json 格式你随时可以投喂给 ai, 让 ai 来分析。首先第一我现在还没做我要做的两件事情,第一个就是数据的格式化, 就是我会做一个数据清洗的一个流程,然后再做一个 json 格式化,这样让人可以非常非常明了的知道这些数据,数据的数据,哪些数据是是比较 比较集中的。第二个就是交给 ai, 让它根据这些评论做一份鱼情市场报告,现在它整个整个的一个工具还是比较的一个简陋,之后还会加加上数据的格式化,然后 ai 的 自动化, ai 的 自动化处理。第三个甚至我会,我会让我会,我甚至可以用这些数据来做简易的知识库,每天去,每天可以延伸,还 可以去接入到 opencloud 的, 让它二十四四小时去去,我就是给它任务,然后二十四小时去监控这些关键词的一个趋势。这里面它提一个很有意思的点,就是它会把这个写好的盘容脚本,然后二十四小时去监控这些关键词的一个趋势。这里面 什么意思呢?简单给各位同学解释一下,就是我们现在作为呃人工需要进行处理的话,其实就是需要做到两步,一个就是需求明确。第二个就是测试工具,只要把这两个工作内容处理清楚以后,那么我们就可以打包给到 open globe, 也就相当于是给我们的一个数字,员工第一次测试的时间可能要花掉几个小时的时间, 但是如果一旦把需求测试明确,并且把工具验证成功的话,统一打包给到 opencloud, 那 么我们的第二次以及后边的所有的重复复用的话,其实就不需要完全需要人来做了,那么每天我们其实就是在 opencloud 里边去摘菜就行了。 我在这里是预存的一个接一个一个接口的让 opencloud 的 可以接入的。它比 open 四四点六强的地方是我给他一个非常完整的一个需求的话,他能拆分的很很少,他能把一些模糊的需求变得准确, 把一些把一些非常,比如说整个整个项目,它其实包含了很多个内容,我跟他讲讲清楚之后,它会自动化的去做测试,自动化的去改 bug, 自动化的去最后最后给我呈现一个完整的项目。这里面给大家补充一点,就是我们会发现很多模型它在更新的时候,其实更新的名字应该都叫什么?三三点五、四四点五这种更新的方式,对吧?它起码是个整数。当然这一次 呃谷歌 gem 三它更新的名字叫三点一 pro, 对 吧?那通过名字其实也能看出来,它其实就是一个呃小版本的迭代。像我们之前在用一些大模型去写一些工具,或者是去完成一些核心任务的话,宽泛的大需求大项目它是可以帮助我们进行完成的。 比如说写一个应用程序,你会明确明显的发现他写一个应用程序会很快,而且呢,呃一些核心的功能,核心的需求我们都可以完成,里面就会涉及到很多一些细微的小的点,就比如说交互上面点击按钮跳转不了了,或者说是一些文字会有一些错乱。 像我们看到很多的评测也是一样的,要求他去生成一个游戏,那个小鸟的动来动去的,你能看出来他是一个小鸟在这动来动去,但是他 不符合物理规律,并且里边的很多的元素啊,都是一些歪七扭八错乱,这种效果相当于是呃影响到我们的一些使用和体验的上面,所以这一次三点一的更新相帮助我们去补全了最后的那一个模块,就是帮助用户去提升一部体 验的内容。这一次更新的话在他的明确的文档,谷歌的技术文档报告里面有写清楚,所以也推荐大家可以去看一看,这他就是一段一段指定差就完成了,这就是这些是 旗舰版三点一的 pro 的 一个强大了,还就是我现在做的这个东西,然后我这个东西我做完之后呢,我就跟我的老板还有我的总监去讲, 他们觉得这个东西很有价值。 ok, 这个视频差不多到这也结束了,最后呢再给各位同学做一个简单的复盘,就是我们通过目前的旗舰版三点一 pro 这个模型,加上 web 定的方式,在三个小时之内我们就可以快速的去制作好自己的一个企业级鱼情分析的一个 ai 系统。那么这个系统的话, 我们制作完成需要前期的,首先就是人为的进行测试,大概率整个流程下来也就是四个小时左右的时间,测试完成好以后,我们就可以把这个工具接入到现在的 openclaw 里边, 进入到我们的数字员工里边,后期的无限次进行复用,每天我们都可以进行鱼情的分析和监控。那么这个整个的一个流程下来,其实目前不需要耗费太多的人力物力和成本。好,那么这期视频就到这,希望对于你有了一些帮助。 ok, 那 我们下期视频再见。拜拜。

谷歌果然藏了一手,就在昨晚,谷歌毫无征兆发布了 gemini 三点一 pro, 相比 gemini 三 pro, 各项基础测试指标都提升了一个档次,推理性能更是提高了两倍以上。另外 svg 动画对比 gemini 三 pro 的 纸片, svg 审美优化的更加美观。 当然还有 gemini 三爆火的三 d 交互模拟,进化也非常大,如今可以更精准追踪手势,做出相应的交互动作。 谷歌 ai 的 进化速度未免也太快了,距离 jamming 三 pro 发布才三个月,马上就能推出更强更先进的模型, ai 的 战斗一刻也不停歇。关注茶官 ai, 学习不迷路!

嘿,大家好,今天咱们来聊个大事,那就是谷歌最新的人工智能模型 gemini 三点一 pro。 注意哦,这可不只是一次小小的更新,它很可能标志着 ai 在 思考这件事上往前迈了一大步。 在咱们深挖之前,我想请大家先想一个问题,知道一个事实和真正的推理到底有什么不一样。 你看,一个系统可以记住全世界所有的知识,但这就代表它能像我们一样思考去解决一个它从来没见过的新问题吗? 没错,这个问题啊,可以说是现在整个人工智能领域最核心的挑战了。不过呢, google 好 像带着它们最新的答案来了,所以今天咱们就是要好好看看这个 gemine 三点一 pro, 它到底是怎么在 ai 的 推理之路上迈出这关键一步的。 好,那咱们就来看看这个新来的 gemini 到底有什么不一样。首先得明确一点,这可不是又一次简单的升级迭代,谷歌自己也说了,这次是直击模型最核心的智能。 简单来说呢, gemini 三点一 pro 它是在三系列的基础上开发的,但重点是这次升级直接动了核心智能,就是说让它变得更会思考了。目标嘛,就是要搞定那些特别复杂,没有标准答案的任务。 而且啊,这次发布是全面铺开的,不管你是普通用户还是开发者,都能摸得着。好了,现在到了最关键的部分了,这个所谓的推理能力的飞跃究竟是啥意思?更智能这三个字到底体现在哪呢? 咱们可以这么理解,如果说之前的 gemini 三 pro 已经是一个很强的基础选手了,那三点一 pro 就是 在他的基础上,对核心的推理能力来了一次彻头彻尾的大升级。所以关键的区别不在于他知道的更多,而在于他能想的更明白。 来看这个数字,百分之七十七点一就这么个数字,它可能看起来普普通通,但它背后的分量可真的不一般。 这个分数是哪儿来的呢?来自一个叫 a r c a g i two 的 精准测试。这个测试特别有意思,他不考 ai, 记住了多少东西,而是给他看一些他从来没见过的逻辑题,看他能不能当场解出来。 这就好比不是考你背了多少公式,而是直接让你现场做一道你没见过的难题。所以关键来了,拿到这个分数,意味着新模型的推理性能是上一代的 两倍还多。对,你没听错,是两倍多。在 ai 这个领域,这种进步速度简直就是飞跃了。那光说不练假把式,这么强的推理能力,到底能干点啥呢?咱们来看几个实际的例子,看看它怎么从写代码变成了搞创作。 先看第一个代码动画,现在呀,你只要用嘴说,用文字描述一下你想要个什么样的动画,三点一 pro 就 能直接给你生成一个 svg 动画,可以直接用在网站上。 这种格式的好处是啥呢?它是纯代码画出来的,所以不管你怎么放大都超级清晰,而且文件还特别小,效率简直拉满了。 再来看个更牛的系统综合,他居然能搭一个实时的航天仪表盘出来。你想想这个过程, 他得先听懂你的需求,然后自己去找公开的数据流,再把这些数据处理好,最后用可视化的方式给你展示出来,让你可以实时看到国际空间站的轨道,这个整合信息的能力太强了。还有这个交互设计, 设想一下模型不光是能写出那种很复杂的三 d 鸟鸟群飞的动画代码,更厉害的是它还能让你通过手势追踪,直接去控制这群鸟往哪飞。这对设计师来说简直就是打开了新世界的大门呐! 这个例子我个人最喜欢叫创意编码,有人让他给书小说呼啸山庄设计一个现代风格的个人网站, 你看他怎么做的?他没有呆呆的去总结书里讲了什么,而是去感受和推理这本书整体的那种压抑又狂热的氛围,然后基于这种感觉,设计出一个能抓住主角精气神的现代界面。哇!从理解抽象的艺术概念到做出具体的创意设计,这一步太关键了。 说了这么多好东西,大家肯定想问了,我怎么才能用上呢?别急,咱们马上就说,看看不同的人群怎么接入这个新的模型,这张表就很清楚了,如果你是开发者,那好办,通过 jamen、 api、 ai studio 这些平台,现在就能用到预览版。 企业用户呢,也有 vertex ai 和 gemini enterprise 可以 用,那咱们普通消费者呢?如果你订阅了 google ai pro 或者 ultra 计划,恭喜你现在打开 gemini 应用或者 nobel lm, 就 能直接体验到三点一 pro 的 威力了。 最后啊,咱们来聊聊未来,谷歌这次为什么只放了个预览版出来,这背后又藏着什么大计划呢? 官方的说法是发布预览版是为了测试这些新功能,也是为了听听大家的反馈,说白了就是先拿出来给大家用用看,一边收集意见,一边把它打磨的更好,为后面更大规模的正式发布做准备。 这就引出了一个非常重要的概念,叫代理式工作流。这个词听起来有点复杂,其实说白了就是希望 ai 能像一个超级智能的助理, 你给他一个大目标,比如帮我策划一场线下活动,他就能自己去一步一步的规划、联系、执行,把所有事情都搞定。而 gemini 三点一 pro 这么强的推理能力,就是实现这个宏伟目标最重要的一块拼图。 所以你看,咱们绕了一圈,又回到了最初的那个问题,当 ai 真的 学会了思考,而不只是记忆,我们下一步会放手让它去做什么复杂的任务呢?是让它帮我们搞科学研究,还是规划整整城市的交通,甚至是进行艺术创造? 这个问题的答案可能比我们想象的还要快地来到我们面前。好了,今天就聊到这里,感谢大家。

谷歌刚刚放出了他们目前最强性能最好的 ai 模型杰莫尼三点一 pro, 这不仅是一次常规升级,而是一次全方位的实力碾压。今天这期视频我就带大家硬核实测它的真实表现,看看它能整出什么花活,以及它在精准测试中到底有多变态。 废话不多说,我们直接开始。首先测测他的三 d 和空间理解能力。我上传了一张平面的宝塔照片,他不仅直接写出了精美的三 d 动画代码,而且细节还原度暴打目前市面上其他顶流模型。 以为这就完了,我让他给我手搓了一个可以自己画音符的钢琴卷帘窗界面,然后让他生成一段大师级绝唱的三十二小节钢琴曲,结果不仅毫无违和感,和声还极其专业。 接下来是本期视频最让我震撼的多模态实测,我给他发了一段关于日本地震科普的视频, 注意,我的提示词里没提日本,也没提地震,完全依靠他自己看视频理解。结果他直接给我写出了一个完整的网页 app, 点一下地图,不仅能模拟地震波纹,还能根据你设置的政绩自动计算对周边大城市的影响, 这理解和执行力绝了。实测这么猛,跑分怎么样?规格上,它支持惊人的一百万 tock 上下文,塞进七十万个单词或者一小时的视频,轻轻松松。 榜单方面,他在测试智商和涌现学习能力的 a、 r c、 agi 二测试中直接断层领先 opps、 五点六等一众大满贯选手。他还能在不联网的情况下拿下高难度人类最后考试的最高分, 而且幻觉率极低,也就是很少一本正经的胡说八道。不过有意思的是,在另一个比较玄学的 l m irina 盲测榜单里,它的代码和文本得分却意外低于 g p t。 五点二,看来在特定语境下,它还是有些水土不服的。 总结一下, jammer 三点一 pro 毫无疑问是当下最全能、最具性价比的顶尖 ai 模型之一,无论是做三 d 动画、写小游戏,还是跨模态的视频转代码,它都展现出了极高的完成度。 目前你已经可以在 jamming 网页端或者 ai studio 里玩到它了。大家觉得这次谷歌的绝杀能打几分?欢迎在弹幕和评论区告诉我,这里是赛博前少带你追踪最前沿的 ai 科技,我们下期视频见!

今天终于不用被 c dance 二点零新闻刷屏了,没错,虽说字节跳动即将发布的视频模型一直在霸占各大新闻头条,但世界并没有因此停止转动。 所以今天我们聊点跟 dance 无关的内容,就是 google 的 几项重磅发布,包括 gemini 三点一、 larry 三,也就是那个音乐生成模型,还有一个叫 photoshop 的 新工具。 我知道大家一听到这儿肯定都竖起了耳朵,期待我会说出 vo 四这个名字。那个还没来,不过也许有个大字日期了,也许吧。视频方面, magic 推出了大家期待已久的功能,创意视频放大。 而在图像领域,我们得以 equiminy v 八的真容,还有大量关于这一新模型的情报。所以今天脱下舞鞋好好放松一下, 毕竟这是大家应得的享受。首先, google 最近可谓动作频频,其实就在我刚开始录这期视频的时候,他们发布了 gemini 三点一 pro, 这次发布仅呈上周 gemini 三的 deep scene。 更新之后,据官方介绍,新版本在核心推理能力上更进一步,更智能, 解决复杂问题的基础能力也更强了。那么来看看跑分数据,你也知道我并不是什么跑分党,但既然聊到大圆模型嘛,看跑分也算是规定动作了,他们显然在高调展示七七点一分的 r k g i 二成绩,如果你还不了解的话,这是抽象与推理语料库第二版, 主要测试模型的流体智力,也就是他学习新技能并仅凭少量视力及时掌握新规则的能力。为了让大家对百分之七十七点一有个直观的概念,人类测试者的平均得分大约在百分之六十六之间, 尤其是在面对这类从未见过的谜题时,所以七七点一分显然更高。看来这部分测试我算是通过了。显然,三点一已经超越了人类的平均水平,也就是在这类抽象推理上的表现。 至于那个名字起得最深得我心的测试,人类最后的艺考杰米三点一 pro 裸测得分百分之四十四点四,配合搜索和代码工具则达到了百分之五十一点四。 相比 gemini 三 pro, 这绝对是质的飞跃。有趣的是,这几乎形成了镜像对比跟 cloudops 的 百分之四十和百分之五十三。 说到底,在面对人类最后的艺考时,你们知道该怪谁吗?聪明人,你们这些聪明人得加把劲,多生些聪明的后代了。你们这些聪明宝宝最好也能提点更有水平的问题。 没错,关于全球最强模型这座摩天轮,我们现在转到了这个位置。如果你想试用 gemini, 它还是走那种典型的 gemini 发布套路,已经在 gemini app 上线了 pro 和 ultra, 订阅,用户的使用额度更高。所以说,我得承认, gemini 经常满嘴跑火车, 或者对自己的版本号含糊其词。话虽这么说,你也可以去 ais 里经常满嘴跑火车,选一下就行,你只需要把它切换到 gemini 三点一 pro preview 我确实上手简单,试了试用我的惯用测试手段,写个复刻版的导弹司令部,结果它完成的相当不错,整个过程只用了寥寥几个提示词,表现确实很好。这游戏其实是有声音的,但我把它静音了,毕竟你们现在应该不想听那种八十年代的阶级音效。说明一下,这并不是靠单样本提示一次生成的。 其实在构建的过程中,他还会主动给出建议,比如问我要不要加点音效,或者在游戏中加入强化道具。而且他是边构建边提出建议的,感觉就像他在仔细琢磨我的提示词,然后顺便提醒我说,你这里可能需要点音效,或者想让游戏更具挑战性一点, 肯定会有更多有趣的玩法在接下来的几天涌现。这只是我刚才随手试的一条指令。我说 根据这个频道链接帮我做一个互动网站,结果它生成了。这个我觉得很有意思的一点是,它甚至还提供了一个提示词构建工具,这点确实非常有意思。接下来看看音乐方面, leary 啊也迎来了更新,这是酷狗推出的音乐生成工具,它目前只能生成三十秒长的片段, 我觉得之后应该会支持更长的生成时间和续写功能。但就目前而言,这里面确实有不少值得关注的亮点。这主要归功于 gemini 三的多模态能力, 包括能让你通过图片来进行创作。据我所知,还没有其他音乐生成器具备这功能,生成过程直接在 gemini 里完成。 当然,这里有一些预设的流派,你可以直接用,或者也可以自己写提示词。咱们试个提示词,身穿蓝色西装的男子横穿马路,试图躲避想给他开罚单的警察。看这几个选项听起来确实挺适合当健声音乐的,咱们来试一下,看看效果如何。 觉得有点无厘头?确实有点,但也有点九十年代末千禧年初那种神曲的感觉,也就是那种三十多秒的生成片段。我觉得它的定位并不是那种专业的全功能的 ai 音频制作工具,而是一个能让人轻松有趣地探索 ai 音乐生成的途径。 其实这种多模态的尝试还挺有意思的,我上传了喷火女孩的原图,只输入了根据此图生成歌曲的指令,没加别的,来看看它的生成结果。 准备好撕裂一切,看我点燃熊熊烈火。唯一的渴望唯一的渴望。我是说我个人觉得 我不会选用八十年代风格的 pet bennett 摇滚金曲作为喷火女孩的主题曲,但这显然表明 levi 确实看懂了这张图, 他能理解图中的角色是谁,并据此生成了相应的歌曲。我觉得很有意思的一点是每次生成的片段, 而不会到了三十秒就突然断掉。这点确实挺有意思。 所以我也会持续关注 lyra, 感觉它后续还会有更多惊喜。而且说实话,我最近一直手痒,想搞点音乐,毕竟那些吉他在墙上已经挂太久了。 tony 也有一个相当有趣的更新,这是属于 google labs 的 项目, 我想这可能主要是针对观看本频道的品牌和营销从业者。不过我觉得一旦你看到它的效果,大概也能想到很多其他非常有趣的用途。 这是一个叫 photo shoot 的 新功能,顾名思义,它显然是用来生成产品。摄影大片的生成效果真的很棒。我随手找了张拍的很烂的 usb 极限器,照片刚好就在我桌上,就是这张。没错,拍的确实挺烂的,但我们就用这张来上传, 接着就能看到这些拍摄模板,你可以对它们进行修改,还有很多其他选项,我们先用默认的就好, 比例就选九点十六分试试看吧,这样更有卖相。点击生成 w, 随后生成了这四张图。说实话,我得承认效果真的挺棒,毕竟我给他的底图其实就是张随手拍的废片,确实挺让人惊艳的。所以你看,如果你手头有想处理掉的东西,比如一直堆在地下室,想在二手平台上卖掉的, 只要随便拍张烂照片上传到这里就行了。接下来配合潘美丽工具,你可以直接用那四张图片,基本上就能直接生成一整套广告方案了。 我刚才给他传了一张全球最强 usb 扩展物的照片,来看看他最后给出的效果。瞧出来了,也就一分钟左右的时间,我就做出了一套全能枢纽无限可能的广告。你知道这种技术以后会在哪大显身手吗?比如在亚马逊,在那我们能看到很多类似的功能应用,请问有点意思,其实你在这里也可以给素材制作动画,所以这基本上就是免费版的 nano banana pro, 估计还有 vo 三。说到这,我知道最近有很多人都在问 vo 四到底什么时候出, 不过要先声明一下,我这儿并没有任何内部消息。虽然我一直都坚持认为这会在 google s o 大 会上发布,官方也已经官宣日期是 五月十九号,毕竟 i c o 可是 google 的 年度重头戏,所有真正的重磅消息通常都会在那儿发布,所以我猜到时候就能见到 v o 四了。单从时机和日期来看, 这都最合情合理,再加上你也知道,毕竟这是个展示实力的大舞台。所以再次声明,我并没有什么内部消息。我呀,五月十九日,言归正传, magnificent 推出了大家期待已久的视频放大功能。如果你关注 ai 圈子有一段时间了,你肯定知道 magnificent 是 最早的一批,即使不是首创,也是创意图像放大工具。而且显而易见的是,视频放大功能呼声很高,上线第一天起就在期待,现在它终于正式上线了。确切地说, magnificent 和 freeplay 现在都支持这一功能了。 我们这就来把这两个都看一看。 magnificent 的 老用户对这个布局应该不会陌生,很明显,这里是文件上传区。放大模式主要有两种风格,自然或生动。 还有一个创意程度调节滑块分辨率,支持一 k、 二 k 以及四 k。 还有一个高质量开关,开启后处理时间会变长,但最终的画质表现会更出色。 还有 fps 提升功能,我想它能让视频帧率直接翻倍。至于 turbo 模式,则可以大幅提升处理速度。我还不清楚 如果同时开启高质量模式和加速模式,效果会变成怎样。这里有锐化滑块和智能颗粒滑块。不过我想提醒一下,就像调整其他参数一样,很多时候适度才是最好的。比如把我们之前生成的这段 cds 视频,再用 magnifik 放大增强工具处理一下,效果非常明显, 我想你们应该能看出来。我也拿不准。很难说 youtube 的 压缩机制会产生什么影响?但帧率确实提升了。总的来说,它的确名副其实。感觉画面有点,至少我觉得对比度太强了。这是将创造力设为零,并上彩样到二 k 的 效果, 开启了高级质量和帧率提升。锐化设为零,颗密度也设为零。我觉得这个模型非常擅长处理 cgi 和动画风格。这是另一个 cds 生成的结果,不过随着画面推进,它确实能修复并清理掉大量的瑕疵。不过我想说的是,效果确实非常出色, 但它偶尔也会产生一些诡异的细节。正如你所知,这是这类 ai 放大工具的通病。这也是需要稍加留意的地方,因为它偶尔会生成一些奇怪甚至有些莫名其妙的效果。比如这里 我们可以看到这朵云,或者说这里的这道烟柱。 magnificent 看到后心想,哦,这是个踩着悬浮滑板的人。 不过说句公道话,只要人在画面里,它就能一直维持这个滑板人形象。这点倒还算过关。 他还会搞些骚操作,比如在没脸的地方硬塞张脸,比如在这个红色标志里, magic 却硬是觉得这里面有张脸。确实,我也知道这很离谱,挺诡异的,挺荒诞的,但我好这口,我也说不上来。这就像 ai 里常有的那些灵异瞬间, 我超爱看这些玩意儿。不过我得提醒一下,画面可能会出现反转,甚至某种程度的换脸现象。就像这里看到的,这是一个 c 部 cds。 我 懂了,这是 magnificent java 生成的片段展示威尔史密斯大战意大利面怪,挺有意思的,你能看到它对这只意大利面怪的处理效果非常棒, 我是说画面优化得非常非常干净,所以说威尔史密斯的脸确实有点像被换脸了一样。 当然,这个片段的画面变化很快,以至于我不确定大家是否真的注意到了,但这确实是个值得注意的问题。不过我觉得他在处理 c g 角色方面表现得尤为出色。这其实只是巫书四预告片里的一张截图,你是指这些经过视频压缩的素材,截图后又再次导入, 所以画质看起来满是噪点,非常糊。但它在修复这类画质问题上效果拔群,特别是你基本没看到犀利的脸部有任何走样。至于这一张,我直接把创意度拉到了百分之四十六。 也就是说,即便你把参数调得很夸张,最后生成的效果依然相当不错。我还想在 free pick 上也尝试一下。这里的逻辑稍微有点绕,因为它把功能分成了几个不同的预设 动画、三 d 写实艺术和自定义。首先用三 d 动画模式来试一下,看看效果如何。如果你想要所有那些进阶选项及我们在 magic 看到的那些,你需要点击下方的这个自定义按钮,这样就能解锁和 magic 完全一样的配置了。 所以这里有两个不同的入口,都可以进行操作。这里有个挺有意思的玩法,就是拿我拍的这段视频来做演示。这段视频其实是在 wallabs 里录制的,就是那个三 d 世界模型工具。 我们前阵子刚聊过,他顺便提一下,他们刚拿到了十亿美元的融资,整整十亿美金,简直太惊人了!把这段视频放进 magick 进行放大处理,我是说出来的放大效果确实非常出色。 我最喜欢用 marble 的 一点是将其作为虚拟背景进去截几张不同角度的图, 然后导入到 nano banana 里,把角色放进去,效果非常不错。既然 cds 二可能下周发布,而输出分辨率只有七二零 p, 你 肯定会想要个画质放大工具,或者手头备个创意放大工具,所以很值得收藏一下。 接下来, midori 的 v 八版本也快发布了,我们现在可以抢先预览一下,还有一些令人惊喜的消息。 值得注意的是,我们现在看到的是 v 八模型的早期评分测试。正如官方所说,这些图意在表现的平淡无奇、中规中矩、不带主观风格,并不能完全代表 v 八的最终水平。但如果你是 me journey 的 老用户了,你会发现它们在重大版本发布前总会来这么一手, 目的是根据社区的反馈来微调模型。不过这确实能让我们提前了解 v 八的发展方向, 比如文字生成能力。终于 midori 能够生成正确的文本了。虽然看起来我知道这谈不上是什么颠覆性的进步,但这确实是我们许多人期待已久的功能。此外,说实话, v 八还会带来常规升级、更好的提示词理解、连贯性及构图能力,毕竟每次新模型发布时,这些都是老生常谈了, 而且据说这个版本的运行速度会非常快。我非常期待 v 八最终成型后的样子。 再次强调,目前的状况并不能完全反映模型的最终表现,但根据我和 midori 内部员工的交流来看,他们其实是在表达比起 v 七对 v 八的期待值要高得多,远远超过了当初发布 v 七时的热度。 不可否认, v 七发布时的表现确实有点差强人意,显然连他们自己也多多少少承认了这一点。看来我们很快就能见到全新的编辑器了,我猜测它可能会更符合现代化的 nano banner 图像编辑风格,并且能提供更强大、更可靠的图像参考功能。 除此之外,据说我们还会迎来一个全新的深层界面。他们还提到今年年内将推出全新的 v 二视频模型,而且该模型的规模将远超之前的 v 一 版本。显然他们现在手里掌握着充足的算力资源,所以这绝对是一个值得重点关注的视频模型。 mid journey v 八最快下周发布,但别忘了延期惯例,毕竟他们发布东西向来有自己的节奏,不按常理出牌。说到时间,我今天的节目时间也差不多到了, 接下来我会再去四处搜罗一下,看看还有没有其他值得关注的新鲜事。那么除此之外,其实就是做下准备,为下周一大波 c dance 的 内容。至少我是这么认为的,我觉得这事肯定准。虽然官方还没公布确切日期,但我估计应该是。那么在那之前,感谢大家的收看,我是 tim, 我 们下期再见。

还在被论文卡住,寒假后就要交稿的小伙伴们,一定一定一定要去试一下谷歌昨夜凌晨最新发布的君美莱三点一 pro 大 模型,然后一定要去试一下它这个 deep 设计功能啊!它可以让你在几分钟之内就学会原来至少要二十几天才能学会的东西啊! 而且有一个非常重要的一点,他生成内容的 ai 率竟然只有七点三九,就意味着这个东西可以直接拿去使用啊!今天我让他帮我写了一个生物医药领域的中数,他在十几分钟内就搞定了我之前至少要二十多天才能搞定的工作。 而且我还让我的薄厚师姐替我检查了一遍他整篇文章内容都是真实可靠的,而且更关键的是,他引用的文献都是真实可靠的,跟那些国产 ai 完全不是一回事。 之后我又来到这个网站检测它生成内容的 ai 率,非常惊喜啊,它生成的 ai 率竟然只有百分之七点三九,就意味着这个内容可以完全拿去直接使用啊!今天我还发现了一个快速获得 gmail 会员的方法,就是来到这个网址, ai 六六点 o r g, 然后进店选择,然后这里面有各种 gmail 会员套装,然后有需要的请自己,然后一定要去试试这个最新的 gmail 三点一 pro 大 模型啊!

终于来了,杰米妮三点一 pro 今天正式发布,说实话,我期待这一刻已经很久了, google 最近的日子确实不太好过,有段时间给人的感觉是,每当他们刚发布新产品 open ai for entropic, 紧接着两周后就会甩出更强的东西,然后大家转头就把 google 给忘了,这就是过去一年来的常态。但这次给我的感觉完全不同。我这话绝不是随口说说, 我研究了他们今天发布的所有资料,也看了演示视频,我觉得谷歌这次是真的重回巅峰,拿回了话语权。话不多说,我们直接切入正题。大家现在看到的是我让这两个模型分别开发的一款提速风格游戏,一个是谷歌最新的 jamming 三点一 pro 预览版,以及 entropix 推出的最新模型 cloud ops 四点六。 接下来我们来看看这两个模型的表现,对比一下他们的实际效果以及各自的优劣。老实说,这两个模型的表现都让我感到非常惊艳,因为我做体塑农场、体塑瀑布这类测试已经有一段时间了, 我发现深层的画面越来越清晰,互动性也越来越强,而且这些模型还增加了不少新功能。比如你看我一开始输入的指令是创建一个有动物的体塑农场,就生成了农场, 但我希望能跟这个场景进行互动,所以我就接着输入,帮我跟农场互动,或者做点什么操作。你看这些都是很随意的提示词,非常简单,这两个模型都能做到这一点。我们先来看看 jamini 的 表现,我把它全屏展示一下,大家一眼就能看出这个体速农场看起来非常精美且准确。 这边有一头牛,这里有几只鸡,还有几头猪,那个是什么?我看像是一堆干草。这儿还有绵羊,这是一个农场,大家仔细看动画效果和整体画面非常丝滑,没有任何卡顿或画面错误。 这边是谷仓,我可以点击作物进行种植或收割,也能点击动物收集产物。比如我要是点击这头牛,你会看到我的牛奶积分增加了,所以我再多点几下,每次挤奶这牛都跟疯了一样。 然后再点点鸡,收点鸡蛋。大家看这边,接着是绵羊,剪点羊毛,多来点,然后是猪, 猪给什么呢?松露,有点意思,我都不知道猪还能出松露,再看看还有什么,我能点这甘草吗?看来甘草点不了, 不过我可以把库存卖了,所以我把它卖了,进账四四十美元。这我没意见,这钱我收下了,而且还能种点作物。大家看,这一切都是模型生成的,我只是跟他说,嘿, 给我做一个体速农场,再整点能交互的东西,可以看到树正在长,现在能从这收点东西,还能种点东西什么的, 看看我拿到了什么是作物。那我现在可以把作物卖了,能重新再种吗?这能行吗?还真行,这样我就能卖作物了,虽然我已经种下了作物,我就无法再操作它了。这个设定挺好, 所以我可以使用资金了,而且能把它卖掉或者重新种植,这挺酷的。以上就是三点一生成的效果,现在来看看 cloud opus 四点六生成了什么。我们在新浏览器窗口里把它打开, 点击任意动物选中,然后喂食或者抚摸它们,或者收集产物换取金币。作物点击任意作物即可交互,给生长中的作物浇水。我们可以看出 opus 的 四点六 至少在目前在交互性上增加了很多元素。不过我们来看看地图做的怎么样。地图看起来相当不错,我没什么好抱怨的,但可以看到奶牛好像飘在半空, 绵羊也飘在半空,跟那个比,它确实加了不少动物。再来看看还能做些什么。我要是点一下这个金牛,我喜欢这种游戏化要素,像幸福度什么的, 你看幸福度在下降,如果我摸摸它,继续摸的话,数值就会长。要是喂它的话,我还能喂牛什么的,还能收集产物, 这点也挺不错的。加入了这么多新功能,我倒觉得挺好的,没什么可挑剔的。所以这两款模型,显然它们都各有优劣。我们正处于这样一个阶段,各大模型的能力都已经变得非常强悍,它们之间已经很难拉开差距了,但我对这两者的表现都很满意。 至于 ai 社区对此有什么反应,那是 ai 社区现在彻底炸锅了。讨论的焦点主要集中在它的推理得分上。在 ark agi 二基准测试中,这是由 francesco challet 设计的,专门作为模型无法作弊的基准,要么靠真本事推理,要么就别想拿高分。 此前顶级模型的分数一直卡在百分之五十以下,三点一 pro 达到了百分之七十七。尽管大家谈及 agi 时人很谨慎,但这种跨越式的提升确实不容忽视。 现在画面上是 jammy 三点一在网页端模拟生成的 windows 系统首先你可以观察到的是,这一版生成的效果看起来要专业得多,而且它对 windows 系统的还原度也更高。相比于我们见过的其他模型生成的版本,可以看到它能生成全新的桌面环境,还能创建非常相似的侧边栏, 就像 windows 的 原声。外观上面不仅有 teams 之类的应用程序,底部还有这些新功能区,可以调节亮度、音量等各种设置。由此可见,该模型的编程能力非常强悍。与我们过去看过的其他演示相比, 这次的演示清楚地证明了这一点。为了展示更多细节,我们来看看文件资源管理器。大家会发现,这模型不仅能生成这些组建, 而且看起来还挺逼真,跟真实的 windows 界面非常像。而且项目中还藏了一些小彩蛋,如果查看下载之类的文件夹,会发现有安装包、音乐应用和图片, 甚至还能更换壁纸。此外,还有一个照片应用,还能做些什么呢?还有个天气应用,定位设在印度加尔各答,这挺酷的,我们可以移动它或者展开查看。此外还有截图工具、控制面板, 里面的系统和安全图标我觉得跟 windows 很 像,其实我平时用的是 mac, 所以 也不太确定。接着是设置,可以在这儿进行全方位的个性化调整,我们可以自定义背景,还能切换深浅色模式,这点很棒。 因为这一功能我在其他模型中还没见过,至少没达到这种水准,所以能看到这个真的很不错,看看还有什么?这里还有日历功能,跟 windows 相比,它看起来倒更像 macos 的 日历,不过我不介意这做的相当不错。然后是计算器, 再说是计算器又是满满 windows 风格,比起其他版本。好了,我们来看看具体数据。其实这值得一聊的内容远不止 google 博客里重点强调的那一项精准测试。先从最重磅的那个指标开始说起, 奥特 a g i 二只在测试模型能否处理全新的逻辑模式,即那些他从未见过且无法仅靠模式匹配就能蒙混过关的难题。他是目前最难的推理精准测试之一。而 jimmy 三点一 pro 拿到了百分之七十七点一的高分, 这 mini 三 pro 的 得分是百分之三十一点一,这是它们的上一代模型。所以这可不是一丁点的进步,相当于从通过率的三分之一跨越到了四分之三。作为参照, cloud opus 四点六的得分是百分之六十八点八,而 gpt 五点二则是百分之五十二点九。在这项基本测试中,三点一 pro 不 仅超越了自家的旧版本, 也明显甩开了其他竞争对手。有意思的是,在旧版的 ark a g i e 测试中,三点一 pro 拿下了百分之九十八的高分,这项测试目前已基本宣告功课。而在 science g p q a diamond 这一项,这是一项考察研究生水平科学知识的测试, 这类题目要求综合分析,跨越多个学科,而非单纯记忆事实。三点一 pro 拿到了百分之九十四点三的高分,再次领跑全场。 cloud opus 四点六的得分是百分之九十一点三, gpt 五点二则是百分之九十二点四。虽然差距不算悬殊,但谷歌依然稳坐第一。在编程能力方面,有两个精准测试值得关注。首先是 swbench verify, 该测试考察模型在真实 get up 仓库自主修复 bug 的 能力。 三点一 pro 得分百分之八十点六,与百分之八十点八的 cloud opus 四点六不相上下,这两款模型可谓是棋逢对手。 接着是 livecodebench, 它主要侧重于竞技编程,也就是考察算法以及高压环境下的解析能力。三点一 pro 的 e o。 分 数达到了两千八百八十七,相比之下, demo 三 pro 为两千四三九 g p t 五点二,仅为两千三百九十三。那么在纯代码能力方面,这次升级的提升非常显著。 而在监制任务中,也就是 apex agents 测试,这项测试很有意思,因为它衡量的是长程专业任务,而非单次问答,而是需要模型持续进行规划与执行的多步工作流。三点一 pro 为百分之二十三, office 四点六则为百分之二十九点八, 可见 google 在 该领域再次领跑,相比上一代 jamming, 这次的跨越非常惊人。还有衡量工具调用能力的 m c p atlus 精准测试,三点一 pro 得分为百分之六十九点二。此外,还有 browser com 一 项针对网页浏览与研究能力的精准测试,它的得分达到了百分之八十五点九。 不过坦白说,这并非全线胜出, cloud sonic 四点六及其扩展思考模式在长文本性能上与三点一 pro 持平,两者在 m r c l v 二中的得分均为百分之八十四点九, 实际上在专家任务评估中处于领先。采用了另一项 e i o 风格的精准,虽然在某些领域竞争对手依然能与之抗衡,但在顶层竞争中差距已非常微小。另外还有一点值得一提,它的定价与 germany 三 pro 维持不变,这意味着在性能大幅提升的同时, api 用户却无需支付额外费用。相比 antropica 的 opus 系列模型, google 的 单头肯成本也明显更低。但总的来说, google 在 十六项精准测试中取得了十三项领先。它没拿第一的那三项大多属于极端测试 或是竞争对手数据不全的类别,包含推理、科学、编程及智能体任务。这是迄今最强的一套。 google 发布的精准测试成绩足以媲美甚至超越 openai 和 antropica 的 顶级模型。 没错, google 强势回归了,至少目前如此。至于三点一 pro 在 日常使用中能否经受住来自 openai 和 astropik 竞品的考验,我们拭目以待。但从参数表现和演示效果来看,这是他们许久以来最让人眼前一亮的作品。我 会把博文链接放在简介里,如果你想亲自阅读,如果你是开发者, ai studio 可以 免费试用,值得用你自己的提示词跑跑看,体验一下手感。希望大家喜欢。本期视频,我们下期见。

呃,谷歌君美来这边发布了最新的一个模型,叫做君美三点一 pro, 他 是君美三 pro 的 这个升级版,那么我们呃别小看他这个只加了零点一啊, 那么他之前是三,然后现在三点一,别小看他加了零点一,但是他这个能力啊,是是相比之下提升了一个等级啊。然后我们也可以看到之前三呃生成的图片, 然后和三点一生成的图片,它细节啊是很到位,细节是呃能够浪漫的,那么它现在也可以将这个一些呃图表啊,然后数据表啊,转化成一个可视的一个呃交互的一个内容啊,那么像这样子,我们可以把自己数据导进去,然后它会生成一个这样的一个页面出来, 然后他呃也多了那个呃音乐的功能,制作音乐的功能,那么我们可以看到他现在的推理能力啊,然后呃又比这个绝美声破啊强了很多,然后也是再一次摇摇点心了。呃,我们还可以看到他这个 呃推理能力上这些复杂的这些细节的表现都是比之前多了很多,整体看就是他在处理这种复杂主题的可直观的方面。那么三点一的话比三 pose 呃增强了很多了,甚至可以直接啊一句话生成一个我的世界,那么能 在那个叉上面,人家也做了测试啊,然后的话我们现在嗯使用这个,嗯,君美三 pro 的 话,主要君美三点一 pro 在 最新版主要有 以下几个呃渠道啊,那么第一个我们就直接打开官网,打开官网之后我们的就右下角直接选就行了,他现在已经没有三 pro 了,直接替换成三点一 pro 了,现在都是用的是最新款的,那么我们官网用的话就需要一些工具什么的是比较麻烦, 然后的话我们,呃也可以用到我们这个国内这个气象站啊,那么打开这个网站之后啊,在国内所有网络,所有浏览器、手机、电脑、电视啊都可以访问这个页面, 不需要其他工具啊。我们进去之后直接点这个桌面来,然后再选择任意的一个通道,这些通道都可以用的,就选择任意一个点进去,然后就会来到一个跟这个官网一样,这是官网,那么这是我们的这个 就像这样的页面,它是完全一样的,一模一样的,没有任何区别的。然后,呃,我们也可以选择这里,哎,右下角这里选个 sample, 这样子就一样子可以体验到我们最新的这个 专门的这个三点一 pro 的 这个功能呢,那么它这个制作音乐这些啊,也都可以用它的做音乐,我们选择这个音乐这里就可以去制作了。然后其他的功能跟官网这是我们进项站,然后这是官网,它是完全同步的。然后最重要一点就是我们这进项站的这个, 嗯,额度是无限制额度的,你想用多少条都可以啊。官网它是有限制的,不管你开会员或者是免费版都是有限制次数的。那么我比如说我们这个,嗯, 他提示上线之后,我们可以点右上角回到手机这里,然后又可以来到我们这里面选其他一个另外一个没有上线的通道点进去继续使用, 那么这就是使用我们最新版这个专门的三点一破的方法,然后如果有小伙伴遇到其他问题,可以在评论区讨论一下。