粉丝686获赞10

昨天谷歌晚上发布了一堆东西, i o。 大 会,嗯,试了一下,那些什么 i t gravity 啊,然后 as do do 啊那些更新都恰巧仁义,那个欧尼的视频模型也不太行,但是它的那个世界模型 g 三更新了一个比较有意思的东西。 呃,这个先介绍一下甄姬三,他是一个谷歌发布的一个世界模型,你可以给他一张图片,然后或者他生成一张图片,你就可以走到那个图片的世界里,呃,然后去参观浏览跳跃,跟世界互动,然后他昨天更新了一个什么功能呢?你可以选择谷歌街景的任意一个地点 作为你的世界模型的起始地点,然后你就可以走到这个世界地点中去游览。比如说,比如我这里选择了美国的黄石公园,然后选择了黄石公园以后呢,他就会可以拖动这个小人,选择具具体的地点, 然后你选择差不多了呢,你就作为手针,把它作为手针,然后确认以后呢?呃,去以它为开始针深层世界,然后它还可以选择它是一个什么样的风格,比如说下雪呀, low poly 呀,然后呃,雨天呀这些,或者海底世界。 然后呢,你也可以基于这个风格再进行一次定义,比如说我可以选择什么辐射风格的,对吧?大灾变之后的, 嗯,这个能让你的代入感非常的强,尤其是比如说在一些城市里啊,可以去玩玩,目前只支持 ultra 的 会员可以玩。

这可能是目前来说去除 ai word 最全面,效果最好的一个提示词文档。首先我们可以看到它完整的一个目录,为什么 ai 写的东西一,演讲,关于人物构建的十大核心维度,完整的方法论框架,可附用的提示模板, 还有常见误区和避坑指南,还有一些禁忌的玩法。那我们首先可以看到啊, ai word 的 本质就是打破完美,注入瑕疵和情绪。 ai 输出的呢,永远都是正确的废话,语法完美,逻辑严谨,客观中立,这恰恰就是它机器味的原因。那么构建人味的十大核心维度有维度一,身份认同, 给 ai 一个真实的身份和经历。那么我们可以看到啊,每一个维度都有错误的写法和正确的写法的一个案例展示,包括可用的一个提示词模板。 这里面呢,你可以把自己真实的背景和精力放进去,让 ai 根据你的人设来创作为度。二呢,细节体感 ai 呢,收集了海量的语料数据,但是它没有嗅觉、触觉、味觉等等,我们要人为的增加五感进去,可以看一下真实的案例,解释 它的话,错误的一个写法是什么?正确的做法是什么?可用的提示词模板库是什么?包括下面维度三,保持偏见啊, 不追求主流的一个正确性。正确的废话呢,那毫无价值。我们要保持自己的一个看法,包括下面也有错误的说法和正确的说法,包括可用的贴纸模板。包括维度四,价值观维度,保持粗糙感,真实比完美更有力量,包括它的一些解释等等。 更多维度呢,我们就不一一看了,想要深度了解呢,可以自己看一下哦,我们看一下完整的方法论框架,四步去除 a f 的 流程。首先人设结构化,我是谁 段位的投问,告诉他向谁说口语词库的注入,告诉他怎么说,深度思考机制要告诉他先想再答。那么下面呢,来到大家比较期待的可附用的提示模板库, 第一个呢就是通用的去除 ai 的 模板,告诉他写作风格是什么,必须要做到语气是什么,加入哪些语气词。下面的话是一个自己的 ip 信息的一个模板,这里面的话让 ai 更了解你,或者输出的话更有你的味道,你的一个感觉,这里把自己的人设信息分多维度的投喂给他。 那么接下来呢,还有一个就是我们写文章的一个模板库,这个的话就是一个简短的提示词,让他再重新给你去除一下 ever, 这是一个基础版的,比如你告诉他你是谁,按照以下的要求去抷色。 下面的话有一个去除 av 的 提词词的一个智能体,这下面的话有我们自己做的一个智能体的一个如何做出来的一个思路,这个大家可以去看一看,这个非常实用啊,灵魂注入器反 av 的 提词词,这里面有很多规则限制,他的话刚开始会问你,我是你的专属去 av 的 替身,你想让我扮演谁?你看比如什么什么,把你要 改的一些没有灵魂的文案丢给我,我给你加点料。接下来呢就是八大误区指南,大家常会犯的一些错误,大家可以看一下误区和正确做法,还有一些高频的一些 ai word 的 一些黑词库,还有进阶的一些工具等等。如果大家想系统了解去除 ai word 的 话,这个九六零八的文档可以认真看一下,免费分享给你。

做投标的谁懂啊,每次都要在几十个文件夹里翻资质,明明库里已有几百份资质,还是会漏选选错。想用 ai 赋能,又怕它匹配不全不准确。 别纠结了, ai 投标零材料引用功能,解决你的烦恼。标书解析完成后,系统会自动从商务资料库中匹配符合本次招标要求的资质。 同时还支持人工从商务资料库中选择资质以及上传新资质。该流程能够辅助 ai 在 填写商务标识更加丰富准确,同时还能从技术资料库中选择技术标。编辑需要用到的技术方案、知识文档和图片。 也支持 ai 在 编辑技术方案时,根据文字内容生成图片,实现图文并茂。 ai 投标零帮你告别繁琐的资质整理,专注更有价值的事。

哈喽,大家好,我是在自己百度快手工作了十年的产品经理 cc, 我 为了不让自己每天刷太长时间的抖音,我给自己外部抠定了一个阶段的 app, 可以 给大家演示一下。比如说我现在刷抖音的时长超过我设置的时长之后,比如说一个小时,它就会自动锁住,可以看到这就是被锁住的状态。那锁住之后呢?抖音我就不能再刷了, 那如果我想解锁,我就必须进入到我的 app 里面去做任务来解锁。那这些任务一般有你可以去读读书,或者说去健身啊,或者说去冥想, 总之就是去做一些可以有利于我身心健康,或说有助于我成长的一些事情。那比如说我可以去选择读书,那选完这个任务之后,就要需要去证明我确实读书了,我需要拍一下我读书的一个过程, 或者可以录一下我读书的语音都可以。那可以看到如果我完成对应的任务之后,我就可以获取一些积分,那积分达到一定的额度之后,比如说我现在达到六百积分,那我就可以换取抖音的一个使用时长, 可以看到我用六百积分解锁了抖音一个小时的使用时长,解锁之后抖音就可以重新使用啦。 那这个产品就特别适用于明知道抖音会造成信息减放,但又控制不住自己使用的人。 那比如我,那我很清楚我每天要健身啊,学习才是有利于我身心健康和个人成长的。但是我还是忍不住每天去躺床上刷一两个小时抖音。那有了这个产品之后呢,它其实可以有效的帮我去戒断抖音好啦。嗯,今天就到这里,大家有好的想法欢迎一起交流。

ai 写完代码后,能不能自动检查,自动格式化,自动提醒你? cloud code 里有一个很实用的功能叫 hooks, 你 可以把 hooks 理解成固定触发器。 cloud code 准备调用工具,刚改完文件,等待你确认任务结束,这些节点都可以自动跑一段你提前写好的命令。 这件事最适合解决三个实际问题, d a i。 改完文件后自动检查。比如 cloud code 写完代码,自动运行格式化命令,或者自动跑一次测试,这样你不用每次都手动提醒它啊,改完记得检查一下。在配置里, 这类动作通常放在 post to use, 意思是工具用完之后再触发,最常见的匹配对象就是 edit right microsoft edit, 也就是改文件相关的操作。第二, ai 动手前先来一下,比如密钥,文件生产配置,这些文件不希望 ai 随便改, 可以把规则放在 pre to use。 cloud code 准备执行工具前,先刨你的检查脚本,命中风险就直接拦住。这类用法很适合小团队边界写成固定规则交给 herk, 每次执行比靠口头提醒更稳定。 第三, ai 等你操作时主动提醒。 cloud code 有 时会卡在权限确认输入,等待任务完成。这些节点给 notification 或 stop 配一个提醒命令,就能弹出系统通知或者播放提示音。 简单说, hooks 让 cloud code 从听你一句一句指挥成按固定工序自己收尾。 新手怎么开始?先从项目级配置做,不要一上来改全局规则。在项目里建 club yeah settings join 写入 hooks 配置一个 hook 通常包含三件事,触发事件匹配条件 要执行的命令。举个简化版 post use 匹配 edit or write 命令,写 npm test 或格式化脚本,这样 cloud code 每次改完文件就会自动跑一次。检查配置好之后,在 cloud code 里输入 hooks。 这个菜单 主要用来看当前加载了哪些 hock, 来自哪个配置文件,匹配什么工具,会执行什么命令,新增和修改还是要回到 settings 文件里处理。 这功能很好用,但有一个底线必须记住, who 会执行本地命令。所以看到别人项目里的 cloud settings override, 不要直接信,先看里面有没有删除文件,上传内容,联网请求读取隐私目录之类的命令。 我建议新手先配三类温和动作,改完文件后跑格式化,任务结束后谈通知,改敏感文件前做拦截,先让他帮你守流程,再慢慢加复杂自动化 这期的重点就一句话, hox 的 价值是把固定检查动作写进流程里,对普通用户来说,它最大的价值是减少反复。提醒你不用每次都说跑一下测试别改密,要做完叫我这些动作可以变成 club code 的 固定工序。

昨天,足易载入游戏史册,游戏引擎 unity 股价暴跌百分之二十四,创二零二二年以来单日最大跌幅。 gta 的 开发商 take two 也暴跌百分之十,原因就是 google 发布最新的 ai 模型 gni 三,它让做游戏变得像说话一样简单描述一个世界,它就时时生成一个你可以走进去, 在里面跑跳的互动世界。有人用它生成了塞尔达,有人几分钟生成了一个 gta。 资本市场恐慌的核心是,当创造世界的门槛崩塌,那么曾经垄断这个门槛的工具价值何在?这不是替代,而是一场彻底的重构。云梯体暴跌,不是因为 ai 今天就能做出元神,而是因为它的核心蓄势被动摇了。 云梯的估值建立在做游戏很难需要专业引擎这个共识上。而 jennie 三用一个生动的演示向所有人宣告,以后可能不需要这样了, 这就够了,资本看的永远是未来预期的折现。未来的游戏开发者不再需要写文案、写代码、画美术,一个好的创意就能做出一款好游戏,现在这些游戏公司可能都不会存在了。

一句话就可以生成一个 gta 式的开放式的游戏,你相信吗?啊?但不管你相不相信啊,这个就是谷歌昨天发布的 jimmy nike 三的最新功能 pro jimmy 三所呈现出的惊人效果。你可以分别描述你的场景和角色,然后就可以生成一个可以自由操控的可游玩开放世界, 比如说扮演一只小狗狗在村庄里面闲逛啊,或者说一只蚂蚁在树枝上探险。虽然我没有亲自尝试啊,因为它需要 out 版本的。看到每个月的一百二十五刀的价格就让我放弃了。但是在我查看了大量使用者的视频之后呢,我发现谷歌的这个 j 三确实比我之前尝试过一些类似的 ai 深城市开放世界要强上太多了。 这里首先要先科普一个概念,虽然我们看上去它好像是一个可以玩的游戏,但本质上它是根据我们的实时操作来实时渲染图像, 不是常规游戏开发那种先是通过三 d 建模,然后再根据程序代码控制模型播放动作来实现的。你可以理解,屏幕后面有一个画家在根据你的每一步操作,飞快地画出你下一步可能会得到的画面, 所以本质上它就是一个可以交互的 ai 视频。那之前我体验过一些类似的 ai 平台,会有比较强的幻觉和不稳定性,比如说你前面有个椅子,那你转个头,它回来变成桌子了这样,而且画面的分辨率和细节就更没法说了,那就和用监视器玩游戏似的。 但相比起呢, g m g 三首先做到了极强的一致性以及交互的真实性,比如说像这样的台球碰撞, 其次,它画面的表现更加稳定和清晰,基本上可以媲美一些当前的三 a 游戏了。当然,虽然看上去已经很酷了,也对游戏业产生了不小的冲击,直接导致 g t a 开发商二星缩水百分之十, uni t 暴跌的百分之二十一。 但目前这种 ai 完全生成的方式,其实还是无法直接作用于游戏开发之中的,因为首先它时长很短,只有六十秒钟。其次呢,游戏开发是需要大量的定制内容,比如说游戏中各种场景啊,模型啊, ui 以及特效,以及各种游戏系统,游戏玩法等等。 同时呢,需要对这些组成的游戏的元素有针对性的进行藕合调整和迭代。所以这些通过 ai 渲染的方式其实是无法实现的。那咱们就算你能够完全按照实时渲染的方式来做一个玩几个小时的游戏, 但这要消耗的 token 所花费的 money 估计也得是个天文数字了。所以说呢,目前 ai 开发游戏最常见的模式还是通过 ai 制作一些图像啊,模型啊,场景, ui, 甚至是动作,以及用 ai 来辅助写代码这种替代一部分开发工作的方式。 但未来这种完全 ai 线上的交互形式,到底能不能直接做游戏,其实也确实是可以期待一下。那大家你们觉得 ai 做游戏到底靠不靠谱?你未来会不会尝试呢?也可以在弹幕和评论区里面讨论一下。

我怎么感觉有了 ai 之后我变得更累了呢?嗯,现在是凌晨的一点半,我还在公司,然后这边靠的在帮我调研一个聚成智能的项目,然后我要去做一个仿真, 这边呢我的扣带丝在帮我进行一个爬虫的脚本的运行,然后我来把它放在这个我自己写的一个对 外国人开放,就是对接外国人到中国来旅游的这么一个网站,然后这里还有一个做 remotion, 用 remotion 和这个最近比较火的这个 hyperframes 做 ai 视频, ai 科普视频的这么一个一个项目正在进行跑,我刚刚出了结果,这里还有我的打印机,然后这边 在复现论文,然后这里呢又在做一些,也是在另一篇另一篇生物论文的复线上, 他现在正在处理,正在跑模拟,然后自己的网站也正在开始 更新,然后去处理这些 p r s, 就 跟他们合并或者是继续修改用 cloud 和 codex, 然后这个项目是有一个有真实用户的这么一个项目进行一个维护。 所以说感觉有了 ai 之后能做的事情多了,但是怎么感觉变累了呢?

前两天被邀约上了一个直播的演讲会,给他们做一种叫 speech craft 的 演讲。我的天呐, speech craft 它是一系列的演讲嘉宾的分享, 我们就是其中某一期的某一个环节,而我们这一次有点特别,就这个东西,你去讲我们怎么样去写出这本书的? ai 时代的职场演讲新策略。 这本书的作者一共有三位,以前的 speech 稿都是找一个嘉宾来讲,这次主办方就想,既然是三个人写的书,就让三个老师来讲。有些时候一个和尚有水喝,幸好呢,尹丹老师在美国去不来,所以我跟 taylor 老师在网上开了个会,终于把这件事情的流程给这样落定了下来 啊!后来终于这天就来了,这时候我刚好在外面走着路,手机信号有点问题,就怎么都没有进得了直播间。幸好跟我一起合作的 taylor 老师灵机一动,他说, 先讲半个小时,我再讲半个小时,这就妥妥的把我们俩商量的一起讲的事情直接变成了两个老师单独讲。然后我终于进去了,原来发现他们讲的是 english, i have no problem with english。 但是我没有准备要用英文讲,我以为就是讲讲我们写这本书的故事,哈哈哈, hahaha。 而另外一个老师要讲的是 ai 到底会不会取代我们人类的演讲,这是一个特别有趣的话题。 taylor s 老师还准备了 ppt, 还引用了现代非常实心的一些案例。 now when i say big fish, i don't have to tell my hand how wide my hand must be my hand knows of to help me to describe how big the fish is。 我 说,天呐,我的准备没人家那么好,怎么办?当然,我的能力就是再紧张的时候也让人感觉我很自。 于是我就开始用英文讲, we made a decision and we want to make a very good toastmasters。 也找到了一个比较好的地方,讲着大概三十秒钟。主持人也是老朋友,叫 derrick, 他 跟我说,周老师,你要不用中文吧,你用普通话吧。哎,周什么,你也讲中文呢?我说,我讲广东话,哈哈,都我我讲广东话啦, 大家就开始笑了,因为这俱乐部呢,是佛山的,他都会讲广东话啦。大家就开始笑了,因为这俱乐部呢,是佛山的,他都会讲广东话。他说,好好好, 哈哈哈,谋了,你让我讲普通话吧,然后接下去呢? siri 就 说,哪里让你用普通话,可能他了解我,普通话驾驭能力还是会强一些。于是呢,我就用普通话完成了这一场的演讲。没有特别的准备,但是我有一个方向要去讲,讲到后半段的时候,我突然就觉得为什么要这样讲? 其实在书里,我们和 a i 关系的时候,出这本书也是这样的。我,我们最开始就是把三位老师关于演讲的毕生经验都放进去了,牛逼 牛逼。结果没有想到,快写完了之后,出版社跟我们说,抱歉,现在可能出不了这书了,不优先, 我们不是自费的哈,是出版社花钱来买我们的版权的,所以我们赚的也很少,基本上是出版社在当生意做,而我们只是他的雇佣小弟。但是你要这样出的话,你必须挺硬核呀,所以我们当时都蒙了,都写了那么久了,那就不能出版吗?要重新联系出版商吗?后来才知道原因是 ai 出现了, 说这些知识跟 ai 相关的会不会过时,会不会淘汰呀?你们能不能跟 ai 沾点边呢?刚好 ai 出来,我们都很时尚很潮流嘛,主要是我们的男老师,当时他们刚去了美 国,有个特点就是挺有时间的,所以他研究了很多跟嵌 gpt 之间怎么对话,怎么样帮他磨课程,磨稿子,帮他写演讲,学会了这一套,太好了。你知道吗?我们把我们以前知识体系里面的所有的方方面面都用 ai 重新做了一遍,然后去尝试用 ai 帮我们提升效率, 但是不让 ai 替代我们。就这样我们又花多了一年的时间重新写这本书,而且中间的每一个用词 ai 都优化过。以前要是我在翻译 julie carter, the comedy bible, 我 也用 ai 帮我优化一些,可能有一些用词会更加的接地气,更加精准。我也知道,我这个人说话吧,有的时候用词不那么平实, 总会用一些那种七零八拐的词,哈哈哈,所以这一次我们就形成了这本书。而到那一天,我发现我自己讲着讲着,我也就明白了我们跟 ai 那 个关系。最开始的时候是兴奋,用着用着开始害怕,害怕着害怕着就开始过度依赖,到了最后才有勇气 等 ai 说拜拜,才知道它这个边界在哪。最后我发现演讲也是这么回事。最开始我们演讲嘛,真的好辛苦,写稿子,然后有了 ai 之后,哎,这写的挺快的,但是写着写着发现 ai 写出来的东西啊,我们也不是那么说话的呀,特别那个 deepsea, 最后 ai 帮了我们之后,我们还得自己去调一遍,还是得调回一个人的那种语 言。其实 ai 是 我们的助理,但不能代替我们做决策,所以这个时候吧,我们就开始慢慢学会了用 ai 帮我们做演讲。 到了最后的最后,我们真的在演讲的时候突然就不依靠 ai 了,因为很多最好的演讲,原来它是即兴出来的,所以那一天的工作坊我也就半即兴的完成了三十分钟,太爽了。最后 是我发言的高光时刻,我们到底在在学什么?我们到底在在讲什么?是 technique 吗?是 skill 吗?是,是 format 吗?都不是啊。如果你要真正要掌握到是你爱演讲,你就会兴奋。你听到人演讲, 你看到他的眼神在放光的时候,你觉得他这一生没白活,他的,他的生命在闪耀。哇,就是这样一个东西 啊。所以不是哪个对还是错,不是谁得奖,谁没得奖,而是大家共同创造了一台戏,在彰显我们生命最高光的时刻。我觉得如果我们能够这样去看待演讲,呃 呃,叫此生无悔吧。我觉得真正的人性是什么?真正的人性其实就是把人的灵魂价值更加的看重,而不是把人更加的工具化。当 ai 已经来挑战人类了,你可以问问自己,我,我意识到我自己 是一个有灵的活人吗?如果我意识到了我的生命才刚刚开始,如果我迷失了,那你来找我聊聊吧。

各位变天了,公告发的这个珍妮三,让我第一次觉得咱们手里的 solo 瞬间不香了。为什么?因为视频只能看,而这东西能进。简单说,他把你的一句话,一张草图,直接算成了一个有物理碰撞、能跑能跳的游戏世界。你看这只兔子,它会左右摇晃,会立定跳远,踩到水会有连衣。 这不是只有画面的视频,这是只有上帝才能写的物理法则。你要做的仅仅是按下键盘上的 w a s d, 那 这东西对你有啥用啊? 我总结了三点,很实在。第一,设计师的神器,不用学建模,画张草图,甲方直接就能进去逛一圈,比看图直观一万倍。 第二,带娃的魔法,孩子画了怪兽,你把它变成活的,让它自己操作,这哪怕是给孩子吹牛,都是顶级素材。第三,成年人的发泄污,心情不好, 生成一个可以随便破坏的房间,进去砸个稀巴烂。在这个世界,你是规则的主。我们总说要摆脱打工人心态,什么是打工人心态?就是被动执行, 而基尼给你的是主动权。从今天起,不管是做梦还是做方案,别光想把它造出来进去玩,这可能是我们这代人离造物主最近的一次。我是设计师妍妍,关注我,带你用 ai 创造属于自己的世界!

谷歌又放大招了!这是谷歌新上线的 project genie, 之前还只生成代码,生成图片、生成视频,现在甚至可以生成三 d 的 游戏了。输入指令就可以创建一个游戏世界。在这个游戏世界,可以动态地加载你前进所遇到的一些场景。 把一张图片喂到 project genie, 它就能够生成对应的游戏, 甚至自己的宠物给他拍张照片,它也能够生成你操纵这个你的宠物,探索这个世界的游戏。 你还可以把一个人的肖像对应的照片放到 ai 中,生成对应的三 d 视频。三 d 游戏, ai 的 手珠也还是伸向了游戏。我是不是拉 chris 关注我,带你了解更多有意思的推理项目和工具。

你以为像 cds 二点零那样,只要输入一句话就能生成物理规律严密、光影无懈可击的高清大片,就已经摸到视频生成大模型的终局了吗?不, cds 二点零的画面哪怕再逼真,它生成的依然是一个死的视频,你只能坐在屏幕前当一个被动的看客,视频播完就结束了。 但是谷歌 deepmind 团队丢出的不再是视频,而是一个直接受你操控、实时渲染的物理世界。 今天我们就来硬核扒一扒这背后到底藏着怎样让人头皮发麻的算法黑科技!它不仅是一场视觉革命,更是人类通往通用人工智能的一把终极钥匙。 传统的互动环境或者游戏是怎么做出来的?背后是庞大的规则代码。程序员需要用物理引擎来定义重力,用极其复杂的坐标系来设定碰撞体积,还需要预先写好指令告诉电脑当用户输入某个特定信号时,系统要调用哪一个动画动作。但珍妮根本不屑于走这条老路, 他是一套完全端到端的神经网络大模型,他的逻辑是直接从像素到像素的降维打击。那么,他到底是怎么在没有任何代码规则输入的情况下,学会创造物理世界的呢? 这就要聊到这里最核心的技术底座,无监督的潜在动作空间。学习 deepmind 的 科学家们收集了全网足足三万个小时的未标注视频,直接喂给了这个拥有上百亿参数的庞大网络。 请注意,这三万个小时的数据里,没有任何动作标签,没有任何手柄指令的数据集,它只有纯粹的画面。这就相当于把一个神童关在小黑屋里,不给他任何武功秘籍,只让他看别人比武。 jennie 首先做了一件事,叫做视频 token 化。 他把这海量的视频画面像大型语言模型处理文本词汇一样,压缩成了离散的视觉 token。 紧接着,最不可思议的魔法出现了。 jennie 的 内部架构中包含了一个极其强大的时空 transformer 模型。 这个模型在逐帧观察视频流的时候发现了一个规律,画面 a 和画面 b 之间产生了变化,这中间一定存在某种看不见的驱动力,于是在没有任何人类干预的情况下,接近依靠极其恐怖的算力自己生生推演并构建出了一个潜在动作空间。 他不需要知道什么是跳跃键,什么是方向键,他只通过对比连续真的像素位移就能自己规划出。当某个潜在维度发生改变时,画面里的主体就会克服向下的引力,产生向上的位移, 这就是他自己悟出的重力和操控概念。一旦这个潜在动作空间被建立起来,基地内部的动态预测模型就会接管一切。 当你通过键盘或模型接口输入一个控制信号时,他不是在播放一段预设的动画,而是在进行极其高频的自回归预测。 他在每一毫秒都在疯狂计算基于上一帧的画面状态,结合你刚刚输入的潜在动作指令,下一帧的全景像素应该长什么样。这种纯靠神经网络硬算出来的动态环境,不仅具备惊人的空间一致性,还彻底突破了传统物理引擎的算力瓶颈。说到这里,咱们得拉升一下视角。 你可能会问,谷歌花这么多算力搞出这么个逆天的架构,难道只是为了炫技吗?绝对不是!基尼真正的战略图谋是剑指聚深智能,也就是未来的 ai 机器人。 我们要训练一个能够在真实物理世界里端茶倒水,甚至在火星上搭建基地的机器人。如果靠现实实验室里的物理试错,那个成本和效率是极其绝望的。 而基尼实际上就是为所有聚深智能打造了一个可以无限生成的超级虚拟训练舱。既然他能通过看视频悟出虚拟空间的运行规律,那他同样能通过看现实世界的录像,在服务器里一比一地生成极其复杂的现实物理环境。 成千上万个 ai 大 脑可以被投放进机密生成的环境里,去学习怎么抓取物体,怎么应对突发状况。经历亿万次试错,毕业后再降临到现实的机械躯体里,这才是这项技术真正让人胆寒的地方。不过各位硬核玩家先别急着拔剑, 目前这个宛如造物主义般的机密模型,暂时只对美国本土的 google ai ultra 订阅用户开放了测试权限,国内的朋友甚至绝大多数的普通开发者现在还只能隔着屏幕眼馋。 但在这个 ai 按天进化的狂飙时代,算力的壁垒和封闭的测试圈往往撑不了太久,技术的阀门一旦打开,全面下放或者开圆平替的出现只是时间问题。我们现在要做的就是让子弹再飞一会,同时看懂牌桌上的底牌。 面对这样一个连物理法则都能被神经网络重写的时代,你觉得下一步 ai 还能进化出什么离谱的能力?如果你觉得今天这期硬核拆解对你有启发,别忘了点个赞,或者把视频转发给你的,即刻朋友们一起讨论。