粉丝2.1万获赞14.6万

用谷歌欧米生成带货视频,其实最稳定的方式还是用分镜图做带货啊,很多人现在他们在用欧米做带货视频,都是用单图做,然后呢?其实我今天做的思路呢,我就在想为什么不能用分镜图做呢?对不对?他既然都是多餐。然后今天我调试了一下午的提示词,我最后发现是什么呢?你得让你的让欧米能理解你的提 词,外加分镜头,它的画面就会走的很好,就是如果你的提示词里面,嗯,就是优化的不太好,你的分镜头就会崩。大家想一想,你就想一想你以前用吉梦做带货视频,你如果做简单的产品,你用单图都是可以做的。但是你就记住一点,只要是复杂的产品, 还是分镜图,这样控制可控性更高吗?出错率更低。经过我今天测试啊,基本上用分镜图做的,没有穿模的,基本上都没有百分之九十,百分之九十五的视频,我觉得都没有穿模的。偶尔穿模呢,就是一些画面,比如我今天做这个清洁剂,清洁剂呢,不要让他出那个灶台,那个灶台他去擦那个灶台,他就会穿模,但是如果没有这种画面的话,他其实基本上不穿模。

谷歌今日凌晨发布了 gemini, 在 底层逻辑上简直就是一次史诗级的进化,瞬间引发了轰动,我们一起来看看实际的测试效果吧。哈喽,各位小伙伴们大家好,今天给大家演示一下最新的视频模型 omni flash 的 使用方法。 好,这个的话呢,它支持使用十秒啊,然后三十个积分这种方式操作好,那么怎么来操作呢?假如说我们要做这样的一个漫剧效果 好,那么首先第一个我们可以使用分镜啊,这个是我之前做的分镜。好,那么我直接把这个分镜的话呢,放到我的这个提示词里边啊,那么我可以直接到这里艾特一下就可以了。好,我艾特一下分镜,点击确认。好,然后的话呢,我可以直接说 啊,使用啊,根据分镜,或者我把它删掉啊,根据分镜生成动画。 好,然后我艾特一下这个分镜,这个分镜好,可以了。好,然后人物参考,使用这一个人物。好,然后场景参考,场景参考, 再使用一下这个场景。哎,我的场景也有了。好,这样子的话呢,那么就直接就 ok 了啊,然后我们直接来生成好生,呃,动画流畅,然后运镜流畅 就可以了。好,那么就直接点击生成好,这个的话呢,大家就可以看到一条非常运镜流畅的,并且呢有音效的这样的一个画面呢,就可以展示。 嗯,而且它的准确度是非常高的啊,就是没有脱离我们的这一个分镜,所以的话呢,这个是一个非常好用的功能。

昨晚 google 发布了 nano banana 二版本,我连夜用两个版本做了对比测试,模拟一个美术馆从线稿到效果图再到动画的设计全过程,完整动画在视频最后。 banana 二属于轻量化版本,出图更快,成本单价更低,文字理解更准,当然也因为是轻量化,品质是比不上原 pro 版本。下面展示 ai 设计制作全过程。 打开 gamemini 网站新对话框,给他一个安藤忠雄身份设计一座艺术馆的黑白线稿图完整提示词如下,欢迎抄作业可看此处 ai 思考过程正调用 nano banana 二模型, 不再是 pro, 若想用回 pro 版本,可去 google 其他网站产品使用。二十多秒后得到一张建筑手绘图,对比两个版本出来的效果,你们喜欢哪个?请评论区留言。接下来将现稿图转为现实风格的建筑摄影图,清晨雾天风格提示词如下,我们同样上下对比,此时你喜欢哪个? 然后就用词主控角度发展东南西北四个人事角度。提示词如下,其实肯定是 pro 版本出图品质更高,审美更好,而且当时是白天一次成功,现在 banana 二版本只能凌晨一点后算力充足情况下多次抽卡才做到现在此效果。继续放大对比,你们觉得如何? 接下来根据此斜图直接生成一张鸟看图,提示词特别简单,而且不用电图, jimmy 三点一,在同一个对话框中是有上下文记忆的。 继续点击放大对比,当然 pro 版本前面的图调子的雾气比较重,让鸟看显得有点脏。当时我用 pro 一 句话转为现实风格的日景效果出来,效果就很好。接着我们尝试电风格参考图,将刚才的鸟看图做风格转换,将参考图作为图一,本项目图作为图二,拖到提示词框, 提示词用最简单的三段式即可。参考图一,什么,将图二做成什么,保持什么不变。具体提示词如下,可直接抄作业。 再对比一下,两个版本的效果都还不错。后面我做了几个不同角度的摄影风格图和展满,在此我就只展示一个典型的吧,目标是做含十二个角度的展满,建筑空间加美女,给他一个建筑大师和摄影大师身份,要求出十二个角度, 从鸟看到局部再到室内,还要四整美女街拍图。最后明确为有主次的灵活的国际竞赛拍板风格出来效果还不错。提示词说的角度基本上都有一一反馈,甚至还可以垫上你们的女神。如果之前的红砖房改造项目,就用我的花式滑冰女神 k 宝出了很多写真大片,顺道提一句, k 宝解禁复出了,请各位多多支持! 好!静态图玩的差不多了,接下来玩动画,以最后一张多角度展版图作为电图,直接让詹麦奶调用 vol 生成视频动画。提示词有点复杂,且需多次测试,若大家感兴趣,请评论区留言,我后面专门做一期动画分享。最后展示一下昨晚花了两个小时用 vol 做的动画效果。 the geometry we finally found it。

家人们,谷歌最近更新了新的视频模型 gemini omni 已经上线,今天给大家介绍下更新的新功能。第一个可以创建角色附用,也就是我们所说的角色库, 方便拿来做长视频和保持人物一致。新增了 flow 内置的智能体,可以直接完成脚本和分镜图的生成。我随便测试了一个香水的带货视频,生成出来的效果也是不错,最新的 omni 模型也是可以做出这种分镜效果了。 可以预见后面 tk 的 视频类型会变得越来越多,后续也会给大家持续分享不同的玩法。第三个,你可以直接在 flow 打造属于你自己的工具,包括调整图片角度、图片编辑等等, 利好大家创作。第四个可以上传你自己本人的照片和声音,生成你自己的 ai 视频。第五个呢,就是 flow app 在 android 的 移动端推出,可以在手机上创作视频了,大家赶快都去试起来吧!

谷歌的欧米尼视频生成模型上线了,我们可以在这个 flow 平台上进行体验,同时 flow 平台也上线了很多的视频和图片编辑小工具, 那么本期视频我就给大家测试体验一下欧米尼模型还有这些小工具。首先我进行测试的时候,模型只开放了 fresh 模型, 目前最高能生成七二零 p 十秒的视频,每个视频消耗三十个点数, umi pro 会员一共有一千个 ai 点数,而且我在使用的时候,它的首帧参考功能还没有上线,所以我就简单测试了几个纹身视频的例子, i will send you back to the dark abyss。 好,提示词所要求的东西都有,但是动作,电影质感还有音效都差很多,可以看一下 c 带是二点零的, 而且在 flow 这个平台,我们可以在下面这里输入提示词,直接对视频进行二次编辑。比如我直接输入一条金枪鱼跳上船,我们来看一下效果, i will send you back to the dark abyss。 他 这添加的内容太生硬了,几乎是不可用的。当然有可能他是 fresh 模型的原因。我们再多看几个例子, 这条视频的话,飞机驾驶是还不错,女主的紧张感和节奏也还行,但最后飞机仪表盘反向了,而且多了一个人。下一个我们试一下著名 ip 加想象力 why won't this stupid code work? 暂停一下,这里电脑里表现的内容太棒了,连代码的说尽都像那么回事。 i refuse to do this? 直接切镜头换风格 anymore why won't 他 这条真人路飞生成的其实挺棒的,这是就中间莫名其妙多出来一个动漫风格的镜头,下一个是变形金刚的镜头, 这个表现就太差了,别说跟 c 站十二点零比了,连快乐马都比不过。 下面是一个著名 ip 加动漫风格, anya will defeat all the villains, 这个表现其实还算可以了,介于 first 和 cds 二点零完全体之间, 下一个是香港电影。如果记忆是一个管头,我希望他永远不回国。起 这个案例就表现的很差了,无论是中文音还是镜头都不符合要求。如果记忆是一个罐头,我希望它永远不会过期。来一个九比十六的变身镜头, 那就再来一次, 感觉能比快乐马好上一些,但是这种动作和特效还是 c 大 师您的拿手好, 再试一下科幻镜头, 这个表现太拉胯了,完全没有电影质感,比快乐马都差远。 总结一下就是 omni, 它的表现肯定是不如 cds 二点零的,但它毕竟还是 flash 模型,不知道它有没有正式版,如果有正式版还是未来可期的。它还有一个优点就是足够的便宜,性价比还是很高的,目前生产速度也快,而且目前还 现那些著名的 ip。 今天除了欧莫尼这个更新之外, pro 这个平台还上线了巨多的图像编辑和视频编辑小工具, 我也帮大家测试了一下,总结一下就是很鸡肋,就是看起来很厉害,实际上就是一些常见的开源项目整合而成的图像和视频编辑工具, 比如说编辑文字动画的呀,还有说像什么手绘转图片,从各个仕图和角度去查看原始的图片,这个就是千问的技术吧,我记得还有什么视频跟随音乐动起来,这样的就适合整活。 还有一个是上传三 d 模型,然后再转化为二 d 平面图片, 它的视频小工具还有一个印象比较深刻的是一个抽帧加抠图加重叠的技术, 其他的图像小工具的话,要不然就见太多了,要不然就完全没什么意义。总结一下的话就是 omni 未来可期,图像工具的话作用不大。 那么以上就是 jimmy 在 本次 flow 上的更新的测试结果了,我个人是比较失望的。好,如果本期视频对你有帮助的话,麻烦帮我点个赞。

全球搜索之王,世界最塌视频平台的亲爹, transform 框架的奠基人谷歌终于发布了它的最新视频模型 wilhelm。 但是没想到啊没想到, wilhelm 上手一侧,像个鹿鞭一样拉完呐。 那 vivo 给我的感觉不是下一代视频模型,而是上一代视频模型。戴了个新墨镜,说自己刚从硅谷进修回来。什么东西啊?你说它不能生成吧?它能生成还能自动分镜,但你真想把它当做一个视频创作工具,那你可遭老罪了。这下 cds 又可以美美涨价喽! 哎,算了,开始测试吧。本次 vivo omni 可以 在 gemini 的 官网和 flow 进行使用。我这里做了几组对比,主要是看四个维度,分别是指令完成度、动作逻辑流畅度、一致性。 零分代表不及格,一分代表及格,两分代表满意。那第一组是文声图,题词如下,我们先来看 vivo omni 的, 我们再来看看 simon 的。 你们觉得这两个片段哪个好一点? 虽然这两个片段都是槽点满满,但是从情绪渲染和动作流畅度上, sentence 还是要强上不少的。不像 vivo omni 这个动作设计啊,完全的放弃治疗。那这是我对这相册时的打分,两个逻辑性都不及格,但是 vivo omni 它的流畅度也不及格,没救了。 刚刚是动漫高动态场景,那我们再来看一组偏静态的真实场景。先来看看 real 欧美,看什么看?不必声张,对我们如同对寻常百姓,即刻大人方幸,对付百姓小的拿手。嗯? 看什么看?哈哈哈哈哈哈,这个纯大爷啊!这巴掌轻飘飘的不够凶,还突然愤恿大笑,操,你们都干嘛呢?妈的,哎呀,我最知名的是中间的台词念错了一句,直接这个片段就是报废的。我们再来看看 sentence 的, 不必声张,对我们如同对寻常百姓即可, 大人放心对付百姓,小的拿手。嗯,看什么看,你吼那么大声干什么嘛?这个情绪就到位了,但是没有完整的挥手扇耳光的动作,而且这一巴掌下去,关羽脸上竟然凭空出现了一道疤痕。 这个物理逻辑零分啊。掌上附魔了说一声,这是我对这一项的打分。那测完了纹身视频,我们测试一下图身视频,而且我们之前测的都是多分镜画面,你说有没有一种可能会有 all night 单场景稳定呢?于是我让 eevee 帮我生成了一张很复杂的图片,让人物在这个场景跳舞, 最后再弄个更花的大翅膀,看看谁能压得住。先来看看 cds 的, 除了中间转反了一下,其他的没什么毛病。再来看看 vivo omnit。 嗯,停停停停停,不是谁拉这了,你直接处理不了,给我简化了。什么意思?本相零分啊,这个就无需比较了,那一目了然。 我们再来看看多图融合表现。这个是参考人物,这是参考场景。先来看看 vivo omnit 的 表现。 不是,哥们儿,这照片是你吗?是我是吗?是,那时候我还很瘦。再来看看 sentence 的 表现吧。 i said, 我 还能说什么呢?直接上评分吧。最后一个测试是九宫格分镜测试,这是用 emoji 做的一张九宫格分镜图。先来看看 vivo omnit 的, 感觉还行是吧,但是它很多镜头跟我的九宫格分镜图完全不一样。我们再来看看 status 的 表现。 status 它也不是百分百对,但是大部分镜头都是跟着九宫格走的。剧组测试下来,我只能对 vivo omni 说, 你不是我的星,你是路人。很失望啊,兄弟们。没出之前都说是自洁杀手,自洁被他逼的要出新模型了,结果呢?端上了一道菜,菜名叫做,敬请期待下一代视频模型哦。 我还能说什么呢?让我们进行 pro 的 发布吗?我相信这个 flash 绝对不是你的真正实力。那也希望你不要跟每次世界赛的 lpl 一 样再藏。但藏的是什么呢?回家的机票。那么本期视频就到此为止了,我是二级之标同学,我们下期再见。拜拜。

谷歌昨天更新的 flow 智能体也太好用了吧,可以直接一次性生成十四张图片,再也不需要一张一张去生成了,一起来看看是怎么使用的吧。今天给大家介绍一下最新的 flow 的 这一个 agent, 呃,特别好用啊,它的最好用的点在哪呢?就是它和一次性生成的图片没有上线。 嗯,假如说大家看到像我当前的这一个画面,我可以给他一个画面,他瞬间呢就可以给我生成十四张完全的这样的照片,大家看到瞬间十四个角度,这都可以了。好,这个具体怎么来操作呢?首先第一个,这是我的根图啊,随便拿一张你的图片出来啊,添加到这里面。第二个,这里使用智能体。 好,然后的话呢,点开这个智能体,好,我把它删掉,添加指令,添加指令之后的话呢,把我们的这一个十四分镜的这个模板给它拉进来,放到这里面粘贴啊,就可以了,点击确认。好,这样子的话呢,那么 他就有了十四个的规则啊,有了这个规则之后,那么你就写关键词叫生成十四张图。好,然后根据以上 十四个以上规则,就是因为我的那个里边是有十四个角度啊,以上规则生成十四个角度 的图片,这样子的话呢,你就直接点击开始。哎,这样的话呢,那么他这边就会稍等啊,他这边就会有这个 需要你确认,如果你是 bro 的 这个会员的话呢,升图是免费的,那么他就会让你确认一下,然后您啊积分啊可以使用,当然你也可以批量的生成多个视频。好,这个是 第一个操作,就是大家可以看到他会瞬间给你生成十四个角度的这一个图片,这第一种的。好,第二个的话呢,那么有了这一个之后啊,那么第二个就是我们以前做画面是使用九宫格的,那么以后我们其实从理论上来说就不再需要做九宫格了,那么我们的九宫格直接就可以变成, 大家可以看一下。好,我们的九宫格直接就可以变成一张一张的图。好,那这个的话呢,也是很简单的直接选择智能体,然后的话呢随便选一张这个九宫格啊,对,这些都是我刚刚已经弄完的。 好,假如说我到这个地方选择这张,呃,前面的这个九宫格吧,选择这个九宫格添加到这里面。好,那么直接生成啊,九宫生成九张图片。好,把以上九宫格图,九宫格图片啊,放大每一宫格。 好就可以了。好,直接点击它就可以了啊,这个时候你看到这里就会放大每一宫格的图片,点击确认。好,那么直接点击确认。哎,这个时候的话呢,他就会收到信息, 就帮你把这个呃画面啊,生成九张这种独立的照片,这样子就可以了啊,效果非常好,包括清晰度,大家可以看一下清晰度, 嗯,没有任何问题。好,这个就是他的智能体的使用啊,非常的方便。好,感谢大家观看。

google 昨晚发布了新的视频生成模型 omni, 他 宣称自己在多模态融合和物理模拟上都有明显提升,那我们就拿它和 cds 做个简单对比测试。

dance 二点零这次终于有对手了!谷歌刚刚发布的视频模型 omni 到底行不行,我们一试便知。先来看 omni 强在哪里?首先是视频编辑能力, omni 能够在改变画面元素的同时,保持角色和场景的一致性,比如把现实中的雕塑变成泡泡,一触即破, 把自拍里的镜子变成液态,让人碰到就变成终结者。或者是把小提琴手从音乐厅挪到草地上,再变换一个拍摄角度,不过他好像忘记把琴带出门了,真是尴尬。其次是物理引擎更加精准,那说人话就是重力、速度和碰撞之类的效果更加真实。 另外,奥尼也拥有了全能参考的能力,除了能够参考图像、视频和音频合成最终效果之外呢,还能给视频加上指定的特效包装。正为我的动销同事捏一把汗, 那接下来我们看看同框对比 omni 和 c dance 二点零谁的效果更好呢?实测下来, omni 的 物理效果确实更加优秀啊,画面风格也更加丰富多变,但中文能力就远远不如国产模型 c dance 了,这些有机材料就能自醒发光,而且 c dance 的 人物位置更加稳定,画面更有影视风格。 目前这面的 omni flash 模型已经正式上线,不过每天只能生成三条视频,你觉得 omni 能够和 c dance 一 战吗?来评论区咱们接着聊。

大家好,我是 kitty, 今天我们一起看一下谷歌最新发布的 i o 大 会啊,会上发布了非常多的内容,那有很多产品我们现在可以用,也有很多期货产品。今天的话主要介绍一下我们现在可以用的产品。 现在谷歌每个月处理的 top 函数是非常非常多的,那 jimmy app 呢,现在也是被更多人喜欢。 目前谷歌有十三个产品,用户量是超过十个亿的,非常非常恐怖的量。今年夏天呢,我们就可以在 youtube 上面使用它的 ask youtube 功能。谷歌呢,最近还在 cloud nest 上宣布了第八代的 tpu, 大家可以简单了解一下。 此外呢,这次和我们非常相关的有 omni 模型,还有三点五, flash 模型。这次发布没有发布, pro 模型会在下个月发布。谷歌今天发布的是 omni 的 第一个模型 omni flash, 我们可以在它的 app flow 进行使用。需要注意的是,有用户呢是 out 的 会员,它在使用 omni 生成五个视频之后,甚至无法再使用 pro 或者是 flash 模型了。目前 jamal 它在设置里新增了一个使用限制, 它和 pro 的 一样,也分五小时的限制和啊一周的限制。我就提示它生成一个视频, 那它就花了我百分之二十六的一个五小时额度。除此以外,我今天在 gmail 的 啊官网上去提问的内容并不多, 那我们可以看到已经啊有三分之二五小时的额度已经被使用掉了。如果你是 pro 会员,非常推荐你在 flow 的 平台上去调用,让它生成图片,或者是让它生成视频,因为谷歌每个月会给 pro 用户一千积分的一个额度, 那我们用 omni flash 来生成图片,一张图片呢,十秒钟它就会花费三十积分。而如果说是六秒的视频,那就会花费二十积分。但是它生成的视频呢,和 jimmy 上一样, 都有一个视频的水印,这点是,呃,不是特别好的。如果你在 flow 平台上生成图片,选择它的 nano banana 二, 那是不花费积分的,而且这里呢,是没有水印。这次 flow 呢,还非常好,推出了一个 agent 的 模式, 这和我们在其他的一些 ai 绘图平台上 agent 的 模式是非常像的。我提示它让它去生成这样的一个分镜,拉倒不拉倒。二,呃,即使我选择了 agent 的 模式,它生成的图片分镜也是要比 gbt image 二要差的非常非常多。 之后呢,我就根据 gpt 一 米二生成的图片上传给 flow, 让它来生成视频。 this scent is amazing freshly fried stinky tofu crispy outside and tender inside one bite crispy and bursting with flavor it smells bad, but tastes so good。 可以 看到它生成的音频里面呢,有都是英文。此外,呃,一开始给它的原图里面呢,有都是英文。此外,呃,一开始给它的原图呢,是真人的质感, 原图的话是有一些文字的,而它在最后生成的图片里面是没有相关广告文字的,做的是比较差。所以我后来我就提示让它根据这张图片要生成中文视频。 这香味也太上头了吧,那它生成的视频,这就对了,变成了中文。如果你是在 jimmy app 里面直接提示它生成视频的时候, 就不需要我们像在腐肉里面要再明确提示他一下,这香味也太上头了吧。现炸臭豆腐,外酥里嫩,灵魂酱汁,一口咬下去,爆汁,越吃越上瘾,再来一份,非常不可,香到停不下 啊。即使是这样,那我觉得 flash 在 这里表现的和我一开始给他提供的图片这样的一个分镜啊,相差还是比较远的。所以我后来又提示 gbt 呢,让他改一下。我说我的视频是十秒,让他再重新深图 修改后他就将啊镜头变少了一点。然后呢,每个镜头他是安排了两秒之后,我就取消了 agent 的 模式,上传了这样的一个 gbt 的 图片, 然后提示啊, omni flash, 我 让它根据我上传的这样的一个图片啊,输出中文视频。那它最终生产的这个视频和我刚刚提供给它的图片就比较像了。 这味道也太勾人了吧。现炸臭豆腐,外酥里嫩,一口爆汁,香到上头,闻着臭,吃着也太香了。夜市进店,臭豆腐等你来尝。但是我们也可以看到这个视频里啊,它有很多文字是没有体现在这样的一个广告里。 第二呢,呃,这个视频最后,呃,有文字还是有错误,跟我一开始给他的这样的一个横排的广告分镜还是有较大差别的。呃,所以我个人对 omni 这一次的视频输出的话不是特别满意。 谷歌说 omni 提供了一种更容易的视频编辑方式,用自然语言下指令。他们认为 omni 的 优点是角色保持一致,物理效果站得住脚,还有场景会记住此前发生的事情。 omni flash 它的物理表现是非常不错的, 这两个视频都呃展现的非常好,当然了,你让 omni 来切换不同的场景啊,物体变化也是非常简单的。这次 omni 呢,特别强调是它的物理创建,视觉能力非常强,非常真实的这样的一个 demo。 omni 可以 利用 jimmy 的 知识,把语言图像和 e 连接起来,超越单纯的模式匹配。而且 omni 还可以从短的提示词创建有说服力的解释性视频。 它呢,现在也是支持多个图像文本,视频、音频啊合在一起,并且支持从已有的素材延展创作。 我们可以看到一开始就是简单的一条鱼,然后啊几笔图画最终生成的这个视频呢,啊,就很好的保留了原图的一个参考,还有官方这样的一个展示,我认为啊,对我们来说日常帮助也是比较大的。 呃,有这样的一个啊,插画,然后上方是真实视频,最终做出非常有动效的视频。目前节目奶设置里呢,还支持上传你自己的一个头像 啊,然后融入到视频里。三点五 flash 呢,现在是谷歌最强大的模型,官方展示这样一张图呢,意味着三点五 flash 它啊,速度快, 它的制力能力强。我们通过这张图可以看到 gmail 的 三点五 flash 啊,对比 crowd opt 四点七和 gpt 五点五都是有非常大的竞争优势的。 官方又展示了一些案例呢,非常不错,比如这个案例呢就是,嗯,几百张图片,然后让 gemite 三点五 flash 做一个分类,在提示词里面呢,就有明确提到让它用啊自 agent 来处理。我最近呢也是做了一个图片重命名的应用, 我一开始也是让 ai agent 来帮我实现的,在 ai 编程工具里让它去实现,但是我后来发现,嗯,很多都不能完成。 那我后来是做了一个啊, mac 应用啊,用本地的千万模型来去做这样的一个重命名。那我们看到反重力的 id 里面呢,就能直接去实现这样的一个功能。 而且就目前而言, gemna 三点五 flash 在 反重力 ide 里面,它的使用额度还是比较多的。三点五 flash 呢,还可以仅使用科学论文作为输入来再现 alpha zero 的 可玩版本, 这就说明它的治理能力啊,非常强,而且它可以自我改进。官方还有个例子非常好啊,就是让它来做一个工具。这个工具呢,是可以 调用啊,海量的 agent, 然后让它们去搭建不同的场景, 只要你给他足够的 talk, 那 他最终多个 agent 就 能帮你去生成啊,非常丰富场景的这样的一个三 d 建筑群。谷歌还展示了一些通过 as studio 来生成的应用,比如说你给他任意的论文, 最终这个应用呢,啊,就能帮你生成,非常丰富啊,重现论文里面的各种交互的展示。 三点五 flash, 还可以帮你去生成这样栩栩如生的机械操作呃,领悟感非常强的应用。此外呢,也可以一句提示, 它就可以帮你调用六个 agent 探索呃,六个不同的 ui 设计,除了我们可以在 jimmy ipad 里去使用,呃,三点五 flash, 那 它现在呢,也是 air mod 里的呃,默认模型, 可以帮助我们带来更好的搜索体验。谷歌这次大会还有个非常好的变化是它的 anti gravity 升级了,升级到二点零了。虽然说呃我现在的 anti gravity 二点零登录不上, 但是它现在也出了一个新的 cui, cui 呢是我可以登得上的。现在的 gemini cui 呢,也会逐步迁移到 anti gravity cui。 如果说你之前能登录 gemini c u i, 那 现在登录 anti gravity 啊,还是非常方便的。当我们下载反重力二点零之后,它会呃有这样个提示,是否要下载 ide? 如果勾选之后,那你电脑里就会有两个 app, 一个是新的呃二点零,一个是之前的一个界面 ide。 如果大家之前使用呃反重力的 ide 登录有问题,那现在可以试下它的 cy 安装的话,可以看一下这里。安装好之后,我们就可以通过 agy 来进行交互。初次使用呢,他会让你进行一个授权,我们需要把呃网页上面获取到的一段代码,然后输入到终端里。登录后第一次使用呢,呃,建议直接来到他的设置,把数据收集的这样的一个选项给关掉。 工具调用的源序这块建议啊,直接打开。目前呢, jamal 三点五在反重力的 cy 里面运行的时候,的确速度非常快。呃,但是呢,它的质量如何呢? 这块我会放在最后,大家有兴趣的话可以翻到后面看。现在呢,我将介绍一下新的反重力二点零。呃,我们可以看到它的桌面应用是非常大的升级, 它有动态子 agent, 还有一个呃异步任务管理运行的, 而且还可以用简单的 jason 格式定义 hux。 二点零还新增了一个啊,全新的计划任务, 这和 codas 也是非常像,也新增了一些命令,比如说啊, girl 这个命令呢, crowd, codas 都有,包括 ems agent 也有啊, gryalme 呢,这个 scale 一 开始呢,是由马特啊一个开发者,然后他去构建的 反重力这里用到了这个功能呢,是可以在开始实现之前,反向提问以面对以面对计划的具体细节达成一致。比如这里呢,我就通过使用这个命令,然后后面跟上我的一个需求反重力。不明白的地方呢,他就会问你 啊,他问了我多个问题,最终三点五生成的 flash 啊,结果可能不是令我非常满意,但是前面呢,先和它对齐需求啊,这样的一个功能还是非常好的。最后还有一个功能是 browser, 可能这是在 ide 里面独有的。 cy 里面呢,是没有这样的一个斜杠命令的。反中立官方介绍呢,二点零呢,它的 logo 就是 白色的背景, 而 i e e 呢,它的 app 背景呢,就是一个黑色的网格。谷歌呢,这次还介绍反重力构建一个操作系统,它们让反重力二点零呢,用了一组 agent, 从内核进程管理、内存管理、文件系统到视频和键盘驱动, 构建了一个人运行 freedom 的 功能性操作系统。在构建过程中呢,用到了九十三个字, agent, 以 api 价格来算啊,花了差不多是九百多刀。他们分享的这个案例呢,主要是讲同步和异步 agent 怎么去进行操作的。他们认为在异步交互中,通常不再重要的是模型的性格与行为方式,真正重要的是,模型到底有多聪明。 通过这个例子呢,他们是认为 jimmy 是 一个非常聪明的模型。谷歌还介绍了他们怎么编排这些 agent teams, 这并不是几行提示就能完成的事情,实际上有数千行提示。他们没有让单个 agent 身兼多职, 而是创建了一系列具有专门目标和约束的自 agent 的 类型。我们可以看一下,比如说有调度型管理者,策略分析者,实际编码者,独立审查者,还有测试 啊核验的一个 agent。 他 们还采取了一些技巧,比如说啊,怎么处理上下文长度限制的,一旦达到限制,他就会把完整状态写入 handoff files, 结束自己的后台任务,并且调用一个拥有相同目标和权限的一个啊继任者子 agent 者 后,记者呢?从文件平滑恢复。如果遇到任务堵塞的情况下,他们就会使用新的 scheduled tasks 啊 primitive 设置后台循环进行的定时任务,然后检查各个子 agent。 呃,写录的一个这样的一个进程文件, 所以它们中间是有各种设置的,还有对抗大圆模型,懒惰,它们就会通过一个 auditor 来实现。这次呢,反重力二点零还推出了一个 teamwork preview, 这是一个新的啊,斜杠命令。 这个斜杠命令呢,目前是一个研究预览状态,只有两百多的 out 用户才可以去使用它。 呃,官方建议呢,搭配三点 flash, 使用 timoc preview 的 时候,账单是非常高的。 现在呢,简单来看一下谷歌反重力 cy 的 一些命令啊,刚刚有提到 agi 来唤醒,然后我们可以通过问号,斜杠 at 这些比较常规。 那斜杠命令里面的话,比如说有斜杠 agents, 可以 用来查看管理审批正在运行的子 agents skills 呢,也是比较常规的啊,还有 statelines 这些的话都和 crawl code 是 非常像的 啊。当然我们也可以经常看一下它的 usage, 目前呢 ci 里面也是可以使用 opt 四点六的。 我在登录过程中呢,就发现隔了一两小时之后,它又让我重新再登录。 config 的 话,我们可以来管理 c y 的 配置,刚刚我有提到呃,我们进入之后可以把它的信息收集呢啊这样的一个配置给关掉, 要安装反重力的插件呢,我们可以用这样的一个命令啊, what flows 里那我们可以看一下可以斜杠,然后来触发某一个工作流。反重力呢,还可以用安卓 c y, 这里有一些命令,大家可以简单了解一下。现在来介绍一下如何在呃 a s 九九里面构建原生的安卓应用, 可以通过一个提示词就可以构建高质量的呃安卓应用,它呢使用嵌入式的呃安卓模拟器, 可以在 web 浏览器中创建,并且编辑安卓应用还是比较方便的。我们可以通过 usb 线呢,连接安卓手机就可以通过, 之后就可以通过 a d b 把应用直接安装到设备上,而且它还支持你啊直接把应用呢发布到谷歌 play 用于测试 as 丢丢会自动创建应用记录打包,然后并且上传到啊安卓 play 的 开发者控制台的一个测试轨道, 应用会在几分钟之内就可以安装,非常非常方便。当你需要更高级的迭代的时候,你可以去将它下载下来 啊转移到 android studio 里面进行开发,或者是转移到反重力里进行开发。谷歌介绍他们还会在 as studio 里面添加和安卓相关的 firebase 的 集成。官方呢,还给出了一些呃提示词灵感, 比如说这样的一个提示词就可以让 air studio 帮你做啊,手表的应用,或者是折叠屏的应用,再或者是一个面向吉他手的伴奏练习应用。谷歌现在的订阅方案呢,也有了一个很大的升级, 那 air ultra 之前是二百五十刀的,现在是降到两百刀了,而且还提供了一档是一百刀的 pro 呢。啊,之前是二十刀,那现在还有一个五十刀一个月的。 它们的区别主要是这些方面,一个是呃存储空间的区别,第二呢是 jamming 的 使用上限,目前 pro 二十刀的,它的 jamming 使用上限是普通用户的四倍,总体而言的话,这个额度感觉是大大缩减了。 呃,那它新增了一个非常好的额度呢,就是 youtube 影视权益这块还是不错的,因为现在这个单买也是需要呃九刀左右。因为我平常用谷歌的啊 pro 会员比较少, 所以目前订阅它的这样的一个新的二十刀的啊,还是非常不错的。需要注意的是,如果说你现在订阅它的一百刀的 air force 会员, 那可以在反重力里面去领取一个啊一百刀的奖励积分, 这个优惠是有时间限制的,目前邀求用户是能优先访问一些新功能的,比如说 gemina spark, 还有 project jenny。 最后来看一下 gemina sineon flash 这一次的编码能力 啊,我呢将这样一段提示词和这样的一张图片发给三点五 flash, 想要让他呢啊,帮我去复刻一下啊。工具里我选择的是 canvas, 思考程度呢,我是选择了最大。 那它生成的速度还是非常快的。三点五 flash 呢?它有提示我啊,这里用到了完全自主的一个乐曲,是用 web audio api 来合成的。它生成这个效果是我近期测过多个模型里面 应该是啊和 jimmy 五点五 pro 啊非常接近了。和原图的话,嗯,是也是非常接近。而这样的一个效果呢,是我通过三点五 flash 在呃反重力的 c y 里面生成的。那我们看到这样的一个效果就简单非常多。而我们现在右侧看到的这样的一个效果呢,是我在 a s studio 里面拉拉生成的。那这里的主要区别呢?就是 canvas tool 它带的系统提示词, 目前我还不知道它的系统提示词是什么,但是我们可以看到你用不同的哈尼斯那生成的效果就会千差万别。再看它生成的千夫拉船,这千夫拉船呢,是提示了四次。它生成的这个船还是挺逼真的 啊,我最喜欢的就是它这个水面做的特别特别逼真,整个场景是比较暗的。一开始它生成的是这样的一个场景, 后来我就截图让他进行优化,这是他的优化内容。优化后的这个效果呢,左边能看到船,然后要小心的去移动,才能看到纤夫在哪里。 他把这个潜伏还是画在了呃,水面上,没有看到绳索和潜伏黏在一起。而现在我们看到的是 jamal 外部端 canvas 里面去生成的潜伏拉船。他给到了我好几个不同的镜头视角, 还有船体追踪,江岸全景,船手仰望,除了夕阳落日呢,还可以切换到其他不同的天气场景,而且呢,它这里还有音频。 这样一个页面设计,让我感觉,呃 jamal 三点五 flash 非常非常像 gbt 五点五,不知道它是不是向 gbt 进行取经了,右上角还有个感叹号, 点击后我们会看到这样的一段说明文字,我认为 gmail 三点五 flash 是 一个 mo 模型, 它的参数量应该是比较大的啊,激活量的话可能是相对比较少一点, 它的知识丰富度还是比较强的。虽然说三点五 flash 的 速度非常快,但是它在做这样的简单页面的时候啊,控制台是经常出现这样的报错的, 这个可能也是 moe 模型的一些局限。再看三点五 flash 在 jammer 平台上生成的交通信号仿真, 我们明显感知左边呢,是有非常多的参数,非常像 gpt 的 风格,它在这里啊,模拟还是非常不错的。小车呢,非常像我们现实里的各种小轿车,而且它还模仿了这种转弯, 但是他在路口,我们可以看到这两个车子连在了一起,那正常情况下啊,不太会是突然,车子行到这里就停在呃路中间了。我们会看到这样的交通仿真,车辆非常非常多,但是有 穿模现象,有很多都是错误的。再看 flash 做的仓库分解,同样呢,我们页面上看到啊,它的元素是非常多的,右侧能看到事件日记, 现在是一个红色的正方体,日记里显示抓出了,但是实际上啊,物体是突然之间就没了, 所以它的这个物体获取,它是没有完全展示出来的,它就非常适合做各种页面的一个 demo。 然后我们可以把这张图呢 截好发给 control, 再去实现具体的功能。我们在下方还能看到一个极停功能,点击一下啊,也会啊,这个功能的话演示出来也是也是能展现出来的。哎呀,我觉得他在这问题上还是表现的不错的。我最后给他的任务呢,就是给他这样一张截图, 让他帮我输出中文页面要明亮的主题,页面要美观,最终生成的这样的一个画面 啊,我个人觉得和我一开始发给他的图片还是非常像的,包括他这里用的一些小的图标元素也是比较到位。第二个的方框呢,我们会看到有多个颜色, 那最终啊, gmail 三点五 flash, 他 在这里做的是渐变色的效果,所以这一点上他是还原的不到位。那总体而言,我觉得他在这里呢展示的要点, 展示的这样的一个差异,我个人感觉还是不错的。而且现在三点五 flash 它的速度很快啊,是明显要比三点一 pro 要速度要快很多的, 做这样的页面就非常合适。以上呢,就是今天介绍关于啊谷歌 i o 大 会的所有内容 啊 jamal 三点五 flash, 它目前的价格还是比较贵的,输入一点五刀,输出十九刀。但是如果说编程的话,我个人还是更推荐啊,用 gbt 五点五,希望我的视频对你有帮助,我们下次再见。

兄弟们,今天谷歌 gemini 生成视频发布了,给大家做个测试,看看效果怎么样。我做的三个主题分别是机械战士打斗仙侠人物打斗迪士尼皮克斯三 d 动画。想通过这三个场景来看 gemini 模型视频能力。接下来我们来看看这两个模型最终的表现,大家各自打分吧。 有请三位选手依次登场。 i don't want to go to school, but it's time to get up sleepyhead fine, i'm going! 各位看官,你觉得哪个好?

嗨, hello, 大家好啊,我的名字是麻团。今天我将带领大家一起使用 appchain 进行创作。 首先让我们点击注册,在注册界面输入手机号、用户名、邮箱等信息,如果可以的话可以使用我的邀请码哦。注册好后点击登录,如果忘记密码可以用验证码登录哦。现在开始我们的路程吧, 这里是 app 首页啊,让我们先新建一个项目, 这里是无限画布,我们的创意全能在这里实现,无论是文本还是图片, 又或者是视频生成无限画布全能搞定。左侧面板里分别是资产库、分镜素材以及生成历史。资产库可以保存咱做出来的人物、场景图片作为我们的数字资产分镜制作可以保存我们做出来的分镜图片和分镜视频。 生成历史会记录我们在项目中做过的所有图片和视频,如果在画布中不小心删除素材也可以在这里找回。接下来让我们隆重介绍咱的 ai 助手, 我们只需要跟他自然交流,他就能把想法变成现实。介绍完了咱们的基本功能,接下来咱们做个案例吧。 想必大家都知道凡人修仙传,那我们就让韩丽跳一段江南 style。 我 们要想做好视频,首先要拷写剧本,我们可以让 ai 助手帮我们编辑。在对话框输入让韩丽跳一段江南 style, ai 小 助手会马上出几版剧本供我们参考。敲定好剧本,我们就要做角色三式图, 我们可以去网上扒出韩老魔的截图,复制粘贴到 ai 助手的对话框里,让 ai 帮我们生成角色三式图。 第三步,确定场景这次我们就让韩老魔在乱星海跳舞吧!跟 ai 助手说场景设定在乱星海。 第四步,分镜制作其实很简单,就是告诉 ai 谁在做什么,离镜头多远。比如在乱星海的礁石上,韩丽正对着镜头跳起丝滑的骑马舞。最后一步,见证奇迹的时刻生成视频, 把分镜图交给 ai 视频模型,点击生成,属于你的凡人版江南 style 就 正式诞生了。看韩老魔站着的舞姿够不够丝滑。 ai 助手是我们最好的伙伴,有任何需求都可以和他沟通,他会一步步引导你制作属于自己的视频。好了,快去试试吧!

今天凌晨一点, jammy 迎来更新,主播也是熬夜蹲着直播,看看官方这次有哪些重大更新。 jammy 这次发布了三点五 flash, 同时发布了一个新的视频模型 omni, 那 么主播也是在更新的第一时间进行了使用,可以看到在福楼页面中增加了 omni 的 模型,同时推出了 flow agent, 能够围绕我们输入的初步想法,自主拆解并规划复杂的创作工作流。 那么主播接下来进行初步的演示效果,进入页面输入我们的指令,同时上传所需的图片,选择我们的奥秘。接下来效果展示。 对于 flow 中的更新还有很多,比如人物角色的替换,人物一致性、动作流畅度等等,那么后续主播会对 flow 的 更新进行一一的讲解,帮助大家更好地应用到跨境电商视频制作当中。关注加收藏,获得最新消息!

万众期待的谷歌最新的视频生成工具今天终于在谷歌 i o 大 会上发布,这个工具完全走了和 c dance 二点零 不同的路线。谷歌说在这次的发布中有三个特殊的能力,第一个能力就是跨媒体的创作能力,这个新工具可以接收文本、图像、音频、视频的各种形式的输入,并将它们自由结合,生成全新的内容。第二次的新的工具展示了重点能力,就是替换功能, 用户可以非常精确的修改画面中的特定元素,例如无缝替换场景的角色,调整局部细节,改变整体艺术风格,切换背景环境,甚至转换摄像机的视角。第三就是强大的生存类,谷歌用了构建世界这个词, 这个新的工具可以打破现实界限,生成复杂动态且富有想象力的各种场景。

本视频除配音外的所有素材由 gemini omni flash 在 google flow 中开启, agent 模式一气呵成,总计用时三分钟。想体验这种生城爽感的 ai 玩家们,评论区聊聊 它的核心口号很直接,从任何输入创造一切文字、图像、音频和视频都可以成为新视频的起点。 这不再只是视频生成,而是一个多模态创作系统。素材、声音、画面和指令会进入同一个创作核心。更关键的是,对话式编辑继续描述、修改要求,模型会沿着上一次结果保持,角色和场景继续推进。 奥米还强调,世界理解、重力动能和流体运动决定 ai 视频看起来是真实还是只是炫技。 在 google flow 里,这些能力变成创作者工作台提示词。预览窗口和时间线被放进同一个界面。 普通用户也会在 gemini app、 youtube shorts 和 youtube create 里接触到它。 ai 视频正在进入手机日常, 最后,画面可以交给 ai 生成,但可信信息必须被标记和校验。本地后期负责把事实守住。