昨夜,设计圈直接沸腾,谷歌发布了香蕉的第三个版本,香蕉 banana 二模型正式上线了,这次的新版本更强更快,用完后我只能说设计真的不存在了。首先是分辨率的提升,香蕉二模型支持二 k 直出,生成的图片比上一代 pro 的 分辨率更高, 并且对文字的生成效果提升了不少,复杂的长文本生成更加清晰。另外就是对画面的理解更加丰富,生成的图片更加多样。 还有一个非常强大的提升,就是分辨率的开放,香蕉二模型支持一比八的图片比例,这意味着可以直接生成详情页长途海报。 举个例子,上传这张产品图,现在可以直接生成完整的长途详情页海报了,而且排版和文字都能一键直出。那么在哪里用香蕉二模型呢?首先就是在 jamming 中可以直接看到香蕉二,还有谷歌实验室打开图片功能即可,或者在 flow 中可以免费使用。 再就是 lovelt 等聚合战中都已经适配,赶紧去试试。咱就说这还要什么美工啊,真的瑟瑟发抖了!
粉丝2.9万获赞13.6万

谷歌的 nano 本纳纳昨天晚上悄咪咪的上线了,我们的模型焦虑又该开始了,以前所学习到的所有图像生成模型完全都可以抛弃不要了,接下来我会通过人物肖像海报、中文理解参考图、流程图以及多个维度给大家做一下测试。首先呢,我们先来看一下这个是它 nano pro 二官方模型更新的一个文档说明,这里面提到了一共三大点的更新方向。首先第一大点其实就是呃成本的降低,因为它这一次的更新模型的训练过程呢,主要用到了就是 gimna 三啊 gimna 的 flash 模型进行的推理, 所以相较于 nano pro 来说,它的成本生成成本下降了将近百分之五十。其次呢,就是它的生成速度确实提高了很多,因为它这里边新增了一个五幺二的分辨率 向下进行了兼容,虽然是向下分辨率降低一些了,但是它有效的确实是帮助我们可以快速的拿到一个成结果。然后在高强度的这种并行的很多的呃生成过程当中呢,我们可以快速得到一个最终验证的方案,这样的话不至于我们在生成的过程当中等时间太久。 第二大点呢,就是它的一个核心的性能的一个提升,这里面主要体现在于其实就是文字的渲染,一会呢我有生成一个案例,就是生成一个呃中国古代的墓碑的那么一个质感图片,一会大家带着大家一起来看一下。第三大点更新的就是它有一个更强的一个灵活性了, 这一次它增加了很多的一个图片的比例,就比如说四比一啊,一比四啊,八比一、一比八啊,这种非常极端的比例,它都是可以生成的, 也就是满足了我们很多的这种创作的需求的最终落地的版本,要不然的话,因为比例不同,我们后期进行裁切的过程当中也会存在很多图片信息元素不合理,又得重新进行生成,就很麻烦。 ok, 那 么我们接下来来带着大家看一下我生成一些基本案例, 这个呢我用到的是一个多图参考的案例,这里边我生成的一些图片,各种各样的小元素,汽车、帽子,然后包括衣服、人物,我用一个最简单的自然语言,大家可以注意一下我这个写的词啊, 都是一些非常非常普通的大白话,只需要按照上面图片里边的信息一比一说到,把这些元素都含在在内了,那么最后我们就可以得到一个基本的元素和效果。我们再来往下看,就是一个流程图,这里边呢我让他根据某一篇英文的论文, 然后让他帮助我最后根据这篇论文生成一个生整个的流程图。这里面涉及到一个相对来说复杂一点的逻辑,就是因为论文本身是英文的,相当于是他阅读完这篇论文的内容,先把英文翻译成中文, 然后再按照中文的结构和方式,帮助我去生成一张图片。对大家来看一下,这个生成结果 里边含盖了标题啊,副标题,以及每一个流程的过程当中涉及到的中文排版比例关系都是非常准确的。 ok, 然后我们再来往下看,就是海报,这里面海报啊,其实像现在的绝大多数的图像生成模型来说,都是可以完成的, 所以我先用了一个相对来说简单一点的,比如说指环王的电影海报,是吧?然后又采用的是恶魔高校的这种画风啊,他可以很好的完成,没有任何问题。 再来往下就是我让他去生成了一个这种人物海报,里边会带有一些基本的字样, ok, 也是相对来说很稳定,没有任何问题,基本上都是一次成功文字排版啊,包括人物脸型比例关系,包括手的位置,还有这些蝴蝶的元素, 并没有出现太多的这种不合理情况,对吧?然后我们再来往下看,就稍微加一点难度,让它生成一些动态的效果,这种牛奶海报的效果,对吧?再来往下呢,就是我让它去生成了一个基本的分镜效果 啊,都是通过这种最简单的自然语言直接描述,没有像啊, nano banana pro 的 那个版本的时候,我们当时记得还得去写这种 jason 格式的提示词结构 ai 模型,它才能够理解的非常准确。而这一次完全不需要了 对于自然语言的理解,因为这个 gemine 它结合了 gemine flash, 它所生成的对于自然语言的理解是非常到位的,所以我们通过直接打字的方式,没有任何结构,它就可以生成,很标准而且很统一,每一个元素 不会差别太大,对吧?各位同学来看一下所有的人物的脸,脸部的细节和信息其实都是可以保持高高度统一的效果。 ok, 我 们再来往下看,哎,这个相对来说有点意思啊,就是我让它去生成了一个 这种分享会或者叫做 ppt 的 形式吧,用的是乔布斯,并且呢里边的文案啊,用的也是中文,加了一个乔布斯名字的落款。 我就在想,那我上传一张我的图片,然后我让他把我的乔布斯的头像改成我的头像,并且最后的落款改成我的名字,行不行? 哎,没想到我用这种最简单打排话,然后让他去生成,完全是 ok 的, 完全可以做到,衣服也是完全统一了,哈哈,所以这种方式的话,我们后期的话,其实 ppt 都不需要人来做了,是吧?这个直接把需求给到 ai 就 可以了,主要来看一下, 也就是他官方文档说明里面对于中文生成中文理解,大家可以看一下这个墓碑前面前景的这个墓碑上面的一些中文字体和效果生成的笔画 啊,以及质感都是非常高精度的,对吧?他不会出现文字看不清看不懂的这种歪七扭八的情况。来看一下后边的这个排落,上面的这些中文也是完全可以看清的,也是一个毛笔字,也能够看清具体是什么文字。 所以这一次对于我整体来说, nintendo 二更新的模型最大的两点优势,第一个就是升升速度,第二个就是中文理解,它也符合了我们前段时间看到我前往期的一些视频,我之前有评测过一期 nintendo 呃, jimmy 三点一, 今年三点一的模型更新,这几个月以来谷歌的模型更新全部都是在呃小步快跑上面体验层上面的整整体的效果,所以这个其实对于我们很多来说,我们不需要太多的模型,大模型的更新它可以生成我已经知道了, 而我现在需要的其实就是生成完成的最后那一关,最后那一步生成完之后能不能直接拿来用?还是说生成完成以后,我还得再需要人工进行后期调整细节和调整调整生成结果,这样的话其实对于专业的设计师来说完全没问题。 但是呢,对于很多的小白用户或者说非专业人士来说,还得需要我人为去修改的话,是极其痛苦和困难的一件事情,这个就相当于我完全没有没有办法拿去用了。就比如说这张图片我生成完成以后,墓碑啊、背景啊、树啊都是 ok 的, 但是这里面的文字看不清, 那我文字其实对于整张图片来说比例就是非常的小,那我需要专业人士去改文字,并且加光影,加效果,加内阴影,但是对于非专业人士来说他改不了,那这张图片其实对于他们来说就是完全一张废图。 而这一次的谷歌 jimmy 三点一以及 nintendo 二的模型更新完全就解决了这一步,所以这个是我整体测试,花了大量几个小时测试下来,对于我整体的一个体感和感受。 ok, 那 么我们这一期视频就到这,我们下一期视频再见,各位同学,拜拜!

我服了,用 levato 加 nano banana 二刷图真的爽,一点都不心疼。我不是设计出身,每次写文章到配图环节就非常头疼,不会调参数,也没有设计师的审美直觉,所以每次我都是用一个笨办法,像拍照一样狂拍一堆调胶卷时代,一卷三十六张,每按一次都会心疼。 数码时代,现在一下拍二十张其实都不心疼的。 ai 生图也经历了这个过程,成本一变,我们的策略就跟着变。以前用 nano banana pro 出图,一张图几毛钱,速度又慢, 出了不满意的也只能说算了,就这张吧,不想再等了。现在 nano banana 二成本要涨,速度拉满。在 robot 里,我直接发给他一个提字词,他就生成了十张不同的设计风格变体,我只要去慢慢挑就好了。并且让我更爽的是 robot 的 画布机子, 十几张图全部在一个画面上,一屏全看完,不用一张张翻,直接看哪张好哪张差,眼睛一扫就知道便宜让我敢刷画布让我刷的很爽。我给大家对比一下,二,相当于是 pro 的 蒸馏版,蒸馏是什么意思呢?蒸馏是用大模型能力去训练一个更小的模型,让它跑得更快,成本更低,同时尽量保留效果, 所以 none of none 的 二会便宜很多,性价比直接拉满。根据我实际的体验家,网上那些评价它的文字效果居然比 pro 还要强,这是没有想到的。并且在纹身图测评里面它是第一, 清晰度上和 pro 略有差距,但大多数场景都是够用的,刷图就是要快和便宜,清晰度差一点点,感知倒是不大,而且 laot 前十,它的积分是无限用的, 练手完全就不花钱。很多人对我怎么做这样一个逻辑图很感兴趣,我跟大家说一下我是怎么去刷出来这张图的。首先第一步我会有一个内容, 文章的内容我会让 agent 去判断有哪些地方讲的不够清楚,可以画一些 a s c i 的 逻辑图,让大家方便理解。然后让 agent 批量导出这些逻辑图,放到 robot 里面,用 none 二做几十张变体去挑就好了。 下面我具体讲一下 a c i i 是 什么呢?我们可以看到这个就是 a c i, 它是由字母组成的图片形式, ai 是 能够直接用代码画出来的,它可以用箭头和方框把逻辑关系给表达清楚。 像一般的流程图、对比图、架构图,我们都是可以用这个先把它的框架定下来的,然后让 id 的 批量导出,批量导出我这里也提供了一份完整的提示词,大家可以去复制。复制了提示词以后呢,我们就可以把它批量丢给 robot, 在 这里选 nano banana 二模型,它就可以批量去制作了。 这里的这些图都是我让 nano banana 二批量出来的,非常的快,几分钟它就可以搞定几十张,而且还可以让它尝试多种风格, 风格还是很多变的。最近还有些小伙伴给我提供了一些更好的玩法,我们可以去网上复制下来一些风格的图片,让 agent 参考这个图片去进行设计,这就更方便了。 laot 比较好的一点,它还有中文改字的功能, 比如说我要改这个字,我可以直接点击这里的编辑文字,我们就能看到它,这里就会有一个列表,我们就能够直接改文字,改了以后直接点击这里的应用修改就可以了,改完以后风格也不会变,排版也不会崩。十几张图里面,我们直接交一张满意的用,省去了重跑的时间。 以前用 ai 生图,真的每张都要算着用,不敢多跑,不敢乱改,出了不满意也只能凑着用,现在反过来了, nonono 二,我不心疼,话不请示,让我放开了。挑出图这件事情,真的从我们原来的抽卡变成了刷图。 对于不是设计出身的而言,刷图可能是最快的解法,不用学 ps, 也不用找设计师,就是刷。

就在刚刚,谷歌重磅发布了最新版的 nano banana two, 作为当下最强大的生图模型,对比上一代的 nano banana pro, 新版本大幅提高了图像生成速度,并增强了光照效果以及纹理细节。 谷歌宣称,从现在开始,用户可以创建具有真实世界级精度的图像,这绝对是一个革命性的进步。同时,新版本的 nano banana two 还使用了网络实时搜索功能,大幅增强了图片的准确性,确保生成的图片符合真实世界逻辑。 而最为重要的更新则是文字处理部分,新版本的文字效果更加精确和美观,可以直接生成具有商业效果的邀请函以及海报,大幅提高了生产力。同时,配合新版本的发布, gemini 也更新了图像生成的模板功能,从此用户不再需要冥思苦想各种提示词,可以从官方模板直接开始创作新的图片, 工作效率大幅提升。目前,用户已经能通过 gemini 使用新版本的 nano banana two, 并可免费获得高级版本的图像生成功能。欢迎各位实测并在评论区给出您的反馈意见。

纳努克纳纳二冠胸更新,光影细节更真实,渲染更精致,原声支持四 k 高清指出多角色多道具一致性更强!继这次更新,我总结了四个实用商业案例,真正帮你提高生产力。 香蕉二模型在生成显示商业摄影,尤其是玻璃液体金属光以上,比以前更真实自然。在 lover 里,香蕉二模型可以零门槛使用无限生成,只用一句提示词,就生成了这张海报。琥珀液体透光自然,玻璃褶身精致平生,文字清晰可读。以往最头疼的文字模糊问题被解决,直接就是商业成品。 还能把琥珀液体换成绿色,玻璃瓶换成磨砂材质,再把背景换成北极光,所有修改都能在原有结构上精准完成。 三加二毛钱这次升级,文字渲染更精准复杂,构图的一致性也更稳定,做产品信息图特别实用,这是我用这句题之词一次指出的效果。这句锐利,排版工整,色彩和构图也很大牌,核心信息都在对的位置,需要改词点一下 logo 的 编辑文字页面文字能直接识别并精准替换,不用重新抽卡。 分镜最怕角色或场景风格不连贯。三加二在多角色多道具一致性上更稳定,一次生成整套分镜,即使五十多画面、四个角色以及箱子里十几种道具,也几乎统一在 love 无限画布里。快速预览和二次创作也更便捷。 love 一 次快速批量生成几十甚至上百张图的能力组合上,三加二模型更强的细节一致性,用来做 sku, 一定量延展减脂网展。比如 接一张图,生成三张不同颜色 u i 的 版本,再把同款手表放到办公室、运动、户外等不同场景,五张图一次完成,不同尺寸的社媒素材也能批量生成。相比 johnny lover 在 大规模创作上出图更快、成本更低,同时可控性也更高。

nano banana 二更新了新模型,深图效果真的很强!一条视频看懂 nano banana 二的八个新玩法,建议先收藏,案例和提示词都整理好了,视频结尾可以领取。一、一句话生成游戏 ui 只需要一句提示词,就能直接生成完整的游戏 ui 界面,多种风格都可以生成,布局和视觉风格也很到位。二、草稿图生成 ui 界面这是我随手画的抽象草图,发给 nano banana 二,它可以直接还原出一个完整的网页界面, 还可以一键换设计风格。三、多主体一致性把这组不同角色的图发给 nano banana 二,让它生成一张包含全部角色并且有剧情的图片。合成后的图片,每个角色特征和风格都和原图保持一致。目前在一个工作流里,可以保持五个角色的特征一致 和十四个对象的高保真度稳定输出。四、产品图直出视觉设计方案给 nano banana 二发一张产品图,它可以直接生成一整套视觉设计方案, logo、 标准色、产品延展都可以直接生成,非常强。 五、一句话生成科普信息图让他做一张水循环信息图 nano banana 二生成的图片信息更准确,逻辑结构也更清晰合理。六、一次输出多张连环画 输入提示词,可以让 nano banana 二一次生成多达二十张漫画,画风统一,故事连贯,几乎不用再调。七、地图截图变卡通全景图随便截一张地图, 它可以直接生成一张卡通风格的全景图,空间结构都对得上。八、一句话复现城市场景只用一句提示词就可以还原一九七零年代的贝尔法斯特街景年代氛围,非常准确。 视频里的案例和提示词已经整理好了,有需要的朋友可以扣 n b 二领取。以上就是本期全部内容,我们下期见。

谷歌最新的模型 number 不 number 二发布了,新的模型,无论在生成速度,价格、中文理解能力方面都有提升,我们来测试一下,只需要来到真魅力官网,或者使用 google 的 ai 实验室,也或者连接国内中转的 a p i 都能够使用这个最新的模型。在这里来到真魅力的官网, 在下方呢,可以选择制作图片单机,然后在这里呢可以选择图片的风格,可以直接锁定当前的画面风格,能够保持画面的一致性,你会发现它会有多种风格能够提供给大家进行选择,比如说在这里我们选择一个电影的效果单机,然后在这里呢可以选择 添加图片啊,或者是直接输入提示词,让当前的 ai 根据当前的画面风格来生成我们想要的内容,比如说在这里输入提示词语。夜的城市天桥上,一个穿着黑色风衣的有气质的中年男人独自站在路灯下,然后雨水呢打湿他的头发和肩膀。 那么在这里呢,可以将画面的比例设置为常见的电影比例二十一 b 九,我们单机提交按钮,在这里呢,它就会调用最新的 n n b n 二的模型,我们来看一下当前的生成效果吧, 可以单机进行放大,可以预览一下当前的图片效果,大家感觉怎么样呢?那么整体的画面质量还是比较不错的,那么这个时候呢,我们可以将它在上方进行下载完整的图片,这个时候大家就可以放在一些 ai 视频工具里面呢, 将当前的人物生成视频,当然如果大家对当前的图片不太满意,可以选择重做来进行重新尝试一遍,我来简单的看一下当前的效果, 大家可以看一下当前重做之后的画面效果,感觉还是比之前那那不那那一要生成效果更加的真实。然后还有一个最常用的就是上传图片来进行参考,重新开启一个新的对话,在这里选择制作图片,上传当前的图片,输入提示词,参考当前图片。 女生开了一辆敞篷跑车,身后是上海的东方明珠,画面的比例呢是十六比九。单机提交按钮来看一下效果,它会自动调用 banana, banana 二的模型,我们预览一下它的效果, 我们打开看一下,大家觉得这个当前的人物的一致性以及服装的一致性,还有整个背景的生成,大家感觉怎么样呢?当然如果你有其他的一些喜好,比如说我们将当前的背景呢生成为白天, 在这里呢可以修改贴纸词,直接进行描述白天场景阳光明媚,淡季更新,他会重新根据当前的贴纸词来生成出想要的画面效果。哇,大家觉得怎么样呢?这张图片觉得好看的可以扣个一啊,但是啊会有一些 bug, 嗯,这个门是开的,那么这个时候遇见这些问题呢,解决方法,要么重做,要么大家可以把它直接拖进 ps 里面进行 修掉。但是整个的画面的啊,质量呢以及质感是整体不错的,而且整个的你看车,这个车他是不是逆行, 对不对?然后在这里啊可以选择重做来看一下当前的效果,可以看到整体的画面质量呢,是要比之前的第一代,它的画面效果会更好,但是呢还是需要我们进行反复的抽卡来得到我们想要的画面, 当然也可以去不断地去优化当前的提示词,来得到我们想要的画面效果。那么接下来呢,我们来再测试一下当前常见的人物的三式图。那么比如说我们在制作一些 ai 影视或者是 ai 动画以及 ai 广告呢, 他需要我们去保持人物的一致性,或者是场景的一致性,这个时候呢就需要生成人物的三十图,在这里呢上传人物的三十图,输入提示词,生成当前人物的三十图,人物的全身像,然后背景为纯白色图片比例呢为十六比九啊,生成正面,侧面和背面。点击提交, 我们重新试一下当前的画面效果,这个时候单机放大一下,来看一下当前的画面效果,整体的质量还不错啊,因为给他的只是一个这个中近景,但是呢他帮我们生成了其他的一些画面,包括人物的手部啊,以及手部视频啊,包括脚步啊等等, 包括一致性方面,他做的也还是不错啊,但是呢整个的这个侧面他还是需要我们再次生成的啊,因为脚没有漏出来,这个时候可以单机重做来重新尝试一下。 大家可以看到当前重新制作之后的整体画面效果是非常 ok 的, 所以说目前他的整体的效果还是有一点点的不稳定性的存在, 所以说有一些自己满意的图片,并不是模型的能力本身不行,它需要我们进行反复的抽卡,反复的尝试,反复的调教进行使用的,当然 none none 二呢,它每一天都有一些免费的额度,接下来呢,它需要进行收费的,那么整体来说呢, 它的画面的生成质量是完全 ok 的, 但是如果你大量的去制作像 ai 广告啊, ai 影视啊,以及 ai 漫剧啊,我还是推荐大家使用国内模型 这个 none none 的 二呢,我们可以作为 ai 辅助的工具,比如说有些三式图我用其他软件生成的不太理想,我们可以直接使用 none none 的 二来生成出我们满意的图片之后,再拖进其他的 ai 工具里面,将当前的图片生成满意的图片或者是视频等等, 进行多个 ai 工具协同使用。那么接下来我们再次去进行参考一张图片来看一下当前的 banana 二的想象力,那么在这里呢,选择上传文件还是选择当前图片,给他一个具有想象力的场景,就是贴纸比较简单,就是女生手持宝剑,然后再与怪物进行决斗, 然后画面的比例就用常见的横幅比例啊,十六比九,点击提交,来预览一下当前的 number 二,他的想象力会帮助我们生成什么样的图片呢?来看一下。哇,这个感觉还不错啊,就整体的画面挺惊艳的,可以看到当前的他的整个的画面的感觉,情绪可以太看这里,他的身上有一些 擦伤等等啊,整体的画面质量还是比较不错的啊,这个时候可以将它进行下载下来,然后将它生成视频即可。当然如果对当前的画面还是不太满意啊,选择重做,反复的抽卡,抽多张,然后进行下载,这个呢就是 nonbanban 二的整个的画面的效果, 可以看到在一的基础上呢,它增加了一些画面的细节以及纹理等等,整体的画面的质量比之前要高了很多, 但受限于每天给大家提供一些免费的额度,大家可以根据自己想要的画面来简单的去测试一下。这个就是 nana banana 二的内容,来看一下 nana banana 二他的描述中文文字的能力怎么样? 在这里呢丢给他一个提示词,然后这里描述的是这个中文海报的一个画面,单机提交看一下效果,大家可以看到整体效果怎么样呢? 还是不错的哈,对于中文的这个文字的这个识别,它是有非常大的提升,可以看到整体的文字内容以及整体的画面是非常的不错的,当然也可以呢继续进行重做来不断的去抽卡我们满意的画面内容,可以看到 它的中文的能力的识别,整体还是不错的,你看像周围的啊,虽然有些文字啊,会有一些小小的一些文字类的问题呢,但是整体来说影响是不大的, 我们主要的文字的标题生成的还是不错的。所以说当前的 nonbanban 二呢,相比于第一代,它在升图的速度方面快了好多,同时呢在中文的文字的生成方面也优化了好多,整体的画面质量,画面风格都比上一代要好了很多, 因为他每天都有一些免费的额度,可以拿着自己喜欢的图片,喜欢的提示词来进行尝试一下。 nonono 二他给我们生成的图片效果 ok, 还有其他的 ai 问题都可以发在评论区。我看到呢,都会进行给大家回复的。我是崔老师,我们下期视频见。

兰蔻 pro 二发布了,那么今天我们用官方的三个演示案例,看看它的真实效果到底怎么样。第一个案例是叫 windows, 它模拟是坐在窗边看真实的风景, 我这边用广州塔去做测试,我们可以看到它真的把广州塔的这个结构特征做出来了。而且今天广州是阴天多云, 我们可以看到它的氛围跟光线的灰度也基本是对得上的。这里就可以看得出纳德布纳二的这个核心能力,第一个就是世界的理解能力,第二个就是这个环境和真实观影的深层能力。 第二个演示的 demo 呢,就是这个 gopro kit driver, 它可以帮助我们生成不同国家版本的这个视觉物料。我上传了一张自己知识部的这个海报,我们可以看到它整体的这个字体的清晰度和白板结构,还有语言这个适配度也是非常稳定的,不同国家的地区风格视觉都有非常好的一个一致性。 那么对于我们做这些品牌本地跨境游的人呢,其实非常实用的。第三个呢,我觉得也挺有意思的,他就叫做宠物旅行,上传一张宠物的照片呢,可以带着我们的宠物去不同国家去旅行。这里主要测试的就是角色的一致性,还有跨场景的迁移能力。 我们会发现不管这一个背景怎么变,但整个宠物的体型、毛色还有这个特征呢,就是保持的非常一致的。总的来说,兰博兰达这一代呢,在真实感、文字深沉还有角色这个一致性上面呢,都有明显的加强。我建议大家可以去官方的 demo 里面去玩一下。好的,我们这一期的视频就到这里,我们下期再见。

banana banana 二终于来了,你现在可以用它一键生成分解动画平面图,秒变商拍视频,一句话指出精美手账,甚至丢个坐标就能还原城市的历史变迁过程, 别再把它当成一个只会画画的工具。这次更新,他完全变身成了一个全能打工人。打开 laot, 选择 nano 二模型,这个工具完美补齐了 nano banana 重复抽卡和不能修改的短板,还能像在 ps 里一样点哪改哪。 比如给他一张参考图,先生成二十多张美食分解图,点一下选中底部的美食,就能马上生成俯视视角的单张图片。 点击视频生成器,分别选择两张首尾帧,一个丝滑的美食分解视频就做完了。纳诺尔这次升级引入了逻辑成功模式,他不再是简单的像素堆砌,而是先理解你的意图,再进行脑内建模。比如来给他加个难度,让他标注这个手表分解后的详细参数,信息呈现的非常准确。 他可以上传一张美食图,让他帮你计算卡路里,或者让他画一张咖啡制作的全流程图。还有这种大神级别的科研绘图,这个生产力简直是对人工手搓的降维打击。 但最让我感到恐怖的还是 nano 二进入了全球实时数据,直接开了一个上帝视角。这里我只给了一个上海外滩的坐标, 它不仅能还原一百年来不同年代的风格差异,甚至连建筑的老化程度、周围街景的变化都做了合理推演。再随便截图几个网红店铺丢给他,就能一件生成这样的精美手账。他还贴心标注上了每家店铺的招牌菜,或者给他一句话,就能直接生成四月份日本赏樱的旅游攻略。 这次还有一个炸裂的更新, number 二可以支持最多五个角色和十四个物品的一致性锁定。这也就意味着,现在一个人就是一整个制作团队。 在喇叭特里一口气框住这十几张图,让 number 二把他们放到同一个场景里。不仅融入的非常和谐,人物角色物品的一致性也都稳稳在线,还可以生成连贯的长篇漫画。 所以以后你只要写好剧本,纳诺尔就能稳稳的帮你把它们画出来。或者像这样给产品一键生成多场景多风格的商拍图,连样品都不用寄,直接在喇叭特里暴力产出全套素材。以前我们聊 ai, 总是在担心它会不会取代人类, 但是看完今天的纳诺尔测评,你会发现它其实是在解放我们的生产力。技术的发展是没有尽头的,但是你的效率可以现在就发生质变。

现在的 ai 生图已经能够生成这样的图片了, 前几天刚送走一个二字背的超强模型,现在人家已经是各种限制了, 足以证明其能力之强。而这次的 banana 二点零我是很期待了,试了一下,图片质量一如既往的优秀点好,关注我们直接来看看这个香蕉,它又强了吗? 那怎么用二点零点开杰姆奶,再点击这个制作图片就能使用了。这次二点零升级后,直接就被时装到大部分谷歌相关应用中。看看老大哥, pro 现在得等人家生完才能再使用它了。 二点零最强的点无非就是他更会搜了 pro 版本,他只能搜索出文字信息,而二点零他能够识别网上图片了,像是这几天治疗低血压的生化危机九,嗯,我是一点都不敢玩这种恐怖游戏哈,只能点开图片来看看。 这里我就让二点零和 pro 生成了生化危机九的实际画面,这个 pro 给我整去刺客信条去了 啊。而二点零这个马虽然有待加强,但是你看人物的发型啊,身材和气质,这些都非常符合李昂的感觉。 点开他们的思考过程,可以看到像是 pro, 它就是全屏,感觉这里应该是什么氛围,或者直接幻想出新主角新场景,只能说不当编剧真是屈才了。 而二点零如果他并不了解这是什么,就会先去搜索网上相关图片,然后根据网上信息进行生图,再将图片和网上素材进行拟合,相似了才会输出出来。只不过这个图片质量嘛,生图模型进步空间还是很大的。 可以说二点零他的实时信息能力以及图片细节能力变得更强了,而第二点就是文字能力的增强,这次终于没有那么多鬼画符了, 我让他生成一个 banana banana 二的苹果风格宣传图,当当怎么样?这个文字表现在各个文字的细节处,也没有出现胡乱添加笔画的现象。看看 pro, 还在思考,香蕉是什么全新的手机品牌,什么超大电池,什么欧莱的屏都给我了,国外版豆包手机是吧? 甚至官方还直接出了一个应用,展现二点零的文字功底啊!就是这个,只要你上传一张图片,然后选择相应的国家什么的,就能一键升出各个文字版本的宣传图。有没有懂日语的小伙伴,看看这个对不对? 不过你别说,飞驰人生是真好看吧?哎,官方还出了另一个 app, 足不出户就能让我家饭饱出门旅行, 什么长城、巴黎铁塔、大本钟、富士山,也是圆了猫猫环球世界的梦想了。而这也是二点零超级强的一点,主体一致性超强,各位小伙伴家里如果有小宠物的话,也可以让他出门旅游啦。 以上这三点能力,就是我用下来感觉变化比较明显的,有了图像搜索能力,针对于具体事物的生成会有更加不错的效果。并且现在二点零的价格还进一步降低,仅仅只有 pro 的 二分之一,而画面还支持更多种比例了,可以说是创作者们的福音了。那这根香蕉强了吗? 嗯,如墙。总的来说呢,这一次 none of none 的 二点零图片质量并没有显著上升, ai 乱造的现象也依旧存在,并且还需要更加详尽的描述词才能够生成非常优质的图片。 可以说没有前几天 cds 二点零所带来的新一代视频生存模型那么震撼,甚至我愿意称它为 nano banana flash 更多一点。一个大版本的迭代并没有引发更大的技术变更,让人不得不怀疑,嗯,是不是江郎才尽了? 可能这次的小升级是二 pro 的 铺垫,毕竟要对最强 ai 抱有信心。好了,以上就是本期视频的全部内容了,喜欢这期视频不妨给我点一个关注和大大的赞,这对我来说非常重要。那么我们下次再聊点好玩的,拜拜!

就在刚刚,谷歌发布了新的 ai 生图模型 nano banana 二,大杯的画质,白菜的价格,网友直呼太强大!我们来感受下都更新了哪些内容。 一、实时的世界知识 nano banana 二、退出 windows 功能,全面接入 gemini 的 知识库和实时网络搜索,结合全球实景与实时天气数据,生成逼真击窗景致,每一帧皆贴合真实地利气象。 二、更强的编辑能力,故事趣事感大幅提升。三个毛茸茸的小伙伴一起建树屋的故事被拆成了六个章节,整个故事惊险刺激,情节跌宕起伏,以一个欢乐的时刻收尾, 全程角色统一不走形,这对需要做连续续世的创作者来说,简直是福音。三、世界级推演能力 自 nano banana 出世后,全世界人们累计生图超十亿张。谷歌 deepmind 通过分为编码首搓了一个 demo, 展示了其对现实世界的强大理解力,单真脑补后续场景连贯性简直强到离谱。 四、精准的文本渲染, ai 生图写字乱码的老问题,在 nano 二彻底优化可置翻广告素材,多语言来适配目标市场。今天的教程就到这,我是跑跑,最后祝各位玩的愉快!

就在昨晚,谷歌娇咪咪的上线了他们的生图模型纳洛普纳纳二,那官方描述显示是他们拥有了最先进的头像创建和编辑技术,具有专业的功能和闪电般的速度。那我也是第一时间在他们的官网去找到了他们这一块的一个具体介绍, 那通过具体介绍,总共其实就有一个三大方向的一个更新的一个点。第一个说是他们的生图速度更快了,能够让更多的用户去 卷取到这个 gemini 的 一个知识库,并且利用这个网络和这个图像生成模型给到的这个信息会更加的准确。那第二一个就说是可控制性和包括说输出的图片的质量比变高了,相比较于之前的五幺二, 这个 ps 像素升级到了可以四 k 高宽的这个分辨率,让人可以提出更多的这样一个分辨率的一个素材。第三一个整体这次的升级要比之前要便宜一点,这次可能生成一张图片大概是零点 五毛钱人民币,之前可能是零点七五人民币这样一个情况,那基本上大的也再没什么大的更新,那我也实际上去体验了他们 nasa 二的这个深度模型的实际的给我这种体验感感受,这里我就不放我具体的这个 体验案例了,我觉得他跟比于之前的这个升级并没有太大的升级,因为就只是有点像是挤牙膏这样的一个升级, 如果说你感兴趣,你可以自己去这个展馆的官网,你就直接去调取纳多布纳纳的这个深度模型就可以自己去使用,其他的再没有什么大的升级地方,相比于去年的纳多布纳纳的 这个深度模型出来之后,我觉得可能是没有什么太多东西可以挤,只能是说是先去提升速度和提升的图片质量。对,以上是我对纳多布纳纳二的一个升级后的一个体验感受。这里是密码小亮,我是詹瑞。那我们下期视频再见。