北极生存一个月获得十个亿,你会选择哪一个?
粉丝2223获赞7.4万

减少一年寿命,换取一个超能力,你会选哪一个?第一个,下金蛋的母鸡。第二个,瞬移。第三个,控制白天黑夜。 第四个,制造三个分身。 第五个,指定一个人永远爱你,我喜欢你很久了,请和我交往吧!第六个,超强记忆。 第七个,飞行, 第八个,时间暂停。

上班我有五种事不干,会干的事我不干。没毛病,学不到东西。我大哥干,他干啥呀?对,不会干的事我也不干。那更对了,不会干的事我大哥怎么干?还有一个着急的事我也不干。那玩意。那着急就容易出错。 对,不着急的事我更不干了。那我大哥都不着急,凭什么让我大哥干?最后一个我不想干的事我不干,不干。我大哥不想干咱就不干。对,你没听说过打工人四错之言吗? 那,那你听好了,咱们打工人讲究的就是大哥。你这样,你教教他,多做多错,少做少错,不做不错不错不错,哈哈哈。



ai 模型各有所长,没有哪一个能包打天下。如果你在做一件比较重要的事,把同一个问题扔给三个模型,往往能得到更全面的参考,而不是被单一模型的带偏。 今天分享一个可以同时对比所有最新的顶级 ai 模型的网站。谋理里面不但包含了最新的 ai 模型,而且好玩的是它有三种模式,战斗模式,选两个模型同时回答同一个问题,答案左右对照展示, 适合那种知道自己的问题但不确定哪个模型回答的更好的场景。并排模式,你可以手动选择三个大模型进行对比回答。直接聊天模式,选择一个大模型进行常规的对话。除了语言,大模型里面还有很多好用的图片类大模型,重点是国内就能访问,非常给力。

拥有这三个工具,彻底征服 ai, 我 原称之为 ai 时代最伟大发明,第一个发现 ai, 有 了这个网站,就等于拥有了所有 ai 工具的入口,聚合超一万款工具, 覆盖二十家领域,想找啥直接搜热门工具还配好了提示词教学,对新手小白真的不要太友好。 二个说德 ai, 这是一个边拍演讲全能的 ai 火爆工具,其中内置了数字人功能,简单说就是可以用数字人模特来生成各种宣发视频、培训课、广告片等等,省去了拍摄剪辑的麻烦。 更神奇的是,它还可以定制自己的数字人,声音和外貌都完全克隆一本像,从今以后可以二十四小时替你出镜拍视频。第三个 pro palette, 这个是字节旗下的提示词优化工具,可以说就是提示词的黄埔军校,你只管说人话,这个网站就能直接自动转化为专业提示词, ai 使用效率直接提升。这三款工具你用过几个?用过一个的扣二,我看看谁是隐藏大佬,觉得有用记得收藏,别想用的时候翻不到。

作为设计博主,我用过的 ai 工具少数有几十种了,大家都问到底哪个更好用,我用了一天之后发现其实没有哪个工具是所谓的全能型选手,每个工具都有自己特别擅长的一款,所以我今天不做那种哪个吊打哪个的测评,我就直接分享一下我现在真实在用的 ai 设计工具流。现在风很大的某风我会用来做全案,因为它的大画布挺好用的, 调布局做延展,看整体风格就很直观。不过它有一个小问题,就是模板库比较单一,而且比较适合口令型图图。 如果给他为素材图,让他给你出类似的成品图,其实效果不太好,最好是给他一个明确的操作指令,就比如说告诉他图二的什么东西替换到图一里,这种是可以的。但如果要为素材图比较好用的,我觉得是那个类图,一 句话出进去,再为几张图能举一反三,给你四张还不错的成品图。如果遇到那种既要设计图又要建模又要出视频的,我会用 love 二,它主要是建模视频和设计图能够一起出,只要提供你想要的风格就可以。 还有一个最近我在用的工具还挺有意思的,叫 seed ai, 它跟很多 ai 设计工具不太一样的地方是,它真的很适合坐长途。如果你坐过长途就会知道,长途其实挺麻烦的,因为排版要连续,文字内容很多, 视觉还要统一。但 seed 的 逻辑比较像是按长途结构去生成整版的内容,自动排版,自动分页,自动匹配视觉层级, 能做到文字不少,风格也统一。很多 ai 工具其实都是偏单张图生成,但是它可以一次性生成很多张,所以我会选择用 seed。 如果你平时做长图排版、 文字信息型海报、多页的红薯图纹,不如交给 seed 的 来做会比较顺手,你甚至还可以用它来做 ppt 和智力。如果我要做动态海报或者特效视频,我会比较常用,列不列,给他喂几张图,他能很好理解你想要的效果,几分钟就能做一个动态版本,而且还自带音乐。所以我平时做简单的动态海报其实还挺经常用的。 特效视频里也有很多的模板,现在 cds 出来了,很多软件里都有,但是给的案例太少了。但我如果用 livelive 里面的特效视频,它已经有很多势力了。还有一类工具,我其实用的不少,但不一定是拿来做设计的。比如某库,它其实就属于那种设计师社群型的平台, 这种平台对我来说的价值其实是看别人怎么用 ai 获取设计的建议和反馈,看一些案例或者是跟其他设计师交流。所以现在如果有人问我 ai 工具到底用哪一个,我反而会说,不要,只选一个,不同工具,负责不同的阶段,这样搭配起来效率其实会高很多。我还整理了干货资料,有需要的话欢迎在底下一起交流。

最近几个月 ai 绘画领域可太热闹了,谷歌的 banana pro 才登上华为没多久,这周阿里和字节也都纷纷发货,字节拿出了 c 俊五点零模型,阿里则寄出 image 二点零模型,再加上老牌的绘画厂商 mini jennie, 以及号称什么都能画的 groot, 现在 ai 绘画工具的选择多到让人头疼。那为了帮大家省钱,今天这个视频我们做一期 ai 绘画测评,看看现阶段咱们普通用户面对不同的绘画需求,到底应该选哪款产品。那本次参赛的选手分别是 nasa pro、 腾讯的混元三点零,阿里的 emoji 二点零、 mini 九九 v 七可林以及马斯克的 group。 说个题外话,本来想把自己刚发的 cg 五点零模型一起测试的,但是很遗憾,截止到视频录制的时间底,我的账号还没有开通权限, 如果拿他们的旧模型直接来参赛,感觉有点不公平。所以这一次视频的测试暂时不参加了。但是视频结果我会附上我的测试文档,里面有所有的提示词和案例,等我的账号全开通了以后,我会把新的跑图结果贴进去,供大家自行参考。那点赞收藏好,我们的测评正式开始。 第一关,我们先来个简单点的,让 ai 画一个人像,看看二零二六年的今天, ai 画人物的水平到底进化到什么程度了。我们让所有的 ai 都跑这一套提示词 好,直接看结果。首先是没得诀,你 mga 画出来的人整体的服装和背景都是对的,但是他没有按照我们要求的姿势来,然后在裤子上面也少了 logo 的 细节, 人物的质感还是有一点不自然,感觉脸上有点油。美女兄弟,这一题给个三分吧。然后是腾讯的混元三点零,整体的细节都对,然后手机上面稍微有点小瑕疵,还有人物看起来没有那么真实,有点像游戏里面的剑魔。三分, 下一个选手是阿里刚刚发的 emoji 二点零提示词,里面要求的所有细节都有造型,姿势,服装,包括裤子上的 logo 都是对的,人物的真实程度也不错,真实感上我觉得比前两个要好,这个给四分吧。 接下来是 banana pro, 讲实话,这张图一出,我觉得直接比赛结束了,细节都对,并且他的裤子上面的字还非常贴心的给做了一个镜像,太真实了啊。我就问你,你要在网上刷到这张图的话,能分辨出来这是 ai 做的吗? 直接五分,然后下一位可林这个服装不对啊,裤子上面缺少了 logo 的 细节,然后人脸看起来不够自然,有种把美颜里边的磨皮效果拉满的感觉。三分吧 group, 裤子上面的文字也是做了镜像,整体还不错,我觉得能第二档给个四分。所以第一题测完,总体的得分情况如下, ok, 那 画完了假人,接下来让 ai 画一个真实存在的人物试试,因为啊,每个 ai 画的假人,他长得都不一样,你没有办法判断他还原的像不像,但真实存在的名人是很容易认出来的。所以我们用这一套提示词,让成龙大哥当模特。 首先什么的,杰尼这个紧身还有衣服的质感都不错,但是人物画的完全不像,这是重庆生成的一个人物,给个三分, 然后二号选手,腾讯。这张图细节倒是都有质感吧,就明显不如 m j 画的,并且人也不像。两分吧,不能再多了。三号选手 emg, 二点零画的非常真实啊,大胡子,破旧的皮夹克,你看他这个胳膊上还专门有一个补丁,这些细节都很到位,人一眼都能认出来是谁。 五分,下一位。 banana pro 的 效果依然非常顶啊,尤其你看这个背景,还做了个虚化的效果,画面的层次感一下子就出来了,人物也是完美还原,你也能认出来的是谁?五分, 再下一位,可龄化的,我们看一眼。光影还不错,但是服装跟表情的细节没有前几个到位。人物吧,你不能说不像,但也不算太像。三分吧, 最后 groot 这个画的就太难受了,整个画面看起来有种浓浓的油腻感,怎么都二零二六年了,还画出这种水平啊。一分吧,不能再多了。好,所以这一题我们的总评分如下, 画完了人物,接下来测一道画物品呢,我们输入这一套提示词,直接看结果。媒体君利在这一题终于算找回了场子啊。光影效果,包括你看这个丝绸的质感,都是 t 零级别的存在,但是阳光的效果它没有完全表现出来,算是有一点点小遗憾。给个四分, 下一位选手,腾讯混元。这张图咋说呢,空气中的尘埃倒是有,丝绸的质感也没有问题,但这张图最大的问题就是他把阳光化成了强光手电的效果,有点搞笑。三分,好,下一个选手,这个效果也非常棒啊,杯子的光影包括丝绸的质感都是没得说,还有空气中的这个灰尘,效果, 五分。 blender pro 在 这一题的表现整体也不错,但是在阳光上面的细节处理没有前一位好,这题给个四分。下一位可琳,这个就有点花里胡哨,没有意义的闪光两分。最后是 groot, 这个阳光的效果有点抽象啊,其他的倒还好,给个三分吧。 ok, 所以 这一题我们的总评分如下,接下来是本次测评的重头戏,文字生成。我们在日常工作中,绝大多数的打工人真实的做图需求一定是要在图上加文字的。我们先让 ai 做一个黑板字看看效果,我们输入这套提示词。 这题的难点主要在于混合双打画面里面既要有中文,又要有数学公式。首先怎么样?就你说实话, mj 写字一直都不行,感觉把它加入到这个文字测试里面有点欺负人,给一分吧,不能再多了。 第二位是腾讯的会员,黑板背景什么都是按要求来的,但是他的内容上有部分错误,整体给个三分。 下一位因为就二点零这个模型画的粉笔灰的效果非常逼真啊。唯一有一点小瑕疵就是这个 k 大 于五,这里缺失了数字五,但整体的内容跟质感上都非常好,四分。 banana pro 这一题表现也非常棒啊,文字的准确性上没有任何问题,但小瑕疵是他的粉笔字的质感没有上一个选手好,给四分吧。 可林这个基本的框架是有的,但是内容错误,然后背景也不对,我们要在黑板上写粉笔字,但他这个做的更像是一个海报,不按照我们提示词来。两分吧,不能再多了。 最后是 group, 内容框架是有的,然后背景也是黑板,有粉笔印,但是文字有错误,给个三分。那这一题综合评分不下。 测完了黑板报,我们来上点强度啊,做一个复杂的信息卡片。这道题我们光提示词就有这么长, 他不光要考察模型的理解能力,还要看深层内容的准确性和美观度。首先第一位选手,美女觉得你这个配色乍一看还挺好的, 但是你要细看的话,他的文字还有语音理解实在是没眼看,他就不擅长处理这种内容,一分吧,不能再多了。下一位选手,腾讯会员。这个布局上是按照我们要求来的, 提示词要求的三大视觉区域都有,视觉中心是一个大尺寸的流油果,然后下面是九大模块,但是它具体每个模块的细节就不太行,只放了几个看不懂的小图,给三分吧。 下一位,阿里这个模型写文字的效果实在太稳了,排版是完全按照要求来的,详情的内容也都是准确的,非常好。五分。 普拉达 pro 的 质量也是没得说,所有的板块都有,并且他这个 u i 我 感觉会比阿里家的那个要更加丰富好看一点也是五分。可林的语义理解还不错,我要求的内容起码是都有的,但是文字的准确性上还需要加强。三分。 最后 groot 画了图,这个整体布局也不错,但是内容写的是纯英文,而且他哪怕纯英文的内容也乱码两分吧,所以这道题总得分如下, 下一题我们继续上难度啊,通常用 ai 画一张图,哪怕画错一点细节都很正常,但这一次我们要求所有的 ai 在 四乘四的格子里面画出十六个连续的分镜。看看这种难题大家的表现情况怎么样。 首先一号选手梅哲里的这一题表现比我预期要好一点,虽然他的文字能力依旧不行。然后格子数量上我们要求是十六个,他只给了八个,但是画风不错,排版也很 ok, 这题给他两分。 然后下一位选手,混元的画风不错,内容上面画了十一个格子,字幕生成的还行,没有明显的错误,给三分。 阿里的 image 二点零画风没有毛病,是宫崎骏。格子的数量是我们要求的四乘四画的,然后每一个分镜我们要求的文字都有,并且字没有错误,很棒,四分。 下一个选手, banana pro。 这张图的画风我觉得要更加宫崎骏一点,并且它的细节会比 emg 二点零要多。左上角标记了不同分镜的分镜号,这个我能给五分。 下一题是可林啊,可林这位选手在生成的过程中出了点小意外,因为我们的提示是太长了,所以说他会有提示,超出长度的部分不会响应, 那说明他能接受的题时的长度比较短。不过可林的画风是没有问题的。格子数量上一共给出了十个格子,然后文字的准确性稍微有待加强,这道题给两分。最后是 group, 它的画风没有问题,然后内容量上有十二个格子,缺点是字幕不是中文的,给两分吧。 所以这一道题总得分如下。最后一个环节,我们来测测图片编辑的能力,真正的生产的工具一定是可控的。我们先来测一道简单的题啊,把画面上这张图左手的手机画成一个瓶盖打开的矿泉水,看看大家表现怎么样。 一号选手 miss johnny, 这个成功了,物体的一致性保持的不错,但是他左右手的顺序搞反了,并且背景和手的姿势也不对,勉强给两分吧。下一位混元的表现很不错啊,整体的细节都对,他还专门把打开的瓶盖挂在旁边了,呵呵,可以 五分。然后 ipad 二点零跟 banana pro 任务完成的都很好,挑不出毛病都能五分。可琳在这一题上表现的就很激烈,生成了一个这么个玩意儿,我感觉跟它们的功能设计有关,在图片编辑上,可琳家使用起来就没有其他家那么方便。 banana pro 还有 groot quan 都是直接对话框里面粘贴照片,写提示词即可。但可零,你要想编辑图片,你得选不同的功能,比如这个单图参考还是多图参考模式,这就很麻烦,这一题画的也不对,零分。最后是 groot 矿泉水瓶子稍微有一点模糊,不过也不算毛病,完成任务五分。所以这道题总体的评分情况如下。 最后我们再来测一道双图参考题,上传一张我的照片跟一张老马的照片,让图一的男人跟图二的男人在火箭发射基地合影, 一起来看看效果。一号选手梅德军尼,他因为涉及到了真人名人,所以没办法生成这道题,他不参赛。二号选手,毁原,这一题我觉得表现的很好,我跟马斯克的脸都还原的不错,给五分。 英美九二点零跟马斯克还原的还挺像,甚至换了一身 nasa 的 衣服,很细节,但是我脸部的相似度我觉得没有混元高,整体算还行的水平,给四分。 fenty pro 也是我的人脸没有还原的很好,但老马的表现还是不错的,看来大家都是认识马斯克的,也是给四分。 可林这一题不光我不像,马斯克的相似度也没有前面两个那么高,给三分吧。最后, group 不 愧是马斯克的 ai, 他 真的就只管自己的老板,咋给我化成了个外国人呢?一分不能再多了。所以这道题总评分不下, 所有题目都测完了,总得分不下。总结一下,首先 banana pro 依旧是目前的王者,测试下来除了个别小瑕疵以外,几乎没有短板,是当之无愧的六边形战士。但是啊,使用起来稍微有一点点门槛。 首先你要懂得如何科学上网,并且免费的账号每天的额度并不多,你要充会员才有好的体验,比较适合专业的玩家。那阿里新发的一枚 g 二点零模型,能力已经不输不难的 pro, 尤其是在写汉字做海报这种生产力场景上,表现极其惊艳。 如果你懒得折腾网络,然后又想要好的效果的话,国产模型里面一枚机二点零是首选。再看腾讯混元三点零,它的表现可以说中规中矩,整体还不错,但个别场景仍需要打磨,目前可以排在第二梯队。最后,我们要聊一聊这个赛道,曾经的神 mini 杰瑞尼, 如果你单看光影和画面质感,他目前仍然是 t 零级别的艺术家,但遗憾的是啊,在过去的两年里,他几乎有点停滞不前了,很多场景跟功能都不支持,以至于他被后来者们超越,希望他能继续努力。 那至于可林和 groot 呢?目前站在生产力工具的这个角度来说,他们距离可用差距还挺大。不过 groot 最出名的倒也不是搞生产力,你懂的。 那最后我想说,工具其实不分好坏,只要能满足你当下需求,他就是最好的工具。那视频里面所用到的所有提示词和整理型的手册,大家别忘了给我点赞加关注,我是山河,我们下期见!

大家好,现在市面上的 ai 生图和 ai 生视频模型越来越多,很多人最头疼的不是不会用,而是根本不知道该选哪一个。有的模型效果强,但国内不方便用。有的模型门槛低,但出图和出视频质量又不稳定,所以本期视频我直接帮你测一遍。 因为考虑到部分模型在国内使用不方便,这次我会把测试分成国内和国际两部分,我会用同一组提示词分别测试这些主流模型的深图和深视频效果,最后帮你筛选出到底谁更强,谁更稳,谁更适合普通人。那么废话不多说,我们直接开始 参与。本次测试的模型有极梦 c dream、 万象可零、三千万、 image、 flux、 nano banana、 gpt image。 其实本来还有一个 mid journey, 但是因为经济原因,这期就先不测试了。好,测试将通过四段相同的提示词, 大家可以看一下是这四段。这四段提示词呢,分别从不同的场景与要求来测试这七个 ai 模型的深图水平。本次测试为了保证 ai 的 深层稳定性,我都会重复输入三次同样的内容来确保深层质量稳定。 而且为了方便大家观看,我直接将每次深层质量最好的几张图贴出。 首先咱们测试的是吉梦,它在国内比较有代表性的一点是同时覆盖了深图和深视频这两类多模态创作场景,而且对中文体式子的语义理解会更自然一些。对普通用户来说,它的上手门槛不算高,同时也更贴近国内短视频内容创作的实际工作流。 在文本一中,吉梦的表现力是非常不错的,没有出现任何不符合逻辑的错误,而且氛围与冷暖光对比都很不错。虽说手部细节与背景细节略微有一点不足,但是整体完整度不错,不得不给个好评。 文案二种集梦的表现力反而更好了。文案涉及的几个难处,像雨夜便利店透明的雨伞,然后讲稿纸张、室内外光线反差、地面反光、远处模糊的行人角色情绪态度, 它全部都没有出错。这张图比上一张更能体现模型能力,因为它不只是把雨夜便利店这个场景搭出来了, 他把各种冷暖对比、地面反光和人物状态一起处理出来,第一眼氛围和虚实感都更完整。但是问题也在像脸部的 ai 修饰感,便利店内部更细的结构信息放大看还是不是很扎实, 所以他是一个已经很会出片的水平,但是还没有达到细节统治级。文本三中的表现力就更一般了。文本提及的是正在一边看电脑一边记笔记, 但是电脑直接被横着摆到了身边, ai 对 此的理解与我们想要的效果有了出入,虽然符合要求,但不符合逻辑层面。其次,线条过于简单,写的比较潦草。 文本四这张图的优点很明显,首先是结构更稳,无论是人物站位、走廊透视,还是窗户门框和楼梯这些背景元素,空间关系都比较成立,没有上一张那种位置逻辑发飘的问题, 其实线条也更干净,人物轮廓、头发和周围边缘都明显更利落,所以整张图的完成度会高,不爽。不过他的缺点也有点太稳健了,虽然很好看,但是冲击力和记忆点都不都不强,都一般,更像一张成熟的校园番插画,而不是特别有个人风格的顶级作品。 综合来看,吉梦这次给我的感觉是质量在线,稳定性不错,但是性价比很高。 它最强的地方不是每一张都特别惊艳,而是整体出片率比较稳,中文提示词也比较友好。对于国内普通用户来说,上手门槛低,而且确实能生成一些能直接拿来用的图。 但他的问题也很清楚,就是细节精度和结构硬度还没有到达顶级模型那种程度。有些图呢,第一眼看很好,但放大后还是能发现很明显的 ai 痕迹。所以如果让我给他下一个定论,我会说他不是最顶级的,但绝对是目前国内比较值得一用的模型。 接下来是通易万象,它的特点是能力覆盖比较完整, 不只是能生图,也能做视频生成和图像编辑,你可以把它理解成一个更偏中性的国产模型。优势不一定是某一个点特别极端,但是整体的能力比较均衡,适合同时有照片和视频生成需求的用户。我们来看图, 文本一中生成的图,其实有些两极分化,有能够让人眼前一亮的图像。图一这张图最大的优点不是单纯好看, 而是场景很扎实,宿舍空间、桌面物体、人物动作和墙上的中文便签都比较自然,整体很像一个真实的学生在熬夜准备答辩,而不是单纯摆出一个学习场景。 不过他的问题也还在,像台灯有两个支架,电脑的使用不符合逻辑,所以他更强的是生活感和场景完成度,而不是细节极限。但同时呢,外向也会有逻辑严重错误的图像。图二纸上字体模糊,左右手深沉,与文本要求不符,而且细节非常差。 比较遗憾的是,文本二不知道哪方面出现了问题,万象始终提示提示词不符合要求,我改了好多版都不能过,无奈,咱们直接看文本三吧。 文本三中,万象真的是发力了,夕阳窗边的光影、人物完成度和整体色彩统一的非常好,他不只是生成了一张学习长颈鹿, 而是已经有点商业插画和青春校园封面的感觉。这一张图我实在是挑不出什么大毛病,审美各有所好,但这张绝对是对我的胃口了,好评。 再看文本四,文本四中这张图已经不只是单纯的好看了,他最强的地方在于光影和空间一起成立,夕阳不只是把画面燃暖,而是真正参与了人物纸张、窗户和走廊空间的塑造,所以整张图会有很强的成片感和故事感。 当然,问题也还在,比如背景版的文字还是比较模糊,但如果单看校园动漫题材,这张已经是完成度非常高的一张了。 综合来看,万象的优势很明显,尤其是在动漫风和校园氛围这类题材上,质量和稳定性都比较强,触图上限也高。但他并不是所有题材都一样稳,像宿舍做 ppt 这种更贴近真实生活又涉及复杂空间和桌面逻辑的场景,抽卡感还是比较明显的, 也出了不少不符合常理的图。所以如果要下一个更精准的结论,我会说,外像是一个上限很高,动漫风很强,但在复杂写实生活场景里还不算完全稳定的模型。 再来看可林,他现在在国内 ai 视频这条线上讨论度很高,而且不只是停留在能生成视频这个层面上,而是在我更完整的创作体验上来说。 简单来说,如果说你更看重视频生成,你的画面质量、镜头表现和内容一致性,那可林基本是绕不过去的一款模型。而且不得不说的是,可林当前的国际的影响力也是逐渐变大的。 来看文本一,文本一中从这组结果来看,可林在深夜宿舍学习这类题材上的优点比较明显,整体氛围感稳定,冷暖光处理自然 人物和桌面元素也能快速搭出一种专注学习的状态。他的问题不在于画面好不好看,而在于容易把场景做的比较模板化。第一,眼光感不错,但在宿舍空间逻辑道具细节和贴合度上偶尔还不够扎实。 简单来说呢,就是可妮比较擅长做有氛围的学习图,但在更具体、更真实的生活场景上,还有继续提升的空间。 文门二,这张图在可林这组里属于完成度比较高的一张,它的优点在于题材贴合度明显更强,雨夜便利店、透明小雨伞和地面反光这些关键元素都比较完整, 整体氛围感也很成立。相比前面更模板的学习场景,这张图更像一个具体故事里的镜头。它的问题主要还是细节方面,比如雨伞和背景路灯的光影其实是不对的, 文案字体还是模糊了,所以综合来看,可林在这类语言氛围题材的表现上,明显好于他在普通宿舍学习场景的发挥。 文案三中,这张图的优点是整体非常稳,人物、校园夕阳、桌面和窗外场景都比较统一。相比可林前面几张写实图,这张在风格统一性和稳定性上会更强。 不过他的问题也比较明显,就是画面有点太标准答案了,虽然好看,但是记忆力不算很强,桌面和电脑这些细节也还是更偏适宜,而不是真正的特别扎实。 文本四,这张图整体完整度不错,最大的优点是画面很干净,走廊透视、床边夕阳和人物站立都比较顺,整体有比较稳定的校园动漫氛围。他的问题主要在于有点过于保守,人物是标准化的校园番角色,表情和动作也都比较平,资料内容呢,也更像适应性的白纸, 所以虽然好看稳定,但记忆点和冲击力不算很强。简单来说,这张图属于稳妥耐看型,适合做校园题材的插画或者过场画面还没有到特别惊艳,特别有辨识度的程度。 综合来看,可林的优势比较明确,他比较擅长做第一眼观感强、风格统一的图,尤其在动漫风、动漫夕阳和愉悦情绪场景这类题材上,出图完成度会比较高。他的问题也很清楚,说白了就是太稳了,所以导致更偏出偏感,而不是细节硬。 在寝室学习、桌面道具、真实生活空间这类更复杂的写实场景里,偶尔会出现模板化或者说不够符合常理的情况。 所以如果让我给他下一个定论,我会说,可您是一个比较会做氛围、适合做内容包装和视觉表达的模型,但在复杂真实场景和稳定性上面还有需要提升的空间。 接下来是千问他比较有代表性的一点,不只是能生成图片,而是在中文文字渲染、复杂排版理解和图像编辑这几个方面上更有辨识度。 你可以把它理解成一个更偏听得懂、需求,也更适合中文内容场景的图像模型。另,官方就把它的重点放在了复杂文本生成、专业版式呈现以及生成和编辑一体化这些能力上。 简单来说,如果你比较在意海报、 ppt、 信息图这类既要画面又要文字配合的内容,千万会是一个很值得关注的方向。它的优势不只是把图做出来,而是更强调让图片里的信息表达也尽量成立。 来看文本一,有明显抽卡现象这张图的优点是整体很贴近中文语境下的真实宿舍场景、 人物长相、宿舍环境、书架、床铺、便签和台灯这些元素都比较本土化,而且便签上的中文内容也明显比很多模型更像正常信息,不再只是完全乱码,所以第一眼会让人觉得他不只是会做学习氛围,而是真的在往中文校园环境这个方向靠。但是与文本要求差距有些大。 文美要求是深夜的宿舍书桌前修改 ppt, 电脑屏幕发出微弱冷光,和台灯暖光形成对比,而它的表现出来并没有表现出这些方向,只能说细节方面还是不行,但是整体确实更偏向于中国本土化。 文本二,这张图对提示词、核心场景的还原度很高,雨夜便利店、透明雨伞、淋湿的头发、人物手迹的讲稿,还有如何生成高质量 ppt 这样的中文标题都比前面不少模型更接近真正可读的中文。结果 说明他的中文文字和场景语义结合上确实有优势,而且人物气质也更贴近中国校园语境,虽然人有一些细节不太到位,但是整体看来还不错。 文本三优点是信息表达能力很强,电脑桌面上的英文标题,桌上的便签、书本封面,这些内容都明显比一般模型更像真正有内容的学习场景, 而且人物动作关系也比较顺,这种边看边写的学习逻辑是成立的,所以他的任务理解和画面实用性上会给人一种比较聪明的感觉。但这一步非常稳,但也就是太稳了,缺少了一些特点。 文本四测试结果一般,抽卡很严重,整体效果也是中规中矩,实在想不出有什么突出的点需要来谈论。 整体来看,千问最大的特点是他在中文语境的理解上做得非常好,他更像是一个很懂中文内容场景,很适合知识类和信息类图片任务的实用性模型,强在任务理解和文字融合,弱在个性化视觉爆发力和稳定性。 然后是 flux, 它在这两年热度很高,主要是因为它的生成质量和可控性上都比较突出。下面那种更看运气的模型, flux 会更遵循题诗词的指引、细节表现和整体控制能力,所以它更像是一类兼顾效果和稳定性的主流生图模型。 来看文本一,文本一中这张图信息量足,并且主题表达更直接,尤其是人物刻画的真实性方面,做的非常好,也是最具有显实性的一张图片了。但是部分提示字细节没有抓住,比如说右手握着鼠标,左手压着纸张, 而且生成图片的时候还是会抽卡,你像图二就是抽卡的结果,所以说这个模型上限极高,但这调教所需要的心思也不能少。 来看文本二,这张图的优点是氛围感很强,雨夜、便利店、灯光、透明伞和地面反光这些元素放在一起,第一眼就很容易把观众吸引进去,而且人物主体也比较突出,拿来做封面或者片头会比较有吸引力。不 过它的问题也很明显,就是细节经不起审看,尤其是手上那份资料上的文字,还是有比较重的 ai 痕迹。另外整个设定更像是为了贴合主题印拼凑出来的视觉感受,真实细节有了,但就是让人觉得很假。 文本三,这张图的优点是平衡感最好,人物桌面、电脑、书本、便签和创意校园这些元素放在一起,不仅画面完整,而且主题也更明确,观众一眼就能看出来这是一个在认真学习和整理内容的场景,所以它既有动漫风的稳定性,也有一定的实际表达能力。 不过他的问题也在于,这种图虽然稳,但也因为太稳反而少了一些冲击力,整体更像一张很标准的学习场景插图、桌面和电脑这些细节也还是更偏实易,而不是真正特别扎实,总体来说还是不错的。 文本四中这张图的优点是整体非常稳,人物、校园、黄昏、走廊窗外、晚霞、教室门和远处空间这些内容都比较统一, 确实把提示词里那种日系动漫风格、青春感、情怀、电影氛围的方向做出来了,而且人物姿态、服装画面色调也都比较干净,说明模型在这种动漫场景下的整体控制能力是很在线的。 不过他的问题也比较明显,就说他虽然完成了这几个大方向,但是对提示词里的怀里抱着课堂展示讲稿和笔记本光晕打在纸上边缘 细节丰富但不要杂乱。这些更具体的执行其实没有强到特别准确,所以这张给人的感觉更像是一张很好看的校园动漫场景图,而不完全是一张比较好的功能性画面。 总结, lux two 的 优点其实很清楚,就是它在场景氛围理解上是比较强的,你想要有明显情绪标签的画面,它都能快速抓到主视觉重点,说明它很会做短视频、自媒体和知识类内容里的场景配图。 不过他的问题也同样明显,就是他更擅长完成大方向,不太擅长吃掉你提着自己那些特别硬的细节要求,尤其是一旦涉及真实、文字明确、手部动作、纸张结构复杂、物体螺形和不要 ai 感这种要求时,他就容易停留在像那么回事,而不是真的做到位。 从稳定性来看,他的动漫风和插画风里明显比显示风更稳,而且显示方面还有不少波动性。 从质量上来看,它的整体观感不差,氛围构图和色调都能撑住,但高质量更多体现在整体包装,而不是极致真实和细节硬度, 但是对于人物的脸部细节刻画,我认为是比较好的。所以综合来说, flex two 更像一个很会做感觉的模型,上线非常之高。但如果你特别在意提示词细节、文字正确性和写实可信度,它还不算顶级。 接下来是 nano banana two, 他 在 ai 视频领域一直都很有代表性,而且更偏向认真做视频创作这条路线。 如果你把他理解成他关注的不只是让画面动起来,而是视频生成的时间一致性、角色稳定性和整体成片感,所以会更偏向于专业创作工具一些。这一次我不做评价,直接将图全部贴出来, 怎么样?看完之后我就一个想法,除了不能很好的理解中国本土化的提词之外,太全面了,每一个图片的完成度和清晰度都是超高质量。 整体来看, banana banana two 给我的感觉是一个执行力比想象中更强,尤其在可读信息和场景服从上有亮点的模型。它是一个偏务实、偏听话,适合内容创作者做功能性出图的模型,强在任务理解和画面可用性,但弱在作品个性,没有很夸张的作品表达。 最后是 g p t image, 它比较有特点的地方不只是能生成图片,而是它在指令理解、上下文衔接和后续修改这几个方面会更强一点。也就是说,它不只是出一张图,而是更像一个能理解你需求,在配合你不断细化结果的图像模型。先看文本一 效果。说实话,除了电脑的巨大槽点外,严格遵守了文字指示词,动作细节没问题,但是逻辑漏洞很大,就像刚刚提及的电脑位置异常,所以对于抽象真实性概念还需要加强。再来看文本二, 这张图的优点是人物质感很强,脸部、头发、皮肤和雨水状态都比一般模型更细透明,雨伞的结构也比较自然, 便利店的暖光和街道反光把氛围衬的很足,所以第一眼会明显感觉到他的写实能力比前面不少模型更硬。不过他的问题也很明显,就是你提示词里最难的那部分,没有完全拿下。纸张上的中文标题依然是错的,虽然比纯段码更像字了,但本质上还是伪文字。 所以这张图说明 g p t 在 人物和环境质感上很强,但文字控制依然不是很理想。 文本三中这张图的优点是画面非常干净,动漫风格稳定,人物桌面、书本、奶茶、窗外夕阳这些元素都很统一,而且整体色彩很舒服。下面很多动漫模型,它的画面完成度和阅读舒适度都更高,不过结合前面的各种模型来看,属于不犯错但也没有个人特点的模型了。 再来看文本四,这张图的优点是氛围感和窗户上的光影很漂亮, 走廊反光和远处空间也把那种黄昏校园安静准备展示的感觉做的很完整,而且人物比例、服装和姿态都比较自然,整体已经有了一种接近高质量动画剧照的感觉。这张图做出了自己的特点,我认为可以给一个好评。 综合来看, gbt 在 大体完整度方面表现不错,尤其是在人物质感、光影层次、写实氛围和动漫完整度这几个方面确实比很多模型要更成熟一点。 很多图第一眼看上去就已经很像成品了,不过他的问题也恰恰出在这里,他太会做成品感了,所以很容易让人忽视掉那些真正影响可信度的东西。比如中文文字不准、电脑桌面摆放不合理、动作逻辑不顺、主题细节没有真实落地。 也就是说,他很适合把图做的很高级,顺眼统一,但并不代表他已经完全理解了你提示词背后的真实使用场景。说白了,还是不太能按照你想要的文字提示词去做,而是会自己脑补一些内容。 那么到这里,器块模型的深度测评就结束了。总的来说,这次测下来,没有谁能真正全方位无敌,有的强在氛围,有的强在听话,有的强在中文和信息表达。 所以选模型这件事,核心根本不是追最强,而是找最适合谁,更适合你的内容方向,谁能稳定帮你做出结果,谁才是真的值得留下来的模型。 下期视频,我将会继续测评这七款模型的深视频能力,当然,如果有你们想看的模型测评,欢迎在评论区回复我,我都会一一去看的。 本期视频耗时良久,纯手搓,也希望看到这里的你可以给我一个点赞与关注,这些都是我做出更好视频的动力,谢谢大家了!

你对机器人的印象是否还停留在春晚的扭秧歌?现实是底特律变人真来了!最近三大 ai 机器人直接炸穿科技圈,迪士尼绝宝克服恐怖谷效应,呆萌出圈!优行的 origin f 一 表情堪比真人, 仿佛能读懂人的情绪。小鹏机器人动作神似人类,猫步直接封神。以前觉得机器人只是工具,现在他们会互动,懂情绪,能模仿人类动作。这已经不是简单技术进步,而是 ai 伴侣时代正式到来。未来机器人走进家庭,陪伴日常真的不远了。


有同学问啊,说 gbt 和 jammer 这两个 ai, 我 到底该选哪一个?我拿我昨天做的一个摩托车的智能体给你做一个对比啊,这个呢是左边啊,这个是 gbt, 然后这个呢是 jammer。 那 我们来看一下, 那帮我生成一些轻量化 a、 d, v 的 干印象图啊,这个呢是 g p t 生成的图啊,这边的话呢,是 demo 生成的图啊,你可以看一下效果啊。第二个是生成氛围图啊,对标本填的啊,我们看一下啊, 然后这边的话呢,是 gemini 的 啊,我们再看第三个渲染这张草图,然后这个是 g p t 渲染的啊,这个是 gemini 渲染的。给你看一下大图吧。大图啊, 好在基于这张草图生成三个不同侧重的造型方案,在这个里面,它生成了三个测试图,可能没有太理解我说的侧重造型这个意思,但效果其实还不错啊。 然后这边也是一样的啊,然后生成了三个侧重不同的方案,我们再看这里啊,根据上传的白膜图生成一张写实渲染,这个是 g p d 渲染的啊,这个质感还是很不错的, 但是这个图不是很全,我再看一下 gemonet。 gemonet 这个一致性确实不错啊,效果也不错。好,我们再看一下啊, g p d 这边生成发动机的半透明图,这个是 g p d 生成的。 好,我们再看一下 gemonet 这边啊,这 gemonet 生成的。 好,我们再看一下生成爆炸图。爆炸图这边的话呢? g b d 生成的图的话呢?感觉有点乱啊,东西是挺多的。 gmail 这边呢?嗯,没有爆炸啊,可能因为我这个提示词工程的关系啊,导致它没有爆炸,但这个的话,我在前一版的提示词里面啊,在这个里面我就生成的时候,我觉得这个图啊,这个效果是可以的。 我们再看下一个啊,给这辆摩托车生成三个不同的配色方案, g p d 这边理解呢,是没有问题的啊,三个配色方案 好,再看一下 gmail 这边, gmail 这边的话呢,生成的方案你看一下他把这个颜色呢放到一辆车上面了,三个不同的颜色,所以这个的话理解有一些问题。再看下一个啊,基于这款车生成一个改款图啊,改装款,这是 g p t 生成的改装款 啊,我这边忘记生成了啊,这边没有生成,我们接着看下一个吧,根据渲染图生成正视,斜视啊,斜前测试啊,等不同的角度。然后这是 g p d 生成的啊,效果也还不错,但一致性呢,相对会差一点点啊。这边是 jammin 生成的, 一致性这块的话是做的非常的好的。我们再看下一个问题,给这辆摩托车生成一个合适的场景,这是 gbt 生成的, gbt 还是有问题,就是它的这个图片的一致性会差一点啊,这个灯头呢,无缘无故多了个,多了个出来了。 我们再看一下 jimmy 这边啊,这个效果还是不错的,整体来看的话呢,嗯, jimmy 在 图片的一致性上面要好于啊,好于 gpt 啊, gpt 这边的话呢,它也有它的优势啊,就是它的理解力我觉得呃,满分, 但是效果方面的话呢,在图片的一致性方面还是弱一些。所以你要问我这两个软件到底选哪一个的话呢?我的建议是两个都用啊,哪个好的话就用哪个。

手机有安兔兔,电脑有三 d mark, 那 现在满天飞的 ai 大 模型到底谁更强呢?今天咱们就来玩一把赛博斗七血。而维纳点 ai 正如其名,就是个让各款 ai 大 模型捉对厮杀的战场。 随便问他一个问题,谁的回答更好,你就投谁一票。全网用户的大量投票结果最终汇成了这样一份大模型榜单。不管是纯聊天、写代码还是视觉分析, 选排名靠前的准没错,但对战好不代表干活强。我们去上期节目介绍的 open rotter, 看看全球用户最近都在用些什么。如果哪款模型近一两个月排名都很靠前, 要么能力确实出众,要么是性价比高,那最近 open claw 这么火啊?想要养一只好用的虾,还得看看 claw evo, 不 看聊天的情商啊!它只测 ai 完成复杂任务的成功率。你会发现 vivo vr pro、 gm 五等几款国产模型还挺好,比 ql 的 还是便宜的多啊!这里是金猪 ai, 你 最近什么模型用得多?体验怎么样?点个关注,记得在评论区分享一下。


很多人想转 ai, 但是第一步就选错了方向,人工智能这行业技术占其实就六个,你要以程序员身份进入这个赛道,必须选方向。记住一句话,选一到三个就够了,那六个都全学,那不是工程师,那是科研院。是 哪六个?我给你快速过一遍。第一, cv 计算机视觉,做图像识别、目标检测、自动驾驶这些。第 二, n l p 自然语言处理,做聊天机器人、大模型、智能助手。第三,多模态、图像、文本、语音一起理解,现在的大模型基本都在往这块走。第四,搜广推,搜索广告推荐系统,这是互联网大厂几十年的核心业务系统。 第五,语音技术, a s r t t s 语音识别和语音合成。第六,强化学习,像 alpha, 机器人角色这些。 好了,六大技术战你都知道了,但真正关键的问题是,普通人该选哪一个?那我直接给你分成两个梯队,第一梯队最推荐入局的三个, nlp、 多模态、搜广推为什么推荐这三个?一句话,岗位多、薪资高、需求稳定。 不管是大厂、中厂还是创业公司,都在招这三类工程师,尤其是搜广推,搜索、广告推荐,这是互联网公司最赚钱的系统,所以这些岗位需求常年都在 那。很多人学 ai, 心里其实都有一个目标,就是高薪,但高薪的前提是市场上得有足够多的岗位,而这三个岗位刚好就是岗位多的。再说第二题,对语音技术、 cv、 计算机视觉还有强化学习, 不是说它们不行,而是门槛太高,或者需求没有那么大。比如强化学习,很多岗位直接要求科研背景,再比如 cv, 计算机视觉,早些年是 ai 第一赛道, 但现在风头明显的被 nlp 抢走了。所以如果你是普通工程师转 ai 优先选择第一梯队。最后说一句大实话,学 ai 最可怕的不是难,而是没有路线。很多人自己摸索半年, python 学一点,深度学习看一点,结果半年过去,什么项目都没有做出来。 所以我把二零二六年最新 ai 学习路线整理成了一张完整地图,从基础到入门进阶,项目实战,每一步先学什么,用什么书,做什么项目都写清楚了。想要少走弯路的,直接拿走这张图就行。