粉丝6730获赞2.1万

一张图片点一下就能够拆分图层,自由调整元素的大小和位置。这是阿里最新开源的图像模型,免费的工作流我已经给大家都准备好了, 只需要你上传图片,然后点击运行,完全不用管其他的复杂参数。那么它的效果到底如何呢?是用什么样的场景和另一款也支持图像拆分图层的 love art 对 比,它有什么样的优势呢?看看这个案例, 虽然两边都完成了主体背景还有文字的分离,但是呢,阿里的模型抠图明显更干净,而且背景的重绘效果也明显更好。 虽然呢, rap 它的文字是可以编辑的,但是却丢失了文字的效果。再来看一个更加复杂的案例,我们把分层的数量设置为五,这是阿里开源模型出来的效果,各种 ui 元素基本都被分离出来了。 然而这是 love art 的 效果,除了文字图层,其他的都识别失败了。那么点个关注加收藏,更多详细的资料全都在这里。


我今天听了那个老瓦特创始人成免的一波客对他的采访,而我有特别感同身受的观点就是不管是任何时候去做产品, 你都要经历历史的潮流。当时他为什么会选择老瓦特这个产品?为什么会创业投身去做设计工具、内容创作的工具? 主要的原因就是因为他洞察到了所有的互联网的最基本的刚需,最开始都是从生产工具开始,从生产到消费,然后到社交到泛娱乐化,就是从刚需到软需求。所以 ai 刚出来的时候, 大家如果说你想做一个成功的 ai 产品,刚需是现在重中之重,应该做的也是被市场所认可的。 现在主流的比较火的一些 ai 工具,或者说它付费意愿比较高的,像 laot, 像 cos, 像 cloud code 这些都是一些工具 agent, 而且是比较垂类的,不是那种通用型的。所以我感觉如果说你真的想做一个 比较好的 ai 产品,那现阶段还是做切入用户的刚需,并且要 切入它的生产创作的内容会比较好,所以我觉得这一块是县级段 ai 的 应用的切入点。我自己也有一个观点,我觉得 历史的互联网的潮流,从以前的文字信息到图片信息,再到短视频的火爆,就是到视频信息,其实都是从文字图片到视频,那现在 ai 的 发展其实是不是也是这样?比如说从文字图片到视频,那现在 ai 的 发展是不是也是这样?比如说从文字思考能力、输出能力非常的强, 再到最近 kimi 三点零的升级了,图片的生成能力也非常强,那下一个爆点是什么时候呢?我觉得下一个爆点就是视频生成的创作。 我就说 chris gpd, 他 翻身 kimi 的 爆点我觉得在内容创作,因为他有先发优势,虽然骚扰二他已经火了一段时间了,但是骚扰二他的 留存太低了,现在的视频没办法生成一个有特别长的长视频,感觉像双十二,现在只能生成十秒或者说十多秒的视频,所以我感觉 视频内容创作来说,这个能力还是不够的。如果说他们想要在 ai 时代再次抢占先机,我觉得他们在视频创作这一块需要对萨拉做大的升级,能够更理解视频的一些内容,也能够创造出更多精彩的视频,这是我的一个观点啊。
