阿里的万二点七昨天刚刚发布上线,第一时间做测试,这次测的是一个视频编辑的功能啊,这是视频的手针,我想让这个猫的项圈上面加一个爪印的吊饰, 然后尾巴上面加一个指南针罗盘。我们来看一下结果啊, that wraps up today's exploration if you love this glitch in the geographical matrix hit subscribe smash that like button and stay curious see you on the next atlas。 全民无门槛劈视频的时代真正到来了哈。
粉丝5930获赞4.0万

今天,阿里发布图像生成与编辑统一模型 one 二点七 image, 这款模型具备全链路能力,在人类偏好盲测中评分位列国内第一。 为告别千篇一律的 ai 脸, one 二点七 image 强化了虚拟形象捏脸功能,轻松实现千人千面。同时带来全新调色盘功能,精准控制色彩, 对超长文字表格和复杂公式的渲染可达印刷级,支持十二种语言,最高三 k token 的 文字输入页内领先。 one 二点七 image 还具备强大的组图生成能力,可生成多达十二张图片,用户可对图片进行交互式编辑,实现像素级的精准修改。模型的强大功能在多个行业拥有广阔应用前景。 从今天起,用户可在官网阿里云百炼平台进行体验,千问 app 也将于近期接入。

今天我们来做一套春日主题设计,把拍的照片改成可爱精美的邮票样式。 这次我们用阿里刚发布的 one 二点七模型辅助设计,重点说下这个调色盘功能,我亲自试过了,现在手把手教你落地用到设计中。首先选择 one 二点七或二点七 pro 模型,然后上传照片,输入这段提示词, 这样我们的照片就变成插画了。但我想要的是清透粉蓝色调,用 ps 调太麻烦,靠 ai 写提示词又不知道怎么下手,这个时候就可以用到最新的调色盘功能。点击右上方这个按钮, 在这里可以自由调整颜色和比例,精确控制画面色彩构成。还有更方便的方法,点击左下角上传参考作品,上传想要参考的作品就能一键提取参考配色,可以在这个基础上再次调整,选择我们调整好的配色,瞬间颜色通透了,还把整座喷泉画出来了。在 ps 中设计排版就行了。 再教大家一个用法,这是我生成出的插画,我想只改配色,原图内容丝毫不改。把刚才生成的图片挑选一张最好的下载下来,只需上传生成好的图,用相同的提示词,用调色盘搭配不同配色,依次生成就可以。没错,一次就可以给到客户好几个不同的配色方案,效率超高。 用这个方法完成剩下的邮票设计,把所有素材整合为拼贴海报就完成了,大家快去动手尝试吧!

你还在用传统提示词加模型生成假面 ai 模特吗?快来看看我用阿里 one 二点七模型加相同提示词生成的高质量模特吧!完全一样的提示词,但生成效果、质量却完全不同。 one 二点七支持对 ai 模特等虚拟形 象进行深度自定义。拒绝 ai 模板化长相,看标准大眼睛、瓜子脸 say goodbye, 这是传统模型对双夹带粉子掉腮红的理解,这是 one 二点七交的答卷。 one 二点七 对于不同角色的理解,真的可以说是做到了千人千面。不管是二十八岁的海外公关新贵,还是三十四岁的社恐天才技术顾问,都可以精准定制出你想要的人物角色。除此之外,可以看到,即使我的提示词在对画质、风格有细致的限定下,普通模型生成的画面依然有严重的 ai 交值值感,但 one 二点七 却精准实现了我想要的复古照片颗粒感。在 ai 短视频快速发展的时代,新颖独特、有创意才是优势。拒绝模板化长相提示词,自取,快去试试 one 二点七给你的模特变脸吧!

太全了! ai 深图的塑料网红脸时代今天正式宣告终结!如果你还在被那些千篇一律的 ai 假脸折磨或者苦恼 ai 画不出精准的中文,赶紧先点赞收藏,方便后续反复观看!阿里刚发布的这个深图王牌 one 二点七,绝对会刷新你对国产深图能力的认知。 为什么我说他是深图界的朋友?反复研读。第一, 骨像级捏脸。以前的 ai 身图啊,是抽卡,现在的 one 二点七是整容,它能精准到鹅蛋脸、丹凤眼,甚至是红魔纹理。想要拒绝同质化,追求活人感,这一条啊,就是核心。第二,首创 hex 调色盘设计师的救星来了! 以前啊,给 ai 下指令说暖橙色出来全是盲盒。现在呢,你可以直接输入 hex 色号,或者一键提取明画的配色,色彩控制权第一次回到了人类手里。 第三,告别文盲时代,他支持三 k 超长文本渲染,这意味着什么呢?你可以直接让他生成一张写满公式的高数试卷,或者一整篇苏式的水调歌,头一个字都带错的。 第四,久图一致性,做电商的朋友看过来,你可以喂给他九张参考图,人物长相、光影风格,直接锁死 同一个模特。上一秒在巴黎喝咖啡,下一秒呢,就在马尔代夫冲浪。主体稳如老狗,最狠的是,他已经能作为 skills 接入我们的 open cloud 了。一句话,让你的 ai 助理变成顶级美工。关于 y 二点七的精准提示字库,以及如何一键接入龙虾的教程,我已经望大家整理好了。 想深入研究 ai 深途玩法的朋友,欢迎在评论区交流你的看法,关注我,我是陈凡,带你了解更多能落地的 ai 商业玩法。

阿里刚刚发布了视觉生成大模型万二点七,含盖图像与视频,把视觉生成、编辑和理解统一到一个模型里。图像模型具备人脸、骨骼及控制,你可以精确调整角色的脸,变成你想要的样子。超强交互式编辑,可以添加移动元素、像素及精度。 视频模型也是主打修改可控,无论是元素、环境还是风格,直哪改哪。阿里说,消除了 ai 生成内容的不可预测性,视觉模型作为生产力工具,越来越专业可控了。

看腻了, ai 生成的标准脸调色堪比抽奖,你的问题现在有解了!就在这两天,阿里发布了图像生成与编辑统一模型万象二点七 image, 精准戳中了行业落地最头疼的几个点。首先,它终结了 ai 标准脸。 通过强化虚拟形象捏脸功能,我们可以定制从骨相、眼眸到五官的每一个细节,不管是鹅蛋脸还是丹凤眼,真正实现千人千面,这对虚拟偶像和高辨识度内容创作来说简直是福音。 更绝的是,他还推出了调色盘功能,以前生图色调全看命,现在我可以一键提取参考图的色彩分布比例,精确控制纹身图的色彩构成,再 加上三 k 偷看超长文本渲染能力,一页 a 四纸都能清晰排版,告别文字模糊和内容错乱。并且,万象二点七因为具备更强的主体一致性,最高支持九张参考图,可以保持角色与风格的统一。想给模特换件衣服,却让背景变得面目全非的失控感,正是拜拜。 在此基础上,它的组图生成能力可以支撑完整序式,能够生成多达十二张逻辑连贯的图像系列。这一套组合全下来,万象二点七 image 能够胜任批量产出分镜脚本、电商模特套图及多视角建筑图等,在短视频、电商、教育等多个行业都具备商业可用性。 它的原声交互式编辑模块也是让人惊喜。针对设计师在改稿时哪里不爽改哪里的真实需求,万象二点七 image 支持精准框对局部进行调整。这意味着你可以只修饰人物的一处皱纹,或者精准替换画面背景中的一个摆件,而不用担心破坏原图的构图逻辑。这种指哪打哪的控制力,解决了专业创意流中最高频的对其成本问题。 当控制力不再是瓶颈, ai 才真正成为了设计师手中的那只神笔。目前 ai 大 模型竞争已从拼参数转向拼场景,万向二点七 m h 这种懂创作者、懂业务场景的模型才是真正的全能选手。

不知道大家有没有注意到,最近阿里在 ai 上的节奏明显快了起来,从二月份千万三点五发布到现在,一个半月内接连推出了三款模型。 三月三十日,全模特大模型困三点五 omni 发布,狂览二百一十五项 s o t a, 能看懂视频了。四月一日,头像生成模型 y 二点七 image 上线,捏脸和调色盘功能被漫剧创作者玩出的话,捏出了一个 ai 女友。 四月二日呢,昆三点六 plus 上线,直接登顶了国产最强编程模型。三天三款覆盖全模态图像生成编程 agent 的 三大方向,每个都是各自赛道的王者。有意思的是,这次密集发布的前两周,阿里刚刚成立 ai tech hub, 这个世界群一成立,释放了一个明确的信号,阿里开始猛攻 agent, 说白了就是让 ai 真正独立完成任务。要做到这一点呢,光有模型源不够,必须把算力、模型、应用这三层彻底打通过去。模型与应用之间隔着太多复杂环节,模型再强,真要让他干活,还得靠人来调用和控制。而 阿里想做的是让 ai 落地,不再让开发者自己去填那些坑。 agent 就是 最直接的出口,但 agent 对 talk 的 消耗是成百上千倍的增长。所以阿里在成立 ath 之后,核心就三件事,创造 talk, 输送 talk 应用、 talk, 加速 agent 从实验室走向产业化的过程。 这一点在千万三点六身上体现的最为明显。千万三点六特别强调多模态智能体编程,也就是代理式编程,谁还能看懂需求,自己拆解任务,规划路径,写代码、跑测试、改 bug, 直到完成任务。 在 s l e 奔驰他们的奔驰二点零、 n l two、 reaper 等全网评测中,千万三点六的编程表现超越了两到三倍参数量的 g l m 五、 kimi k 二点五等国产模型。 直接 p g cloud 的 oppo 四点五,四月三日又在全球知名大模型盲测榜单 co 的 rena 中昆三点六 plus 排名全球第二,超越了 openai、 谷歌 xai 等国巨巨头,成为了排名最高的中国大模型。而且它支持一百万次元的上下文窗口,说白了就是它能记住整个代码窗口,然后一把搞定。 更狠的是,千万三点六还对 open core、 捆 code、 捆 code 等主流龙虾和 agent 的 框架全部都做了优化适配 抖音告诉开发者,你用什么框架都行,我全都支持。不只是编程纤维,三点五欧美里的表现同样扎脸,打开摄像头对着草头口出需求, 它就能直接生成带有复杂 ui 的 产品原型界面,支持一百一十三种语言及方言识别。而 web 扣顶从头文推向了因视频实时交互的新阶段。而 one 二点七 image 则解决 ai 生投领域的标准脸色彩盲盒的痛点, 纹身图能力超过了 gpt image 一 点五还支持三 k vox 超长文字渲染,能输出一整页 a 四纸的内容。 市场反应也很直接,千万三点六上线就登顶了每个平台的全球销量第一。这个平台看的就是实用性,全球开发者用脚投票千万,这次性能匹敌 cloud office 四点五,但每百万 vox 收入最低才两块钱,价格不到 cloud office 四点五,但每百万 vox 收入最低才两块钱,价格不到。 cloud office 纯纯降维打击, 其实不止是魔性这一块。之前阿里发布了 ai 原生工作平台悟空,紧接着由于全球 ai 需求爆发,供应链涨价,阿里云的算力和储存产品最高上调了百分之三十四。 结果市场依然供不应求,本质上就是因为阿里云已经从卖算力资源转向了卖智能服务,像目前稳居中国企业级大魔性应用市场第一,客户含盖互联网、金融、消费电子及汽车等重点行业, 大家愿意为他提供的 ai 能力买单,这还只是开始,后续千万三点六系列还将开源其他尺寸模型,性能更强的旗舰模型困三点六 max 也将在近期发布。可以说,在基础模型领域,阿里一直是国产模型的天花板。 这次三联发再次印证了这一点。悟空千万 app 扣的这些 ai 应用级平台,已经在第一时间全线接入了最新模型。这一轮 ai 的 牌局,阿里显然想玩票大的。

嗨,今天是二零二六年四月七号周二。好吧,让我们随便聊聊上周 ai 圈又发生了什么。 先看 anthropic。 anthropic 因为 npm 打包失误,不小心把 cloud code 终端智能体的完整元代码给卸出去了,五十一万行代码 里面藏着四十四项还没发布的隐藏功能。不过说实话嘛,我觉得这件事对目前市面上的 ai 编程工具冲击其实不大, 因为各家编程 a 阵早就逆向的差不多了,真正受影响的可能也就那些想研究 a 阵的开发者。而且真要学 a 阵的架构的话, open ai 的 codex 一 直都是开源的,能学到的东西更多,也更系统。接下来看看阿里这边吧, 这周连着发了好几个底座更新,先是那个专为智能体编程设计的 coen 三点六 plus, 跟以前那种只会写个代码块的模型不太一样, 它现在的核心进化是在智能体工作流上,能在一个循环里自己感知、推理,然后执行, 甚至能处理跨文件的端到端库级代码开发。为了支撑这种复杂的系统级工程,阿里这次大方地把上下文默认给到了一百万头肯,而且他视觉推理也进化了,能直接看 ui 截图或者手绘稿,然后精准地去调用第三方工具。 万象那边也跟着更新了全新的万二点七,图像模型,和视频模型一起上线。针对那种 ai 统一脸呢,它还加了个虚拟人脸骨骼定制功能, 它终于解决了生图软件不识字的问题,支持十二种语言的内嵌文字渲染,还给提示词留了三千个 token 的 超大空间。 至于视频基座弯二点七微丢吗?这一版阿里的思路很清晰,不卷画质参数了,改卷局部控制和确定性。开发者现在能像修图一样去修改视频里的特定元素, 甚至还能人为干预剧情走向。不过价格也不算便宜就是了,七百二十 p 的 生成成本是六毛钱一秒,高清的要一块钱。 目前实在是看不出它和 cds 二点零比起来,竞争性在哪。比起阿里呢?腾讯这周在开源视频赛道扳回一城,他们在 hugen face 上开源了一个叫 omni weaving 的 视频生成框架,底层是八十三亿参数的混元视频,最新版 还外挂了一个七十亿参数的推理大脑。这玩意儿主打一个提示词推理,支持文字显示,支持多张图视频多模态输入。 实测下来呢,他解析复杂用户意图的能力非常强,算是目前开源视频模型里最能打的了。谷歌这周也低调发了个开源推理模型 game 四,专门给那些跑在本地的 ai 智能体设计的,主攻端测的逻辑推理和工具调用。 谷歌还是想把推理能力往大家兜里的手机和笔记本上塞。再看看这周那些专注在执行任务上的角色。法国的一家创企 h company 发了个动作视觉模型,叫 holo 三。这东西只有三百五十亿参数, 但它是专门为了电脑使用场景链的。在最新的智能体极准测试里,它跑出了快八十分的高分, 硬生生把 gpt 五点四和 cloud 四点六都给压了一头。最关键的是吧,它的运行成本只有那些闭源大模型 api 的 十分之一。国内的智谱这周也出了个视觉编程模型, 叫 glm5v turbo。 这款模型能一键把屏幕截图转成可运行的代码,你发个设计草图或者录屏给他, 他看一眼布局和交互逻辑,就能给你吐出像素级对齐的前端代码。他还专门优化了长链条的视觉探索任务,显然是想让 ai 智能体在处理图形界面时更灵光一点。 说到极致的运行效率呢,李逵的 ai 这周发了个只有三点五亿参数的袖珍模型,虽然个头小,但人家欲训练时吃掉了二十八万亿个偷啃,还加了大规模强化学习, 在 h 一 百显卡上的峰值吞吐量能跑到每秒四万多个字。为了这么快的速度嘛,他基本上把数学和代码能力都砍了, 所有智力全点在了工具调用和结构化数据提取上。最后快速过几条工具和研究方向的短讯。 curser 三点零正式上线了, 官方直接把传统的文件系统界面拆了,换成了智能体。优先的新外观,让 ai 从底层整合整个项目。 together ai 开源了一套叫 aurora 的 自适应加速系统, 边提供服务边自学,让前沿模型的吞吐量最高翻了接近一倍。 howinface 的 强化学习库 control 更新到了一点零版,一口气整合了七十五种后训练算法, 中小团队调模型应该能省事儿不少。京东开源了图像编辑机座捉 ai, 能通过输入相机旋转角度数值来精准控制透视, 还有个宏框位移语法,能操控物体位置。初创团队 fishen labs 出了个叫 galileo 零的诊断模型,专门给 ai 视频找物理法则 bug 的, 据说研发只花了二十万美元,但表现压过了不少顶级闭元模型。斯坦福大学发了项扎心研究,说现在的多模态大模型,在完全不给看图的情况下,视觉测试居然还能拿七八十分,很多高分其实就是靠文本知识盲猜出来的。 好,以上就是上周的 ai 资讯,接下来看上周全球前十的生成式 ai 产品访问量排名, 然后再看一下近一年生成式 ai 访问量的变化,最后再看看本周 hugenface 上热度前十的开源模型有哪些。 嗯,好吧,这期就这样,感谢收看,觉得有用的话点个赞分享一下,下期见!

今天,阿里巴巴图像生成与编辑统一模型 one 二点七 emoji 正式发布。针对当前 ai 深途中的审美疲劳、色彩失控等痛点, one 二点七 emoji 带来了更具活人感的人物生成、精准的色彩控制以及超长文本渲染能力。为了让 ai 深 沉的人物告别同质化, one 二点七 emoji 进一步强化了虚拟形象捏脸功能,通过对骨像、 眼眸及五官细微处的全方位定制模型支持在提示词中灵活更换脸型,如圆脸、方脸、长方形与眼部特征,如丹凤眼、深邃眼窝。这让 ai 不 再只是深沉一张标准脸,而是能根据创意需求,塑造出极具辨识度、富有生命力的面孔。

重磅更新,阿里全新发布的万象二点七 image, 直接解决 ai 生图几大痛点!大家好,我是你们的好朋友千言。这次阿里全新发布的万二点七 image 强化了虚拟形象捏脸功能,从骨相到眼眸,五官细节全能定制,脸型随你捏。而且它还带来了全新的调色盘功能, 可以一键吸取大师配色,想用什么颜色用多少,你说了算。更厉害的是,他还能读懂超长小作文,最高三千透片,输入论文海报信息图印刷级质量直接拉满,文字清晰不出错。另外,如果你觉得生成图哪里不对,还通过精准框选,轻松实现像素级编辑, 人物换位置加元素,改文字就像玩游戏一样简单。它的能力远不止于此,从短剧制作、社交娱乐到电商广告、内容创作等等, y 二点七 image 在 为每个行业带来全新可能。关注千言,让 ai 更好地服务于你!

你是否想过让 ai 从执行命令的演员变成统筹全局的导演?阿里全新发布的 one 二七 video 视频生成模型正在实现这一突破,它具备文声视频、图声视频、参考声视频及视频编辑四大核心能力, 覆盖从创意到成片全流程,一句话即可修改视频元素,切换风格,自动保持光影逻辑一致,可调整角色表情、动作、台词、音色与口型精准匹配, 支持自由切换机位视角。长篇内容可稳定五个角色形象与声音,更有智能剧本、电影及运镜和四十一种表情控制。 ai 包揽分镜与合成,让你专注核心创意,关注百晓,解锁更多 ai 前沿产品!
