K纪元2天前
每周AI大事件盘点(25-12.15-12.21) 1.中国版的Sora2来了,阿里云万相 2.6 上线,是国内首个“角色扮演”视频模型,上传 5 秒自拍,输入一句“赛博悬疑”,AI 自动写分镜、换妆发、配原声, 15 秒电影级成片即刻出炉;多人同台也能音画同步,镜头切换零穿帮。 2.谷歌拒绝被openAI逆转推出Gemini 3 Flash,Extra High模式下硬刚GPT-5.2不落下风,运行速度达 Gemini 2.5 Pro 的 3 倍,实测实现 “零延迟” 响应,成本仅为 Gemini 3 Pro 的四分之一。 3.Ray-Ban Meta 眼镜更新,联手Spotify搞了个大动作!只需说一句"嘿Meta,来首应景的歌",无论是深夜跑步、公园遛狗还是厨房做饭,计算机视觉立即识别画面氛围,Spotify的个性化引擎瞬间为你量身定制专属BGM。其对话聚焦功能可以让人们在嘈杂的环境中更容易听到其他人的声音,这两项功能将率先在美国和加拿大地区推出。 4.Adobe发布的Firefly更新简直颠覆了视频编辑行业,现在你只需要说句话"把天空变成阴天的感觉",AI就能瞬间修改视频里的任何元素,甚至连镜头角度都能通过语音指令调整,它还能自动把你的视频提升到4K超清画质,集成Runway Aleph模型让编辑精度达到前所未有的水平,Black Forest Labs的FLUX.2模型也已加入,订阅用户现在可以不限次数使用这些黑科技功能。 5.OpenAI 免费开放 GPT Image 1.5,生成速度直接飙到 4 倍。改图能精准保留光线、构图和人物外观等关键细节,彻底解决文本乱码难题,还能自由添加、移除图像元素,加上专属 Images 入口和预设滤镜,本次更新由DALL-E主要开发者和Sora负责人联手打造 6.字节发布音视频创作模型 Seedance 1.5 pro,原生兼容多语种及四川话、粤语等方言,口型与语调贴合度大幅提升。模型解锁电影级运镜能力,可流畅完成长镜头跟随、希区柯克变焦等高难度操作。 7.商汤科技发布 AI 办公智能体小浣熊 3.0,让AI从“草稿助手”跃升为“办公搭子”。新版多模态智能体引擎一键生成可直接汇报的专业PPT,自主规划大纲。#阿里云万相 #Gemini3Flash #raybanmeta智能眼镜 #Firefly #GPTImage
00:00 / 02:25
连播
清屏
智能
倍速
点赞6
00:00 / 00:34
连播
清屏
智能
倍速
点赞3
00:00 / 00:34
连播
清屏
智能
倍速
点赞7
00:00 / 01:12
连播
清屏
智能
倍速
点赞5
00:00 / 01:11
连播
清屏
智能
倍速
点赞3