一川AI3周前
今日AI新闻2025.09.25 1. 生数科技最新发布的 Vidu Q2 模型在图生视频领域实现突破,能精准捕捉微表情变化,支持图生视频、首尾帧视频及可调时长等模式。该技术已应用于影视特效和虚拟主播场景,大幅提升情感表达自然度。 2. 火山引擎推出炉米 Lumi 平台,支持豆包、即梦等视觉模型的 LoRA 微调。该平台提供从图片到视频的全流程 AIGC 服务,企业用户可快速定制专属视觉风格,目前已接入电商、广告等行业的 200 + 企业。 3. 阿里云 CTO 在云栖大会披露,通义千问项目已开源 300 余个模型,总下载量达 6 亿次。其万象生成模型累计产出 3.9 亿张图片和 7000 万条视频,数字内容生成能力覆盖设计、教育等八大领域。 4. 百度发布视觉理解模型 Qianfan-VL 系列(含 3B/8B/70B 版本),依托自研昆仑芯 P800 芯片训练,OCR 识别准确率提升 40%。该模型已在 GitHub 和 Hugging Face 开源,特别适用于教育场景的图文交互应用。 5. 微软宣布在 Copilot 助手集成 Anthropic 的 AI 模型,企业用户可构建定制化 AI 代理。值得注意的是,该服务将部署在亚马逊和谷歌云平台,标志着微软在维持与 OpenAI 合作同时拓展技术供应链。 6. 英伟达开源 Audio2Face 模型,支持游戏角色实时面部动画生成。该技术已应用于《赛博朋克 2077》等 3A 大作,开发周期缩短 30%,配合 Omniverse 平台可实现跨工作室协同制作。 7. Meta 推出具备沙箱推演能力的 Code World Model(32B 参数),需双 H100 GPU 支持。该模型能模拟代码执行结果,错误预警准确率达 92%,目前已在 GitHub 开源供开发者测试。#今日AI新闻#火山引擎#OCR#anthropic #meta
00:00 / 02:11
连播
清屏
智能
倍速
点赞7
秋和3周前
看AI飚演技,还挺上头的 最近闭关,工作刚刚告一段落就赶上ViduQ2这一波更新 赶紧来试了试~ 使用体感如下: ✨【AI 演技派实锤!表情细节惊到我】 之前总觉得AI表情不够生动,不懂情绪,这次 Q2 的 “细微表情生成” 直接开挂!昨天上传了张小女生的图,指令输出 “1-2s女孩错愕的表情,3-4s忍住不笑,同时左右顾盼,5s突然露出邪恶的笑,挑衅着镜头这里的人物”,生成的 5s 视频里,她嘴角往上撇的弧度、眼底一闪而过的邪恶感都清清楚楚,连发丝的轻微颤动都还原了😂 🎬【运镜自由!手残也能拍电影感】 最惊喜的是新增的 “推拉运镜” 感!以前生成视频虽然不全是固定镜头,但是也无法随心所欲的做镜头调度。现在在生成视频时,直接输入运镜提示词,镜头从全身缓缓推到脸部的过程十分感人。 ⚡️【秒出片!等咖啡的时间就搞定】 虽然一如既往的快,但结合生成的生动程度,确实是比较快的,从上传图片到生成不过几分钟,「没时间搞创作」这种话已经变得越来越像借口了🔥 🧠【AI 比我还懂我!指令零翻车】 终于不用跟 AI 反复掰扯了!从个人使用的真实体感来讲,几乎成功率达到100%,Q2对于语义的理解很精准。甚至包括情绪词以及一些大运镜的动作,以前失败的画面都一一实现,「言出法随」即视感。 作者声明:本视频由ViduQ2生成 #ViduQ2看AI演戏 #AI复刻神级演技 #ViduQ2 #AI一秒变脸 #Vidu @Vidu AI
00:00 / 00:44
连播
清屏
智能
倍速
点赞14
00:00 / 00:42
连播
清屏
智能
倍速
点赞142
00:00 / 00:23
连播
清屏
智能
倍速
点赞2561
00:00 / 00:31
连播
清屏
智能
倍速
点赞33
00:00 / 04:54
连播
清屏
智能
倍速
点赞2609
00:00 / 08:51
连播
清屏
智能
倍速
点赞22
00:00 / 00:58
连播
清屏
智能
倍速
点赞232