00:00 / 01:15
连播
清屏
智能
倍速
点赞0
一川AI8月前
今日AI新闻2025.06.16 1. 腾讯宣布混元 3D2.1 大模型对外开源,这是首个全链路开源的工业级 3D 生成大模型。该模型显著提升了几何生成质量和 PBR 材质生成能力,降低了开发门槛,适用于游戏、电影、电商等多个行业领域。 2. OpenAI Codex 迎来全新升级,新增生成多种代码版本功能,提升开发效率。优化细节包括加载进度查看、取消操作及安装问题修复,操作更灵活。基于 codex-1 模型优化,提高代码生成准确性,支持 GitHub 代码库提取 3. 微软发布 Code Researcher,基于大型语言模型 (LLM),能深度分析代码库和提交历史,追踪崩溃根本原因并生成修复补丁。在 Linux 内核崩溃修复测试中,Code Researcher 的崩溃解决率高达 58%,远超 SWE-agent 的 37.5%。 4. Observer AI 作为一款专为屏幕自动化工具设计的 AI 框架,通过实时监控屏幕内容并进行智能化分析,显著提升了操作效率,解决了传统工具效率瓶颈的问题。 5. Genspark AI 发布革新性 AI Browser,内置 AI 代理,提供智能导航与内容分析,支持模块化扩展,适用于学术研究、商业决策和内容创作等领域。 6. 蚂蚁集团和 Inclusion AI 联合推出 Ming-Omni,这是首个开源版多模态 GPT-4o,具备图像、文本、音频及视频处理能力,支持语音与图像生成、多模态输入融合处理。 7. MagicTryOn 是一种基于大型视频扩散变换器的虚拟试穿框架,通过创新的模型设计和服装保留策略,在大幅度运动场景下表现出色,提升了视频虚拟试穿的时空一致性。 8. 字节跳动推出 Seaweed APT2,这是一款高效的 AI 视频生成模型,具有实时视频流生成、互动相机控制和虚拟人类生成的能力,被认为是通往虚拟全息甲板的重要一步。 10. OpenAI 升级 ChatGPT Search 功能,新增图片搜索和项目管理功能,提供更精准、更智能的响应。#今日AI新闻 #大模型#多模态ai #视频生成
00:00 / 02:29
连播
清屏
智能
倍速
点赞10