00:00 / 01:22
连播
清屏
智能
倍速
点赞4
00:00 / 02:17
连播
清屏
智能
倍速
点赞262
00:00 / 00:56
连播
清屏
智能
倍速
点赞4
一川AI3月前
今日AI新闻2025.09.16 1. 腾讯发布混元 3D 3.0 模型 —— 建模精度提升 3 倍,同步推出创作平台与开源计划。该模型采用 3D-DiT 分级雕刻技术,配套的混元 3D Studio 平台提供专业创作工具,同时宣布将开源核心模型加速行业应用。 2. 昆仑万维音乐平台 Mureka 上线 Agent Studio 功能 —— 用户通过语音描述即可生成完整音乐作品。该功能覆盖专辑制作、热点写歌等六大场景,显著降低音乐创作门槛。 3. 阿里 Qoder 推出付费订阅服务 ——Pro 版每月 20 美元支持无限代码补全。服务优化了 Credits 消耗机制,提升智能体工具并行处理能力,Pro + 版本提供 6000 Credits 额度。 4. VEED 发布 Fabric 1.0 视频工具 —— 静态图片 7 秒生成会说话视频。该工具唇形同步准确率达 92%,生成效率提升 7 倍且成本降低 60 倍,集成多语言字幕功能。 5. OpenAI 推出 GPT-5-Codex 编码代理 —— 动态思考机制实现智能任务分解。支持 IDE 插件、网页端等全平台接入,开发者实测显示可缩短 40% 编码时间。 7. 字节跳动开源 Mini-o3 视觉模型 —— 突破 10 轮以上深度视觉推理。采用 VisualProbe 数据集与超轮次掩码策略,在复杂图像理解任务中准确率提升 35%。 8. 上海 AI Lab 推出 Lumina-DiMOO 多模态模型 —— 全离散架构实现跨模态对齐。文本到图像生成质量达 SOTA 水平,同步支持音频语义理解。 9. 腾讯 AI 绘画微调技术升级 —— 生成图像美学评分提升 300%。创新 Direct-Align 技术解决梯度爆炸问题,SRPO 算法实现精准风格控制。 10. Meta 发布 MobileLLM-R1 边缘模型 ——10 亿参数实现高效推理。 11. 谷歌 DeepMind 推出 VaultGemma 模型 —— 差分隐私技术保护数据安全。通过添加随机噪声防止数据溯源,参数规模 10 亿。 12. 豆包月活 1.57 亿登顶行业榜首 —— 环比增长 6.6% 超越 DeepSeek。#今日AI新闻#3D模型#昆仑万维 #deepmind #多模态模型
00:00 / 02:26
连播
清屏
智能
倍速
点赞24
00:00 / 06:32
连播
清屏
智能
倍速
点赞1880
一川AI5月前
今日AI新闻2025.7.8 1. 腾讯混元推出美术级 3D 生成大模型 Hunyuan3D-PolyGen—— 通过 BPT 技术和自回归网格生成框架,能实现复杂几何模型的精准生成,建模效率提升 70%。该模型采用三步框架压缩面表征 Token 数量 74%,并引入强化学习提升优质结果生成概率 40% 以上。 2. 阿里巴巴发布多模态大模型 HumanOmniV2—— 全局上下文理解能力支持 69.33% 的基准测试准确率,其强制性上下文总结机制显著提升教育、医疗等场景的多模态推理能力,在三大权威数据集表现优异。 3. 钉钉 AI 表格上线 ——1 小时处理千级任务的数据分析神器,内置 80 多种字段模板,通过自然语言指令自动生成公式图表,首创 "表格即文档" 功能实现智能协作。 4. 百度 PaddleOCR3.1 版本升级 —— 多语种识别支持 37 种语言且准确率提升 30%,新增 MCP 服务器功能简化开发流程,复杂文档翻译可精准处理专业术语。 5. 微软双线发力:Deep Research 智能体开放 API—— 自动化处理金融医疗等领域的科研分析流程;Win11 预览版代码泄露 AI 动态壁纸功能,未来或支持主题自适配和时间响应机制。 6. 香港理工与 OPPO 联合推出 DLoRAL 视频高清化框架 —— 双 LoRA 架构使生成速度提升 10 倍,C-LoRA 保障时间连贯性,D-LoRA 增强画面细节,突破传统超分辨率技术瓶颈。 8. 谷歌开源 MCP Toolbox for Databases—— 仅需 10 行代码即可让 AI 智能体安全接入 AlloyDB 等主流数据库,内置连接池管理和身份验证机制,配套详细开发指南。#今日AI新闻#3D大模型#OCR #MCP
00:00 / 01:59
连播
清屏
智能
倍速
点赞14