00:00 / 00:00
连播
清屏
智能
倍速
点赞188
今日AI新闻 1. 美团发布推理大模型 LongCat-Flash-Thinking——5600 亿参数动态激活, 可动态激活 186 亿至 313 亿参数。在数学推理、代码生成等任务中表现优异,模型权重已开源并提供专属聊天网站支持开发者。 2. 阿里开源 Wan-Animate 视频生成工具 —— 模型集成骨骼控制、面部特征提取等技术,用户仅需一张图片和参考视频即可生成高精度动画,支持电商广告、音乐视频等场景。模型已开源并计划扩展多人物支持。 3. 字节豆包翻译大模型上线 ——火山引擎推出的豆包翻译模型支持 28 种语言互译,性能媲美 GPT-4o,输入输出成本分别为每百万字符 1.20 元和 3.60 元。 4. 华为与浙大联合发布 DeepSeek-R1-Safe—— 国内首个昇腾千卡算力安全大模型,有害信息防御率近 100% 该模型在 AI 安全与性能间取得平衡,防御成功率接近满分且通用性能损耗控制在 1% 以内,为昇腾生态提供新方向。 5. 阿里巴巴 Qwen3-Omni 即将发布 ——Thinker-Talker 双轨设计提升端侧多模态效率 阿里云 Qwen 团队新跨模态模型采用流式处理优化,已提交 Hugging Face 集成 PR,适用于实时交互场景。 6. xAI 推出 Grok4Fast—— 计算量降 40% 单任务成本锐减 98%,GPQA 测试表现优异 该模型通过架构优化显著降低能耗,在复杂任务基准测试中保持高性能。 7. IBM 推出轻量级文档模型 Granite-Docling-258M—— 多语言文档转换精度超传统 OCR 专为文件处理设计的 2.58 亿参数模型,支持中文等语言并保留原始版面结构,未来将扩展语种覆盖。 8. 中科院类脑模型 SpikingBrain 突破 ——2% 训练数据实现百倍文本处理加速 采用脉冲神经元机制的混合线性注意力架构,能耗更低且长文本处理速度达主流模型 100 倍。
00:00 / 00:00
连播
清屏
智能
倍速
点赞3