00:00 / 02:12
连播
清屏
智能
倍速
点赞33
00:00 / 01:23
连播
清屏
智能
倍速
点赞8
00:00 / 00:43
连播
清屏
智能
倍速
点赞1945
00:00 / 00:49
连播
清屏
智能
倍速
点赞21
00:00 / 01:10
连播
清屏
智能
倍速
点赞0
一川AI6月前
今日AI新闻2025.08.07 1. 阿里推出 Qwen3-4B 模型 —— 手机端运行的小型语言模型,性能接近 30B 级大模型,数学推理能力突出。同系列 Qwen3-4B-Instruct-2507 已超越 GPT-4.1-nano 表现。 2. 小红书开源多模态模型 dots.vlm1—— 集成 NaViT 视觉编码器,支持动态分辨率处理,在 STEM 数学推理任务中接近 Gemini2.5Pro 水平。其训练集经过精细清洗,显著提升图文对齐质量。 3. MiniMax 发布 Speech2.5 语音模型 —— 支持 40 种语言无缝切换,音色复刻精度达行业顶级,可保留方言口音特征。中文表现保持全球领先,英文及其他语种生成质量同步提升。 4. Midjourney 推出 HD 视频模式 —— 专业级影像生成工具,分辨率较标准版提升 3 倍,但生成成本增加 2.2 倍。该功能直接对标 OpenAI 的 Sora 视频模型。 5. Cursor1.4 版本上线 —— 强化异步任务处理能力,可后台管理代码库索引任务。针对百万行级代码库优化搜索效率,推动 AI 编程向全自动化转型。 6. MiniCPM-V4.0 开源 —— 手机端多模态模型,仅 4.1B 参数却具备 GPT-4V 级图像理解能力。在 iPhone16Pro Max 实测响应速度达 17token / 秒,首次延迟低于 2 秒。 7. 硬件厂商拥抱开源 ——AMD 锐龙 AI Max+395 成为首款支持 gpt-oss-120b 的消费级处理器,高通同期演示骁龙平台运行 gpt-oss-20b 模型。 8. 腾讯开源复杂文档解析神器WeKnora,可处理 PDF/Word/ 图片混合内容。内置大模型交互功能,支持通过自然语言查询提取结构化数据。 9. FlowSpeech 面世 —— 首个专注书面语转口语的 TTS 工具,能自动调整新闻稿等正式文本为口语化表达。即将推出个性化音色定制服务。#今日AI新闻#qwen #minimax #cursor#人工智能
00:00 / 02:13
连播
清屏
智能
倍速
点赞6