00:00 / 00:00
连播
清屏
智能
倍速
点赞0
00:00 / 00:00
连播
清屏
智能
倍速
点赞2
00:00 / 00:00
连播
清屏
智能
倍速
点赞2.0万
00:00 / 00:01
连播
清屏
智能
倍速
点赞61
今日AI新闻2025.10.17 1. 谷歌 Gemini 3.0 Pro 小范围推送 —— 强化多模态推理能力,可生成前端代码。DeepMind 团队开始向部分用户推送该模型,其 Deep Think 架构显著提升复杂任务处理能力,支持文本 / 图像 / 音频 / 视频混合输入,轻量级 Flash 版本预计适配移动设备,正式版计划 10 月底发布。 2. 百度 PaddleOCR-VL 文档解析模型 ——0.9B 参数实现 109 种语言精准识别。该轻量化模型推理速度较主流方案提升 30%,特别适合跨境文档处理场景,技术白皮书显示其表格识别准确率达 98.7%。 3. 爱诗科技完成 1 亿元 B + 轮融资,旗下 PixVerse 视频生成工具用户破亿。该公司的 ARR 突破 4000 万美元,V5 版本新增 Agent 创作助手功能,可将文本提示转化为分镜脚本,4K 视频生成速度缩短至 90 秒。 4. Anthropic 为 Claude 推出 Skills 功能 —— 像整理文件夹一样管理 AI 技能。用户可打包指令集处理 Excel 等特定任务,与 OpenAI 的 AgentKit 形成竞争。实测显示该功能使品牌指南制作效率提升 60%,自定义技能支持跨平台同步。 5. Pinterest 上线 AI 内容过滤器,用户可手动调节信息流中 AI 生成图像占比至 10%-50%。平台同步启用 "AI Modified" 标签,首批测试覆盖 30% 欧美用户。 6. 开源社区迎来 LLaVA-OneVision-1.5 多模态模型 ——8B 参数超越 Qwen2.5-VL。三阶段训练法使其在视觉问答测试中准确率提升 12%,特别擅长解析医学影像与工程图纸,开发者可免费商用。 7. 微软 Azure 平台上线 Sora2 视频生成服务 —— 按秒计费开启商业化。定价 0.1 美元 / 秒支持 4K/60 帧输出,企业用户包月套餐同步推出。该服务暂未对中国区开放,需通过国际版访问。 8. 旅行平台 Kayak 推出 AI 模式 ——ChatGPT 驱动全流程规划。用户用自然语言查询 "1 万元预算日本七日游" 即可获得完整行程方案,酒店比价功能整合 3000 家供应商英语年底将支持中文语音交互。#今日AI新闻#gemini#sora2#ocr #claude
00:00 / 00:00
连播
清屏
智能
倍速
点赞12
00:00 / 00:00
连播
清屏
智能
倍速
点赞6417