一川AI2周前
今日AI新闻2025.12.12 1. Medeo AI 视频创作工具升级 新版视频 Agent 通过智能架构实现自然语言修改剧本功能,支持实时动态调整,将视频生产周期缩短 50% 以上。该工具整合多模态资源库,可自动优化成片质量并适配多语言市场。 2. 钉钉职场 AI 全家桶上线 8.1.10 版本实现三大突破:消息界面内置智能回复建议、会议记录升级为可交互协作伙伴、DingTalk 硬件支持实时多语种翻译。跨国企业实测显示跨语言会议效率提升 60%。 3. OpenAI 低调发布 GPT-5.2 该模型在办公场景表现突出:三分钟生成商业 PPT、代码错误率降低 42%,逻辑一致性测试分数达历史新高。同步推出的成人模式通过欧盟与中国双重合规认证,支持医疗金融等敏感领域私有化部署。 4. 迪士尼 10 亿美元押注 AI 内容 与 OpenAI 达成三年战略合作,米老鼠等经典 IP 将接入 Sora 视频生成平台。Disney + 计划 2026 年上线官方认证的 AI 创作专区,订阅用户可参与生成式内容生态。 5. 谷歌开放研究型 AI 接口 Gemini Deep Research 首次向开发者开放 SATA 模型 API,支持处理百万级上下文数据。该技术已集成至谷歌搜索与财经服务,可自动完成企业尽调等专业研究任务。 6. Cohere 推出智能检索系统 Rerank 4 模型将上下文窗口扩展至 32K,企业知识库检索准确率提升四倍。其自学习功能允许用户通过日常使用数据持续优化模型,无需额外标注训练。 7. 3D 手办生成器面世 拓竹科技联合腾讯混元 3D3.0 推出「印你」工具,单张图片即可生成可打印模型。采用 3D-DiT 分级雕刻技术,细节精度达专业建模师水准,个人创作成本降低 90%。 8. 谷歌笔记工具会员升级 NotebookLM 为 Ultra 会员提供 50 倍使用额度,并开放 Gemini 顶级模型权限。新版本支持 600 个数据源接入,可自动生成无水印商务 PPT 等专业文档。#今日AI新闻#agent #gpt #sora#拓竹
00:00 / 02:32
连播
清屏
智能
倍速
点赞10
40秒!用AI搞定一套可爱圣诞IP延展设计 本期视频用“无限画布”搞定一整套IP设计延展~画布+Agent一站式创作 【提示词】👇 【引用IP图片,图片尺寸16:9】1、生成此IP的正面视角、侧面视角和背面视角 【引用三视图图片】2、生成专业黑白单线稿草图的三视角 【引用IP图片】3、排版布局:采用中心聚焦式排版,IP形象居于画面正中央,成为绝对视觉焦点;“All I Want For Christmas Is You” 等文字围绕 IP形象分布,IP背后放置超大号无衬线字母 “CANDY CANE”,强化视觉冲击;版权相关文字在画面边缘环绕,IP正下方标注 “茸糖心愿”,明确IP名称与圣诞节周边商品属性,整体布局对称平衡,元素融入温暖房间、火炉、圣诞袜、姜饼人等圣诞节符号,实现视觉统一。字体风格:全图使用无衬线字体,字母线条圆润利落、识别性强,搭配少量鹿角轮廓装饰字体细节,确保文字信息清晰易读且贴合主题。色彩与氛围:以暖色为背景主色调,点缀浅金色线条提亮画面,营造温馨治愈的圣诞节氛围;IP形象与暖色文字形成鲜明色彩对比,搭配金色星星点缀,丰富画面层次,突出 IP主体。画面与信息:整体画面简洁干净,清晰传递IP形象的 “茸糖心愿” 版权归属、品类属性,以及与圣诞节场景的关联性,兼具视觉吸引力与信息传递效率。 【引用IP图片:图片尺寸 1:1】4、生成4个可爱 Q 版大头贴纸表情包,仅保留头部(含头发)特写,无身体部分,头部边缘有白色圆角描边。表情分别为:害羞脸红(低头捂脸脸颊泛粉)、wink 眨眼(单眼眯起比心)、生气愤怒(皱眉瞪眼鼓腮)、悲伤流泪(眼睛垂泪嘴角下撇);整体为卡通贴纸风格,背景为纯黑色,无多余装饰元素,突出脸部表情细节。 【引用IP图片:图片尺寸3:4】5、生成4个超级可爱的表情包,参考图片形象,表情包括:1.思考(在看书时挠头)2.吃饭(餐桌前吃姜饼人)3.睡觉(盖着被子闭眼睛)4.玩电脑(戴着眼镜) 【引用IP图片】6、保持角色的动作和形象不变,生成三套不同主题服饰:新年(双手举福字)、元宵节(双手端着一碗汤圆)、端午节(捧着粽子吃,嘴边有米粒) 【引用挂圣诞袜图片】生成视频:让IP装饰圣诞树,动作流畅自然 #一站式AI创作工作台 #AI六边形战士 #圣诞IP #IP设计 #IP形象设计
00:00 / 01:14
连播
清屏
智能
倍速
点赞35
什么是AI Agent:智能管家 AI Agent可以看作是"大模型+规划+记忆+工具调用+执行"的组合。下图展示了这一演进过程:最左边是普通的LLM,仅能被动生成文本;逐步加入规划、记忆和工具调用能力后,最终演变为具备行动力的智能体。 可以把AI Agent看成是基于大模型的控制系统,它由多个模块协同工作。例如,它使用规划模块将高层目标拆解成一系列可执行的子任务;使用记忆模块保存对话和任务的历史信息;通过工具模块调用外部API或软件来获取数据和执行辅助操作;最后由行动模块把决策落实为具体动作。我们可以从下面四个主要模块逐一来理解: ● 记忆模块:类似于人类大脑的记忆功能,用来记录智能体的内部日志和与用户的交互历史。它包括短期记忆当前任务或对话的上下文和长期记忆外部知识库中的持久信息。通过记忆模块,AI Agent可以在执行过程中保留必要的信息,并在后续调用时快速检索和复用这些知识。 ● 规划模块:负责制定完成目标的行动方案。具体来说,AI Agent会将一个大目标分解成多个子目标和步骤,形成连贯的行动计划。这通常通过思维链chain of thought等技术实现,让模型在解决复杂任务时一步步推理并决策。比如,如果目标是"筹备会议",规划模块会自动细化为预定会议室、准备资料、发送日程邀请等步骤。 ● 工具模块:让智能体能调用外部资源来增强功能。由于大模型本身只是"有想法没有手",所以AI Agent会用工具模块接入各种接口或插件:例如计算器、搜索引擎、日历系统、代码执行环境等。当Agent需要执行特定操作时,它就会使用相应的工具来完成,比如在计算时调用计算器,在查找数据时调用搜索API。 ● 行动模块:负责将决策付诸实践。也就是智能体真正执行任务的部分。它把规划和判断转化为具体操作,例如调用下层程序接口、发送网络请求或输出生成的结果给用户。可以把行动模块想象成Agent的"肢体"或"执行器",当计划制定完毕后,行动模块就负责完成诸如发邮件、整理文档、启动设备等具体工作。 #人工智能 #AI新手村 #agent #科普一下 #科普
00:00 / 07:49
连播
清屏
智能
倍速
点赞11
00:00 / 01:13
连播
清屏
智能
倍速
点赞0
00:00 / 01:53
连播
清屏
智能
倍速
点赞2
00:00 / 02:12
连播
清屏
智能
倍速
点赞6
00:00 / 01:33
连播
清屏
智能
倍速
点赞1