多模态理解和生成的区别以及结合点!#InfoQ #大模型 #腾讯混元 #编程 #程序员

codex多模态是什么

10
1
3
分享
举报
发布时间:2026-05-14 10:13
InfoQ
InfoQ

粉丝2.2万获赞12.5万

相关视频

  • GPT 5.6现身?Codex更新加速 Codex 环境疑似提前出现 GPT 5.6 记录,说明新一轮模型测试可能已在后台推进。同时,Moonshot 与 DeepSeek 合并传闻升温,Kimi 也被卷入整合讨论,或将影响多模型与多模态能力布局。 
#GPT5 6
 #Codex  #OpenAI  #DeepSeek  #Moonshot  #Kimi
    01:05
    查看AI文稿
  • 每天半小时AI知识 | OpenAI Codex不只会写代码 你以为Codex只是个写代码的工具?OpenAI刚刚发布重大更新,把Codex从"编码助手"升级为"全能型助手"(Codex for almost everything)。现在它不只能写代码,还能直接控制你的桌面——打开应用、浏览网页、编辑文档、执行命令,就像一个真正的助手在帮你工作。这是OpenAI对标Anthropic Claude Code的重磅反击。AI的边界正在从"代码编辑器"扩展到"整个操作系统",从"单点工具"进化为"系统级能力"。想象一下,你只需要说"帮我整理这周的会议纪要并发邮件给团队",Codex就会自动打开Outlook、提取会议记录、生成总结、发送邮件。这不是科幻,这是现在。
    00:48
    查看AI文稿
  • 我试了 Codex 最新 Chrome 插件,已经不像 AI OpenAI Codex 今天上线了全新的 Chrome 浏览器插件。
这次更新最大的亮点是:Codex 已经能够连接真实的 Chrome 浏览器,在不打断你当前操作的情况下,自主运行独立标签页;同时,还支持多个 agent 并行开启不同标签页,协同处理任务。
从“写代码助手”,正式进化为真正可执行、多线程协作的 AI Agent。
        
#Codex   #OpenAI   #Chrome插件    #AI   #Codex更新
    04:22
    查看AI文稿
  • 要写PPT或者图片直接拆成PPT,GPT+Codex 真的快的不行。#chatgpt #codex
    03:37
    查看AI文稿
  • 试试用codex上的新插件Hyperframes做个视频 豆包的多模态还是很厉害的。
(看工程文件名有claude,应该是搬运过来的。
#ai #mackbookair #agent #豆包
    01:22
    查看AI文稿
  • 一定要想尽办法用上Codex! #AI #AI编程 #Vibecoding #程序员 #技术
    01:16
    查看AI文稿
  • 端侧多模态AI agent已经发展到这种程度了吗.jpg? 视频AI含量拉满了:
所有代码均由ai编写(codex+claude),app完全由端侧ai驱动(gemma4-e2b)
视频本身也是ai生成(codex+hyperFrame),这个还没有做精细打磨,针对编辑场景做微调的甚至。。。 
对于小作坊而言,端侧的优势是无服务器成本,对用户而言省钱,劣势是智力比服务端大模型低,但是gemma4真的已经很猛了,实测效果非常惊艳。
而这种相册app又非常好的契合,不需要那么高的智能,但是又高度隐私,不适合全都高到云端去处理。起码比现在的手机里的相册记忆强多了。 
总结就是:利用端侧ai强大的多模态理解能力+流程agent包装,素材的管理搜索召回,剪辑建议,你不满意的自己跟agent沟通改,感觉真的很强。
    01:22
    端侧多模态AI agent已经发展到这种程度了吗.jpg? 视频AI含量拉满了:
    所有代码均由ai编写(codex+claude),app完全由端侧ai驱动(gemma4-e2b)
    视频本身也是ai生成(codex+hyperFrame),这个还没有做精细打磨,针对编辑场景做微调的甚至。。。
    对于小作坊而言,端侧的优势是无服务器成本,对用户而言省钱,劣势是智力比服务端大模型低,但是gemma4真的已经很猛了,实测效果非常惊艳。
    而这种相册app又非常好的契合,不需要那么高的智能,但是又高度隐私,不适合全都高到云端去处理。起码比现在的手机里的相册记忆强多了。
    总结就是:利用端侧ai强大的多模态理解能力+流程agent包装,素材的管理搜索召回,剪辑建议,你不满意的自己跟agent沟通改,感觉真的很强。
    查看AI文稿
  • 谁更能自己开发自己测?国产AI能操作本地电脑了 screenclaw 能让 所有多模态AI大模型 读懂你的电脑截图,并基于截图坐标,操作你的本地电脑。大部分操作能无感操作,不会抢占你的鼠标和键盘。 
配合openclaw、Hermes、claude code、codex、trae等agent,还能远程遥控AI操作电脑。
    06:31
    查看AI文稿
  • 第112期丽姐的AI悄悄话-Codex这个多线程设计,让你的AI打工从不摸鱼!
#codex #codex使用 #AI #agent #多线程
    02:28
    查看AI文稿
  • 为什么我热衷于codex? #codex #chatgpt #一人公司
    01:52
    查看AI文稿
  • 吹claude的都是没用过codex的,真可怜 账号注册难度 暴打claude
复杂任务长时间开发 暴打claude
token使用费用 暴打claude
桌面软件控制成功率 暴打claude
claude有的我都有啊,可是我有的claude都没有啊
    02:43
    查看AI文稿
  • Codex你用错了!这7个隐藏玩法太强了! 很多人对 Codex 有个误解,就是觉得它只能写代码。这期我直接分享 7 个我自己真的在用的隐藏玩法,看完你会更清楚,它到底有多强!
#codex #vibecoding #OpenAI
    02:27
    查看AI文稿
  • Codex 多账号管理 Cockpit-Tools 你是否为管理和切换多个 Codex 账号而烦恼? 本期视频, 科技博主 DP 将手把手教你使用 `cockpit-tools` 这款强大工具, 轻松实现账号的快速导入和一键切换. 视频不仅详细演示了操作步骤, 更重点强调了如何安全地使用该工具, 通过导入本地官方 App 授权信息来保障账号安全. 告别繁琐的重复登录, 让你的 Codex 使用体验更加流畅高效!
关联资源: https://dpit.lib00.com#AI#AI编程#OpenAI#Codex
    04:46
    查看AI文稿
  • ⚡ 告别复制粘贴!Codex 浏览器插件来了, Codex 浏览器插件来了,一句话操控所有网页 
OpenAI 最新发布 Codex Chrome 插件,现已支持 macOS 和 Windows,能在浏览器里直接和网页、应用深度联动。最爽的是它支持多标签后台并行工作,干活的时候完全不打扰你浏览,真正的「AI 在背后默默打工」。 
#OpenAI #Codex #ChatGPT #AI编程 #ChromeAI #AI神器 #AI工具 #程序员 #AIAgent #人工智能 #效率工具 #跨境电商
    01:49
    查看AI文稿
  • Codex 真把 Claude Code 反超了? Codex 最近更新后,社区里开始有人说它在部分能力上超过 Claude Code。这个视频不做简单站队,而是拆解 AI 编程工具真正该怎么比:模型写代码、终端工作流、多 agent 并行、Skills、Automations、电脑操作、浏览器、PR review 和安全边界。#ai新星计划 #青年创作者成长计划 #ai #Codex 、#claude
    04:35
    查看AI文稿
  • GPT-5.5+Codex封神!5分钟做自媒体选题工具 我用Codex+GPT-5.5,只花了5分钟,就做了一个自媒体选题工具!
不仅可以一键给选题打分、分析流量潜力,还能自动生成封面图,效率直接翻3倍! 
这就是今天要给大家分享的「GPT-5.5 + Codex氛围感编程」工作流。
它解决了AI开发两大痛点:单轮生成无法迭代优化、没法同时推进多个项目。
搭配Codex桌面应用,你不用写复杂代码,可以直接像搭积木一样就能做出能用的产品。
 
使用方法超简单:
第一步,新建项目文件夹,给出基础提示词,搭核心框架;
第二步,边跑边迭代,在终端实时修改不用重来;
第三步,跨项目无缝切换,还能调用Claude优化前端样式。 
让AI帮自己干活,可以解放更多劳动力!!
#AI学习  #AI工具  #AI知识  #科技  #codex
    01:30
    GPT-5.5+Codex封神!5分钟做自媒体选题工具 我用Codex+GPT-5.5,只花了5分钟,就做了一个自媒体选题工具!
    不仅可以一键给选题打分、分析流量潜力,还能自动生成封面图,效率直接翻3倍!
    这就是今天要给大家分享的「GPT-5.5 + Codex氛围感编程」工作流。
    它解决了AI开发两大痛点:单轮生成无法迭代优化、没法同时推进多个项目。
    搭配Codex桌面应用,你不用写复杂代码,可以直接像搭积木一样就能做出能用的产品。

    使用方法超简单:
    第一步,新建项目文件夹,给出基础提示词,搭核心框架;
    第二步,边跑边迭代,在终端实时修改不用重来;
    第三步,跨项目无缝切换,还能调用Claude优化前端样式。
    让AI帮自己干活,可以解放更多劳动力!!
    #AI学习 #AI工具 #AI知识 #科技 #codex
    查看AI文稿
  • 多模态研究这样发三四区论文真的很容易#多模态 #人工智能 #SCI #研究生 #论文写作
    01:18
    查看AI文稿