粉丝1.5万获赞38.4万

你们知道吗?豆包居然可以炒股! deepsea 可以 挖掘潜力股!我最近刷了很多视频,理财圈的很多牛人都在推豆包加 deepsea 的 炒股组合打法,豆包帮你做交易策划, deepsea 帮你精准挖掘潜力股,只需要复制这几个贴士,新手都能上手,尤其是最后这支基本面选股贴士,直接帮你删掉垃圾股,抓住核心机会!

deepseek v 四吹得神乎其神,什么元神归位,结果呢?不还是个瘸腿的纯文本模型?人家 gpt cloud 都玩多模态了,他倒好,连张截图都看不了,还得用户自己折腾, ocr 效率打折扣不说,这叫哪门子旗舰? 再说那所谓的百万上下文听着唬人,实际用起来, pro 版延迟比 gpt 五点五慢百分之二十到百分之三十,跟个慢半拍的老古董似的。数学推理更是拉胯, proofbench 才百分之十的得分,跟 gpt 五点四的百分之五十六比,简直是小学生跟大学生的差距,还好意思说逼进闭源上限? 最可笑的是定价, pro 版输出二十四元每百万 token 看着比币源便宜,可它缺了多模态这块核心拼图,性价比根本无从谈起。开源是开源了,可一点六 t 参数的 pro 版有几个人跑得起? flash 版又被老用户吐槽不如 v 三点二, 这不就是典型的雷声大雨点小?说白了就是靠着低价加长上下文的噱头割一波韭菜,真要论综合实力,给 cloud opus 提鞋都不配。

内外 ai 从夯到拉,主打一个真实 cloud, 绝对的夯爆了,逻辑严谨,没有幻觉,像个靠谱的高级军师,综合体验最完美, chat gpt 妥妥的顶级行业,六边形战士,写文案敲代码极其成熟,综合实力依然是标杆, 知乎 man 必须给到顶级。谷歌全家桶联动力强,多模态理解力无敌,上限极高,豆包国内妥妥的人上人,上手简单,情绪价值拉满,就是深度差点意思,像个会来事的助理。 deepsea, 给个人上人写代码,搞逻辑的偏科天才,但生态薄弱,普通用户用起来不够丝滑。 kimi 绝对的打工神器,几十万次的报告秒总结,还能顺手帮你打个 ppt, 但缺乏洞察大局的灵魂。 rock 娱乐属性直接憨爆了。主打一个敢说正经,干活容易翻车,但拿来当互联网嘴气无敌,通一千问给个人上人,背靠阿里的生态点外卖搞办公非常顺手,但表现中庸,不够惊艳。 腾讯元宝也是人上人,背靠微信生态处理文档还行,但深度一般,没啥不可代替性, 违心一言,这就有点拉完了。说白了就是高级版的百度搜索信息还得自己辨真假,实用性打折,质朴清颜只能排在后面,除了清华背景没啥存在感,硬达质量没记忆点,很容易被遗忘。

用豆包 deepsea 整出稿的,千万别直接用,他们没真实文献支撑,参考文献全是瞎编的,一查就漏线。还有同学傻呵呵,先找文献,再复制粘贴,最后 ai 痕迹重 查,重不过关白忙活。今天直接教你们省时间的招用织网加豆包,二十分钟搞定能用的出稿步骤超简单! 第一步,先去织网搜文献,别瞎翻,左边筛主要主题,次要主题,时间锁定近五年。点右上角详情摘要、关键词全出来,挑十几二十篇,直接用查新引文格式导出。第二步,把导出的文献丢给豆包, 别让他写全书,就让他帮你规划研究方向,再搭个三级大纲,这才是 ai 该干的活,省得你自己费脑。第三步,最关键,把大纲文献全丢进 paper 写,填好题目, 学校信息格式要求右边勾选需要的图标、公式代码,点提交就完事。他自带各种学校模板,不用你手动调格式。二十分钟不到,结构完整、格式规范,查重达标的初稿就出来了,赶时间的快试试!

hello, 大家好久不见,最近 ai 圈里呢,火了好一阵子的小龙虾,它叫 openflaw, 它能帮你清理收件箱,发邮件、管理日历或者订机票等等等。类似现实世界里面的 贾维斯,你只要给他去发送一条消息,他就能够自己去把事情搞定。但他和我们平常使用的豆包啊, deepsea 或者是千问,到底差别在哪里呢?今天我就想通过一个视频跟你通俗易懂的讲清楚这件事情。 我啊,之前呢,也被这些名词搞得很晕,什么大模型啊, agent 呀, l l m 呀,感觉每隔一段时间就有不停的有新词去冒出来,根本跟不上。但其实呢,只要搞懂一个核心的区别,你就能看懂现在 ai 圈到底在讲什么,也能知道自己该用哪个工具。 首先,什么是大模型?我们先说豆包, deepsea, kimi 啊,或者以及海外的,像是 chat gpt 啊, jamina, grog 这一类,它们呢,统一叫做大语言模型。或者你咬文嚼字,我们再精细一点,它们叫做基于大语言模型的聊天机器人。那大语言模型它的英文缩写是 l l m, 全称呢,就是 large language model, 我喜欢把它理解成公司里那个什么都懂,随叫随到的聪明人。比如你问他这封邮件,帮我润色一下,他马上能给你办到。你问他,哎,这份数据,帮我分析一下趋势呗,他也能立马给你一个非常清晰的答案。但是有一点,他呢,不会主动帮你做任何事情,你只要不开口,他就安静的坐在那里,你问一句,他答一句。 所以呢,你看,无论是网页端呢,或者是手机端,他们都是通过对话框的形式来展现,这就是大模型,一个极其强大的对话工具,需要你全程参与,主动发问,那 ai agent 是 什么呢? agent 这个词,它的本意就是代理人、执行者的意思,我们还是用刚才那个聪明人来打比方,大模型是你问他才答, 而 ai agent 它是那种你说完目标,它自己把整件事情跑完的助理。举个最直接的例子是我们刚才提到的那只小龙虾,呃,就是 openclaw。 那 openclaw 它其实是今年非常火的开元 ai agent 之一,因为它的这个呃表现,它的类似于吉祥物,是一只就红色的小龙虾,就长这个样子。那这个 ai agent 它能干什么呢? 你可以直接在 whatsapp 或者是 telegram 上跟它发消息,呃,后面现在已接入到非书,你也可以直接跟在非书上跟它去沟通。呃,比如说,你帮我把这周收件箱里所有未读的重要邮件整理一下,然后总结发给我, 他就能自己去读,自己去整理,然后把结果发给你。或者比如说,你告诉他,我下周三有个会议哎,帮我提前一天设定一个提醒,然后顺便查一下那天的天气情况怎么样,哎,他就会自己设好提醒,然后到时候主动去找你。甚至呢,有人让他去。比如说 啊,发现需要这个 apikey 的 时候,它自己也可以去浏览器里面去申请,就它真的会自己打开浏览器,然后把整个的这个 api 配置好了。它和豆包最本质的区别是什么呢?我们可以根据刚才的描述来看出来,豆包是你主动去问哎,问完它就结束了,但 opencloud 呢,它是,它会一直在后台运行着,就是随时可以主动找你,也可以按照你设定的任务自动去执行。 就像 deepsea 啊豆包,它是你桌子上的一本百科全书,你想问什么,它就能答什么。而 opencloud 呢,它是一个住在你电脑里二十四小时不下班的私人助理。 好,我来做一个总结。所谓大模型呢,像是刚才提到的 deepsea、 豆包、 kimi 呀叉、 g p t 啊, gemina 啊 rock 这种,它适合随时问答、写作、分析,需要你主动地去跟它交互,然后主动地去使用它。免费 啊,基本上上手也很快。那对于用户来说,日常工作是完全够用的。但是 ai agent 呢?就像刚才提到的 opencl 这一类,它非常适合去执行自动化、流程化的任务,它可以在后台持续的运转,它不只是回答你,而是替你把事情做完。 对于一般的用户来说,县级段,其实,呃,在国内用 d c k 啊豆包呀,或者是这种千问日常就够用了,它真的能够帮你省去非常多的时间。你有任何的问题,只要对着 app 去说一句或者提个问题,它就能帮你解决。但是呢,如果你想往前走一步,想让某些事情真正的自动化,那像 open call 这类 agent 的 工具就值得你去了解。而且其实这不是技术人员的专利,它正在变得越来越容易上手。 好,那今天这期的内容就到这里,如果你觉得有收获,可以点个收藏,之后后还能翻出来再看一看。另外,你也可以在评论区告诉我,你现在在用哪个 ai 工具,或者你有没有什么特别想自动化但一直没空搞定的事情?那我们下期再见。

如果你觉得用 deep seek 豆包进行普通对话就是在玩 ai agent, 那 么你可能连门都没入。近期读了一些文章和结合我对 ai 应用开发学习的认识,谈谈我对大模型 agent 以及 ai 应用开发的认识。我们平常与大模型 deep seek 豆包进行对话, 他们本质上只是一颗大脑去理解用户意图,深层推理过程,综合信息后输出给你。而 agent 则是在大模型的基础上去直接帮你干活。例如传统的 chat gpt 对 话,帮我规划一次旅行,他会说 你可以考虑去参观哪里哪里,而我需要去各个网站查机票,订酒店。而如果是 agent, 那 么它可以自动搜索机票价格,比较酒店,并筛选计算预算,将完整的计划 pdf 交付给你。了解了 agent 的 概念,也就知道了市面上 ai 应用开发岗位即是对各种各样的 agent 进行开发,这其中又会涉及到很多技术,比如 agent 开发框架, agent 在 本地知识库上解锁。深层我也是刚理解了为什么以前有一种说法叫做一人的 ar 公司其实就是多 a 成的杰作。以上都是个人观点,欢迎评论区留下你们的看法。我也是一名正在学习 ar 应用开发的博主,欢迎你们的关注。

家人们,别再被你手里的 ai 给骗了,你天天用的那玩意根本不是真正的 ai! 是 不是跟我一样,刚用 ai 的 时候觉得这东西要上天了,结果却越用越气?让他写个旅游攻略就给你列个干巴巴的空架子, 让做个工作周报,通篇全是正确的废话,纯纯就是推一下动一下,你多吩咐半句他都不会给你带个啥也摸不清门道的实习生。一模一样, 越用心越累。你平时用的叉子、 g p p 豆包这些只能叫 ai 聊天机器人,而真正能帮你把活干明白的叫 agent。 用人话翻译,普通 ai 是 你喊一句才动一下的实习生, agent 就是 你给个目标就能搬妥的全能私人助理。有个最接地气的例子你瞬间就懂。你说一句,五一我从北京去成都玩,四天五千预算,但老人要轻松不踩坑。 普通 ai 呢,给你列个四天行程大纲就完事了,剩下查机票订酒店算预算,全得你自己弄在 ai 界面呢,你说完这句话直接往沙发一摊,啥也不用管,他自己给你挑不折腾老人的航班, 开电梯不临街的酒店,还每天只去两个地方的轻松行程,连每一笔开销都给你算的明明白白,门票、预约提醒都给你安排的妥妥贴贴。谁觉得这是什么大厂才能用的上的黑科技,离咱们普通人远的很。 现在这玩意零门槛就能用?打工人做报表,写周报,整理会议资料,学生党做学习计划整笔记,就连你减肥都给你算好,每一顿的卡路里点外卖,怎么点都给你安排的明明白白,一句话给你记死了, ac 就是 你不用听不用你教 自己想办法把事情给办明白的专属助理。是不是超心动,想知道在哪能用上?关注我带你把 ai 玩的明明白白。你们平时用 ai 最烦的是什么?评论区告诉我。

兄弟们,你有没有发现啊,打开豆包或者 deepsafe 网页的时候呢,有个位置啊,总写着 a p f, 它是啥?干什么的?举个例子啊,你想喝奶茶,你只要在奶茶店里跟店员说我要一杯珍珠奶茶,少冰三分糖。店员呢,就把需求传给后厨,后厨做好呢,再把奶茶递回来。大魔仙, a p i 就是 这个店员, 它是你和大模型通信的通道。软件呢,把你的问题通过 a p i 发送给大模型,大模型处理完呢,再把答案通过 a p i 返回给软件。那 a p i 里的那么多参数,嗯,是什么意思啊?

前几天不是 deepsea v 四发布了吗?又让人想起去年一月份它那个火爆一时,但是我认为你真的没必要轻易的去换,我觉得对于大多数人来说就是你百分之九十五的问题,豆包就已经够了,主要是它多模态能力比较强, 你可以去试一下它那些思考模式啊,然后深度研究,还有语音视频播客也可以去玩玩作图生,视频什么的基本上就能够覆盖你生活绝大多数的 嗯,场景了吧,反正我身边的长辈我就让他们用豆包。那这次 deepsea 的 v 四呢?主打是呃, a 证,推理啊,代码数学这些专业的能力的提升,还有百万上下文嘛,因为它前端其实做的也不是说特别上新呃,多模态能力相对来说也不是很突出,它其实走的还是弊端,靠 api 跟企业合作那条线。 我觉得对于大多数看视频的 c 端的用户,普通用户来说,你用豆包就行了。然后目前呢,豆包的月活也是最多的嘛,差不多三点四,三点五个亿左右,第二是千问,然后第三个才到 deepsea。 好,那刚才说的就是针对入门的嘛,轻度的用户,那如果某一天你开启了推理,开启了深度,然后呢,你发现他的回答怎么着都不满意你有可能我们就先不说提示词的问题啊,你有可能触碰到了他的能力的边界或者叫上限,然后这个时候呢,你再可以尝试的去找 deepsea 啊,或者说 啊千万啊等等去试一下他们的推理的能力。哎,很想比较一下,看看是不是回答的更符合你的心意,更专业等等。 然后才是第三种,就是你自己能力很强,你也很清楚自己要什么。你要写代码,那肯定就是 codex cloud。 如果你在谷歌的声台,那就是 jimmy, 如果你要查 x 的 内容,那就 grog。 然后像我用搜索列表看新闻,那就 perplexity。 所以 最后结论就是,我不建议大家经常的去换 ai 工具,因为我觉得挺耗费精力的,大多数情况下你也触碰不到 ai 工具的边界。

五月九日, deepsea 识图模式开始大范围向用户开放,出物框上方多出一个新按钮和快速模式专家模式并排出现。目前该功能仍标志为内测中,但几乎所有灰度账号都已经能看到入口。 作为国产大模型的引领者,我们今天就来看看 deepsea 在 目前多强格局中,识图水平到底如何呢?我们首先丢给了它一张稍带遮掩的神奇宝贝图, deepsea 很 快准确识别,第一题完美过关。 单一图片考验的是 ai 的 认知与规划能力,那面对多数据长文本又会如何呢?于是啊,我们又丢给他一张算术图,月算虽简单,量却不小。结果显示啊, pdf 的 精确度和执行结果依然很不错。 接下来上点难度给了一张画面元素更多更复杂的图,并要求做逻辑推断。第一次快速模式下得到的结论甚至有些离谱,但加入深度思考后,经过画面分析和推理,最终得了正确结论。 不过仔细看画面识别,仍然出了一点小差错。图中右臂打着石膏的男子手里并没有拐杖,但 deepsea 却将墙壁线条误认成了有拐杖。 最后,我们挑选了一道当年正确率仅百分之三十七的天津中考图形推理题。这一次,我们终于看到了 deepsea 的 纠结,整道题推理了近两分半钟,却依然得到了一个错误的答案。 最后做个小总结,苏苏否认。在应对复杂画面与深度推理时,我们确实看到 dvd 的 犯错甚至纠结的一面。 但更值得注意的是,从快速推理的翻车到深度思考的准确,这种纠错能力啊,恰恰是最难得的。而他在海量算式题上的零误差之行,在基础图纸上的秒级判断,已经证明了他在核心视觉感知和稳定执行上的基本功。 在国产 ai 追赶全球顶尖水平的路上, deepsea 不是 那个每道题都考满分的天才少年,而是那个敢于面对考题持续迭代、稳步前行的坚定选手。虽不完美,但这正是一个负责任的大模型该有的成长姿态。关注杰哥,带你拆解技术背后的商业密码!

我在这里做一个保命的声明啊,我们豆包很好,他是一个非常好的这个 ai 助手。这两天我不是出来摆摊吗?然后我就总结了一下大家问的最多的一个问题,这个问题就是你们这个产品跟豆包到底有什么区别? 然后我回答了无数遍,其实这个问题很好啊,因为他说出了大家对于 ai 产品的普遍想法, ai 不 就是一个聊天框吗?有了豆包,我为什么要用你们的产品?但是当大家问我这个问题的时候,我当时就确实,嗯,我该怎么再去解释一下呢? 后来我就整理了一下思路,然后正好跟大家说一下,给大家去做一个简单的了解。在我在这里做一个保命的声明啊,我们豆包很好,他是一个非常好的这个 ai 助手。我只是想给大家表述一下, 像豆包这种 ai 助手跟通用智能体的一个区别。豆包呢,他就是一个很典型的 ai 助手,你问他的问题,他能回答,你给他资料呢?他能给你总结,你如果说想做一个小程序呢?他能帮你想出这个创意,这都没问题。 但是现在 ai 行业呢,其实正在发生变化,你只生成一段文字,这个价值远远不够,甚至说没有价值了。 很多时候文字呢,它就是一个半成品,你拿到方案,你还要自己去执行,你拿到代码呢?你需要自己去调试,对不对?像机座模型来说,他只是把文案给到你,剩下的排版、发布、投放,还需要你自己来做,对吧?有时候 ai 说的很对,但是事情他确实没有帮你把事情往前推进。 我举个例子,比如说大家现在最近玩的这一 make two, 它在升图的时候,你输入一段提示词,就能生成一个很好看的图片,如果这行文字能驱动后边的模型生成一张商业海报, 这个时候它的价值就不在文字本身了,大家能理解吧?它的价值在于最终撬动出来的那个成果,最终成果,所以现在 ai 的 重点正是从生成内容走向交付结果。这个时候就是我要跟大家讲的通用智能企它最大区别了,它就相当于是一个数字员工, 你给他一个目标,他帮你拆解步骤、查资料、搜集工具、整理文件,最终把任务的这个结果推给你。最近不是有一个很热的新闻吗? mata 要收购 minos, 被中国监管叫停,然后要求撤销这个收购交易。 minos 呢,其实就属于这类产品,就是通用智能体的一个代表。 他厉害的地方呢,不是陪你聊天,是给你个任务,就像刚才说的,帮你拆步骤、查资料、操作工具,最后给你个结果。我再给大家举一个实际的操作案例来说明这个差别。比如说我现在让豆包帮我做一个行业分析,往他做一个,比如说 deepsea 的 这个深度分析报告, 他会非常快的以流式输出的这个形式帮我输出这种文字稿,但仅此而已。然后我让他帮我生成一个 word 格式的这个版本,大家可以看一下啊。第一次他拒绝我插队,然后第二次又又又把内容重新给我输出了一遍, 再次向我确认是否要生成,我确认之后,魔幻的来了,最终他给我生成一个百度网盘的链接,还有一个提取码,但是呢,你以为这就结束了吗?我点进链接之后,发现这个链接是个假的,这个呢,我就要替豆包来解释一下,这个不赖。豆包是因为机座模型和通用智能体的业务不同,带来的结果不一样, 是有结果,但是这个程度是没办法让你直接拿去开会的,因为数据你要核,然后来源还要查图片,还要重新做, ppt 呢,也要去排 结论,需要你自己再重新提炼一下,整理一下,对吧?这是通用智能体做的报告,我就不给大家展示我的产品了,我只是给大家看一下最终的成果。 理想状态下呢,就是他自己拆任务,然后先查市场数据,然后再做进品分析,再整理表格和图标,最终交付一份这可以看的带有格式的报告。这么看,通用智能体其实更聚焦某一个具体的场景,我再举个例子啊, 比如说你现在想做一个小程序,你输入我想做一个测试类的小程序,叫测测,你是哪种打工人,动物,是吧?适合做短视频传播。如果说是通用智能体,在给你做的时候,他会先帮你拆解需求,生成一个页面,设计交互配置,最后中的这个结构逻辑,给你个能跑的 demo, 这个版本你可以先去运行一下, 如果是豆包的话,豆包会给你个策划,告诉你题目该怎么设计,结果页该怎么写,传播点在哪里,评论区呢?是该怎么互动的,这些呢,也都有价值。但是当你把 app 关掉之后呢?问题其实还在什么?问题就是页面谁来做,按钮谁来写,题目逻辑谁来答, 结果页面谁来生成,小程序谁来上线?你还是停留在我有一个很完整的想法的这个阶段。其实一路走来我就发现普通人做产品最难的不是说他想不到,是想到了他动不了,找产品,找设计,找前端,找后端,还没来得及验证,这个热情已经被消耗掉了。 所以可以这样理解,豆包帮你把想法写清楚,通过智能体呢,帮你把任务做完整,这就是他俩最大的区别。哎,最开始让人惊讶的呢是他会写, 现在最关键的是他能不能查,能不能算,能不能画图,能不能生成文件,最后给你交付一个能用的结果。所以这不是说豆包墙还是通用智能底墙的问题,是他们本来就是两类产品,一个偏表达和思考,一个偏执行和交付,就是这点区别。

你可以直接讲一个核心,但豆包清问 d p、 c 分 都是做问答的,反正 class 产品是做任务的。做问答跟做任务有什么区别?我说区别不是说产品,你企业如果像 ai 做流程做业务,他必须要学会做任务,而不是做问答。就为什么 ai 现在叫 n 进程,它能够 到企业去跟人一起携手做做事情本质就是因为 class。 这个以前更多是什么? 是获取知识和信息,而不是跟你一起在说事情,他更多是承担你的脑力的延伸,也就是说你的智力延伸,而不是做你手脚的延伸。好,加上智力加手脚的人就全方位的延伸,他什么都不拿什么任务,因为他东西什么不拿什么的问题对你说, 就这个你问的问题对吧?他更多以前承担是你脑力智力的延伸,他不会帮你做事。而 class 呢,是你手脚的延伸,他可以帮你发文件,他可以帮你关机, 对吧?他可以帮你整理一个桌面啊,桌面很横断,我也不想等你了。让卡拉帮我整理一下桌面,让卡拉帮我文件夹分成。很好,我这么多文件散落在一起,结果那天晚上讲的,嗯,把我分个裁,把这个文件的类型或者内容,对吧?啊?分类,这就是它的区别,这个区别带来的就是 这种员工就从甘蔗之老变成一个人,本来就甘蔗之老变成人了嘛。啊,这个区别就很大了对不对?所以这个他不能代表生产力,他只能代表创意,而可爱的产品是可以代表生产力的直接生产力。创意是间接生产 力,创意他是生产力,他不是他间接生产力,而执行作用呢?直接生产力 区别到这啊,他更多创意的营销就是脑力营销啊,手脚营销好,这是他本质区别。本质区别好进到这肯定还很啊。不是太了解啊。本质区别底下有很多区别对不对?他为什么有本质区别?我是传哥,企业 ai 落地,关注我就够了。

最近你是不是经常刷到这些词, cloud code agent ai 员工自动写代码,自动做网站,听起来一个比一个高级,但很多人其实根本分不清 cloud code 到底是啥, codex 又到底是啥? 为什么现在大家天天都在聊 agent? 这期我将用普通人能听懂的大白话一次性给你讲清楚。上期我讲了 gpt、 cloud gem 到底该怎么选, 但选对模型只是第一步,真正关键的是你怎么让 ai 不 只是回答你,而是真的帮你干活。首先,我们在日常和网页里使用的豆包 gpt cloud 本质上像是一个聪 明的顾问,你让他写文案,他给你一段文案,你让他做表格,他给你一个表格内容,让他写代码,他就给你一段代码。但表格做好了,你还得自己下载到本地。代码写好了,你还得自己 复制保存,平时打开软件、修改文件、运行测试,很多时候还得你自己来。所以网页上的 ai 模型主要是在给你答案。而 agent 相当于是运行在电脑终端里的 ai, 你 给他权限,他就能从给答案升级成接管你电脑的全能管家。 比如 openai 这边,它家的 ai 叫做 gpt, 它家的 agent 叫做 codex, 它可以读代码、改代码、运行代码,还能在云端后台帮你处理开发任务。而 cloud 作为 ansore pig 这家公司的 ai 大 语言模型, 它们家的 agent 叫做 cloud code, 你 可以把 cloud code 理解为 cloud 的 终端程序员,它和 codex 一 样,能够理解你的代码项目,跨多个文件和工具,帮你写代码、修 bug, 自动化处理并开发任务。 google 这边代表产品可以看 antigravity, 更像是一个 jimmy 的 开发工作台,因为它不只是在聊天框里回答你,而是可以让 agent 在 编辑器,终端浏览器之间去写作,去规划执行验证任务。所以你可以这样理解, g b t cloud jimmy 是一个 ai 大 脑,而 codex cloud code, anti gravity, jimmy c r i 是 让这些大脑真正去干活的工具。大模型往往没有本地客户端,而 agent 则都是下载到电脑上的客户端或者运行在终端里的工具。 普通人先记住三句话,网页 ai 是 给你答案, agent 是 替你执行任务。所以下次再听到 cloud code codex anti gravity 不要再觉得玄乎, 它们本质上就是让 ai 从聊天框里走出来,开始真正替你干活。你想选哪个? codex, cloud code 还是 antigravity? 进去告诉我,下一期我直接讲它们到底怎么选。

我为什么不建议用豆包 deepseek 直接生成出稿?你知道问题在哪吗?它俩压根没连织网,参考文献,全是瞎编的。就算最新版的 deepseek v 四出来了,写出来的东西还是一股机器人味儿,你想把那个味儿去掉 改吧,没个三天五天根本弄不干净。关键是忙活半天, ai 率还不一定降得下来,那怎么偷懒又靠谱?很简单,把织网和豆包搭着用,二十分钟就能搞出一篇格式漂亮 ai 率个位数的出稿。 直接上操作,先去知网找权威文献,输入关键词,一搜出来的文献质量有好有坏,别一偏偏傻。点左边栏,直接勾上主要主题和次要主题,时间范围选近五年。 然后点右上角那个田字格按钮,摘要关键词、年份、作者全给你列的清清楚楚,一眼扫过去就明白,这样筛效率更高。挑个十来二十篇你觉得有用的点导出查新引文格式,复制下来存好。 第二步,让豆包干他最擅长的事。第一,根据你刚才那些文献帮你理一理研究思路。第二,让他给你列一个三级大纲,做完就停,别跟他废话。 完事以后,把刚才从知网弄来的参考文献,豆包给的大纲全交给 ok, 毕业填上基本信息,比如学历题目,学校的格式模板需求,你也可以把开题报告丢进去,有数据的话直接上传就行。 参考文献自定义,没有的话右边一点就一键解锁,它自动帮你从知网吧真实文献中英文的都在。接着,到了大纲目录页面,可以选择在当前章节里插图表、公式代码啥的, 如果有特别需要注意的,点击这个投位,把详细需求输进去就行。拿到出稿后,你只需要再仔细校对一下内容,按自己的需要调调内容,就大功告成了。

最近我一直跟大家在分享 codex 或者 coco 的 时候,评论区最常见的问题就是,它跟豆包到底有什么区别啊?是不是豆包也能携带吗? codex 也能聊天?那不都是一样的吗?甚至有人会问,我已经有豆包, kimi、 deep sick 呢?还要不要再学这些看起来更复杂的工具? 哎,我觉得这个问题特别典型啊,就是因为大家其实把这两类东西混在一起比呢,你拿豆包跟 codex 去比,有点像问一个能够帮你马上去做出 ppt, 写报告来做图片的,一个万能的一个 app, 和一个能够帮你用你的电脑去读理项目,改理文件,跑检查的一个 ai 的 实习生,到底谁会更厉害?我觉得他们不是一个赛道啊! ok, 大家好,我是 fred, 这期我们就用最简单的方式去讲清楚,想豆包啊, codex code 到底它的差异在哪里?而 kimi 和 deepseek 又应该放在什么样的位置? 很多人我们觉得一比较 ai 工具,就会问它到底能不能写文案啊?比如说它到底能不能做 ppt? 哎,能不能抠图,能不能写代码? 这个问题也不是错的啊,但很容易把所有的工具都混在一起,因为现在大部分的 ai 工具都有会把这种功能做得越来越全,对吧?真正的区别不是说功能的这种清单 啊,一张,呃,而是他的工作的位置。如果你想要一份的内容,一张图,一个 ppt 啊,那你就是在这种平台里面去要结果。如果你想要处理自己电脑里面的项目、文件、脚本、网页测试和工作流,那就不是普通的这种聊天的 chatbox 啊,或者是这种网页端的 agent 能够完全覆盖的场景呢? 我把诶,第一类就是类似豆包啊, kimi 啊,包括 deepseek 放在一类啊,我叫它就万能的这种入口的这种 app, 它最大的优势就是低门槛, 哎,打开这种网页啊或者 app 就 能用,比如说豆包适合快速去做搜索啊,图片的视频啊, ppt 啊,日常内容啊。而 kimi 适合一些长文档资料这种密集型的一些研究,还有一些 a 帧的工具 啊,一些 a 阶的任务。而 deepstack 更适合去做一些深度的推理啊,文本的沟通,当然也可以作为 api 或者底层模型来去做一些口令。那这类产品最适合普通人上手,是因为它已经把复杂的能力封装成了按钮界面和模板 啊。然后第二类的话就是 codex, 那 和 callcode, 我 更愿意把它叫做一个 ai 的 十一生,就它厉害的地方不是说多一个聊天框或者怎么样,而是它可以这进入你真实的一个环境, 比如说它能够读你本地的项目文件,理解你已经写过的规则,帮你改脚本,改网页啊,改文档,然后再跑一次检查,确认这次改动没有问题。在网上 它还能把你重复做的流程沉淀成 skills, 变成你自己长期的工作流。所以说它的门槛会高一点,你要理解文件权限啊,以及验证,但它的上限也明显高非常非常多啊。 呃,我现在比如说打开两个文件给大家去演示,比如说这是 codex, 我 某可能一百个 csv 啊。然后我可以在这个文件夹里面,大家可以看到我的文件夹里面,比如说,哎,看不到啊,不好意思啊,我这文件夹里面就有一百个 csv, 我 让他去帮我做,把这一百个 csv 做成一个深度数据洞察,生成一个 html 分 析给我,那你们就可以看到 他就已经啊单独把整一个内容啊,一百个文件去做了深度的分析啊,包括时间节奏 啊,月份啊,热力图,白区域的表现,渠道的结构,销量排名啊,增长风险机会点等等等等。你可以理解他把一一百个 c s v 啊,都做了深度的数据的洞察和处理,然后生成了一个看板给你啊, 即使它是一千个和一万个,它也能够完完全全去处理,这就是 codex 或者 coco 这种类似,你可以把它当成实习生也好,或者怎么样也好,它能够处理的一个工作。而对于比如说豆包而言啊,我觉得有个最明显的差异,就比如说我举例子,我这里传文件哈,对吧? 啊?然后我这里比如选但凡超过五十个啊,你就可以看到,比如说豆包这里面只能理解五十个文件,所以它会本身会有一些呃文件的限限制。 然后同时我这里面有创的上传了五十个 csv 啊,统一让它生成 html 给我。那这个时候呢,它其实豆包给的一些结果我觉得也还是蛮不错的啊,比如它能够生成一些 csv 的 这种啊, 一一些分析的报告啊,一些指标什么的,但是它确实这一次没有成功的给我输出一个 html 报告,理论上它是可以输出的啊。同时呢,我们也可以再去看一下,比如说像豆包还有什么样别的功能,比如它可以生成 ppt 啊, 图像生成,当然它也一些哦,有一些扣点的东西,它底层是火山引擎的编代码啊,模型,然后一些解析啊,写作啊,但后面还有生成音乐翻译,视频生成,深度研究, ai 播客记录,会议啊, ai 表格等等等等等等。 所以说你可以明显看到像豆包这种 app, 它把很多我们普通人常用的一些 呃内容啊,都封装到它的网页里面。而 kimi 啊和 deepsea 都是类似的,所以说我们一张图来讲清楚这两者的区别。第一个就是看它的使用门槛 啊,豆包、 deep, deepsea, kimi 明显很更低,打开就能用,而 codas、 cloud code 还需要去配置权限,配置网络,那就门使用门槛会高一些。 第二个是工作环境,而豆包 kimi d p c 更多是在平台自己的网页或者 a p p 里面去使用,而 codex cloud code 更多是在你的项目终端和电脑里面。而呃,前者的这个典型的产物,就比如说大家常用的刚刚给大家演示的 ppt 啊,回答啊,图片啊,视频啊,报告等等。 后者呢,更多是去改一些脚本啊,改一些文件输出网页以及整个的工作流。当然前者他也都能生成,所以说他的上限会更高一些啊,前者的优势就是快啊,适合普通人,后者就是上线能更高,真正的去接触接触我们真实的一个工作流。 然后它的风险呢,可能在于说它的产品边界,比如说刚刚只能传五十个文件,对吧?而 codex 或者 cloud code 呢,它的风险我觉得可能现在主要还是在于说网络的一个问题。 ok, 所以 说听完今天 fred 整个的一个分享,我相信大家对于 cloud code 或 codex 与豆包 kimi 或者 deepsix 这样的一些网页或工具 的区别有一些明显的认知。当然我也不代表说呃像豆包 kimi 和 d p c, 它做不到 codex 或 call code 这个底层模型,它能实现的功能 包括说像豆包的呃模型,包括 kimi 的 呃模型,包括 d p c v 四 pro, 现在也都能够做很多 coding 的 呃工作啊,所以说会越来越接近,但是明显现在还是会有区别,以及它们的用途和使用场景也会有区别。 ok, 我是 fred, 呃,我们下期会持续吧。呃呃,适合大家的一些工作流啊。用 ai 来看怎么去介入,我们下期再见。