瑞平国内与国外的 ai 从夯到辣一共五个级别。第一个,豆包,目前来说,豆包算是国内最亲民、最易用的 ai, 相因快,功能全、门槛低,日常问答文案、生活助手体验极佳,主打的就是情绪价值,但深度明显不足,复杂问题容易浮于表面,套话偏多,有时候也容易出错, 缺乏独立思辨能力,专家模式也难突破上限,属于好用但不够强的 ai, 所以 等级给到人上人。第二个恰,即 p t, ai 界的开创鼻祖,作为行业标杆,综合能力依旧无解,写作推理、代码逻辑全覆盖,成熟度与稳定性遥遥领先,生 态完善。唯一不足是过于追求安全合规,回答偏保守圆滑。结合新发布的 emoji, 二胖爆了,无需多言。 第三个, gemini, 使用过的都知道有多好用,多模态能力非常强,图文视频理解,实时搜索联动潜力巨大,长文本与推理能力亮眼,但非搜索模式下容易出现细节遗忘,连贯性波动 上限极高,稳定性不足。目前他在理解人类意图方面确实强,所以等级必须给到顶级。第四个, deep sea, 写代码这块和逻辑推理有些亮点,垂直领域表现尚可,但整体生态薄弱,插件扩展兼容性极差, 知识库更新之后体验不稳定,只能算能用,远谈不上优秀,所以只能给到 npc。 第五个,缜密长文本,阅读处理,读一档速读论文,整理资料效率极高, 轻量化办公极其顺手,还能帮你直接做 ppt, 但更偏向高效工具,自主思考与逻辑延伸能力一般,缺乏全区洞察,只能做高效辅助,难以承担深度创作与分析, 所以等级只能给到人上人。第六个,通一千问奶茶党,迭代速度快,基础中文表达流畅,垂直领域问答较为贴合国内场景,基础使用不出错,但整体缺乏核心亮点, 逻辑深度、创造力强,吻本能力均不突出,表现中庸稳定,没有让人眼前一亮的突破,属于能用但不够强的中庸替队, 所以只能给到 npc。 第七个, cloud, 目前是 ai 界的真神,碾压所有 ai 模型,它是限阶段综合体验,最接近完美助手的存在。超长文本处理能力,研读长篇资料、论文 书籍,几乎不会遗漏信息,逻辑严谨,幻觉极少,表达自然不生硬。无论是深度思考、专业创作还是复杂任务,都能保持高水准稳定输出,是真正靠实力碾压同行的顶级模型, 所以必须给到憨爆了。第八个, crock, 这个真是神中神了,至于是哪方面神呢,你们懂的我就不多讲了。主打感受风格,依照实时信息,看似犀利, 实则错误率高,逻辑混乱,只能算作娱乐产品,无法胜任专业任务,但娱乐这一块无敌好用,所以综合给到人上人。第九个,元宝,红宝党会员党和千万差不多, d p, 负责推理与搜索,切换灵活,文档能力强,但整体深度与头部仍有差距,有时候听不懂人话,生态优势一般般吧, 个人领域合适的话配合元宝确实还可以使用,所以给到 n p c 吧。第九个,闻心一言就是一个整理好的百度库,你问他,他就帮你去百度搜, 省了你去搜的环节,至于是对是错还是要你自己分辨。这里等级给到拉完了,第十个质朴清严,和前面那个老大一样,几乎无优势,应达质量、流畅度、深度均无亮点,市场存在感极低,所以排到老大后面。
粉丝19获赞1436

你是不是也分不清 check gpt、 gpt 五点五、豆包、 codex、 飞书 agent 这些东西?那今天呢,一条视频给大家讲清楚。视频有点长,建议先赞后看。 其实呢,对于这些产品,我们不用死记它们的产品名,我们只需要分清三层,大模型、 ai 产品 agent。 那 先说大模型,大模型就是 ai 的 底层大脑,比如 gpt 五点五点五、 cloud gemini 二点五 这些呢,是偏语言和多模态能力的,那像 imagis 二点零、 c jim, 还有 nano banana 是 图像模型,那像 cadence 二点零、 sora 等则是视频模型。 你会发现大模型经常有二点零、二点五、五点五这种版本号,因为模型本身一直在升级, 他可能更会推理,更会写代码,更会看图,或者生成视频更真实。但普通人通常不会直接使用大模型。我们真正打开来用的是第二层 ai 产品, 比如切记 ppt、 豆包、 jimmy、 app、 kimi、 小 云雀都可以理解成 ai 产品, 他们背后可能接了不同的大模型,但你看到的是一个 app、 网页、聊天框或者创作工具。 它的特点是你给他一个需求,他马上给你一个结果,像一个很聪明的及时助手。但如果任务变长变复杂,比如需要持续跟进一个项目,每天要检查客户的信息,或者是要把长篇小说拆分成分镜,然后再生成短句, 又或者要读完整个项目代码,并且修好 bug, 那 这个时候就不是一次问答能够解决的了。这个时候需要第三层 agent 智能体。 那 agent 和普通 ai 产品最大的区别不是他更会聊天,而是他更能做事,他能理解目标,拆步骤,记住上下文,调用工具,并且把一个任务持续往前推进。 所以普通的 ai 产品像一个及时的助手,那 agent 更像一个执行助理或者是数字员工。 举个例子,你对宪宪 p t 说,帮我规划一个杭州三日游,他会给你一份攻略。但你对 agent 说,帮我规划杭州三日游,查机票、酒店、天气,把预算整理成表格,那他呢?可能会自己查资料,交信息,整理表格。 在你授权之后,他甚至可以帮你订机票,订酒店。那再比如编程,你问 qq 这个网站应该怎么做,他会告诉你思路。但当你把这个任务交给 codex 或者 cloud code 的 时候,告诉他帮我把这个网站做出来,顺带修复移动端的适配, 那他呢?就会去读文件,改代码,运行命令,看报错,再修复 bug。 所以 像 codex、 cloud code 这种,它不只是一个编程工具,它更准确地说是编程 agent。 国内也有很多 agent, 比如说 code、 飞书、小确短句 agent, 那 海外有 open cloud、 爱马仕 codex、 cloud code minus。 当然你要注意的是,很多产品它不是只能放在一个格子里的,比如说嵌 gpt, 它是一个 ai 产品,但里面也可以有 a agent 的 功能。那飞书是个办公产品,但飞书 ai 里面可以有办公的 agent。 小 云雀是一个内容创作产产品,但它也可以有短剧的 agent。 codex 的 场景是编程,但它的本质还是 agent。 判断一个东西是不是 agent, 不是 只看名字,而是要看他能不能做长线的任务。如果他只是回答,改写、总结,生成一张图,那更像一个 ai 产品。但是如果他能带着上下文,拆步骤,调用工具,持续的推进任务,那他就是 agent。 那最后给大家总结一下,大模型呢,就是最底层的大脑,比如说 g p t 五点五, cloud jimmy kimmy k 二点五, cds 二点零。那 ai 产品呢?是普通人使用 ai 的 入口,比如说切克 p t 豆包 啊, gemna 的 app 等等。那 agent 呢?是能执行长线任务的 ai 系统,比如说 code 飞速 alley open cloud, 还有爱马仕 codex cloud code。 所以 以后啊,你不要再问哪个 ai 最强了,更好的问题是,我现在需要一个及时助手,还是需要一个长期推进任务的 agent? 如果只是写文案,问问问题,生成图片,用 ai 产品就够了。但是呢,如果你要他持续跟进项目操作工具,处理流程,完成复杂的任务,那你真正需要的是 agent。 我是 优娜,关注我,带你了解更多 ai 知识!

六月下你就要付费了,你愿意花这个钱吗?不愿意。我觉得 chad 的 gpt 更好用。他如果比 gpt 便宜,性价比更高的话。我不考虑的呀。但是我觉得很难, 至少现阶段很难。 chad 的 gpt 还有 codex 里面不是有很多服务吗?他可以帮我做小程序啊。我现在在做的一个东西就是给我儿子学汉语,大概半个小时,可能这个他的 图形就出来了,我只要把图片放进去就行了呀。这个就很好用啊,因为现在就是真的很方便你,你所有的想法你都可以用 ai 来实现。

某天,我在楼下被一个陌生人拽住,我疯狂呼救,接着许多路人围观上来,但他却翻出了我俩的合照,说, 这是我老婆,我叫他回家呢。你看,这是我们的照片,可我从不认识他。随着 check gptem 二点零的上线,意味着有图有真相的时代真的过去了。有网友做了个测试,同样发指令 生成一张中国九十年代团圆饭图片。豆包生成的,还是一眼假的油画杆?假人!而切记 g p p 生成的,不告诉你是 ai, 你 根本分辨不出来!男女老少的神态各不一样,桌上的菜不鲜艳,但特别真实。还有年代感十足的旧家具、 老水壶,甚至连相机闪光灯的反光都还原的明明白白。不止于此,还有这张聊天记录。第一眼,你只会觉得配图是 ai 合成的,是从头到尾全部由 ai 生成, 全程毫无破绽,普通人根本无从辨别真伪。这些这些全都是 ai 几分钟搞定的,老一辈还停留在有图就有真相的认知里面,对这些毫无破绽的 ai 假图,他们又该如何分辨真假,规避骗局?这一刻,才后知后觉懂了那句话,科技是把双刃剑, ai 进步的太快了,快到我们已经开始害怕它到底是便利还是隐患。

从来没想到豆包还能这么用。事情是这样子的,我最近在学习英语,原本我以为拆的 gpt 用来去练英语还是不错的,但是我给你听一下,这两种感受到底会差在哪里?首先,你听一下拆的 gpt 读英语的这种感觉, 你就会觉得, even ads that don't directly influence an ai models responses and instead appear separately within the chat window。 这里边的问题就在于,它是连成一气的,没有很明显的,没有很明显的断句。然后呢,你如果用豆包去听的话,你会发现, people new to a field will often copy existing work there's nothing inherently bad about that。 我 自己设定的语速大概是零点七五倍。这个对于新手学习来说啊,我觉得可能, 哪怕尺子 gpt 更地道,但是对于新手来说更慢更符合逻辑语序的断句,我觉得可能会更有帮助。 第二个,豆包官方自己都没想到的用法是,旅游的时候用豆包去旅游,但这里不是让豆包给你做一个旅游攻略。 而且截止到今天,我还是觉得 a a 做的旅游攻略啊,就是糊弄人的,因为他不知道我的偏好,不知道我的上下文的情景,没有我的记忆。他做出来的东西就根本就 就是看起来很好看,但是没什么卵用的旅游计划。但我拿出去用的不是去做旅行计划,而是做主题旅游。 什么意思?比如说我自己特别对苏轼感兴趣,哎,那我就会去惠州一趟,然后我会去惠州的西湖,苏东坡的纪念馆,在那个地方,我打开豆包的专家模式,然后在此情此景下,你去问 苏东坡的各种各样的信息,比如日弹荔枝三百颗,呃,然后你让豆包还原一下当时的场景,你就会知道,原来苏东坡当年呃在写日弹荔枝三百颗的时候,甚至都没有办法吃得起肉,然后只能是野果冲击。所以 每天吃三百颗荔枝基本上就是一个夸张的说法,就是说老子哪怕不吃肉,老子过的也非常开心,每天能吃三百个荔枝,就气死你们这些栽赃陷害我的。所以你还原了当时的情景之后, 哇,你会发现主题旅游非常有趣,而且主题旅游之前非常难的地方,你自己要去拆解一堆的问题,但是豆包的专家模式帮你全部规避了这个东西,所以我觉得豆包的潜力可能还远不止如此啊。 当然,如果他哪天收费了,我或许真的会挣扎一下,然后去先充值一个月去看一下,因为目前来说,这可能是我用的最高频的 ai 软件了。


一定要一定要,我们日常生活中一定要多去用下豆包呀!国内 ai 一个到底谁?这一定不用说了吧,自然是我们抖爸爸的豆包。 ai 相对于国外的四大幻城,他有哪些优缺点呢?啊,今天我正好问这问题,问了豆包 啊,以下是他给我的答复,中文能力自然不用说,遥遥领先。那英呢?英文能力自然也不错,甚至可以和 glog 相持平, 多模态理解,多模态深层也是遥遥领先。推理能力也很不错,和 gmail 和 glog 也基本持平。最重要一点是什么?这个也是我用的非常多的一点,语音交互能力,这个可以说遥遥领先也不为过。还有一个最重要一点,当然是国内访问以及性价比。 既然豆包这么好用,今天我就来测试一下,让他来帮我写一篇综述,看下结果如何。有摘药关键词引言, 然后设计策略,应用进展,最后包括结论以及参考文献,他都应有尽有,还可以说整体功能还是非常强的。唯一不足的就是由于我用的是免费版本, 所以他参考文献我查一下。呃,目前幻觉还是比较严重啊!最近豆包已经推出了付费版本,大家感兴趣兄弟们一定要去试试,我相信有了它的付费版本,再配上它的专家模型,效果一定是会不错的。

豆包千问, chat gdp 相信你都不陌生,那么 coser、 cold body tree 这些呢? 再接下来, cloud code code、 dex 这些你有没有听过?我相信这些 ai 工具频繁地出现在你的社交媒体上,但它们到底是什么关系呢?今天我用五分钟讲清楚的 ai 工具有三种形态, 第一种,豆包元宝 chat g p 这种 chat 类产品,打开对话框跟 ai 说话,我相信百分之九十九的人也是从这里去使用 ai 的。 它的特征就是只能聊天,没有记忆,没有本地文件读取能力,更像是一个大号的智能搜索引擎。第二种, g u i 智能体 tree, codebody codex 桌面版都属于这类, 使用很简单,打开一个文件夹, ai 就 在里面跟你一起去工作,他能读取你电脑上的文件,也可以直接改你的工作区。这类产品现在已经不是程序员专属了,所以推荐其他的岗位同学也可以上手体验一下。 第三种, c l i cloud code codex kimi c l i 大 模型跑在命令行里,这种形式看起来比较奇特, 用起来有些门槛,但真熟练了,比前两者都强大。为什么?模型虽然都是一样的,但外面那一套调度循环工具调用、上下文管理、记忆管理等等,都是为了匹配模型做的一系列工作。 这也是现在很火的一个设计范式, harness engineer, 而 cli 就是 把 harness 做到了极致。接下来演示一下。 cli, 我 放一份 prd 文档在这个文件夹下,目标是做一个网页版的番茄钟,加任务清单。 我在这里说一句,根据这个需求,文档做一个 mvp 出来,剩下的他自己去读 prd 识别功能模块,然后写代码,最终完成目标,这就是 cli 进的 好。我们把整体的布局梳理一下,首先是国外的预参加 open ai、 astropic、 google, 以下是它们的这些产品。 其次是国内的字节,阿里、腾讯、小米,以及这几年陆续成立的大魔性公司 deepsea、 月之暗面、智普、 mini max 还有 coser, 大家可以截图保存一下这些关系和名字,方便以后查看。最后总结一下, chat 有 chat 的 方便, c l i 有 c l i 的 强大,关键是看你的需求。如果你想让 ai 深度参与到工作中,我的建议是从 g u i 开始入手, 随便找一款工具,酷狗吧里吹都可以。打开一个文件夹,让 ai 在 你的工作区里跟你一起干活, 不要光看不练,选一个工具去用,让大模型真正进入到你的工作流,这才是深入体验 ai 的 正确方式。

连 ai 自己都会被 ai 骗,我让 chad 的 gpt 生成了一张所谓二零一零年高中教室的监控实拍图,然后把这张图发给豆包,问他是不是真人拍摄的, 结果豆包斩钉截铁的说,这是真的,不是 ai 产物。可讽刺的是,就连这个 ai 被骗的对话场景本身也是我用 ai 生成的,而且毫无违和感。曾几何时, 我们还能靠手指数不对、文字乱码、光影错乱来识破 ai 图像,但今天,它已经能精准模拟摩尔纹、皮肤、油脂反光,甚至手机拍摄时那种微妙的虚化感,更别说生成你和某个明星或陌生人的合影,逼真到连你自己都可能愣一下。 当伪造的内容连专业 ai 都难以分辨,那眼见为实这四个字恐怕只能沦为一句苦笑。我不是在制造恐慌,而是提醒一个正在逼近的现实,技术一旦普及,最先钻空子的往往是骗子,他们不会等监管跟上,只会立刻用最新工具包装谎言,伪造视频、 捏造聊天记录、合成语音通话,让你防不胜防。所以,从现在起,请对屏幕上的一切内容保持警惕。无论是银行短信还是亲友发来的求助视频,先别急着相信,默认他可能是 ai 生成的, 再通过电话界面或其他独立渠道交叉验证,转发给你在乎的人,尤其是不太熟悉数字技术的长辈,告诉他们,眼见不一定为实在,清醒是我们最后的防线。

最近我一直跟大家在分享 codex 或者 coco 的 时候,评论区最常见的问题就是,它跟豆包到底有什么区别啊?是不是豆包也能携带吗? codex 也能聊天?那不都是一样的吗?甚至有人会问,我已经有豆包, kimi、 deep sick 呢?还要不要再学这些看起来更复杂的工具? 哎,我觉得这个问题特别典型啊,就是因为大家其实把这两类东西混在一起比呢,你拿豆包跟 codex 去比,有点像问一个能够帮你马上去做出 ppt, 写报告来做图片的,一个万能的一个 app, 和一个能够帮你用你的电脑去读理项目,改理文件,跑检查的一个 ai 的 实习生,到底谁会更厉害?我觉得他们不是一个赛道啊! ok, 大家好,我是 fred, 这期我们就用最简单的方式去讲清楚,想豆包啊, codex code 到底它的差异在哪里?而 kimi 和 deepseek 又应该放在什么样的位置? 很多人我们觉得一比较 ai 工具,就会问它到底能不能写文案啊?比如说它到底能不能做 ppt? 哎,能不能抠图,能不能写代码? 这个问题也不是错的啊,但很容易把所有的工具都混在一起,因为现在大部分的 ai 工具都有会把这种功能做得越来越全,对吧?真正的区别不是说功能的这种清单 啊,一张,呃,而是他的工作的位置。如果你想要一份的内容,一张图,一个 ppt 啊,那你就是在这种平台里面去要结果。如果你想要处理自己电脑里面的项目、文件、脚本、网页测试和工作流,那就不是普通的这种聊天的 chatbox 啊,或者是这种网页端的 agent 能够完全覆盖的场景呢? 我把诶,第一类就是类似豆包啊, kimi 啊,包括 deepseek 放在一类啊,我叫它就万能的这种入口的这种 app, 它最大的优势就是低门槛, 哎,打开这种网页啊或者 app 就 能用,比如说豆包适合快速去做搜索啊,图片的视频啊, ppt 啊,日常内容啊。而 kimi 适合一些长文档资料这种密集型的一些研究,还有一些 a 帧的工具 啊,一些 a 阶的任务。而 deepstack 更适合去做一些深度的推理啊,文本的沟通,当然也可以作为 api 或者底层模型来去做一些口令。那这类产品最适合普通人上手,是因为它已经把复杂的能力封装成了按钮界面和模板 啊。然后第二类的话就是 codex, 那 和 callcode, 我 更愿意把它叫做一个 ai 的 十一生,就它厉害的地方不是说多一个聊天框或者怎么样,而是它可以这进入你真实的一个环境, 比如说它能够读你本地的项目文件,理解你已经写过的规则,帮你改脚本,改网页啊,改文档,然后再跑一次检查,确认这次改动没有问题。在网上 它还能把你重复做的流程沉淀成 skills, 变成你自己长期的工作流。所以说它的门槛会高一点,你要理解文件权限啊,以及验证,但它的上限也明显高非常非常多啊。 呃,我现在比如说打开两个文件给大家去演示,比如说这是 codex, 我 某可能一百个 csv 啊。然后我可以在这个文件夹里面,大家可以看到我的文件夹里面,比如说,哎,看不到啊,不好意思啊,我这文件夹里面就有一百个 csv, 我 让他去帮我做,把这一百个 csv 做成一个深度数据洞察,生成一个 html 分 析给我,那你们就可以看到 他就已经啊单独把整一个内容啊,一百个文件去做了深度的分析啊,包括时间节奏 啊,月份啊,热力图,白区域的表现,渠道的结构,销量排名啊,增长风险机会点等等等等。你可以理解他把一一百个 c s v 啊,都做了深度的数据的洞察和处理,然后生成了一个看板给你啊, 即使它是一千个和一万个,它也能够完完全全去处理,这就是 codex 或者 coco 这种类似,你可以把它当成实习生也好,或者怎么样也好,它能够处理的一个工作。而对于比如说豆包而言啊,我觉得有个最明显的差异,就比如说我举例子,我这里传文件哈,对吧? 啊?然后我这里比如选但凡超过五十个啊,你就可以看到,比如说豆包这里面只能理解五十个文件,所以它会本身会有一些呃文件的限限制。 然后同时我这里面有创的上传了五十个 csv 啊,统一让它生成 html 给我。那这个时候呢,它其实豆包给的一些结果我觉得也还是蛮不错的啊,比如它能够生成一些 csv 的 这种啊, 一一些分析的报告啊,一些指标什么的,但是它确实这一次没有成功的给我输出一个 html 报告,理论上它是可以输出的啊。同时呢,我们也可以再去看一下,比如说像豆包还有什么样别的功能,比如它可以生成 ppt 啊, 图像生成,当然它也一些哦,有一些扣点的东西,它底层是火山引擎的编代码啊,模型,然后一些解析啊,写作啊,但后面还有生成音乐翻译,视频生成,深度研究, ai 播客记录,会议啊, ai 表格等等等等等等。 所以说你可以明显看到像豆包这种 app, 它把很多我们普通人常用的一些 呃内容啊,都封装到它的网页里面。而 kimi 啊和 deepsea 都是类似的,所以说我们一张图来讲清楚这两者的区别。第一个就是看它的使用门槛 啊,豆包、 deep, deepsea, kimi 明显很更低,打开就能用,而 codas、 cloud code 还需要去配置权限,配置网络,那就门使用门槛会高一些。 第二个是工作环境,而豆包 kimi d p c 更多是在平台自己的网页或者 a p p 里面去使用,而 codex cloud code 更多是在你的项目终端和电脑里面。而呃,前者的这个典型的产物,就比如说大家常用的刚刚给大家演示的 ppt 啊,回答啊,图片啊,视频啊,报告等等。 后者呢,更多是去改一些脚本啊,改一些文件输出网页以及整个的工作流。当然前者他也都能生成,所以说他的上限会更高一些啊,前者的优势就是快啊,适合普通人,后者就是上线能更高,真正的去接触接触我们真实的一个工作流。 然后它的风险呢,可能在于说它的产品边界,比如说刚刚只能传五十个文件,对吧?而 codex 或者 cloud code 呢,它的风险我觉得可能现在主要还是在于说网络的一个问题。 ok, 所以 说听完今天 fred 整个的一个分享,我相信大家对于 cloud code 或 codex 与豆包 kimi 或者 deepsix 这样的一些网页或工具 的区别有一些明显的认知。当然我也不代表说呃像豆包 kimi 和 d p c, 它做不到 codex 或 call code 这个底层模型,它能实现的功能 包括说像豆包的呃模型,包括 kimi 的 呃模型,包括 d p c v 四 pro, 现在也都能够做很多 coding 的 呃工作啊,所以说会越来越接近,但是明显现在还是会有区别,以及它们的用途和使用场景也会有区别。 ok, 我是 fred, 呃,我们下期会持续吧。呃呃,适合大家的一些工作流啊。用 ai 来看怎么去介入,我们下期再见。

gbt 听说豆包要开始收费了,你怎么看?别着急,免费版还会存在,但区别很快就会显现。你可能会发现,免费用户的答案开始不那么准, 响应也会慢,但付费用户会得到快速而精准的结果。 再过一段时间,你会发现推荐内容变得越来越懂,你甚至开始有倾向。为什么呢?因为这两年你提的每个问题都在帮助 ai 学习。 曾经免费的其实是我们自己,而现在 ai 要把这些聪明卖给真正做生意做决策的人。收费其实就是这个转变的开始。 那我以前一直都是不要钱的呀。没错,你之前的每次提问,其实都在帮助 ai 变得更好,你以为在用它,其实它也在用你的数据长本事。 现在它准备把这些能力卖给那些愿意付费用 ai 提升效率的人。所以你才会看到这个转变。过去免费也是因为我们都在贡献力量。

很多朋友会问,就是我已经有了豆包 deepsea chat 的 gpt, 那 我还有必要去折腾 openclaw、 小 龙虾和爱马仕吗?那它们之间的本质区别到底是什么?以及我该如何把它们组合起来去使用呢?作为一个 ai 工作流业务落地场景的搭建者,今天我用一条视频给你讲明白, 哪怕你是第一次了解 ai, 你 也能够听得懂,用得上。那我先给大家做一个最通俗的比喻,听完你就能够懂这里面的核心区别了。你有没有发现,就像我们现在在用豆包、 deepsea, 甚至是 chart gpt, 其实更多的呢,是去它的官网,去注册账号去使用。这就像是什么呢?就像是你今天想要体验车子,你去到了奔驰的四 s 店,那四 s 店的服务肯定是好的没话说,而且四 s 店他们特别愿意把最新款的产品拿出来给你去感受。 但是呢,如果说你说你想要在它这个座椅上做一个自己专属的图案,你想要把它的车灯,把它的车衣全部都给改造一下,那你觉得你在四 s 店里面能做吗?是不是不能?为什么呢?就是因为这个时候这个车子的使用权其实不是你的,而是这个四 s 店的。 而小龙虾跟爱马仕是什么感觉呢?就是今天你把这个车子已经买回家了,那你买回家了之后呢,它的车灯、车尾、车衣、车模等等一系列的,你想怎么改就怎么改,它现在的所有权是你的,所以它可以由你自己去做深度的改造和定制。 而我们搭建 ai 工作流的核心呢,就是把这些可定制的 ai 产品去和这些通用的 ai 大 模型组合起来, 在你不改变自己工作习惯的基础之上,形成你自己专属的业务系统。通俗易懂的来讲呢,就是取各家所长,最后组合成自己的矩阵。最近的三个月里呢,我在大家对 open call 很 推崇的时候呢,用到抓狂,然后在大家开始慢慢对它去魅的时候呢,算是打磨出 自己的一些方法论。包括现在呢,我在结合飞书多 a 表格和 openclo 去打造一个新的一个内容的生产模型。那么像 openclo、 爱马仕,我在用下来的这个过程中,有一个很深的感受,一定要给大家分享一下。就是呢,我发现我用着用着呢,无形中我的一个工作习惯发生了改变,就是我现在 变得更加愿意去整理,更愿意去梳理 sop, 去沉淀我自己的内容资产了。就拿纳瓦尔宝典这本书来说,当我在跟豆包 deepsea 去聊天的时候,如果说会用到纳瓦尔宝典里面的一些知识和理论,那么我可能会把它写进提示词, 或者说是跟它沟通的过程中,我就把它植入了,比如说请你用纳瓦尔宝典里面的什么什么方法来思考,然后给我回答这样子的一个问题。 为什么会这样子呢?就是因为他的这个大模型的对话,他的上下文长度的问题,导致了我必须以最简短的这个文字量里面给到最大的一个信息密度,去让他最终的质量变得更好。这个就是提示词驱动的大模型沟通方式,那么这个沟通方式他也决定了很多人, 哪怕是用同一个工具,他如果说没有一定的积累,没有一定的提示词的一个编辑能力,他用出来的结果就是不同的。 但是我跟爱马仕去沟通的时候,就完全不是这样的方式了,我给大家分享一下,就是我会怎么做呢?我会先把这本书放到我电脑里面的指定位置,然后再把这个路径告诉他,这里面有一本书啊,叫纳瓦尔宝典, 请你通读纳瓦尔宝典,然后呢把这里面你认为最核心并且对我业务有帮助的信息全部都提炼出来,形成你自己的知识体系。然后呢你再把它存入非书云文档, 当你每一次回答商业问题的时候,你必须去这个非书原文档里面去调用里面的一些知识来对我进行一个回答。那这个里面其实它是一个串联的一个步骤,它最后出来的质量呢,其实并不比我去用 cloud 或者说 cloud gpt 回答的这个质量差。所以在这里面它就更像是什么呢?它就更像是一个你的员工,在他入职的时候呢,你给了他一个操作手册,然后呢一点一点的把操作手册细化给他,然后让他在学习的过程中呢去完成一些工作。那 这个时候呢,他的一个工作的行为习惯,以及工作的效率,甚至他的思考方式,其实都是可以由你来定义的。还有一个比较牛的点,我也给大家拆解一下,就是他的一个主观的东西,假设你有个需求,就是你每天早上十点钟 你都想要收到行业的实时热点新闻,这个需求如果我用 open call 爱马仕来完成,那我就是跟他讲, 请你帮我做一个计划,每天早上十点指定的在这个群里面帮我去推送 ai 自媒体行业的一些热点新闻,并且存入你的长期记忆。然后呢,你新闻的格式呢,要按照这样的格式来写,基本上我就会这样去给他加任务,然后他就会开始给我刷刷刷去开发他的这个功能。 但是呢,如果说我今天想要在豆包这里去体验实时热点新闻的话呢,我是没有办法去跟豆包说,哎,豆包你每天十点给我推送豆包,是他是不会主动给我推送消息的, 基本上是我主动去找他。但是呢,如果说我给 openclock 爱马仕设定好了之后呢,是他每天准时准点在群里给我推送消息,所以说这个点上来说,我觉得他还是挺大的一个区别的。那这个时候肯定有人来问了,那是不是我以后所有的需求都找龙虾和爱马仕就行了? 那我豆包跟 deepsea 就 不要用了呗?啊,不是的,完全不是。恰恰相反,就是在 ai 时代,不同的 ai 工具它都会有自 的差异化定位和优势,我们要做的一定是取其所长,把不同的 ai 工具的优势给它组合起来,最后形成一条自己的业务流水线,那才是最高效的。结合我自己长期实测下来的一个真实体感, 我把今天我提到的这几款工具,它的一个最佳使用场景给大家逐一拆解一下。哪怕你是一个新手,你拿着你自己的需求去对号入座,也绝对不会踩坑。日常当百度用,你选豆包, 查个本地问题,问点生活常识,让他去给到你最新的一些实时热点,你都是可以去找豆包。因为豆包这里面他的一个信息抵达速度是非常快的, 他能够抓取到的这个信息的宽度会比其他的一些免费大模型来讲会更宽一些。比如说你问他杭州本地出车哪家公司最靠谱,他就会去给你全网去搜,还会给你推过来一个讲解的视频什么的,这些视频点进去,你会发现他的时效性其实还是挺 不错的。所以豆包这个非常强大的咨询获取量,其实也取决于它整一个字节跳动的生态,取决于抖音背后的一些数据的贡献。 那么如果说你是遇到了问题,需要深度的去拆解的,比如说你遇到的是人生困惑,创业选择数学方程,甚至说是代码编写,那么你可以去找 deepsea, 尤其是它现在更新的 v 四 pro, 它能够去帮你单点突破的能力是非常强的。它很多时候它出来的这个结果其实都不输于 cloud 的 跟 cloud gpt。 最 最后呢,就是大家问的最多的龙虾和爱马仕怎么选?如果说你龙虾爱马仕都没有装的情况下,我建议你直接装爱马仕,因为它对新手呢是非常的友好的。龙虾的话呢,它好用,但是它需要调教, 然后小白其实会调教起来比较费劲。但是爱马仕的话呢,它在龙虾的基础上,它有一个长期记忆和一个自主进化的能力, 所以说呢,它会更好地去记住你的一些喜好,而且它所有的过程它都会给你实时同步出来,就是不会像龙虾一样聊着聊着人就不见了,整体来说的话,它的上手门槛会更低一些。 所以给大家最后总结一下,当你遇到的是一个简单的一个问答型的问题,那么其实你是遇到一个复杂的一个问题,它是很多个步骤层层递进的,而且这个需求可能是你长期需要的。 高频会出现在你业务场景中的,那你可以选择去用小龙虾或者爱马仕,把它做成一个你自己的一个私有化的一个业务工作流,那这样你长期去使用以及和 ai 提升的效率其实就会越来越好。好,今天的干货就分享到这里,我是茉莉 ai 工作流业务场景的搭建者,关注我,了解更多 ai 新知识。

ai 工具这么多,你用对了吗?豆包聊天的 tipsick 输出长文案 kimi 总结资料看文件 空一千问办公写作做表格腾讯元宝查资料配合绿泡泡拆 gdp 做策划,适合做战略互问奇梦做短视频,画面可零,让静态画面动起来剪映剪视频做成片儿 伽玛做 ppt 做课件 solo 生成音乐你还知道什么 ai 工具?评论区可以打出来。

豆包都开始收费了,那我们外贸人或者跨境电商人,我们需要去购买付费版的豆包吗?今天我把这个事情拆分一下啊,我的这个思路就是把它拆分成几个维度,一个是, 呃, ai 处理文本这个能力方面,还有处理视频,处理图片,还有一个 ppt 嘛,我们把四个维度来替换一下, 呃,我们来详细讲解一下。呃,首先文本的话,这个做外贸的话,呃,如果在写网站里面的内容,文本方面的推理的话,肯定是国外的 ai 更适合我们跨境电商人,因为我们知道大语言模型它其实就是通过第一个单词预测下面这些单词出现的这个概率。所以我们这个豆包呢,它是在整个中文系统 下头位的一个数据,当然英语的数据他也是有,但是他不够全面,因为国外一些网站是禁止中国这些东西去访问的,所以他们能够学到的东西 可能没有国外的全面。而我亲自去做这个文案的时候,我也发现了我让豆包去写过德语的方面的文案,我发现豆包写出来的德语里面直接出现了中文汉字,比如说其他的上下文都是德语的情况下, 在文章正中间突然出现两个汉字,塑料就是塑料,这两个汉字我就知道了豆包学的这个数据源吧,他多多少少是有些问题。后面的话我基本上用国外的,写文案的话,我全部是统一用 excel、 gpt 或者是谷歌 gmail。 我 们要给所有的跨境电商人还有外贸人说清楚,在写给老外看的东西的时候,一定 使用老外的 ai, 不是 崇洋媚外啊,是我们每一个大语言模型 ai 学习的这个 知识点的一个问题哈,所以我们处理文字方面我们讲了,那处理图片呢?对吧?有很多公司他可能网站里面或者是平时用到处理图片比较多,然后豆包这个东西的话,我看了好像是处理图片,他能够处理的更高清,而且速度更更快,这是付费版, 而且还没有这个水印,那如果你处理图片比较多的话,这种场景你是可以去购买这个。 呃,豆包付费版的另外处理视频,对吧?豆包免费版他的视频是低于好像十五秒的,如果你是付费版的话,他这个视频时长就可以做到比较长, 所以如果你处理视频比较多,当然如果是中文类的视频,呃,不需要语音的那些视频的话,那这个豆包的付费版也是值得购买的。最后就是做那个 ppt 嘛,对吧?豆包的 免费版的做 ppt 我 体验过,效果还可以,当然人工介入修改的这个部分呢,起码也要达到百分之三十以上,因为没有办法把你这个思路完全体现到 ppt 里面,所以这个你平时做 ppt 做文档比较多的话,那你还是可以值得去购买一下。

如果你最近刷到一堆 ai 名字,脑子里只有一句话,这都啥?先别怀疑自己,也别急着下载十几个工具,不是你笨,是 ai 圈起名字真的有点爱叠 buff。 先记一个小规则,同一个名字可能有好几个身份,比如 deep seek, 打开网页或者 app 跟它聊天,它就是 ai 应用。但开发者把 deep seek 接近工具里,它又是大模型能力。 所以第一期我们不被定义。先把名字放进四个盒子, ai 应用、大模型、 agent 产品、 agent 框架和工作流平台。 ai 应用最适合小白先用,比如 chat gpt、 豆包、 deepseat timi 通、一千问,还有质朴、清言、文星一言讯、飞星、火海螺 ai 这些国产应用,你先让他帮你写改总结,读文档,别一上来研究底层 大模型更像发动机,比如 g p t kim kimi, g l m lama, hermes, 平时你不一定看见它,但答案能跑起来,靠的就是它。 agent 产品和代码助手。再进一步,比如 manus jenspark、 openclaw, 还有 codex、 cloud code, hermes 这些经常被刷到的名字,他不是只陪你聊天,而是会调用工具把任务往前推。听起来很爽,但新手先别兴奋到乱授权,因为他可能碰到文件、账号、网页这些东西。 最后才是框架和工作流平台,比如 dfi cos lan, graph pro、 ai autojam agents sdk 这些像搭系统的底板,适合你知道要自动化什么之后再学,不然就像还没想好做什么菜,先买了一整套厨房设备。小白路线其实很清楚,先用应用,再懂模型,然后学 agent, 最后搭自己的工作流。 这个系列就按这条路来,不突然把你扔进代码海里。下一期我们讲一个最容易被神话的词, agent 到底是什么? 想从零跟着学评论入门,我会把每一步都拆成普通人能听懂的版本。

我最近和豆包聊天,发现一件特别有意思的事情,就是我以前对自己长相的认知有很多可能都是完全错误的。我把我的照片,我当时刷到一个视频,然后嗯心血来潮把自己的 脸的照片发给豆包,让他来分析我的脸部的五官比例,然后脸型这些东西,然后就是豆包和 chinese ppt, 他 们都是可以识别人脸的。我一直以为我是长眼,然后长脸长中庭,嗯, 结果豆包跟我说我不是长脸,因为我你看我现在是有眼线的,但是我的眼睛形状其实比较短的,他说你是嗯比较 短的眼睛是短的性眼。然后你的脸其实并不长,是因为你的发际线比较长,额头比较长,所以你会觉得你的脸整体是长的,其实你的下半部分脸是比较嗯方圆脸,比较短圆脸的那种,然后他说 嗯你的中庭也并不长,然后是因为你的脸的整体是比较长的,然后就非常醍醐灌顶,他还说嗯 是叉 t g b t 这个是叉 t g b t 说的,他说你不是淡颜,我一直觉得我是淡颜,然后他说你其实是有一点浓颜的,你不是完全的淡颜。 然后我会把我跟他聊天的那个呃指令放在视频的最后我是这样跟他聊的,我让他把我的整个五官,包括我的眼距,眼型,然后嗯这个整个脸型的比例,还有我的呃化妆的时候应该去嗯 妆容的一个思路,还有跟我长得比较像的那些名人,因为我觉得 名人他一般都是有造型团队的,那你如果找到跟你长得比较像的名人的话,你就可以去参考他的打扮思路,相当于,嗯,你为自己免费的有了一个造型的顶级的造型团队的这种 概念。然后你真的我非常推荐你可以把照片发给豆包或者是 check the gpt, 让他帮你,嗯,让他帮你分析你的脸可能会有很多完全超出你认知的,他会给你很多超出你认知的答案, 以及如果大家有选择的话,我其实更推荐大家去用拆的 gbt, 因为他在给你分析的时候他会附带照片给你参考,比如说发型,他会把你适合的发型的照片直接给你, 嗯,然后就非常的细致,比拆的 gbt 比豆包更加的细致。

其实大模型刚才咱就大概说说了。说啊。对,大模型,你想大模型还是大模型?他只会空想,他就是个思想家。哈哈,他就会想,他就会想,想了想。你告诉你,你怎么卖,你怎么卖,但他就是不干。 这是,这是,这是大模型脑子,他是个脑子,他没有手,没有脚啊。但是 agin 呢?是啥? agin 呢?其实是相当于给那大模型装上了一个手和脚,这个手和脚是相当于他能在你的电脑上干什么事?现在还局限在电脑上啊?就是在你的电脑上 我能干啥?你授于他权限,那,那授于他删,删除某些文件的权限,授于他整理文件。呃,桌面的权限。 ok, 你 给他的权这个权限,他就能去 真正的帮你去干这件事。所以说它里面的两个根本区别就说一个只会想,一个不单会想,我还会干,大概是这样。

假如豆宝学 ai, 今日聊 ai 到底会不会思考?老师,我天天用 chat gpt, 它答得跟真人一样,它是不是真的在思考啊? 我先给你泼盆冷水。他根本不在思考他干的事,就猜下一个字啊。猜字这么聪明的东西,你跟我说他在猜字?你打字时手机蹦出来的输入法联想知道吧?你打,今天天气他给你接,真好。 知道啊,那个我天天用叉 gpt, 说白了就是一个读了大半个互联网的史上最强输入法。联想一给他一句话,他就猜下一个字最可能是啥?等等,他不是先看懂了我的问题才回答的吗? 他不看懂,他预测他读了几乎整个互联网,记住了字跟字之间的概率。床前明月,后面大概率揭光。他不懂李白,他只知道全世界都在这揭个光。那他怎么一个字一个字蹦出一整段话的? 猜完一个字接上去,再猜下一个,猜一个接一个再猜,就像玩接龙,一路接到句号。你看到的长篇大论是他猜了成百上千字的结果。 这么一说,他好像确实没在想,可他为啥答的那么对?因为他读的太多了,读的越多,概率压的越准,猜的就越像懂。但猜的准和真的懂是两码事。那他会不会一本正经的胡说八道啊? 当然会,那就是概率把他带沟里了。他不知道自己错,因为他压根不知道自己在说啥,他只是在猜, 我悟了。所以他不是个会思考的脑子,是个把猜字练到出神入化的机器。对,记住这一点,你就比九城人更懂 ai 了。下次他答得神乎其神,你心里有数。他不是在思考,他在猜下一个字。 关于 ai, 你 有啥想搞懂的?评论区告诉我,我会一期一期用大白话讲给你听。关注我,我们下期见。

普通人刚开始学 ai, 别一上来就到处试,先选一个聊天型 ai 当主力工具就够了。 比如 chat、 gbt、 kimi、 豆包这类工具最适合先练,你可以拿来问问题,写文案、改表达、做总结。先把一个工具用顺手,你就会知道 ai 到底怎么帮你做事。等这个主力工具稳定了, 再去扩展搜索型、声图型、视频型工具。记住,先学会一个,再学会一类,这样最稳也最快。点赞、收藏加关注,下期继续解读更多 ai 实用技巧!