粉丝818获赞6.7万

最近玩智能体啊,实在太消耗 token 了,所以我们今天要来讨论说啊,哪里能搞到便宜的甚至是免费的大模型 token 呢?首先我们来看一下,如果正常使用 token, 大 概是个什么价格呢?像我们日常最常用的这个网页版的聊天机器人啊,类似于豆包、 jammy 这些网页的服务, 一问一答,大概每一次呢会消耗几千到几万的 token。 一个月下来呢,大概可能就是三百万的 token, 数量也就是几块钱。但 agent 就 完全不一样了,它要自己规划,自己执行,自己反思,一个任务跑下来呢,可能会调用几十上百次模型。像我们最常使用的 cloud code, open code、 open cloud 这些智能体啊,每一次跑起来都要消耗几万甚至上百万数量级的 token。 我 也翻了一下我自己的使用日志啊,然后大概估算了一下,我每个月的使用量呢,大概是三亿个 token 左右。然后我们来算笔账,如果你使用的是 cloud sum 的 四点五这个模型, 它的价格呢,大概是每一百万的 token, 输入呢是三美元,输出呢是十五美元。考虑上一些这个缓存啊,折扣啊,平均价格呢,你可以认为是每一百万的 token 五美元左右。那这么一算啊,其实你跑一个 agent, 每个月其实要烧掉一千五百美元左右, 就算是换成便宜的多的国产模型啊,一个月也要用到两百到三百美元,这个价格呢,我觉得还是蛮离谱的。所以这期视频啊,我就来跟大家聊聊,怎么才能搞到便宜的甚至是免费的大模型接口。先说好,这期视频呢,是没有任何的广告的,全是我自己实测 实际使用的经验。在正式开始之前啊,我想先给你一个这个思考框架,省钱这件事情呢,本质上其实就在做三个维度的取舍,价格、稳定性、模 的能力。你不可能三个都要,如果你想要最强的模型并且稳定,那肯定就会稍微贵一点,如果你想要便宜,那肯定就要牺牲一些模型的能力或者是稳定性。我们带着这个框架呢,然后再来逐个看各家的方案。先来说这个 cloud 买套餐到底能省多少钱呢?官方没有公布套餐的实际使用量,但有人测过了数据呢,放在这个网址里面,我给大家总结了一下,如果你订阅一百刀的这个套餐,用到极限的话,就能用掉价值一千三百五十刀的这个额度, 相当于打了不到一折,换成人民币算的话,差不多就是零点五元的人民币就能买到一美元的这个使用量。但 cloud 的 官方有两个大坑啊,大家也都知道,第一呢就是国内的用户特别容易封号。第二个呢就是不允许介入其他第三方的服务, 只能在这个 cloudco 的 这些官方应用里面使用,没有办法拿它去接入 opencloud 或者是其他第三方的这个智能体。如果你又想要这个按量付费的这个灵活性,又想要这个套餐的折扣价,那怎么办呢?我觉得唯一的选择啊,就是中转站,中转站呢,你可以把它理解成为这个零售商,就他们会去批量的向 cloudco 的 官方购买 这个套餐,然后呢在中间加一些价格再卖给你刚才说的,比如说零点五元的人民币兑换一美元以上, 市面上有上百家的这个中软站,那怎么挑呢?有人做了一个中软站稳定性的监测,大家想要购买,想要具体了解的,其实可以看这个网站,上面呢监控了几家比较大的这个中软站的稳定性。不过说实话,这个中软站呢,基本上还是一门比较灰色地带的生意, 所以呢,建议大家每次别充太多,这里呢就不具体展开了。然后我们来说第二家那个 check gpt, 相比较那个 cloud code 的, 动不动就封号啊,然后不让接其他的这个工具 open i 呢,其实就大方了很多, 它不仅能接自家的这个 codex, 还允许你去接 open code, 允许你去接 open cloud 这些第三方的项目,而且额度啊,要比 cloud 的 要给的多,大概是零点三元人民币就能买到一美元的使用量。更香的是啊, open i 的 活动特别多,比如说像那个 gpt 开通团队套餐,首月免费,你可以去某鱼搜这个 team, 新车几块钱呢,就能用上价值二十五刀一个月的会员。如果你拿这个会员去跑 codex 啊 token, 相当于说完全白嫖。 codex 的 缺点呢,就是它写代码的速度啊,会相对来说比较慢一点,不过呢,你可以开多个 agent, 让它并行去跑 数量去换取速度。然后下面一个是这个谷歌 gemini gemini 系列模型写代码的综合能力啊,普遍来说稍微比这个 cloud 和 gpt 弱一点,但有个骚操作啊,就是可以通过教育活动拿到免费一年的谷歌 ai 会员,然后用这个谷歌的编程 i d e anti gravity 来跑这个 cloud 模型,然后还有一个更狠一点的玩法,就 使用这个项目 cloud proxy api, 它可以把 antigravity 里面 cloud 的 模型转接出来给 cloud code, open cloud 这些工具去用。因为谷歌会员啊,几乎都能白嫖,所以它对应的这个 token 啊,也约等于免费。不 过这么玩的人啊太多了。谷歌最近呢,在频繁调整这个 anti gravity 的 额度,所以这个方法我也不是太推荐,因为它可能之后就不太稳定了。聊完了预三家之后啊,我们来聊一聊国产的这些模型。国产的模型呢,本来零售价就只有海外模型的一到两折,购买套餐之后呢,就会更便宜了。在国产模型里面啊,我觉得当下最强的可能就是最近推出的这个 kimi k 二点五,我实际用下来它的能力其实跟 cloudsonic 四点五几乎没有什么差别。有兴趣的朋友啊,可以去 kimi 的 海外版看一看, 有个首月零点九九美元的活动,能拿到原价九十九元的套餐,还可以支持这个接入第三方的 cloud code open cloud。 国内版 kimi 的 活动呢,就稍微差点意思了, 每周大概五元左右。但是 kimi 我 觉得最大的问题啊,就是套餐额度给的比较抠,控制台里呢,只显示了使用的百分比,看不到具体的 token 使用量。我实际测下来呢,比下面两家我要介绍的这个国产模型啊,给的量都要少得多。 gim 呢,应该是国内三家里面我觉得最大方的, 然后套餐的额度给的非常的足,最低档的套餐呢,是每个月二十元,每年两百四十元,但价格是真的香,我自己也买了。接口方面呢,也很开放,可以支持接入各种的工具。缺点呢,就是现在 g i m 四点七啊,它的模型效果暂时不如 kimi, 而且高峰时间段呢,因为顾忌它 套餐卖得太多了, token 的 吐字呢,我觉得巨慢。另外一个 mini max 呢,我觉得它的套餐跟 g l m 很 像,然后这里也不跟大家重复了。然后还有一家呢,大家可能没想到,就比较小众,就是英伟达。英伟达呢,其实它也提供这个完全免费,额度不限的这个开源模型, 包括前面说的 kimi k 二点五,然后 jimmy 四点七, mini max m 二点一。但是呢,因为可能门槛太低了,然后用的人实在太多,热门模型的速度呢,慢得离谱。所以这个呢,我就更不推荐了,只是跟大家介绍一下,英伟达,它其实也有这个免费的接口。最后啊,来再帮大家整理一下思路,如果你想追求最强的效果, pro 的 中转站呢,是目前性价比最高的选择。如果你的预算有限啊,那国产模型里面 g i m 的 套餐最实惠。 timi k 二点五的效果最好,但是有传闻呢,说这个月会有大批的这个模型,会推出新一代的模型,到时候呢,我再跟大家更新。然后如果你想白嫖呢? openai 的 这个 timi 拼车几乎是完全零门槛的, 效果也不错。这期盘点里面当然肯定没有包括说这个百分之一百所有的方案,市面上还有很多我没发现,或者是我没有测过的这个方案。如果你有更好的渠道,欢迎在评论区补充,大家一起交流。好了,今天视频就到这里了,我是迪总,黑心李超,我们下次见。

拆的 gpt 五点四强势来袭啊,小龙虾很有可能都不用养了啊!拆的 gpt 五点四直接操作你的电脑帮你干活啊,完全接管你的电脑!好消息是他可以直接干啊,你都不用配置,也不用部署。坏消息是你可能要准备好你的钱包,你的钱包要够鼓! 兄弟们,我先拿我的钱包给大家试试水啊!看好了,拆的 gpt 五点四已经开始跑了啊,看做一个任务能烧多少头啃!

翻墙使用 chat gpt 违法吗?我国并没有禁止使用 chat gpt, 但是无论注册还是使用,那么都需要登录外网,这个时候就需要 vpn 的翻墙软件。在我国未经允许使用翻墙软件的,那么属于违法行为,要面临罚款或者拘留。 那么有人就通过 chat gpt 发泄的商机,利用他的热度或者网友们的好奇心,再通过网络平台销售翻墙软件来进行使用。或者说呢,在平台免费教学,甚至呢免费提供翻墙的工具供他人进行使用,其目的的话就是为了赚取流量。 大家可能不知道,这种行为不仅构成违法,有可能构成犯罪,情节严重的构成提供侵入,非法控制,计算这些系统程序公祭罪,或者说呢非法。 所以通过翻墙获取 chicket gpt 的账号呢,是属于违法行为,同时提供相关的一些工具,用他人使用的,有可能会构成犯罪行为。关注级别律师彭严宁带你了解刑法那些事儿!

codex 大家应该都用上了吧,但是它的缺点就是额度太少了,完全不够用,而且它的头款实在是太贵了。那一种解决方式就是把咱们自己比较便宜的一些模型借进去,比如说 bitcoin, 咱们需要 c c 叉, c c switch 以及 bitcoin 的 api k。 首先我们在 bitcoin 点击 api 开放平台 api case, 创建 api k, 这个 k 一定要保存好。然后我们搜索 c c 叉, 点击这个,在下面找到适合自己的版本,我下载的是 windows 版本,然后搜索 cc switch, 点击下载,在这个界面一直往下翻,找到适合自己的版本,我仍然下载的是 windows 版本,然后安装 在 c c 叉文件夹下,我们新建一个 text 文件,命名为点 e n v, 把这些内容填进去。 k 就是 你设置的登录密码,我这里设置一二三四五六,然后重命名,把点 txt 删掉,运行 c c 叉,这个时候会弹出终端,复制这个 local host 地址,到浏览器打开点,点击 contacts, 选择添加渠道。在这里可以打开 delete 官网找到调用 api, 复制 c u r l, 把这一行改成 api k, 填写你自己的 delete 的 k, 选择详细配置。我们要选择 open ai chat 模式,继续往下翻,把这两个按钮打开,然后就可以了。现在我们在 c c switch 点击 codex 图标,再点击右上角的加号,供应商名称可以随便写。 api k 是 你在 c c x 的 点 e n v 文件里设置的登录密码,我的是一二三四五六 api 请求地址填写这个,点击获取模型列表,可以看到 deepsea 模型了,选择即可。然后我们点击测试模型,如果正常,说明已经配置好了, 我们重启 codex, 选择其他方式登录。这里的 k 也是你在点 e、 n、 v 文件里设置的登录密码,比如我的是一二三四五六,然后就可以了,现在 codex 里面的模型已经是 zip 了。

最近都在传圈的 gpt 快要用不了了,其实呢,是这两天 gpt 开始大规模的封号,嗯,封号的原因不是什么亚洲节点不能登录,不是什么用中文来提问不行,而是有很多卖账号的商家,他们在大批量注册账号的时候,用的是同一个节点, 就导致了 open ai 官方在后台查的时候,把这种关联了相似 ip 的大批量账号一口气全部封禁了。 哪怕你的账号不是批量注册的,但是你用的相似的节点都有可能会被封。大家要知道,因为一些特殊原因呢,我们是无法直接用国内的手机号和银行卡去注册 gpt 的。于是呢,从去年就开始有大量的帮国内用户 注册 g p t 账号的商家在做这个生意,因为小白用户要去注册账号是有一定操作难度的,所以他们通过这种 天然存在的信息差距赚钱。这个事情的问题在于,官方是不允许的,所以批量注册的账号很容易就被封了,你买了这种账号呢,商家如果关店跑路了,你充值的钱也要不回来。所以如果你要长期使用 gpt 的话,建议还是要去增强一下自己的动手能力。

卖 ai token 这门生意的毛利率居然是百分之九十二,但比这个数字更可怕的是,网上教你做这个的博主,没有一个人把真正的风险讲出来。 我花了三天的时间拆了一遍,把好处和坏处一次性给你讲清楚。国内的大部分人因为网络问题,是没有办法用上 cloud 拆的 gpt 这样先进的国外大模型,那能用上的人就想了一个办法, 我去 cloud 官网买一张月卡,然后把里面的 token 组成一个大的 token 池,再把这些 token 分 批次地卖给有需要的人。 举一个例子,我购买了一张两百美元的 cloud 月卡,它可以使用的 token 额度按照官方的标准计价是两千四百美元啊。所以说两千二除以两千四 百分之九十二,就是这个事情的毛利率。那我有了一个很大的 token 池之后,我就可以把 token 分 为很多块,卖给不同的消费者。消费者可以买到的产品有两种形式,第一种是固定额度的 cloud token, 比如说十美元。 第二种是一张月卡售价三百人民币,那你每天可以使用三十美元的 cloud token。 普通人参与这个事情的方式有两种,第一种是当推广员,第二种是建立自己的 token 池。 推广员意思就是说,你只需要推广自己的专属链接,吸引更多的人通过你的这个链接来下单 token 就 可以了。至于说月卡的购买, token 池的构建, 你完全都不用操心,参与的方法也很简单。呃,现在比较成熟的,规模比较大的中转站都有自己的推广计划, 你直接找到他们的负责人,说我要当你的推广员就可以了。那么第二种是构建自己的 token 池。大家不要觉得这个事情听上去很难,其实现在市面上百分之九十九的中转站用用的都是同一套开源的 github 框架,名字叫做 sub to api。 这个框架非常的成熟和强大, 它帮你搞定了多账户的管理,托管的计费,托管之间的动态协调,你只需要输入自己的 cloud 定位链接就可以了。这件事情我推荐普通人先从第一种方式做起,再逐步过渡到第二种方式。原因是第一种它是零成本, 你只需要负责销售就好了,你获得的正反馈也很快,当你积累了足够多的客户,也就是你的需求端稳定了,那对你的服务的稳定性会有更高的要求,这个时候你再把之前获得的利润投入到再生产才是划算的好处都讲完了,接下来我们讲一讲风险。 第一个是大部分人都大大低估了流量获取的难度,但是你不妨带入买家的视角想一想, 你正在上网,一个陌生人突然过来给你说点我这个链接,从我这里买 token 吧,你会怎么想?第二个风险点是官方封禁,其实 cloud 是 不支持月卡、拼卡这种行为的,他也在积极的检测这种模式,并且一旦检测到就进行封号。 这个时候如果你只是一个推广员,你只做销售,这个环节又变成了一个缺点,因为你无法推动上游,也就是真正的中转站去解决封号的问题, 这就会导致售后环节会大大消耗你的心神。所以这也就是为什么我建议普通人一定要从第一个阶段,也就是推广员逐步过渡到第二阶段,建立起自己的好势。 现在的推广员中转站有很多,技术上也没有门槛,所以大家都在同质化竞争打价格战。但客户关心的始终都是服务的稳定性。 当你有了自己的好吃,你可以多买几张月卡,即使一两张被封禁了,剩下的也足够支撑你所有的客户服务不下线。只有你积累足够多的客户和信任,你才能跳出同质化的竞争,打出自己的品牌。这里是 bridge, 我 们下次见。

token 是 所有玩 ai 的 人都离不开的名词,模型、价格看 token, 上下文,长度看 token, 很多事情都需要 token。 你 有没有想过 token 到底是什么?是字数?是词语?还是更底层的东西? 两分钟的视频,我们把头更讲明白。举个例子哈,一句话叫,我昨天在 chat gpt 里测试了 tokenization, 结果有点离谱。我们的大脑会拆分成这样的段落结构。我昨天在 chat gpt 里测试了 tokenization, 结果有点离谱。 我们理解段落的方式是先将完整的句子拆分成若干个独立的块,然后把块之间和块之间去联系起来。模型其实也是如此,完整的句子切开,分开为若干个小块,而这些小块就叫头啃, 并非等于一句话,一个词一个字,而是一种最小的切分单位。同场上的切分逻辑也不太一样,也会带来同一个上下文。 token 的 差异依旧以刚刚的段落去举例,这里的拆法可能是这样,倾向于用很多的小块构建起完整的语义, 而可 loft 的 拆法可能是这样。这两个没什么对错,只是两个厂商之间模型的 tokenization 规则不同。现在模型标配的一百万上下文,从理论上去出发,大家已经觉得很能打,他为什么总觉得不够用呢? 这是因为我们在处理工程的时候,不只是当人对话的输入和输出,还有项目规则、历史对话、文档内容代码日制等等的一些内容。 这些东西哈,一层一层的去叠上去,很快就吃满了上下文。那么我们在实际开发的过程中,怎么做才能最节约 token 呢?第一,别重复交代项目的背景,直接写进欠缺的项目文档。 第二,大群段落要学会自己去提炼成结构化的内容,这比模型直接理解全部的文章更加的节约。第三,明确指令,从类似于帮我看看的表达进阶为只检查这块功能的代码,这就是我开发的一些习惯,希望可以帮助到你。理解了 token, 相信你就明白了和大模型沟通的底层交互范式, 这是 token 最大的意义,它不只是一个计量单位。视频的最后,我也想和大家说,我们要尽量养成好的开发习惯,很多无意义的任务不仅消耗我们的时间,还有背后的服务器资源,甚至是能源。每次重复的计算都会变成更高的成本,都会变成对环境承担的负担。 所以少一点重复,多一点整理,不只是省 token, 省成本,也是在保护我们自己的家园。我是逍遥逍遥,本期视频可以帮助到你,下期再见。

稍微了解一点 ai 的 小伙伴都知道它的计费单位是 token, 但是它到底是便宜还是贵?网上众说纷纭,自己去研究吧。发现什么网页版 a t i lite 套餐、 pro 套餐还有 max 套餐五花八门,真的就越研究越迷糊。 哈喽大家好,我是专注于动画科普 ai 的 阿 k, 今天我就带大家把这些套餐呢版本呢梳理清楚,聊聊给 ai 氪金到底怎么回事? 想知道该怎么给 ai 氪金,先得了解市面上有哪些 ai 产品,我根据个人经验总结下来就三类,第一类网页聊天机器人,比较知名的有 deepsea 网页版、豆包网页版、 gmail 网页版以及 chat gpt 网页版等等。这类产品针对的是没有编程背景的普通人,他主要用来做些答疑解惑或者文案类的工作。 第二种是 a p i, 你 可以理解为它是模型的使用钥匙,模型是部署在服务器中的,你通过这个钥匙就能够使用它,它的主要作用是用来开发产品或者增强已有产品的能力。目前市面上最知名的模型公司,大家可以自己去搜一下哈,我这边聊太多,容易被判定为推广。第三种是 a 键的工具,它本质上还是通过 a p i 的 调用模型, 主要作用则是通过模型能力来降低产品开发的门槛,让普通人也能够轻松使用。目前主流 a 键的工具有两个类别,一类是 cl i, 命令行形式的,最知名的就是 cl i 的 了, 其次是开源的 opencode。 另一类则是带有操作界面的 i d e 工具,最知名的是 cursor, 其次是字节的 tree。 好 弄明白主流 ai 产品有哪些分别,有什么作用以后, 大家就可以根据自己的实际需求选择氪金的类别了。那不同的类别又有怎么样的收费形式呢?首先是网页版聊天机器人,目前国内几个知名厂商都是免费开放使用的,比如 deepseek 和豆包,前者推利能力极强,不过主打的是重文本和代码逻辑,如果对图片识别、联网搜索,甚至有图片生成需求的,就 这里我推荐使用豆包,它是目前国内综合能力头部产品那至于像 jammer 和 chat gpt 这种鼎鼎大名的产品,一般都是按月订月,虽然他们吭完金以后说是畅玩,但实际每天还是有一个限额的,不过不是重度使用的话,一般也用不完。另外, jammer 在 google a s studio 可以 免费试用,但同样有限额哈。 然后是 aint, 其实 aint 的 工具一般是不收费的,收费的是它搭载的大模型,只不过有的厂商是把模型和 aint 的 绑定了,你想用 aint 就 不得不交费。不过我采用的是一种携修办法,用 cloud code 的 aint 的 功能,然后搭配国产大模型的 api。 具体详情我这期视频讲过了,这里就不再赘述了。 最后聊聊 api 的 购买方法,一般也分为两种,第一种是订阅制,像我目前在用的某国产大模型轻量级套餐,它以五小时为周期进行限量。比如你是早上九点开始使用,那么在九点至下午两点之间会有一个用量限制。如果你提前用完了,那就只有等两点零一分重置下一个五小时, 那如果你从两点零一分到晚上七点都没用过,那么下一次的五小时计时就会从你再次使用开始。比如你晚上八点用的,那就从晚上八点开始计时。 这个规则有点绕,需要逻辑上盘一盘才能明白哈。然后现在由于算力紧张,除了五小时一刷新,他还给你套了每周限额和每月限额。如果你的使用频率确实很高,轻量级搞不定,那就只能考虑网上选 pro 套餐或者 max 套餐了, 说简单点就是加钱给额度。那具体差异大家可以去各自官网看啊,看不明白直接留个 deepsea 帮你联网分析一下,妥妥的。 第二种方法就是传统的 token 计费制,也就是用多少算多少钱。如果你跟我一样属于入门级用户,我认为订阅制比按 token 计费还是要香一些的, 不过我也不一定对哈,欢迎懂行的小伙伴评论区指正。至于那些专业类别的,比如图片、视频或者音乐生成工具的付费方式比较单一,大多都是订阅积分制,这里就不详聊了,非专业从业者真的没必要开通那玩意。 那氪金方式我已经聊的比较全面了,具体怎么选呢?目前我的组合是 jamming 网页端加 cloud code 等,搭配国产模型订阅套餐。但我真正想说的是,每个人不同,适合我的不一定适合你,而 世界上根本没有任何一种搭配是完美无缺的,具体还是看个人怎么取舍。比如你可以先买一个月最低价的套餐,通常首月有新人优惠,普遍不到一杯奶茶钱,然后试俩礼拜,如果好用就继续用,如果不好用就换个厂商继续试 低价套餐,不够用就升级套餐,满足不了需求就换 a p i, 这不就是人生的常态吗?在追求自己的道路上,不断取舍,不断选择,别指望从别人那得到符合自己需求的答案,这实在太过于天真了。但是有一种坏的选择,我希望大家都不要选,那就是去一些非正规渠道购买所谓的超低价 a p i 或者合作账号, 用这些账号的来源基本都不合规。为什么这么说呢?原因有两点,首先,这些便宜货的进货渠道有问题,很多商家是利用违规手段获取的额度,官方只要一排查,你的号立马就被封。其次就是使用风险真的太高了,这些号随时会跑路断联不说,如果你用的是第三方中转,你的所有对话内容全在别人的服务器上跑, 隐私代码和商业机密都有被窃取的风险。而且一旦合作号没了,你辛辛苦苦积累的提日词和历史记录瞬间清零,根本找不回来。 另外,网上还有那种打着公益旗号的所谓免费镜像站,千万记住了,天下没有免费的午餐,大模型调用成本很高,镜像站让你免费用,要么是为了收集你的高质量娱乐数据,要么是引诱你购买他们的付费订阅。 总而言之,大家千万不要为了一点蝇头小利,因小失大,使用正规官方渠道的服务才是最稳妥的哈! ok, 那 以上就是本期视频的全部内容了,我将这个动画科普 ai 的 阿 k 无惊无险又到六点,下了个班。

你有没有发现,现在 ai 圈越来越像一个黑化制造机?前两年大家还在聊 chat gpt、 prompt 提示词工程,后来开始聊 r e g。 下量数据库、知识库,再后来变成 agent, skill m c p。 最近又冒出来一堆更离谱的词。很多人听到这些词的第一反应是,我刚搞懂 prompt 怎么又来了 r e g。 我 刚听懂 r e g。 怎么又来了 agent, 我 刚知道 agent 怎么又来了 m c p。 现在又开始讲什么 skill context engine, workspace agent。 于是很多人开始焦虑,是不是我已经跟不上 ai 了?其实我们只要记住一个道理,搞清楚它们底层联系以及出现的逻辑,就很容易理解了。这一期我们都给他说清楚,为什么他会出现,他的出现解决了什么问题。第一章, tok 和 contacts window ai 一 次能看多少? 很多人第一次接触 ai 是 从 chat gpt 开始的,你输入一句话,它就能写文章,写代码。但如果往底层看,其实 ai 并不是像人一样直接阅读一整篇文章,它会先把你输入的内容拆成一个个更小的信息单位,这个单位就叫 tock。 举个简单例子,你输入我喜欢人工智能,在模型眼里,它可能不是一整句话,而是被拆成。我喜欢人工智能, 不同模型的拆法不完全一样。有时候一个中文词会被拆成几个 toc, 有 时候一个英文单词也可能被拆成几段。但你不用纠结它具体怎么拆,你只要理解一件事,拆成的这些小片段就是 toc。 那 toc 为什么重要?因为它会影响三个东西,第一, ai 一 次能读多少内容?第二,你调用 ai 的 成本是多少?第三,为什么 ai 有 时候会忘记前面聊过的内容? 比如一个模型最多能处理八千个头肯,那你的问题,历史对话、系统提示词、文件、内容、工具、返回结果加起来都不能超过这个范围。如果对话越来越长,超过了这个范围,前面的内容就可能被挤出去。 这就像你的桌面只能摊开十张纸,你不断往上放新的资料,最早的资料就会被拿走。模型一次最多能看到多少头肯,就叫 context window, 也就是上下文窗口。 所以你以后看到什么,一百二十八 k 上下文,百万 token 长上下文模型按 token 计费。本质上说的都是一件事,这个 ai 一 次最多能处理多少信息,以及你给他喂了多少信息。 但这里有一个很重要的问题,上下文窗口越大, ai 就 一定越聪明吗?不一定,信息太少, ai 答不出来。信息太多, ai 又可能被无关内容干扰。所以 ai 真正要好用,不只是模型能看多少,而是你怎么把任务交代清楚。 于是,第一个真正出圈的 ai 热词出现了, prompt。 第二章 prompt ai 怎么听懂任务? 早期大家用 ai 的 时候,最兴奋的是,我只要输入一句话,它就能给我答案。但很快大家发现同一个问题,不同问法,结果差别非常大。 你随便问一句,帮我写个方案, ai 可能会写一堆很空的话,什么提升效率、优化体验、扩大影响力、增强用户?男性看起来很完整,但其实没什么用。 但如果你换一种问法,你是一名资深产品经理,请针对一个面向开发久的 ai 工具写一份产品方案,要求包含目标用户、核心痛点、功能模块、商业模式和落地路径。用表格输出, 结果马上就不一样了,它会更具体、更有结构,也更接近你想要的东西。这时候大家开始意识到, ai 很多时候不是不会做,而是你没有把任务说清楚。于是, prompt engineering 火了。 所谓 prompt engineering, 本质不是写咒语,它更像是给 ai 写一份工作说明书,你要告诉他,他现在扮演什么角色,他要完成什么任务,背景信息是什么,输出格式是什么,哪些内容不要写,什么结果才算好,最好还能给他几个例子。 所以早期 ai 圈特别流行各种内容,万能提示词,神级 prompt, 学会这十个提示词,效率提升十倍。这些内容之所以火,是因为它确实解决了早期 ai 使用里最直接的问题。怎么让 ai 更准确地理解我的任务? 但 prom 再强,也只能解决任务怎么说清楚,它解决不了另一个更致命的问题,模型不知道的东西,它就是不知道。 你让他总结你公司的内部文档他没看过,你让他分析你项目里的代码他没读过。你让他回答昨天才发生的事情,他训练时可能根本没有。 如果你硬让他回答,他就只能猜。一旦 ai 开始猜,就可能出现我们最熟悉的问题,一本正经的胡说八道。于是下一个热词出现了, r a g 第三章 r a g ai 怎么查资料? rag 解决的问题很简单,不要让 ai 只凭记忆回答,先让他查资料,再让他回答。比如你有一堆公司文档,产品手册、项目代码、课程资料,客服记录过去,你直接问 ai, 我 们产品的退款规则是什么? 如果 ai 没看过你的产品文档,他大概率不知道,但他又很会组织语言,所以他可能会编出一个看起来很合理的答案,这就很危险。 rag 的 思路是,先把资料放进知识库, 当你提问的时候,系统先去知识库里找相关内容,然后把找到的内容交给 ai, 最后让 ai 基于这些资料回答。 r a g, 全称叫 retrieval augmented generation, 中文一般叫解锁增强生成。 名字听起来很复杂,但逻辑很简单,先解锁再生成。举个例子,你问 ai 请假要提前几天申请, 如果 ai 没看过员工手册,他只能猜。但如果系统先在员工手册里搜索请假申请,提前找到相关条款,再把内容交给 ai, ai 就 可以回答,根据员工手册,年假需要提前三个工作日申请,病假需要提交证明。 这就不是瞎编,而是基于资料回答。 r e g。 背后又带出了几个重要概念, embedding vector database, knowledge base, inviting 是 什么?简单说就是把文字变成一串数字。为什么要变成数字?因为计算机不懂意思,但它可以比较数字之间的距离, 比如怎么申请退款和订单取消后钱怎么退。这两句话字面上不一样,但意思很接近。如果只是关键词搜索可能匹配不准,但如果把它们变成向量,系统就能判断这两句话的语义很相似。 向量数据库就是专门用来存这些向量,并且帮你快速找到相似内容的地方。所以, r a g 让 ai 从只靠脑子回答,变成了可以翻资料。回答这一步非常重要,因为它第一次让 ai 有 了接入外部知识的能力。 但很快,普通 r a g 也暴露了问题。最早的 r a g 很 像一次搜索,你问一个问题,系统查一次资料,然后生成答案。可是,复杂问题往往不是查一次就够了。 有时候第一次查到的资料不完整,有时候问题需要拆成几个小问题,有时候查完 a 才知道还要查 b, 有 时候还要判断资料之间有没有冲突。于是又出现了一个升级方向, aeg。 普通 r a g 更像搜索引擎,你问一次,他查一次 a gentic。 r a g 更像一个研究助理,他会判断资料够不够,如果不够,就换关键词继续查。如果问题太大,就拆成几个子问题。如果多个来源说法不一致,他还要做交叉对比。 到这里, ai 已经不只是被动回答了,他开始有一点主动研究的味道。但新的问题也来了, ai 现在能查资料了,可他还是不能真正做事。 它可以告诉你怎么发邮件,但不能真的发。它可以告诉你怎么查订单,但不能真的查。它可以告诉你代码怎么改,但不能真的改你的项目。 于是,下一个热词来了, to calling。 第四章 to calling ai 怎么从回答变成行动? r a g 让 ai 有 了资料室, to calling 让 ai 有 了手。从这里开始, ai 不 再只是生成文字,它开始可以调用外部工具。比如你问,帮我查一下这个订单状态,它可以调用订单系统,你说帮我跑一下这段 python 代码,它可以调用代码执行环境, 这就是方神 calling 或 to calling。 它解决的核心问题是, ai 怎么从给建议变成执行动作。以前你问 ai, 我 今天下午有空吗?他可能会回答,你可以查看一下你的日历,这叫建议。但如果 ai 接入了日历工具,他就可以直接查你的日历, 然后告诉你,你下午两点到三点有会,四点以后比较空。这就不只是建议了,他真的帮你查了,可以调用工具完成一部分动作,但工具一多,新的麻烦就出现了。 如果 ai 要接天气、数据库、 github 浏览器、公司内部系统,每个工具都要单独开发一套接口,每个平台都有自己的接法,每个 agent 都要重复集成工具描述怎么写,参数怎么传,权限怎么管,调用结果怎么返回,安全边界怎么控制? 如果没有统一方式,这件事会变得非常混乱。于是,又一个热词出现了, m c p 第五章 m c p ai 怎么统一连接外部世界? m c p 为什么会火? 不是因为它让模型本身变得更聪明,而是因为 ai 要进入真实工作环境,必须解决一个很实际的问题,外部工具太多,连接方式太乱。你可以把 m c p 理解成 ai 连接外部工具和数据源的一套标准协议。有点像 ai 世界里的 usb c。 以前每个设备都有自己的接口,手机一个接口,电脑一个接口,相机一个接口,充电器一个接口。 后来 usb c 出现后,大家希望尽量用一个统一接口来连接 m c p。 在 ai 世界里做的事情也类似,以前每个 ai 应用接工具都向自己焊电线、接 github 要写一套,接数据库要写一套,接文件系统又要写一套, 接企业内部系统还要再写一套,开发成本高,维护成本也高。 m c p 想解决的是,工具怎么暴露给 ai? ai 怎么知道自己可以调用哪些能力?工具需要哪些参数,调用结果怎么返回 资源怎么提供?权限和安全边界怎么控制?所以, m c p 不是 一个普通工具,它更像是 ai 接入工具生态的连接层,解决的是怎么让 ai 更标准地连接很多工具和数据源。这时候, ai 已经不只是一个聊天框了,它开始有点像一个可以接插件的系统, 但问题还没有结束。 ai 每次执行任务时,真正影响效果的不只是模型,也不只是工具,还有一个很关键的东西,他当时到底看到了什么信息?这就进入了下一个热词, context engineering。 第六章 context engineering, ai 每次到底该看什么? 很多人以为 prompt engineering 已经过时了,其实不是过时,而是不够了。早期我们关注的是这一句话怎么写得更好。但现在 ai 应用越来越复杂之后,真正的问题变成了这一次任务系统应该给 ai 准备哪些信息? 它要不要看到历史对话?要不要看到用户资料?要不要看到数据库状态?要不要看到公司规范?要不要看到工具调用结果? 这就不是一句 prompt 能解决的了,这叫 context engineering。 你 可以这样理解, prompt engineering 是 写一条好指令, context engineering 是 涉及整个信息流。 举个例子,你让 ai 帮我回复这个客户,如果只是一个简单 prompt, ai 可能只能根据你当前输入的一句话来回复。 但一个真正好用的 ai 客服助手需要知道更多信息,这个客户是谁?他之前买过什么?他之前投诉过什么?公司退款政策是什么?这次回复要不要升级给人工? 这些信息不是随便一股脑塞给 ai 就 行,太少了, ai 顿断不准。太多了, ai 会被干扰。信息过期了, ai 会做出错误判断,权限没管好,还可能泄露敏感数据。 所以, context engineering 的 核心不是给 ai 更多信息,而是给 ai 刚好需要的信息。后来又出现了一个更产品化的词, context engine。 context engineering 更像方法, context engine 更像系统。它的作用是每次 ai 执行任务时,自动帮它组装最合适的上下文,比如该查哪些资料,该带哪些历史记录,该过滤哪些敏感信息,该压缩哪些长内容,该把重要信息放在前面。 它不是让模型本身变聪明,它是让模型每次工作时都能拿到更合适的材料。这件事很重要,因为越往后, ai 的 效果越不只是取决于模型会不会回答,而是取决于系统有没有把正确的信息交给他。 但这里又出现一个新问题,如果每次都要手动告诉 ai, 你 该怎么写周报?你该怎么分析代码?你该怎么处理 excel? 那 还是很麻烦。于是,下一个热词出现了, skill。 第七章 skill ai 怎么沉淀可赋用能力 skill 这个概念其实特别适合普通人理解,因为它解决的是一个非常真实的问题。我不想每次都重新教 ai 一 遍。举个例子,假设你每周都要写工作周报,你每次让 ai 帮你写,都要重新交代很多要求, 这周做了哪些事,哪些项目有进展,哪些问题还没解决,下周计划怎么写?语气要正式一点,但不要太空,不要写成流水账,要突出成果。你说少了, ai 写出来不像你要的。 你说多了,每次又像在重新培训一个新人。这时候你就会想,能不能把这套要求直接保存下来。以后我只要说按我的周报格式来写, ai 就 知道要怎么做。 他会先帮你整理本周事项,再提炼成果和问题,然后按固定格式输出,最后把语气调整成适合公司汇报的风格。这就是 skill 的 驾驭。 prompt 更像一次性指令, skill 更像一份长期 sop。 他 把一套重复出现的工作方法沉淀成 ai 可以 反复调用的能力。 写周报是一种 skill, 分 析代码仓库是一种 skill, 处理财务表格也可以是一种 skill。 它的意义在于, ai 不 再只是临时听你指挥,它开始可以积累一类任务的固定做法,这对个人和团队都很重要。 个人可以把自己的工作风格沉淀下来,团队可以把标准流程沉淀下来,企业可以把岗位经验变成可付用的 ai 能力。 但到这里, ai 主要还是通过文本、文件、 a p i 和工具来做实现实工作里还有大量系统没那么理想,很多系统没有 a p i, 有 些系统虽然有 a p i, 但非常难接。还有很多操作本来就是发生在网页、软件和后台系统里的, 比如点击按钮、填写表单、上传文件、复制粘贴、筛选数据、下载报表、登录后台,在多个页面之间来回操作。这些事情不是简单调用一个 a p i 就 能完成的。于是, ai 又往前走了一步, 他开始尝试像人一样使用电脑。这就引出了下一个方向, computer use。 第八章 computer use ai 怎么操作电脑? to calling 是 ai 丢用 a p i, computer use 是 ai 像人一样操作电脑。这两件事看起来都叫执行动作,但本质不一样。如果一个系统有 a p i, ai 可以 直接调用接口,比如查天气、查订单、查数据库。 但如果一个系统没有 a p i 呢?比如一个老旧后台,一个网页管理系统,一个内部审批页面,一个只能人工点击的表单。 过去这种情况 ai 很 难处理,因为它不能只靠文字生成来完成这些操作。 computer use 的 思路是让 ai 看屏幕,理解界面,然后用鼠标和键盘操作。它可以打开网页,点击按钮,输入内容,滚动页面,选择下拉框,提交表单,下载文件,上传资料。 举个例子,你要报销一张发票,公司系统没有 a p i 以前,你只能自己打开网页,登录后台,点击报销,填写金额,上传发票,选择部门,提交审批。 如果 ai 只能调用 a p i, 那 它帮不上忙。但如果 ai 能 computer use, 它就可以像人一样操作。浏览器,打开报销系统,找到新增报销入口,识别发票金额,填写表单,上传文件,提交申请。 这一步的意义很大,因为它让 ai 不 再只服务于那些接口很完善的新系统,它开始有机会进入很多原本只能人手操作的旧系统, 这也是为什么 ai、 browser、 browser agent、 operator 这些概念会火。浏览器原来是人上网的入口,但未来它也可能变成 ai 替你办事的入口。 不过, computer use 也有很明显的难点,网页布局会变,按钮可能识别错,登录可能需要验证码,一步点错,后面就全错。有些操作还涉及权限和安全,所以 computer use 很 有想象力。但要真正稳定落地,还需要很多工程配套。 而当 ai 既能查资料,又能调用工具,又能操作电脑,还能附用 skill, 下一个问题就变成了,它能不能自己完成一个复杂任务,这就是 agent。 第九章 agent ai 怎么自己拆任务,循环执行 agent 这个词很火,也最容易被讲乱。很多人把 agent 理解成更聪明的聊天机器人,但这不准确。 agent 真正关键的不是聊天,而是它能围绕一个目标,自己拆步骤,选工具,观察结果,再继续调整。 普通聊天机器人是你问一句,他答一句 to call, 领是你让他做一个动作,他调用一个工具。 agent 更像是你给他一个目标,他自己想办法往前推进。 比如你说帮我分析这个项目最近为什么启动失败。普通 ai 可能会告诉你,可以检查配置,依赖端口预制,这叫建议。但一个编程 agent 可能会真的开始做事,他先看错误日制,再读配置文件,再检查依赖版本, 再搜索代码里的相关调用,再尝试运行测试。如果出现新的报错,它再继续定位,最后给出修改方案,甚至直接改代码。 agent 的 核心是一个循环,先计划,再行动,观察结果,根据结果调整下一步。这也是为什么 agent 最先在编程领域爆发,因为代码特别适合 agent, 代码项目有明确的文件,报错信息很具体,测试结果能反馈对错版本控制可以记录改动,改完还能自动运行验证。 一个写代码的 agent 不 只是生成一段代码,它可以读项目、理解文件结构、搜索函数、修改代码、运行测试根据报错继续改,最后生成提交说明,甚至提交 pr。 所以 这两年 ai ide 和 ai coding agent 爆发的非常快。 cursor cloud code codex gemini c l i s w e agent 本质上都在往这个方向走, 这也催生了一个很出圈的词, web code。 什么是 web code? 简单说就是以前是你写代码, ai 辅助你,现在是你描述目标, ai 生成实现,你负责验收和调整。它更像是在改变程序员的工作重心。 以前很多时间花在写,具体实现以后,更多时间会花在定义需求、拆解任务、设计架构、审核代码、控制质量以及管理 ai agent。 但 agent 的 越强,风险也越明显,他会犯错,会乱改文件,会误删内容,会生成不安全代码,会跑偏,会消耗大量偷啃,也可能做出一个看起来能跑,但你完全不敢上线的东西。所以 agent 不是 越自由越好,真正要落地,必须给他套上一套工程约束。 于是下一个热词出现了, harness engineering agent 怎么安全上线? 很多 agent 的 demo 看起来非常震撼,你输入一个目标,它自己拆任务、查资料、调用工具写代码,几分钟之后一个结果就出来了。但一到真实生产环境,问题就复杂了,它能不能控制权限?它能不能知道哪些操作不能做?它生成的结果谁来验证? 他什么时候需要人类审批?他会不会越权访问数据?这时候你会发现, agent 真正难的地方不只是模型本身,更难的是模型外面的工程系统,这就是 harness engineering。 你可以把它理解成给 ai agent 套上的安全带、方向盘、仪表盘和刹车系统。如果模型是发动机, harness 就是 整辆车的控制系统。发动机越强越需要控制,否则它不是跑得更快,而是更容易出事故。 哈尼斯里通常会包括这些东西,权限控制工具、白名单执行、沙箱预制、追踪、错误重试、输出验证、人工审批、成本控制、安全边界、 回滚机制、评测系统。举个简单例子,你让 ai agent 帮你整理电脑文件,如果没有 harness, 它可能会误删重要文件。如果有 harness, 系统就可以限制它只能访问某个文件夹,只能立即确认,所有操作都要记录 危险动作,需要人工审批,出错后可以回滚。再比如,你让 agent 改代码,没有 harness, 他 可能直接改生产代码,有 harness, 他 只能在一个沙箱分支里改,改完完以后必须跑测试,测试通过后才能提交,提交前还要人工 review。 所以,企业真正需要的不是一个看起来很聪明的 agent, 而是一个安全可控、可追踪、能被验证的 agent。 这也是 ai 落地过程中很关键的变化。难点正在从模型够不够聪明转向系统够不够可靠。 讲到这里, ai 已经从聊天机器人变成了能查资料、能调用工具、能写代码、能执行任务的 agent。 但真实业务里还有一个问题, 企业工作不是一个 agent 单独完成的,真实工作往往是一条流程。于是 workflow 开始变得重要。第十一章 workflow ai 怎么进入业务流程? 你想象一个真实业务场景,一个客户提交了咨询表单,系统要先获取表单吞断、客户类型查询、 crm 生成、跟件、建议分配、销售、发送邮件、通知、群聊等待人工确认、写入数据库生成日报,后续还要继续跟进。 这不是一次聊天,也不是一个工具调用,这是一条业务流程,所以 workflow 变得非常重要。 n 八 n define、 zephyr make lan graph 这类工具解决的就是这个问题。 它们的价值不是让模型本身更强,而是把 ai api、 数据库、消息系统、人工审批、定时任务和条件判断串起来。这里面 ai 只负责一部分判断和生成,真正让整个事情跑起来的是 workflow。 你可以这样理解, agent 更像负责思考和判断, workflow 更像负责把步骤按顺序串起来。一个没有 workflow 的 ai 往往只能完成单点任务,但有了 workflow, 它就可以进入一个持续运转的业务流程。这就是为什么 n 八 n define 这类工具会受到关注。它们给了普通人一种可能性, 我不一定要从零写一套系统,我可以把现有工具像搭积木一样串起来,中间需要判断和生成的地方再接入 ai, 这也是 ai 从好玩的聊天框进入真实生产流程的关键一步。 但到这里,还差最后一层, workflow 解决的是一条流程怎么跑?企业真正想要的往往不是一个跑完就结束的流程, 而是一个能长期存在于工作空间里的 ai。 这就到了 workspace agent。 第十二章 workspace agent ai 怎么变成数字员工? workflow 和 workspace agent 很 容易被混在一起,但它们不一样, workflow 更像是一条流程,你设计好步骤,他按步骤执行。 workspace agent 更像是一个长期待在团队里的岗位助手,他不只是执行某一次任务,他还要理解团队长期积累的上下文。 比如,团队有哪些项目,文档放在哪里,谁负责什么,这个客户之前发生过什么,哪个任务卡住了,哪些信息是敏感的, 哪些操作需要审批,谁有权限看什么什么时候应该提醒,什么时候应该交给人类。普通 agent 更像临时工,你给他一个任务,他做一次。 workspace agent 更像岗位助手,他长期待在一个工作空间里,理解流程、权限、上下文和协助关系。举个例子,你让一个普通 agent 帮我写一份项目周报,他可能会问你项目内容是什么?进度是什么?风险是什么?下周计划是什么? 因为他不知道你的团队发生了什么。但一个 workspace agent 不 一样,他已经在你的工作空间里,他能看到任务系统,能看到代码提交,能看到会议纪要,能看到文档更新,能看到成员分工,也能看到上周周报。 所以他可以自动整理出本周完成了哪些事项,哪些任务延期了,哪个模块风险最大,下周应该推进什么、哪些内容还需要负责人确认。这就不是普通聊天机器人了, 它开始进入组织的工作空间。所以 workspace agent 的 重点不止是更智能,它真正代表的是一种产品形态变化。 ai 不 再只是一个你临时打开的工具, 它开始变成团队工作空间里长期存在的一类角色。比如 ai 销售助理、 ai 数据分析助理、 ai 项目管理助理、 ai 研发助理, 他们不再只是回答问题,而是长期处理某一类工作,并且和团队流程结合在一起。当然,这件事也非常难,因为一旦 ai 进入工作空间,就会遇到更多现实问题。权限怎么管?数据怎么隔离? 不同成员看到的信息不一样怎么办? ai 的 建议错了,谁负责?什么时候自动执行,什么时候必须人工确认,他长期记住的信息,哪些应该保留,哪些应该过期。所以, workspace agent 不 只是一个更酷的 agent, 它背后其实牵扯到企业协助权限、安全流程和组织管理。这也是为什么它会成为 ai 眼界里的一个重要方向。 ai 热词不是黑化,而是一张地图。现在我们再回头看这些词就不会那么乱了。 你会发现,这些词并不是一堆孤立概念,它们背后其实有一条主线, ai v 正在从一个会聊天的工具,变成一个能进入真实工作情境。 过去我们以为 ai 的 进步主要是模型越来越强,爬入更多、速度更快,回答更聪明。但现在你会发现,真正的变化不止发生在模型里来越强,更大的变化不止发生在模型。没有信心以盼的神魔天道的你不同志。 这就是为什么 ai 圈会不断出现新词,不是因为大家喜欢制造黑化,而是因为 ai 每往真实工作靠近一步,就会遇到一个新问题,为了解决这些问题,才出现了新的概念、新的工具、新的工程方法。 所以以后你再看到一个新的 ai 热词,不要急着被定义,你只需要问一个问题,它到底是在解决 ai 走向真实工作时的哪个问题?只要这个问题想清楚了,再多的新概念也不会乱。

这是我用 codex 做的动态图标,这些也是像这样的效果,我们现在不需要 ae, 也不需要 p r, 用 codex 就 能实现。那今天我把这个教程分享给大家,用到的工具是 codex 和一个叫 hyperframes 的 插件,点击左边栏的插件,在这里搜 hyperframes, 然后你会看到这个插件的详细信息,点进去再点击,在对话中试用。这里大家记得先添加好项目文件夹,确定好模型,智能等级和速度,然后就可以把题词放进去。比如帮我做一个 codex 和 cloud code 的 功能对比的分析,视频时长十五秒, 尺寸是横版十六比九,视觉风格是苹果简约高级风,需要增加一些动态效果的展示。 这里写错了哈,因为我用的是 ai 语音工具,完全是口喷的,有些词语可能会识别错误,直接改一下就行, 然后点击发送,让他开始做。你看他先是查了一下官方资料,确保这两个工具的信息是最新的,然后他还会去看 hyperframes 的 要求是啥,确定下来视觉身份,然后再去写 html, 他会主动在我们看不到的地方用网页去搜索资料,那整个的思考过程跟我们人类是一样一样的。他还会单独创建一个文件夹,因为我这个目录里面啊,其实是有其他项目文件的,所以他知道不能碰到别的。我把左边的边栏隐藏掉,现在整个页面都是我们的视频制作过程 他很快就确定下来,主画面用冷白、石墨黑、微蓝和暖金做出高级感。我觉得如果大家有更具体的风格,也可以直接在刚才提示词里面告诉他,那整个过程他会自己产出内容,然后检查有没有问题,再自行更正。这些你都可以看到, 如果不想管,就让电脑开着,让扣贷自己干活。那做这样一个视频大概花了十来分钟,然后文件的位置,他参考了哪些资料,最后都会告诉我们。来,我们看一下它的效果。 大家注意看,这只是第一版哦,我觉得已经非常惊艳了,完全没有预先做任何模板,已经可以拿去用了。那不管是发布在社交媒体上,还是工作汇报,都很顶。 实际上呢,它不仅是可以做这种图表,还可以做产品介绍。比如这个辣条的产品视频,你丢给 codex 一个网页,让它做产品或者品牌的介绍,也可以做一个像 open ai 这样的业绩表,那放在 ppt 里面简直是开挂。 你甚至还能让它做这种 logo 散落的视频,或者是宋代山水风格的 ai 发展史, 你给他一段提示词,也不用特别复杂,让他开干就可以了。一般来说啊,十来分钟左右就能做出来,那如果对效果不满意,再沟通几轮, 那到这里大家可能会觉得,哎,这好像没有什么难度啊,很简单,每个人都可以做。那我再分享几招进阶的方法。 第一个呢,如果视频中涉及到图片类的素材,像 logo 啊,或者人像,建议自行上传。或者呢,可以先让 cloud code 整理出这些 logo, 然后再把这个文件夹打包到项目里,这样失误会更少。第二个是关于审美和风格,如果不指定风格,他做出来的大概率就会比较大众化, 像科技风很容易就做成那种已经用烂了的蓝紫色,所以最好是提前指定风格。那我这里也列了一些,大家可以直接拿去用。 最后是音乐和音效,可以让它生成简单的音效,但是背景音乐呢?大家可以用 solo 生成原创的背景音,或者直接在剪辑工具里面把音乐库的素材放进去,最后我再补录一个哈。很多时候我们做动效视频会需要信息的专业性和准确性。 那对于科研、生物科学、生命科学这些领域来说,我比较推荐 bell render 这个插件,它能够把这些领域的一些复杂概念进行可适化。那结合 paperframes 它们两个就能把一些科研领域专业绘色的信息用非常动态的形式表达出来。 比如说我让他做一个 an apple a day keeps the doctor away 这句谚语背后的一个科普回答, 他就会给到我这样一个视频,我们可以看一下效果。 那我们今天的分享就到这里,我们下期再见。