嗯嗯嗯。
粉丝15获赞129

hello, 亲亲们,最近我在疯狂地使用啊 codex 啊,然后它是有七天的免费试用,给我一定的额度,然后我就发现 这种顶级的模型都是双轨制的,就是比如说你在短期提了很多问题,比如说二十条,它就会提示你啊,到限额了,你五个小时之后才可以再用。 那么还有一个轨度就是他是有一定的 token 的, 如果你把这个 token 用完,即便是你啊,再过了五个小时也没有了, 我就觉得这不就跟我们人生一样吗?我们的人生第一轨就是短期的流速限制,对应到一个人的身上,就是你的精力和专注力。短时间如果贷款拉满的话, 就需要进入一个冷却的时间,去发个呆,去睡个觉,因为你不可能。比如说啊,激烈的运动持续一小时,这是不可能的。 那么第二个长期的总量限制,这就是我们生理极限和二十四小时的边界,或者说是我们一生三万天的边界,不管我短期怎么透支,我能怎么恢复,但是我一生的经历和时间,这个总量就是有限的。 ai 的 窗口满了会开始遗忘,小脑还会萎缩, 这个呢,其实是基因给我们的保护机制,如果没有这样的限制,我们会一天之内就把自己火火烧死。 所以如果你今天觉得累了,卡了,别焦虑,那只是系统在提醒你,今天的额度用完了,那就该下班该睡觉了,明天醒来系统又是一次免费刷新。 那么在有限的额度,有限的人生里,要做成一件你热爱的事情, 就要摒弃和主线无关的事情,这一点,就去看看张雪,看看马斯克,看看他们是怎么样对很多事情 say no。

hello, 大家好,我是阿亮,这期视频呢,教大家如何把 codex 接入国产模型,比如说接入 deepsea codex 和 cloud code 呢,不一样,它不支持修改配置文件来切换模型。最初呢,我也是想直接用其他的工具来接,比如说 c c x, 但是折腾了很长时间,发现问题比较多,也很复杂,所以呢,就自己动手来搞定的一个专门的工具, codex 杠 switch, 用这个切换 codex 的 模型就方便多了。接下来呢,就照着我整理的这份 codex 文档,一步一步带大家操作。 首先点击文档中的 codex 杠 switch, 跳转到下载页面,根据自己的电脑 选择安装包。下载后呢,双击打开,我们就以 deepsafe 为例,这里选择 deepsafe, 然后点击这里到 deepsafe 官网去申请 k, 这里有每个模型的申请 api k 的 链接好,点进去呢,就是开放平台,点击 api case, 创建 api k, 然后把拿到的 k 复制到这里就行了。然后点击蓝色按钮,这个时候呢,就切换成 deepsafe 模型了,现在呢,需要重启 codex, 记住这里一定要把 codex 关掉,重新启动, 可以看见这里的模型变成了 deepsafe, 输入一条消息试试,如果它有回复说明呢,就接入成功了。 点击红色按钮,也可以一键切回官方的 jpt 模型。注意切换后必须重启。 codex 这个小工具呢,目前支持主流的啊,国产模型也可以自定义模型,每次启动 codex 前呢,把这个工具启动了,就可以顺畅地用国产模型了。 这一期呢,我们主要是想要通过一个案例带大家整体走一遍流程,更熟悉这个扣带子的使用。很多人觉得呢,做一个案例或者做一个东西之前呢,要先想清楚做什么功能啊,有什么样的风格等等吧,就想了好久好久。其实我们根本没必要 给他最简单的提示词,让他呢先做一个东西出来,然后我们再挑毛病。好了,接下来我们直接开始 新建一个项目文件夹,直接命名为汉堡店,然后新开一个对话,添加新项目需求呢,就一句话,帮我做一个汉堡店的网页回车 codex, 自己理解,自己拆任务,自己给方案,它还可以自己的生图,因为它接入了目前最好的模型啊, gpt 杠一, mate 二,这个是最好的生图模型,我也没仔细看啊,先让它跑一半问出来再说。 哎,过了一会呢就出来了,但是我发现他的主页呢只有一张图片,这样感觉真的是太干了,餐厅也没有什么特色,我想每天都有一个的特色汉堡啊,以一周七天来循环,让他来修改 主视图,图片改为五张图片轮播,设置每天的特色套餐,每日的优惠套餐以一周为一个单位啊,一周为一个周期。每天的菜单呢,可以点击观看,并且每个套餐呢都有相应的配图。 顺便再说一下, codex 是 内置了当下最牛的生图模型,一面之杠二点零模型,比香蕉呢强了不少,改好了来看看效果啊, 这是汉堡店店内环境呢,是必须要有的,然后我输入加入醒目的店内环境图片,分别有,后厨的呃,制作区,冷藏区,前台用餐区,卫生区,冰激凌帐。每个区域呢都有至少两张图片,图片看起来是在同一家店。 好的,等会效果还不错。我们新开一个对话,打开计划模式输入,把这个项目改造成 next js 框架。如果你不知道 next js 是 什么意思,可以再新开一个对话,问他什么是 next js, 然后使用 codex 内置浏览器,我们点开批注按钮,这样的话,你想改哪里啊?直接就能在这里改。比如我想让这个汉堡的价格是零,直接点击这里,价格改为零, 想改哪里呢?都可以在这里直接进行修改。但如果你想让别人也可以打开这个网页,只需要打开 codex, 问他怎么让别人也能打开这个网页。这个也算是给大家留一个作业啊。总之一句话,遇到不会的或者不懂的就去问 codex, 把我们的思路一定要转变过来, 大家有兴趣呢,也可以去尝试着做一点自己的东西。 ai 时代,我们用 ai 工具呢,最主要的就是用来创作,然后提升自己的效率,让我们成为一个 maker。 好 了,这期视频呢就到这里,下一期我们再继续讲 codex, 大家点点关注哈,跟着阿亮学 ai。

我最近觉得我强的可怕,我现在掌握了一个软件,它解决了困扰了我很久很久的问题,它就是扣的 x, 因为它加快了我得到反馈的频率,我只用了一天的时间,我把我们的独立站重新建立了,把我们的官网全部翻新了。整个过程我是非常被动的,他问我,我解答,然后他会给我 做出来我要的东西,我就能够及时看到效果怎么样,我就得到反馈了。第二,我还做了一个小程序,你看一下 这个小程序是我们内部管理的一个小程序,当我们能够看到我们每个人的积分,还有我们的代办事项,我们的完成度过去,我做这样子一个小程序,我至少要花一万块钱以上,一个月以上的时间,中间我得反复去纠正,但是我现在只花了五分钟做完了, 而且我还用它创建了一个美工,我说帮我做一个 p 二五的电商图主图, 他就能够帮我生成一张我喜欢的主图。那我如果说我有其他的 ai 软件,我说帮我生成 p 二五的主图,那他可能不知道 p 二五是什么,但是他知道我想要什么样的图,那我的美工已经几乎是被我的 code x 去取代掉了。现在这能力技巧都变得非常简单,都没有任何的 门槛。以后的能力体现在多维度的理解,他是个比较抽象的,你又要懂产品,又要懂销售,你要懂用户,你要懂痛点,你要懂市场环境,你必须要对这种东西有多维度的一个了解,你才是真正的有竞争力,有优势, 因为单一的能力已经不再是稀缺的资源,他还替我实现了,比如说我们的 财务数据流水,让它自动的去收集我每天的流水,然后填到表格里面上报上去。除此以外,电脑卡顿的问题啊,我的公司的这些数据没办法利用,我用扣篮子都帮我规范,都帮我解决了。 很早之前我就要求我们公司必须把每个流程都要梳理出来,我觉得这是做的正确的一个事情,因为只有把流程梳理出来了,我才能够喂给 ai, 告诉 ai 我 去怎么去做。我觉得超级个体在我们公司马上就会发生 一人公司不再是非常遥远的东西了,我们公司三十个人,我相信 我们可以在一年之内做到三百个人的战斗力,我觉得是完全有可能实现的。后面 我还要给他创建智能体,我要给他创建单独的微信,部署到单独电脑上面,我要让我的 ai 员工之间能够相互的交流,能够替我更加 简单的,更加省心的做事情出来,等我后面的反馈,如果有任何进展,我会跟你们分享的。

欢迎来到这期的讲解,今天咱们要聊点颠覆认知的,彻底改变一下你对人工智能的传统看法,忘掉那个只会一问一答干巴巴的聊天框吧。今天我们要看看怎么把 ai 变成你手底下最靠谱最拼命的虚拟实习生。 咱们先实话实说啊,回想一下你每天的上班时间,到底有多少是被那些无脑的搬砖活给撤掉的?比如积极枯燥的数据录入在好几个表格,或者对着同一个按钮点上几百次, 是不是想想就觉得特别心累?那么咱们直接进入第一部分 ai 的 进化,咱们看看它是怎么从一个副驾驶变成咱们的全能员工的。 咱们来看这个非常有意思的对比。以前大家用的 ai, 比如 copilot, 其实就像是个坐在副驾驶的教练,你累的半死地握着方向盘,它在旁边不停地给你提建议,说风凉话。 但是现在的 kolex 呢?它完成了一次巨大的范式转变,它是一位真正的虚拟员工,直接帮你接管方向盘,帮你把活干完。而你这个指挥官只需要舒舒服服地坐在后排,审查一下最终结果就行了。 所以千万别误会,你绝对不需要懂任何敲代码的技术就能用它,它不仅是个搜索引擎,也绝对不是程序员的专属玩具。你只需要用平时说话的大白话告诉他你的目的地在哪,他自己就会动脑筋规划出一条路走过去。 接下来是第二部分,也是今天的重头戏,这小助手到底能干吗?咱们来揭秘一下他的自动化能力。 重点来了,他到底是怎么替你干活的?这就得说到他一个神仙级的功能电脑操作。 用大白话来讲啊,这就像是你电脑里住进了一个隐形的田螺姑娘,她可以真真切切地看懂你的电脑屏幕,然后像个真人一样去挪动你的鼠标,精准地点击窗口按钮,甚至模拟人类在键盘上噼里啪啦的敲字。不管是切换窗口,还是用剪贴板复制人贴,它全都能代替你的双手去完成。 而且最绝的是什么呢?无论你是用 mac 系统还是 chrome 浏览器,他干这些活全都是在后台静悄悄进行的。也就是说,你可以继续一边看网页,一边写文档。他在后台帮你干他的,绝不会突然弹出来打断你的思路,完全不抢你当前的屏幕焦点。 进入第三部分,咱们来看看有了这个能力,怎么帮你彻底告别复制粘贴,变成全自动日常办公神器。 试想一下,如果老板让你从网页上手动抠五百行数据到 excel 里,是不是想想就头大?现在呢,你只要像屎丸小弟一样,用大白话下一道命令,嘿,帮我提取一下数据, 刚才提到的隐形小助手马上就会接管。他自己去移动鼠标框选数据,按下复制,然后自己打开 excel 表格,把数据格式调得漂漂亮亮的粘贴进去,全自动一气呵成。 当然了,他的本事可不止填表格,日常那些特别繁琐的琐事他都能包圆。比如代替你一行行去填那些枯燥无味的网页表单,或者把工作群里乱糟糟的聊天记录,自动给你整理成一条条清晰的任务。 甚至他还能看懂设计图,直接帮你写出网页代码,或者干脆根据你给的大纲,直接啪的一下给你自动做好一套精美的 ppt。 看到屏幕上这个数字,二十四了吗?对,没错,二十四! 它的自动化功能,意味着你雇佣的这位虚拟员工,是真正意义上每天二十四小时连轴转的。晚上你大可以安心去睡觉。而你的这位好帮手呢,会在漫漫长夜里帮你盯着系统的数据大盘,把昨天积压的各种小毛病 bug 分 门别类整理好,默默优化你的工作流, 等你第二天早上睡到自然醒。泡好咖啡,来到电脑前,一份清晰完整的总结报告已经乖乖躺在你的桌面上了, 简直了对吧?那么第四部分,咱们对号入座一下,到底谁最需要这个帮手?他能怎么解决不同岗位的痛点? 你可能会想,这玩意儿对我这行有用吗?其实不管你是干什么岗位的,他都能精准地帮到你。如果你是个销售,每天对着 crm 系统挨个录入客户状态,点得头晕眼花,现在交给他,他替你自动点击登录、打字录入。如果你是个苦逼的运营,天天被一堆杂乱的数据折磨,他能帮你自动提取、清洗、排版。 如果你是个初级程序员,天天跑测试、修 bug, 那 他就是你专属的除虫小弟。发现没有,他对任何胡柳技术背景的小白都极度友好。 哎,那如果你本来就是个懂点技术的程序员呢?他还有个叫 worktree, 也就是工作树的傻手脚儿 们。传统干活只能一件一件按顺序来,干完 a 再干 b。 但现在你可以同时召唤出好几个 ai 小 助手,他们能在同一个项目的不同分支上,同时在那啪啦啪啦敲代码,互相完全不打架,最后还能奇迹般的把工作成果自动合并在一起,这工作效率绝对是开挂级别的。 接下来进入第五部分,咱们也得客观一点,网上现在传的很神的一句话就能做个游戏,到底是真是假?咱们来个现实大揭秘。 其实啊,现实情况稍微有点骨感,并没有网上传的那么神,他确实能瞬间给你画出好看的图片素材,搭出个游戏的基础代码,但这顶多也就占了整个工程六十百分之的基础工作, 剩下四十百分之的关于游戏的打击感好不好玩,界面细节的微调,这些依然需要你这个人类亲自上手去打磨,才能搞出一个百分之百完美的作品。 但是咱们算笔账啊,以前你想做这么个游戏原型,得花大价钱请个开发工程师,吭哧吭哧搞上整整一个月吧。现在有了它打底,你只需要花短短一个小时就能把基础流程跑通,从一个月压缩到一个小时,这可是整整十倍以上的效率提升,绝对是一个不可思议的跨越了。 最后第六部分,也就是今天我想给大家传递的最核心的理念,你来指挥他来执行。这个虚拟员工给你带来的最核心的价值,其实是一场职场身份的巨大转变,把你从一个埋头苦干的执行者,把高成了一个统筹全局的决策者。 当你把那些枯燥的像机器一样重复的电脑操作全都甩给 ai 去执行之后,你在公司的价值就不再取决于你手速有多快,能不能一天复制粘贴完一千个表格了,而是取决于你做出的战略判断到底有多精准。 所以聊到这儿,我想问问屏幕前的你,既然懂了这些,你准备好坐上指挥官的位子,去雇佣你人生中第一位全能的虚拟 ai 实习生了吗?你的第一道命令又打算让他替你干点什么呢?好好想想吧,咱们下期讲解,再见!

一定要一定要一定要用 codex! 别再把时间浪费在研究一堆 ai 软件上了,直接用一个就是 codex。 为什么我一直在强调 codex? 因为大多数的 ai 只会解决某一个单点的问题。 但是 codex 不 一样,它更像一个真正懂分工、懂协助、懂结果的 ai 中书。你不会做视频没有关系, codex 会帮你调用像 runway、 sit down 这样的专业视频工具。你 不会写文案也没有关系, 他知道应该把任务交给 minus 这类最擅长内容创作的模型。你不会做音乐,也不用焦虑,他还能调用像 solno 这样的音乐生成工具。他真正厉害的地方不是他会某一项功能,而是他知道什么事情应该交给谁来做,并且他能帮你把整个流程串起来。 所以,未来真正拉开人与人差距的,从来不是你会不会操作软件,而是你有没有想法,能不能表达审美够不够好。大道至简。当工具越来越聪明,人最值钱的能力反而变成了更简单的东西, 就是把你想要什么讲清楚。你只需要开口说,哪怕你的普通话不够标准,哪怕带一点口音也没有关系, codex 都能听懂。他不要求你是技术高手,他只要求你有清晰的想法。 所以,如果你真的想提高效率,不要先学一堆技术,先抓住那个最核心的王,擒贼先擒王,在 ai 时代,扣贷就是那个王。

codex 加飞书 c i 简直就是王炸组合,如果你的工作场景里面经常要用到飞书,那我真心建议你一定要把飞书接入 codex, 因为我自己本身就是在做自媒体和内容电商,所以我对竞品内容分析有非常大的需求, 但是市面上很多软件和系统都非常的难用,以及我在用 codex 之前,我自己也搭过一个,只不过是用扣子去搭的一个工作流, 非常的困难,拖拖拽拽搞了我非常久的时间,但这一次用 codex 加飞速 c l i 一个小时不到就帮我全部搞定了,给大家看一下,从提需求到他帮我规划只用了两分钟,然后到确定他帮我搭建这一个系统,只用了二十三分钟。 这个是我让 codex 直接用飞速 c l i 搭建好的一个表格,这个程序它是已经写好了,只要我复制小红书链接,它就可以自动帮我拆解标题,还有正文,还有 视频口播的这个脚本。我觉得视频口播的脚本是对我来说最重要的一个部分。 ok, 那 我们现在复制一个链接,让它试试跑着看, 它现在已经自动在跑了,然后已经在处理中,大家可以看一下。好,它不到两分钟就帮我已经拆解出来了, 对,我们来看一下啊,还是非常非常牛逼的。那其实在我搭建完这一个表格之后,它帮我拆解完视频口播脚本这一部分,其实我没有用到任何的 token, 只是一开始让 codex 帮我开发的时候需要消耗一定的 token, 等后面我再用这一套脚本去跑的时候,已经完全不需要任何的 token, 它花费的额度基本上为零。我在扣子上面搭建这样的一个工作流,还需要我付一定的额度。但其实 codex 已经在这一个文件里面写好了,这个脚本 我在跑的时候就完全不需要消耗额度。但是如果要让 ai 基于这一个口播脚本去分析改写的话,就需要接入一定的 token。 如果你感兴趣的话,我下期也会分享我是怎么用豆包或者是 deep sync 接入到这一个程序当中,让它帮我搭建后面的分析和改写。 所以说大家一定要去接触一下 codex 和飞书 c l i。 如果你也对 ai 加电商, ai 加业务落地感兴趣的话,后续呢,我也会持续更新我的一些实际案例,欢迎大家一起交流。

如果大家在工作当中使用 excel, word, pdf 特别多的话,那么今天这个视频将会给大家每天起码节省一个小时左右。因为我在工作的时候处理报销比较多,所以我给大家演示一下我是怎么用 codex 来处理平时的我的一些日常的一些报销的。第一步,我会把我的这些报销单全部准备好,我这里准备了一些我平时购买一些 ai 软件的一些报销的一些单据,这里都是我的支付宝的一些 截图内容。我把这些内容全部准备好以后,我还会有一个公司的模板,这个是我平时公司的一个报销的一个模板。 在这里我们要做的事情就很简单,第一步,我们把所有的东西全部复制进来,复制到我们的 codex 里面,我告诉他帮我生成一个报销单,把数据全部填到我的这个模板里面,就是这么简单,我们敲一个回车以后,他其实 codex 就 在进行 思考,进行数据的处理了。 ok, 经过了六分钟的处理, codex 也是完成了自己的这个 excel, 我 们打开看一下它长什么样子,它的整个模板也是完全没有错,每一列都是对的,包括它这个数字二百四十五点三九,我自己也是较对过很多次的,是没有错的。最关键的是你 如果还有错误,你可以跟他继续聊天,直到你让这个 codex 完成你想要的这个表格。这第一步就完成了,我这里就不做演示了。第二步,最关键的是什么?你会输入这个 skill quertime, 就是 这个, 这个是什么意思?把你的刚刚跟他对话的整个流程全部记录下来,做成一个技能,那么 以后当你第二次还要重复的去做这个报销单的时候,你就可以调用这个技能,这个技能以后你每次去制作发票都可以去使用的。我给大家演示一下,这里打一个 skype 以后,你就跟他说 把刚刚的流程做成技能保留下来,我这样子告诉他,以后他就能够把刚刚的技能全部保存下来了。我们稍等一会,我们看这边技能也已经都完成了,这是一个 remasement from abuse 的 一个技能,已经生成好了, 就是填充报销灯的意思,他怎么去引用我们第三步,首先打一个斜杠,这里打出他的这个技能名称,我们叫 remasement, 敲一下回车,我们就可以利用这个技能了。如果大家后续像我一样去使用把这个报销的流程,我们就把图片发给他去 引用这个技能,我们敲一下回车就可以了。我这里就不做演示了。像我们刚刚这个整个流程是比较简单,但是如果你做了一些特别复杂的活,你把这个复杂的流程去封装成这么一个 skill, 会给你带来特别多的时间上的节省。 像我如果只做这个报销,我自己手动的去看每一张 pdf, 每一个订单,我可能要花半个小时的时间,那么我使用这个技能以后,我就不需要看我里面每一个金额是多少了,我只需要把它啪的一下全部丢进去,他就给我生成一个报销单,我只需要稍微核对一下,那么 这个事情我大概能从三十分钟节省到五分钟左右,特别方便,因为像在中间的处理的这个流程里面,我们都是不需要自己去再去关注他了, codex 他 会自己的去帮你做掉。 ok, 今天的分享就到这里了,如果大家有问题,评论区欢迎留言,如果有什么 ai 不 懂的,或者想让我出教程,也欢迎评论区留下你的这些问题。 ok, 那 么我们就到这里啦。

好了,大家好,这段时间 codex 相信很多小伙伴已经上手,开始用了一个非常好用的 openai 的 桌面端的一个 agent 工具。那么今天我想推荐一个 codex 里面的一个很强很厉害的一个做视频的插件叫 hyperframes, 它可以帮你按照网页的形式去做成一个视频,相当于用写前端的代码去做一个视频。首先我们知道 ai 在 写前端代码这块已经是非常厉害的,所以说这个插件就可以帮你 让你的 ai 像写代码一样去做视频。好的,那么我们就直接来试一试这个插件到底有多厉害。使用是在这边点击这个插件下面找到这个 hyperframes, 安装之后我们直接右上角点在对话中使用。这里我把 cloud 的 一个官网给他,我说一句,请根据这个网站做一个产品的宣传视频。好的,我们这里让他开始执行。好的,可以看到他跑了一段时间,他去官网去拉取了一些他需要用到的素材, 他接着在执行。好的,现在他已经生成好了,他已经跟我们说宣传视频已经生成好,在这里只需要点开就可以去预览。 并且他除了宣传片以外,他还使用了官方的素材,产品的文案,他还有动画的分镜,他还给这个宣传片加了旁白的阴鬼。让我们来一起看一下 the ai for problem solvers breakdown complex work together research write analyze data and code with expert level collaboration bring code to your desktop browser tools and team code by anthropic think bigger work clearer。 可以 看到整个效果还是非常好的,除了可能画面中有个别的小细节, 有一些排版上的问题,整个的效果你敢相信是我只用了一句话,没有经过任何修改它就出来的一个结果。随着 ai 进一步的发展,一开始的文字、 图片、视频以及到现在的全自动的生成视频以及剪辑, ai 的 发展只会越来越快,而且这个工具对于很多想要制作一些宣传视频、科普视频的人来说非常的有帮助。

全部给我去用扣袋子,太香了。我昨天研究到凌晨四点搞我那个电商的全自动化商品工具,就自动选品,自动采集自动商家,包括自动合价。我给你们看一下我的进度, 目前是已经完成差不多五分之一了吧。选品自动商家,话不多说,我给你们演示一下吧,好吧。 然后上架时间跳一个月内,一个月内商家的新品,然后点一下来,自动跳到对应的,对吧选品工具,然后筛一个月啊,自动筛,然后自动 获取,比如第一页这二十个所有的产品主图,加上商品 id, 看,现在正在跑了,已经看到没在跑,在跑了,自己在跑。来,我们点一下, 你看一下扣带子界面就很简单,对话就行了,你会提词就可以了,全程不需要自己懂代码,不需要自己写,他帮你写好,帮你做个网页出来。 等一下,因为这一页的话有二十个屏,我们等下把这二十个屏跑完。好吧,我现在是全程没动,我没动鼠标的,你看没自己来跑的。 ok, 搞定,看一下来,现在没有数据吗?对吧?好了,刷新一下,看到没?出来了,呃,产品的品名缩写了对吧?标题以及主图一张,对吧?为什么只需要主图?因为后面会拿这个品去 幺六八八去识别,找同款链接,然后来比价,来筛侵权,来改图, ai 改图,然后再来去用妙手来去,对吧?上架去发布, 所以现在只完成了五分之一,所以只需要主图,然后对应的啊,比如上面 id, 我 点一下,点击之后自动跳转到这个平台,自动输入这个商品 id, 自动搜索,自动到对应这个产品链接,就如果你们想看的话点一下对吧?你看信息有了吗?对不对?比如说 想不想听啊?这是它工具自带的,只说你正常的话你得手动输在 id, 还还那啥自动啊,自动化了回来有人说你这个工具对吧?它本来就自带可以上架的呀,为什么说还要做这个东西呢? 因为听好了。举个例子,我们 y r 选品的话,不光是从,比如不光是从云集看,我们还会看 t k 的 数据,看亚马逊的数据,看店铺前端的数据,看什么各种数据,所以 如果云起这个工具他只是一个来源而已,懂 𠲎? 应该干过,应该懂我意思吧,所以全资的话,对 𠲎。

小伙伴们又和大家见面了,相信大家一定都用上考勤了吧,还是那句话,一定要想办法用上考勤。 大家既然现在都用上考勤了,我这期给大家讲讲咱们安装好考勤以后一些基础设置,这些基础设置虽然有时候不是特别复杂,但是设置好了会让我们效率倍增 啊。今天咱们就开始从最简单的菜单开始,常规里头有两个,大概我们主要做两个设置工作模式,这里的你大家看一下这个名称应该都很清楚,适用编程,大家编码多一点的时候选择这种模式,比如说咱们日常办公写文案, 或者写弄一些办公软件多一点说我们用适用于日常工作这个模式,其他的咱们按默认选就行啊。 咱们看到外观,这里这里大家看一下外观,这里根据大家喜好来了啊,什么字体颜色啊,背景啊,这都根据实际状况来。但是这里它有一个特别有意思的功能啊,我给大家看一下 box 里头有一个宠物功能,这个功能挺有意思,大家可以选择自己喜欢的宠物进行跟他培养交互,同样也可以选择创建自己的宠物啊,根据自己喜好来 最新的一个功能,应用快照功能,这个功能我感觉特别好用啊,比如大家看见一个特别喜欢的文章,大家可以按左右的 command 键同时按一下,他就把这个 文章啊就直接截取出来了啊。今天我遇到一个特别实用的问题啊,实用的这个功能就是用这个应用快照功能,比如今天我发现一个软件出了故障,迅速我按一下这个按键给抛给这个 cadast, 他 马上就给我分析出问题迅速解决。 这个特别实用啊,大家遇到问题或者遇到好的这个文章的时候都可以用这个特别实用 啊。咱们看一下下面的配置啊。配置这里头我主要说两项啊,一个是批准策略,这里咱们默认就选这个 on request, 这是遇到关键问题的时候,他会询问我们的意见,我们看一下没问题可以批准。还有个沙盒配置,沙盒配置默认咱们选这个 work based write 就 行啊,他对沙盒空间里头有多些功能啊,遇到一些高危命令执行的时候,他也会询问我们, 咱们看一下个性化,这里头,这里头有两个风格啊,一个亲和,一个务实。 你希望他说的要简洁一点,简洁概念一点,就选务实派啊,希望他详细需要说的,希望他说的详细一点,说的有亲和力一点,可以选择亲和啊。 还有自定义指令,自定义指令这个是约束咱们的 agent, 约束咱们的 codex 不 允许他做什么操作,对他有约束力啊。 这里头我用的是卡帕西大神的他的一个开源项目,他现在这个项目大概有十五万颗星啊, 大家有需要的时候,我可以把我的这个 agent md, 我 可以分享给大家,大家可以用起来,因为把这个,把这个指令用上去啊,我们的 codex 它的效率啊,还是它的约束力,还有它这个呃做事的风格就就会提升很多啊, 这个有需要的我可以分享给大家。剩下的是啊,键盘快捷键这里大家可能不需要改啊,如果特别觉得哪个快捷键特别舒服,自己想改一下也行,但是这一般默认就行,但是我们得看熟悉这些快捷键的用法啊,到时候我们很快捷的调用一些功能啊。 咱们看一下这个连接功能,这个更简单了,这个功能特别实用啊,大家开启这个功能的时候,比如这几个按钮,咱们点开允许 发现控制此设备啊,这就是让我们用,通过我们的手机可以连接到 call 大 师,我们直接在床上就可以实现发送指令或编程, 还有让这让这台 mark 保持唤醒状态,这个也勾选上你的 mark 处于息屏或锁屏状态,我们依然能能用手机控制,这个大大提升我们的效率啊, 而且它在锁屏状态下,它是防止别人窥屏的,还保证我们的隐私。咱们看一下这个浏览器啊,浏览器,这里的浏览器勾选上,这里是让 call 大 师,他可以 控制我们内置浏览器,因为 call 大 师带了一个内置浏览器,它是一个无头浏览器,像我们执行一些自动化脚本的时候,在这里头执行 勾选上就行,这个勾选上还是有挺大用途的,现在电脑操控这个这几个按钮也要勾选上啊。首先第一个按钮,任意应用, 我们勾选这勾选上这个按钮以后,呃, codex 可以 控制我们电脑的任何一个应用,包括给我们调取一些数据,做一些数据分析,进行一些登录,都可以使用它非常方便,尤其是我们做开发的时候,比如开发了自己的小应用,可以让 codex 检查一些流程规则。 这个 google chrome 这个功能是在谷歌浏览器里配了一个额外的插件,它可以读取我们浏览器的当前状态, 比如,比如我们登录,登录到知乎啊,登录到微信啊,登录到我们的公众号,它可以进去看我们的一些数据,帮助我们进行分析啊,帮助我们进行一些选择题啊,这特别方便。 锁屏操作,这个顾名思义,大家都知道啊,就是锁屏状态下,这 call 大 师依然能操作我们电脑,比如我们执行一个长任务的时候,我们就可以用这种状态入党绘画。这里就更简单了,就是 我们可以查看我们已经入党的绘画啊,查看一些历史信息啊,包括一些我们以前入党的一些聊天记录啊这些,有时候我们查一些我们重要信息的时候,还是还是挺有用途的啊。 剩下的就是主要这几个功能啊,还是大家得多用 pods, 多用我们才能发现它的这个价值,提升我们的生产力。 好了,这期就录到这了,小伙伴们把这个 code 起来啊,用起来,有什么问题大家集中反馈吧,有需要我再录一期视频的大家就留言啊! ok, 关注宇哥,带你玩转 ai 时代,好,拜拜!

我奉劝所有还没有装 codex 的 人,千万不要装 codex, 为什么?因为你一旦装了之后,你发现你根本离不开他,我给你看一下这玩意多恐 怖,他居然用了两分钟时间给我做了一个直播复盘的系统,这东西特别简单,未来可以把你的行业做成个系统,你做你的团队管理,做你的业务交付,都可以用到,给大家去展示一下具体的 流程,这里面有直播的工作台,有四个功能,原创直播稿、访写直播稿、直播数据分析、成交数据复盘。可以点新建项目,新建一个直播项目组,我点开始访写,就可以把同行的直播稿直接传进去,让他去进行访写,他就会进行运行。我访写这个提示词之前做这么一个系统,找 外包的话可能花个几万块钱,但是 codex 基本上可以一键出了,为什么说基本呢?因为有些小功能还需要在模拟。给大家看一下我跟他调用的过程其实非常简单,我把他的需求标装了一下, 告诉他这该怎么做,而且我前置给他做了一张系统的图片,让他根据图片来做系统一步步的推出里面的一个功能。未来呢,就像小孩搭乐高积木一样,一个一个功能栏,一个一个去跟他做,把这个系统整个完善,最后接一个云的服务器,或者接个 api, 我 就可以直接去用了。 未来一个人就是一家公司,我把我怎么去用 codex 的 具体流程分享给大家。评论区回 ai 两个字我来安排。最近我对一句话特别的上头,未来淘汰我们的永远不是 ai, 是 那些会用 ai 的 人逐步在淘汰那些不会用 ai 的 人,你觉得呢?

用 ai 剪视频,真正花时间的不是剪辑。过去半个月,我深入的研究了 hyperframes, 得出了一个结论,大多数人出片效果差,不是因为工具不行,而是因为跳过了最关键的前期准备工作,脚本怎么写,素材怎么准备,节奏怎么定,这些都是要提前想清楚的,不然后面全是反光。 所以这一期我把我的整套方案拆解一遍,从 ai 剪视频的原理到成片走一遍完整的流程,里面涉及到的所有的内容都已经开源了,你可以装上直接跟我一起操作。所以这一期又是一期非常干的视频,希望对你有所帮助。那我们现在开始 ai 剪辑到底在干什么? 其实就是让 ai 写代码, ai 用 html、 css 和 javascript 在 网页里面搭画面,动画、字幕、转场,全都靠代码, 然后浏览器一帧帧截图拼成 mp 四。所以你听到的 html 渲染成视频,说白了就是先在浏览器里把画面跑出来,再一帧帧录下来, 那代码能做到什么程度?网页上你见过的所有的交互效果、动效、转场、字幕、动画、三 d 适量图,它全都能做,但它也有做不到的,比如说实拍视频、图片这些它就不能实现,所以必须靠提前准备好素材,或者让它上网帮你来搜索。 hyperframes 就是 这种工作原理,从 html 渲染成视频,它能做的事情非常多, 画面可以分层叠加,视频文字图形往上垒就可以了。它内置了 coco 语音模型来帮你合成配音,还内置了 whisper 语音模型,帮你生成带时间戳的字幕,还能合成背景音乐和音效,甚至能一键扣掉人像背景。 功效方面,三 d、 a e 动画、 gpu 特效这些都支持生成完成后,它还会自动做一轮质量检查,扫代码结构、跑浏览器测试、抽关键帧截图,确保画面没有明显的问题。 hyperframes 的 完整的工作流大概就是这样的,先出使画一个项目,然后一个镜头一个镜头的去搭载画面,搭载完成后,检查和焦验 没有问题就预览,预览通过后输出渲染。我们在这个流程里其实就做两件事,告诉 ai 我 们需要什么样的视频,以及提供 ai 自己造不出来的素材,比如配音图片、视频设计文件等等。 但有个问题,你直接跟 hyperframes 说,帮我剪一条 spacex 的 视频,他大概率做不好,因为什么主线、什么风格、什么节奏、什么素材,他完全不知道,只能靠瞎猜。所以我写了 video spike builder, 加在了 hyperframes 前面,他专门干一件事情,通过追问,逼你动手之前,把所有的决策都想清楚。怎么追问呢?分五个阶段。 第一个阶段是锁定视频的基本盘,他会问你几个问题,包括视频的目的是什么,给谁看,发在什么平台,时常是多少核心,想传递什么信息,以及品牌的调性是什么样的。 第二个阶段是盘点素材,把你可能需要的素材分成六类,逐项跟你确认文案有没有配音,用真人还是 ai 有 没有实拍画面, logo 有 没有高清透明底,需不需要三 d 模型,还缺什么素材要去找等等这些事情。 第三个阶段是我觉得整个 skill 里最有意思的一步叫做激发表达手段,大多数人根本不知道自己想要什么效果,那他就会主动的告诉你 html 可以 实现哪些效果让你来选。 第四个阶段是定视觉主题,你可以从 hyperframes 里面预设的八个主题你选一个,也可以描述你想要的风格,让他来帮你生成一套。 第五个阶段是收集参考和返利,让 ai 有 一个具体的参考,或者明确说你不希望视频里出现什么内容,让 ai 知道哪些原则是不可以违反的。 五个阶段走完,所有的决策都会落到一份叫 video spike 的 markdown 文档里,等到 hyperframes 接手的时候,它只需要照着这份文档执行即可。 这个 skill 里还内置了六十九个预设的画面组建,包含了数据图表、流程图、思维导图、 ui 模拟、大字海报和各种场景,也不需要自己去想这一境用什么形式来表达,它会根据你的内容自动去匹配。 说白了, video spike builder 就 干一件事情逼你想清楚,你前期想得越透,后期出片的质量就会越高,返工就会越少。好,那知道了原理和流程之后,接下来我们来安装 hyperframes。 打开 codex, 点击左上角的 plugins, 在 搜索框里输入 hyperframes, 找到之后点一下右边的加号,弹出窗口后点击下方的安装就可以了。装好了之后,你可以再点进 hyperframes 的 插件页面,看看它的详细介绍。 这里有一点要注意, hyperframes 不是 一个单独的 skill, 它其实包含了十五个 skill, 但在这个页面里,你可以自由地管理这些 skill。 装好了怎么用呢?点击右上角的 tryinchat, 系统就会帮你新开一个聊天窗口, 里面已经预设了一段生成视频的提示词,示意跟着它就能快速上手。接下来我们还要装我专门为 hyperframes 写的一个 skill, 它的作用就是在生成视频之前,帮你先把脚本和分镜梳理清楚。在 github 上面搜索 video spike builder, 找到这个开源项目。 往下滑到安装部分,你会看到两条命令,第一条是安装 hyperframes, 我 们刚才已经装过了,所以跳过。第二条是安装 video spike builder, 复制这条命令, 然后回到 codex, 把命令贴进去。稍等片刻,它就会从 github 上面把项目拉下来进行安装。装好了之后,可以看到它默认安装到了 project level, 也就是项目级, 只在当前这个项目下才能使用。如果你希望在任何项目里都能调用这个 skill, 那 就需要把它装到大局。操作其实很简单,你只需要跟 codex 说一句,帮我把它装到 user level 就 可以了。 hyperframes 和 video spec builder 都已经装好了,不过在开始生成视频之前,我想先让你看一下 video spec builder 里面到底写了些什么。在 cursor 里打开项目左侧,可以看到 video spec builder 这个 skill 的 所有文档已经从 github 上面拉下来了。 我们先打开 skill 的 md 看一下介绍。当用户想制作视频、宣传片、产品演示或者动画的时候,这个 skill 就 会自动启动。它一共有两种模式,第一种是零到一模式,第二种是迭代模式, 启动的时候, skill 会自动检查项目文件,家里有没有现成的 video spike 文档,如果没有或者是空的,那就走零到一模式,如果已经有了,那就进入到迭代模式,让你通过对话反复的打磨视频脚本, 再往下看文档结构,整个 skill 的 文件组织一目了然。其中最重要的是 reference 文件夹里面我准备了几份核心文档, 包括沟通风格、零到一工作流、迭代工作流、视频组建的使用方式、节奏设计指南,以及最关键的一份 question bank, 也就是问题库。我们打开问题库看一下, codex 在 使用这个 skill 时,就是按照前面讲的五个阶段来追问你,一步步逼你把需求想清楚, 每个阶段该问什么,追问的逻辑是什么,什么样的回答可以接受,什么样的回答必须打回去重答,全部都写在了 question bank 里, 可以说 question bank 就是 整个 skill 的 灵魂。看完了 skill 的 内部结构,接下来我们就要开始做视频了,不过在正式开始之前,还有一步准备工作一定要做。 前面我们讲到 hyperframes 里面有八个主题,那如果你想用自己的自定义主题该怎么办?所以这次实操我就带你走一遍。比如我提前整理了 spacex 和 grog 的 设计语言, 纯黑白的硬科技风格,然后提炼成了地址按点 md 设计文档和 tokens 点 css 这样的样式代码,把它们一起复制到了项目文件夹里。 hyposhop 检查自定义主题的逻辑是,如果项目文件夹里已经有了 design, 点 m d 就 会问你要不要使用这份自定义的设计风格。准备工作做好了,接下来我们开始第一条视频。 在聊天框里面输入 slash video spike builder。 使用这个 skill, codex 做的第一件事就是扫描项目目录,他发现里面没有现成的 video spike, 于是就进入到了零到一模式,从零开始引导我们。 他先抛出来两个问题,这条视频讲什么?投放在哪个平台?横屏还是竖屏?那我告诉他,我想做一条关于 spacex 发展历程的视频, 时长大约是一分钟左右,横屏格式 codex 收到了之后,并没有急着往下走,而是上网搜索了一圈 spacex 的 资料,然后又追问了两个问题。第一个是时长,他觉得一分钟,这个回答太模糊了,因为七十五秒、九十秒、一百一十秒的视频节奏是不同的, 所以希望我给一个精确的。第二个呢,是受众,这个片子到底是给谁看的?这决定了内容的深度。那我回答他,时长就一分半左右。受众是普通的知识区观众,核心内容讲的是 spacex 如何通过复用来改变航天行业的发射成本。 拿到这些信息后, codex 给出了初步的方案,九十秒大约可以插入十二到十六个镜头。时长有限,所以没有办法做完整的传记,只能走一条主线,从早期的失败,到 fokken 九的实现复用,再到成本逻辑的改变。他问我这条主线行不行, 另外他还问我有没有竹子稿。那在这一步,我把自己提前准备好的但时间错的配音文件都一起发给了他。 codex 收到字幕和配音之后,先检查了两者在时长的节奏是否对齐,然后仔细的过了一遍字幕内容,帮我做了事实核查,看看这里面有没有表达的错误,或者是事实偏差或者不准确的地方。 查完之后,他问了我一个关键的问题,音频已经准备好了,要不要根据核查的结果重新做一版,把发现的问题都改掉?因为我想快点看一下效果,所以就告诉他不用改了,直接用现成的音频就好了。 紧接着 codex 问了两个关键的画面问题,比如说发射回收筷子夹火箭之类的真实视频或者照片,画面路线是走真实的摄影为主,还是走动态的图形为主?那我告诉他,我目前还没有任何的素材需要他来帮我搜集。 视频的风格以真实的摄影摄像为主,版权先不用担心,因为我们只是测试,不会真的去发出去。现在 codex 开始工作,从竹子稿里面分析出素材的需求,整理成清单,然后去搜索。 搜索完成后,他把视频划分成段落,每个段落该配哪些画面素材都一一对应好呢?给我确认没问题的话,他就会把素材清单写进 video spike 里,然后继续追问。我看了一下没有什么要改的,所以就确认通过。 接下来 callix 问我要不要背景音乐和音效镜头节奏,他给了我一个镜头的节奏建议, 我没有太多的反馈,就让他先按照这个建议去往下执行。那字幕他也问了,是像纪录片那样的整句长注,还是整句加关键词高亮,那我选择的是字幕,需要整句长注。在字体和主题方面, codex 看到我已经有了一套黑白工业风的自定义主题, 不过他还是告诉我, hyperframes 内置的八个预设主题里, data shift 和 shadowcut 这两个也很适合这条片子,但我决定还是不换了,就用我自定义的就好了。最 后 codex 问了装饰和组建的想法,问要不要加时间码,任务编码或者是线框十字定位这些元素, 有没有参考的案例或者是反例?那我确实没有什么特别的参考和反例,就让他按照他自己的建议来设计。以上就是 codex 追问的所有的问题,问题答完之后,他就已经有足够的信息来帮我写视频的脚本了, 那这里我们稍等一下。好,写完了。现在点击右上角的 video spike, 打开它帮我们生成的视频脚本。 这份脚本里面包含了视频的整体基本盘,视频的目的、受众、画面规格、语气基调、修饰结构、表达的手段,还有素材清单,十九个分镜以及每个镜头的具体内容,还有音频的时间轴以及参考范例。最后还有一些留给 codex 自己决定的开放性问题, 所有这些都已经完整的写进这份脚本里了。你刚才看到的这个过程包括内容的主线、受众定位、画风风格、镜头节奏、字幕样式、 bgm 的 氛围、素材清单。所有这些决策在前期全部敲定了,等到 hyperframes 接手的时候,它只需要做执行就行。 如果我跳过了这一步,那直接跟 hyperframes 说,帮我剪一条 spacex 的 片子,相信我,它出来的东西根本就没法用。这就是我开头说的那句,工作量要在前期准备好的意思。 ok, 那 脚本已经准备好了,接下来就是交给 hyperframes 开始干活。在聊天框里输入 slash hyperframes, 让 codex 调用 hyperframes skill。 这个时候 codex 会接上 hyperframes 的 制作流程,根据我们刚才写好的 video spike 开始生成视频。 它会按照我们的设计规范处理字幕、旁白和音频,按照素材清单上网搜索画面素材,还会帮我们合成背景音乐和音效, 这些几乎都不用我们再干预了。因为所有的决策在前期编辑 video spike 的 时候已经全部做完了。 hyperframes 只是在这个环节负责搜集素材、剪辑画面以及最后渲染成视频。 渲染完成后,他还会自动做一轮审核,通过抽取关键帧的方式来检查画面的布局以及素材是否合适。整个过程大概需要四十多分钟,所以这里我先跳过好视频渲染完了,我们来看一下成片效果。二零二四年十月十三号, 一枚七十米高的火箭从太空飞回来,被发射塔上两条机械臂在半空中夹住了。全世界都疯了,但二十二年前造它的这家公司连火箭都飞不起来。二零零二年,马斯克拿卖 paypal 的 钱创办了 spacex, 就 一个目标,让火箭能重复使用。所有人都觉得它疯了。 火箭这东西从来都是用一次就扔了。二零零六年,第一枚炸了。二零零七年,第二枚又炸了。二零零八年,第三枚还是炸了,钱烧完了,特斯拉也在崩盘边缘, 马斯克把最后的钱全压上去。第四枚飞进了轨道。接下来, spacex 做了一件从没人做过的事,让火箭自己飞回来。二零一五年, falcon 九的一级助推器稳稳落回地面。 二零一七年,一枚用过的火箭再次升空,发射成功,火箭不再是一次性的了。今天 spacex 一 年发射超过一百三十次,比全世界其他所有国家加起来还多。一枚助推器最多已经负用超过三十次,发射成本从过去每公斤上万美元降到了两千多。 而开头那一幕,筷子加火箭,就是在这条路上。再往前走一步,火箭连着陆腿都不需要了,直接飞回发射塔,被空中接住翻新再飞。 从什么都炸到徒手接住火箭,再到每一枚都能反复再飞。这条路 spacex 走了二十二年。 刚刚播放的就是一次成片的效果,我没有做任何的干预和调整,从完成度上来说其实还可以,但是你仔细看,里面有不少可以优化的地方。 比如说片子中提到了三次发射失败的场景,其实每一次都可以用一张当时真实的照片来替换,也可以加入更多的视频素材,比如说火箭返回到着陆的画面,但是可能 codex 在 上网搜索的时候就没有找到,那这个时候就需要你来提供了。 而且说到我们自己提供素材,其实主题风格也是一样的。前面这条视频我用的是一套自定义的黑白硬科技风格,那这套主题我是怎么设计的呢?接下来我来带你看一下, 其实很简单,你可以在 cloud design 里面进行设计,输入屏幕上这段提示词,他就会帮你生成一套主题,然后你再跟他多聊几轮,不断的调整细节,基本上各种需求就已经能搞定了。比如我这条 spacex 视频,用的黑白硬科技风格就是这么设计出来的, 它包含了一整套的设计语言,视觉的底座、中英文字体、装饰元素, a 肉出镜使用到的各种贴纸卡片,还有 b 肉讲解概念或流程时候需要用的图标、思维导图以及数据格式化,这些都已经帮你设计好了。 设计完成之后怎么导出呢?有两种方式,第一种是点右上角的 share, 然后选择 download project as a zip 下载成压缩包。那第二种是可以直接点 handoff to cloud code, 这样就可以在 cloud code 里面进行二次的开发和调整 好。实操部分就到这里,最后我来跟你聊一聊我用下来的心得,还有几个实操上的建议。 hyperframes 目前还不是很成熟,所以你千万不要指望它一次就能出成品,除非你的视频本身就很简单,只有字幕和简单的动效,不然你大概率是要调整几轮的。 问题在于,每一轮的调整其实时间成本都非常的高,赶完之后必须重新渲染,一轮就需要半个小时到一个小时的渲染时间,那大概三次也就是三个小时,这个时间成本非常的大。 所以你在使用它之前,一定要先判断一下你这条视频到底适不适合用它来做。像概念的讲解,流程演示、数据图标这类的视频, hyperframes 完全够用。 如果你的视频依赖大量的真实素材,复杂的剪辑节奏,那目前它还搞不定。还有一个问题就是它的效果不太稳定,有点像开盲盒。 虽然看起来它什么都能剪,但是实际体验下来,我觉得它的效果是时好时坏的。如果你真的想把它用起来,比如说批量的去做视频,或者是做讲解类的科普视频, 我建议你要固定一套视觉风格,几个转场和字幕样式以及贴片的动效,做成一条固定的工作流程,不然每次他都从零开始发挥这样的效果,非常不稳定。 然后是关于素材脚本里列的素材清单,不管是图片、视频、音效,我都建议你自己去准备,不要指望扣代斯可以上,我帮你搜索。找回来的素材经常和你的画面对不上,而且现在基本都有反爬 a 阵呢,是没有法下载的, 再加上搜索的过程又慢又耗 tokens, 算下来非常不划算。那我们应该去哪里找素材呢?接下来是我经常使用的素材网站,图片和视频我会常用 pixabay, 最综合 ansplash 和 paxos 的 图片资源,更多一些 bgm 和音效我推荐你用 solno ai 来合成,那这些工具都是支持 api 接入的。如果你有工程能力的话,完全可以自己搭一条自动的流水线, 配音也是一样的。 hyperframes 虽然内置了一个声音合成模型,但是它的效果其实非常的差,声音很机械,在正式的作品里根本没法用。如果你想快速的看效果,那没有问题,但是如果你想把它变成正式能用的视频, 我建议你去使用 mini max 的 speech 二点八 hd 这个模型,或者干脆自己去录好,那我的素材库差不多也就是这些了。那最后呢?我把 ai 剪辑视频这件事情拆成四层来做个收尾。最底层是大模型,模型的能力是地基, 分镜拆的好不好,素材理解的对不对,动效配的准不准全看模型。所以我这里首选 opus 四点七或者是 gpt 五点五。 第二层是脚手架 hyperframes remote, 或者你自己写的任何视频剪辑的 skill 都是脚手架,脚手架决定了你能实现什么样的效果。第三层是脚本书里怎么拆分镜,每个分镜的内容,文案转场以及整体的节奏的设计。 第四层是素材整理,你准备的素材的质量直接决定了最终画面的质量,这四层合在一起,共同决定了 ai 剪辑视频的最终效果。 以上就是本期的全部内容,如果你觉得对你有所帮助,别忘了点赞以及加入废材俱乐部,我们可以一起探索更多实操的玩法,那我们下期见了。

我用了 superpowers 一 段时间之后,最大的感受它不是让 cortex 更快写代码,恰恰相反,它是在让 cortex 不要太快写代码。因为现在 ai coding 里一个常见的问题是,需求还没有澄清,边界还没有确认, 测试还没有想好, cortex 已经开始改文件了。小任务这样做还行,但一旦任务变复杂,这种直接开写的方式很容易出问题。所以这一期我们聊聊 superpowers 到底解决了什么问题。 先简单说一下 superpowers 是 什么,它不是一个单独的 skill, 而是一套给 coding agent 使用的软件开发方法论。在 codex 里面安装很简单,如果 是 codex c r i, 打开 plug ins, 搜索 superpowers, 选择安装就可以了。如果是桌面版的 app, 在 侧边栏 plug ins 或者是那个插件里面找到 superpowers, 点加号安装就可以了。 插件我找到 superpowers 点安装就可以了,因为我已经装过了,所以这边不是加号了。装好之后,它就会作为一组 skills 在 cortex 里面使用。这也是我觉得它很适合 cortex 的 地方。它不是让你每次手动复制一堆 prompt, 而是把一套软件工程流程变成 cortex 可以 按需使用的 skills。 我 理解 superpowers 的 核心就是把 ai coding 拆成 七个顺序执行的步骤。第一步就是头脑风暴,在写代码之前先澄清需求,探索方案,确认边界。第二步就是创建独立工作区,不要直接在当前工作区里乱改, 而是创造一个更安全的独立开发环境。第三步是写实施计划,把任务拆成小步骤,明确要改哪些文件,怎么实现,怎么验证。第四步是指代理开发, 把具体任务交给 subdivision 去执行,让主流程可以更清楚的组织和检查。第五步是 tdd 测试,驱动开发,先考虑怎么证明它是对的,再写实现,而不是先写一堆代码再说。第六步是代码审查,改完不是马上说完成,而是让另一个审查视角检查问题。 第七步是完成分支,最后做验证,收尾、合并或保留分支。所以它的流程不是需求到写代码,而是这一套头脑风暴,到独立工作区域,到实施计划,到代理开发,到 t d d, 到代码审查,再到完成分支,每一步都是一个独立的 skill。 这就是 superpowers 最核心的地方,它把软件工程流程拆成了 ai 可以 执行的一组 skills。 我在 codex 里用下来,感觉它是比较无缝的,尤其是装成插件之后,它不像一个你每次都需要手动调用的命令集合, 更像是给 codex 加了一套开发习惯。比如需求不清楚的时候, codex 会先倾向进头脑风暴,先问问题,探讨边界,确认需求,而不是直接开始改代码。准备实现之前,它会更容易进 writing plans, 设计代码质量时,它会提醒 pdd review 和验证。这就是我觉得就 pos 很 有价值的地方,不是每次靠你提醒 cortex 守流程,而是让 cortex 默认更容易按照工程流程工作。这里也放一个 sdd 的 背景在里面, s d d, 也就是 spec driven development。 规范驱动开发,它的核心思想是不要一上来就写代码,而是先把要做什么说清楚,比如 open spec, 它更偏规范管理,它关注的是把需求变更约定整理成可维护的规范。 spec kit 更偏规范驱动开发流程,它通常会通过一组命令模板,引导 ai 从 需求深层规范计划任务再去实现。而 superpowers 更偏工程纪律和 skills 集合。所以我会这样理解, s d d 解决的是先要把做什么想清楚, superpowers 解决的是做的过程中怎么守流程。最后说一个大家可能关心的问题, token 消耗,而我自己用下来。 superpowers 在 cortex 里的题感是比较轻的,因为它不是每次 都把一大堆规范文档塞进上下文,而是通过一个个 skill 在 需要的时候触发对应流程。当然,它也会消耗 token 头脑风暴,它要讨论需求, writing plans 要写生成计划 review 要读取代码和分析问题, 都不是免费的,但它的消耗更像是按阶段按 skill 触发。而 openstack 和 stackkit 这类的 sdd 工具通常会生成更多的规范计划任务文档,好处呢是结构更完整,坏处是文档越多,后续带入上下文的 token 压力也可能更大。我 之前看到 speckey 的 社区里面有人反馈过类似的问题,有依据里估算,在 cloud code 里,一组 speckey 个 months 可能占用大约十八点六 k 的 tokens, 在 codex c i 的 上下文窗口里面大概占百分之七到百分之十。这个不是官方的 benchmark, 但它说明一件事,流程工具本身也有上下文成本。所以我的判断是, opens back backit 更适合强规范、强文档、强交付约束的任务。 superpowers 更适合日常 ai coding, 因为它更像一层工程流程约束 动成本更低,体感也更自然。所以这一期的结论是, superpowers 不是 给 ai 加超能力,而是给 ai 加工程纪律。它解决的不是 ai 不 会写代码,而是 ai 太容易跳过软件工程流程模型提供能力, superpowers 提供纪律。 下来几期我们会继续拆开看。为什么先要头脑风暴?为什么要写 plans? 为什么 ai 写代码需要 pdd? 以及为什么 ai 也需要 code review? 下一期我们继续。

哈喽,大家好,我是七帅,今天分享一个教程,任何人都可以从零开始用口袋子开发一款 app, 上线 app store, 这是我大概用了大半天的时间做的一款产品决定转盘帮你做决定,这款产品现在正在审核中,今天把我做决定转盘帮你做决定。这个产品的完整的思路,从最初产品的构思到产品上线提审这全流程,用这一个视频给大家讲清楚, 这个视频的时间较长,希望大家能够看完。首先我们先看一下说我做 app 我 前期做了哪些准备。第一个是 apple 的 开发者账号,这个是前提,如果说你没有这个开发者账号,我们是没有办法提审 app 的。 第二个是拆的 gpt 的 会员,这个因为我后面用到的一些编程工具都是通过拆的 gpt plus 会员才能进行操作的。 接下来是扣贷,是客户端,下面这个是 mac 电脑,因为我们开发 ios app 必须得用 mac 电脑,所以说这个也是必须的硬性基础。下面是豆包,好的,现在我们开始讲第一步我是怎么构思这个产品的。 首先我做这个产品的目标是为了能够录一个从零到一做 app 的 一个教程,所以说我就给到豆包,我问,我想作为讲解视频,主要是讲解整个过程,我希望能从产品构想到最终上线到 app store。 我很明显的告诉他这是一个案例,也不用拿到多少下载量,只不过是一个产品,你认为我做一个什么样的产品合适?他回复我说,因为结合我之前我和豆包的聊天,他知道我大概的背景信息,他给我匹配了几个产品,第一个是邮票的管理,第二个是宝宝成长, 第二题里是做番茄,还有做每日记账。在整个独立开发者社区里面,大家都知道独立开发者社区的三件套,记事本、 to do list 还有记账,所以说我不想做这三个产品,那我接下来就问他, 你还有没有其他的思路,你还没有其他产品可以介绍给我的,他结合我自己的个人兴趣和身份,第一个是 ai 提示词,还有个设计灵感,接下来是健身打卡、 重要日子的倒计时等等,相关的这些其实我都不是特别感兴趣。接下来我就发现有一个我特别感兴趣的叫做决定转盘 app, 你 看这个 app 非常有可玩性,而且它比较简单,它相对来讲只有前端的页面,它不用做后端的接口,做后端的服务器,只要有一个前端展示就 ok 了, 那么我就决定做这个 app。 所以 接下来我就给豆包说,我接下来我要做决定 app, 把这些核心功能都转给他,说这个思路不错,你帮我详细介绍一下。他接下来就给我详细介绍一下,说主要的核心功能以及技术的讲解等等。其实这些我没怎么看,因为我也用不着, 接下来我就再给他输入提示词,把这个思路整合成一个我发给扣贷斯的提示词,因为我后面会用扣贷斯去帮我实现,所以说他就帮我去用扣,接下来他就帮我生成了一条适合给扣贷斯使用的提示词,就这样你看有那么多,接下来我就把这个完整给复制下来发给扣贷斯。 好,现在我们看到的是扣贷斯扣端,我再把刚才豆包给我的提示词粘贴到这里之前,我先给扣贷斯发那条命令 说你现在要新建一个项目独立的 ios app, 不要和我之前的项目有任何的混合。他回复我说已经创建了一个独立的 ios app 项目,具体地址在这里,其实这些我也看不懂,接下来我就把豆包刚才给我生成的提示词完整的粘贴到这里发给他。 特别注意一点,我开启的是计划模式,你看裤带也是完整的,按照我的这个提示词的要求帮我去做了,按照我的计划模式帮我去实施。做了那么多东西,写了很多啊,其实我都没怎么看, 做完以后我就告诉他,你实时计划吧,既然你看他处理了九分钟多,他把这个事情帮我做好了,做好以后我想把这个产品直接在我的 iphone 手机上帮我打开。 接下来他就回复我说,我现在还不能在我的 iphone 上打开,因为我的手机版本的系统和我这个叉扣的的系统是不一样的,所以说我的叉扣的里面需要去安装设备支持组建,需要安装 ios 二十六点四的组建。那接下来我就让他去帮我去安装 ios 二十六点四的组建。 他装装,装了很长时间,因为这个比较大,需要八点多,接下来很长时间,他思考了一会就说,那你先下载吧,下载完以后你骑会就行了。 等我下载完以后,我就给他说,我现在我已经完成了,你再看一下他,接下来接着去思考,就发现说我卡在签名用户, 后来我才发现其实我是开发者账号,为什么说会卡在我的签名账户,让我再让他再看一下。看完以后发现其实他是因为登录了我另外一个账户的开发者账号,导致于我的签名是有问题的。思考完以后,他把我这个有权限的这开发者账号的信息给登录上来了, 接下来他就把我这个产品就装在了我的 iphone 手机上,接下来我告诉他,你在我电脑上打开,接下来他又用我的电脑打开了模拟器,把这个 app 帮我跑了起来。我用模拟器打开看了一下,看完以后其实发现它里面是有些问题的,接下来我就告诉他, 你修复 bug 一 共有四个 bug, 这四个 bug 我 都很明确的发给他了,发给他以后他又处理了三个问题,都已经更新,模拟器和真机构建都已经重新通过了。 通过完以后我又发现我毕竟不能每次都打开手机,比较麻烦,那你再用模拟器打开给我看一下。打开模拟器看的时候又发现其实他又有些问题,你看他转盘里面是没有信息的。 第二个是做完以后这些信息是乱的,我就告诉他,你看这两个信息是是乱的,你善变不匹配的情况你要帮我修复,而且这次特别强调了一下,你自己多次测试以后,再打开个模拟器给我看,你不要总是做完以后就给我看,浪费我的时间。这个时候他又去处理,两分钟多把这个产品已经构建完毕了。 勾结完毕以后,结果我又发现了问题,没有,转之前的时候他是六个,当转完以后,结果这两个扇面他是没有信息的,所以说我就又明确的告诉他,这明明是六个选项,但是转盘里面两个选项不显示,而且内容还没有很好的匹配到这个转盘的扇面上, 让他去检查一下,或者是你换另外一种方式也行。最后我又强调了一下,你做好以后再打开模拟器给我看。 接下来他又去做,经过各种处理,最后他提醒我说,如果你愿意,可以把今天吃什么和其他的两个选项他自己过滤一遍,最后做一遍视觉验收。他这次处理时间比较长,处理的七分钟多。验收完以后呢,又发现我的桌面模拟器的桌面和我手机的桌面是没有 app 图标的, 那这个时候我就开始去做这个图标,接下来我再给大家分享我怎么去做这个图标的。好的,现在我们再次打开豆包去讲解我怎么去做应用启动图标的 前提,给大家说一下,我做这个图标全程都没有打开设置软件,全是通过 ai 帮我去完成的。首先我想做 锤子科技,锤子手机之前那个 smartinos 相关的那些你物理的图标,因为我当时忘记了这个 smartinos 当怎么打怎么写,所以说我先问豆包锤子科技的手机系统叫什么?他回答我顺带的给我一张图,这个图很好啊,我就把这个图发给了豆包,我说你看这组图标, 你要反向描述这个图标的提示词要精准,确保我按照你反向推理出来的提示词能够生成我想要的 icon。 接下来都包给我了一些提示词,首先是一个整组图标的提示词,还有单个同风格图标的生成提示词, 其实下面这些没有用,我直接用第二个中文提示词,我把这个单独给复制了下来,复制下来以后我就放到了,我就放到了我的拆的 gpt 里面图片生成模块,接下来讲怎么去用拆的 gpt 把这个图片生成,现在大家看的是拆的 gpt 的 外部端, 我把我刚才豆包给我的提示词放到下面,我告诉猜猜 ppt, 我 想要一个类似于抽奖转盘的 ios app 启动图标,要求如下,并且将宽高比设定为一比一。 这个时候他返给我一张图片,我认为这张图片做的已经相当不错了。接下来我就没有去做任何修改, 我就直接告诉他,因为你这张图片不是最终放在应用商店的可以用的,因为它周边有这么多白色的那个地方,还有投影,就是你把这张图放在社交平台上是没有问题的,但是其实你放到那个提审还是有点问题的, 那我接下来会给他说让这个 icon 充满整个画面,因为我只有这样,我拿到这张图,我才可以上传到我的 a b 十二里面去。接下来他给我返来这么一张图片, 我认为非常好。接下来我就把这个图片复制给了 codex, 让 codex 把这张图作为我 app 的 启动图标。现在我们回到 codex, 这个图就是刚才拆的 gpt 给我生成的图标,我直接粘贴过来,然后把这个图设置为 app 的 桌面启动图标。 思考完以后我就想你不能光生成,你在模拟器打开再给我看看,所以说它大概处理了十二分钟多,把这个事情给做好了, 接下来他问我要不要把这个图标重新安装到我的真机上,我也没回答他,我就想下一步我想直接把这个产品上架到 app store。 好 的,他接下来你看说按照能过审来收尾这个产品了。首先他说我上架之前先补齐这几件关键的事情, 有数据合规、产品的完成度等等相关的。其实我接下来也是按照他给我的建议去做的,他说我先别着急提审,先补这三样东西等着,因为我之前提审过产品,因为我知道需要隐私业的。接下来就让他去帮我去做这两件事情, 第一件和第二件生成一个可上架用的隐私政策的文案页。我突然间想到这个图标版权是我自己做的,我用 ai 做的,为什么会有版权?所以说你不要改我的图标了,你先给我上架用的隐私政策页才给我了一个。 其实这里有一个技巧,很多产品它需要做一个独立的网页去承载我们隐私政策的,但是我没有这么做,我是用非书文档,我把它给拉客档的这些文件全部给复制下来以后,我就直接创建了一个非书文档,把这内容给粘贴进去, 并开启了互联网的访问权限。因为我之前两个产品这么做都没问题的,所以这次我还是这么做的。 ok, 下面告诉他,你开始做。第二步,他也是把这个什么整个商家用的相关的产品都帮我去描述好了。描述完以后,这个时候其实需要我去 app store connect 里面去填写的, 上传 appstore 里面其实有很重要的一步,需要你上传几张你的 app 的 截图的,我们在应用商店看到的那几张图,你开始做 app 的 截图方面要上传,做着做着突然间我的那个 token 不 够用了,呃,我后来干脆想算了,那我自己用手机截图截了三张传上去了。 接下来我就把这个链接 appstore 的 这个链接发给他说,你现在打包上传到我的 appstore, 接下来开始打包开始构建产品 国家完以后他问我说你要不要直接上传?在上传的时候其实他需要横屏的,因为刚开始做的时候,我这里面是没有做横屏的,只是竖屏,但是插口的提醒我必须得有横屏的。所以说我接下来说,那你把竖屏提醒给清掉,再正式上传到 a、 b、 c 二。这次处理的时间特别长,三十一分钟他开始上传了, 但是卡在创建 app 记录这一步最主要的原因,因为我决定转盘这个名字已经被占用了。接下来他给了我三个选项,我就随机选了一个。接下来他开始帮我构建,构建完成以后, 这个其实这边已经没有什么太大问题了,已经开始收尾了。我上传 a、 b 十二时候发现其实有些信息我是懒得填,我就告诉他你把这些内容给我,他下面就开始把这些文本给我,我就直接粘贴过去就行了。 置顶完以后我就发现我这个图标,你看它是默认的,为什么没有显示我的图标,我就问这里怎么不显示图标呢?他告诉我说这是正常的现象,因为他上传上去以后需要一些时间的加载,等过了一会我去刷新了一下,发现那个图标真出现了,没有问题了。 接下来我在提审的时候又发现一个问题,必须上传 ipad 截图,还有年龄分级信息等等。 我又把这个截图发给他了,我说你要给我一个十三寸的 ipad 截图,再给我一个技术知识的内容, ipad 截图我拿到了,直接传上就行了。接下来是这个技术知识的 bug, 我 点开以后跟我刚才是一样的,我把这个也是放在了我的非书文档里面,创建了一个非书文档链接,把这个链接直接粘贴到提审技术知识 u r 里面就可以了。接下来你看他给了说正我这些都我都没看,我直接就直接粘贴复制过去了。 后来我又发现问题,你选择类别, a p p 信息里面设置内容,版权信息等等,它又给我提醒说类别怎么填,我又把它给填上去了,我按照它的信息去填,填完以后发现我整个 a p p 字号是没有问题的,完整的提上去了。 也就是说到现在为止,我是从最初产品公司到最终 app 的 上线,我都已经做完了,已经把这个流程也给大家完整讲述完。提审完以后,这里会看到一张图,是在审核中,这个时候如果说审核成功,这个产品直接上架了。一般情况下 我们提审完以后可能会遇到一些问题,他会给拨回,也告诉我们一些拨回的原因。那接下来我们把拨回的原因 完整的复制,再粘贴给 codex, 让 codex 帮我们去解决。行了,解决完以后再让他帮我们去把这个版本去提审,反正 你不折腾个两三次,一般情况下是不会过审的。我之前上传一个大概折腾了四五次才上线,所以说这个地方大家希望有一些耐心,多次跟 codex 沟通就行了。好,这次分享到这里,希望大家能够喜欢。

我这期视频的口播就是 codex 帮我剪的,我现在的剪辑速度超快,我最近做了一个 codex 剪口播的 skill, 其因是我看到别的博主做的剪辑 skill, 但是他们适配的都是像达芬奇和 pr 这样的专业剪辑软件, 但是我们日常用的最多的还是剪映,那我就去用我的方式重新做了一下。它实现的功能呢,就是在我录口播的时候说重来, codex 就 知道前面这段不要了。最后呢,它会自动来生成一个本地的剪映草稿。整个处理流程呢,分成四步, 第一步,我把原始素材给到 codex 以后呢,他用 whisper 来做中文转写。第二步,在转写结果里面识别从来和 ok 过。第三步,生成 cut list, 也就是 codex 来判断哪些保留,哪些丢弃。第四步,生成一个本地的剪映草稿文件夹。好,我们直接来演示一下,这个是我刚录好的口播素材, 我把它拖进 codex, 然后调用一下这个 skill, 跟他说你帮我粗剪一下这个口播稿,给我生成一个剪映工程。然后等一会,我们先来到剪映,点击这个大局设置,选择草稿位置后面的文件夹,然后右键在访达中显示,然后把你刚才生成好的工程拖进去,然后我们回到剪映,你看这个时候草稿就出现在剪映的界面里面了, 然后你只需要点击重新链接素材,选择一下你的素材, codex 帮你剪完的时间线就出现在剪映里面了。总结一下这个 skill 的 价值,不是让 ai 替我做创作,而是把我在录制的时候已经做出了判断,稳定地转换成剪辑的结果。对了,这期视频的动效也是 codex 帮我做的。下期视频教你怎么做。

最近扣袋子太火了,每天都有大量的新增用户,然后还有很多 cloud 用户,然后转到扣袋子。如果你现在还没有入坑啊, 我建议你也别先急着 follow 我, 把我最近一段时间密集使用的一些技巧,今天分享给你,你看一看适不适合你, 你再决定要不要入坑,就首先 codex, 它之所以这么火,特别是在打工人里面,很多人觉得好用,主要就是因为它已经是从最初的这种 对话的这种智能体,已经变成了可以去帮助你解决日常工作,日常办公的一个图形的界面了。它的操作界面就是很标准的那种三栏式的, 左边是你的整个一个个的项目文件夹,中间是你和 a 键的对话,右边是你对话之后他给你生成的这种各种项目的一个预览。我在日常中使用最多的第一个就是 整理文件,我上来之后就先让他帮我去整理文件,比如说下载文件夹里面会有很多的乱七八糟的截图,还有很多的这种文件视频什么的,都让他去分门别类的帮你去整理、删除、归类。 而且每一个文件他都是可以去给你打上不同的命名的,就比如说按照时间、项目关键词这样去命名,这样的话就是你后面去查找啊,就会非常方便。然后第二个能力就是打工人的办公三件套, 这个是特别实用,就比如说你要去做一个汇报 ppt, 对 吧?上来之后大家你有一些啊文字稿,文字大纲,或者说你连文字大纲都没有,只是一个那种,呃,草稿几句话那种,你也可以教给他,你说 你大概有这样的一个需求,这里有一个建议啊,就是可以安装一个 skill, 这个是 ospec 他 们出的一个官方的一个设计的规范,然后就调用这个 skill 去帮你出 ppt, 这样的话那个 ppt 出来就比较美观, 他会根据你的需求先帮你列一个大纲,你再去改吧改吧,基本上就是一个汇报的出稿就搞定了,很方便。或者说你大量的每天有那种数据处理的需求,你把这些待处理的数据也丢给他,让他去再帮你生成一份 格式化很强的那种数据,出稿也很方便。所以说就他在办公三件套这方面就把很多人给拿捏住了,就是太方便了。 再一个就是本身他的那种操作界面是那种三栏式的,对吧?最左边是你的项目,所以他就很适合你把很多的项目去归档到一个文件夹,基于他现在的这种模式,他是沙箱制的,他会针对于你点开的授权的这个文件夹进行操作,其他的文件夹他不会动, 所以你就可以把很多的这种日常的会议记号或者说聊天记录,比如说都导出来放到这个文件夹里去,他每天去帮你去汇总,你不用说每天去看大量的会议记号或者说聊天记录,他帮你整理之后,你再去对日常工作做一个汇报和总结, 这样其实也能省大量的时间。除此之外呢,我觉得 qq ads 它这种图形界面真的是比很多的工具有好很多,比如它有一个自动化功能,对吧?比如说我每天早上让他去帮我生成这种科技日报, 然后都会迁移到这里,包括我会去关注很多的一些英文的博客,只要有更新,我就会让他帮我抓取过来,直接去更新到这个里面。跑定时任务这个很方便,包括说你在工作中有很多流程化的东西要梳理下来,你也可以用这个自动任务去跑。 因为我看很多人,他比如说他每周一要去整理上一周的周报,把每周的日报去整理出来, 放到整理成一个周报,每周一的时候你就知道说上周做了啥,下周用哪些代办,基本上你就不用说每周再去翻日报去整理了,这个能省很多时间。其实我还想到扣带上面有个很好的功能,就是叫计划模式。就比如说你再去请一个新项目的时候, 如果说你没有什么头绪,不知道该怎么办,你只有可能有一个想法,或者说一个很简单的一个出稿,你也可以丢给他,这个计划模式就是你和他进行一步步的对话,把这个出稿变成一个很简单的一个方案输出出来, 他能够很好的去帮你实现一个从零到零点五的一个过程。就不用说你一个人在那去想,而是说你找了一个 很智能的 ai 的 一个伙伴,帮你去共同去策划了一个这样的一个方案。你再拿这个方案去和你领导汇报的时候,基本上能够帮你度过最困难的第一个阶段的交差,后面你再根据领导给你的很多的需求指示再去完善, 这个是它的计划模式,很好用。然后除了以上这些,我还能想到的就是它在 web coding 这一块就是氛围编程,它相对于 cloud code 我 觉得是更加友好的, 因为基于它整个的这种 gui 的 这种图形界面,可以很好的去管理你的 web coding 这样的文件夹,里面管理了我各种各样的 web coding 的 工具。 然后假如说你在职场工作中,对吧?经常去处理很多的数据啊,想去自己搞一个专属于自己的这种数据面板,你就可以去生成一个,就不用说你去求着开发,或者求着你的数据工程师说你去帮我去开发小工具,他可能还没时间要去排期啊,各种各样的, 包括那种运营海报啊,你也不用说要求着设计师帮你去设计一个,然后前端再给你开发,你就自己可以搞一个小工具,自己后台去传文字啊,去配图啊什么的,很方便的。然后如果说后面想要去升级,直接就点开这个文件夹,就和他聊天,他就可以升级升,比如说你的 优化版怎么怎么样。所以说我发现啊,客户袋子之所以这么多人愿意用,很多打工人想要去尝试,就是因为他把我们日常工作的很多项目融合到了一个界面, 然后去处理,他是一个文件夹,一个文件夹的方式去帮助你把很多工作中很繁琐的东西给处理好,能节省大量的时间。这个我觉得是 openai 很厉害的一点,他盯准了这一块的需求,所以如果说你还没有体验过以上的功能,你也可以去尝试一下,如果你有更好的这种功能啊,小技巧啊,也可以在评论区咱们都一起讨论讨论。 最后呢就是如果说这个视频有帮助到你,帮我点个关注转发,一箭三连,谢谢,我们下期再聊。

接下来我会直接用一些案例来展示它的能力。第一个案例是本地文件的处理,那为什么我第一个案例要说本地文件处理呢?是因为大家之前常用的对话的 ai 产品其实是没有这个能力了, 也导致了我们经常需要复制、粘贴、上传、下载文件,其实是很浪费时间,那 agent 的 本地文件处理能力就会大大提升我们的效率。那比如说我这里有一堆视频素材,文件名全是乱的,以前呢,我只能一个个打开看,然后再手动改名,其实是非常浪费时间的。 现在呢,我直接把这个文件夹丢给 codex, 然后跟他说请读取这个文件夹中的视频及图片素材,然后根据画面内容给我重新整理命名发给他。 ok, 我 们可以看到 codex 已经把我们的素材都整理好,他给我们根据画面内容分成了五类,并完成了重新的命名,并且给了我一个整理清单,包含了原本的文件名,还有新的文件名, 还有内容的说明。那我们现在也回到刚刚的文件夹看一下,看他改的怎么样。这是原本的文件夹,可以看到他根据不同的类型建了不同的文件夹,并且给我们一个整理清单, 我觉得这个任务完成的是相当不错。那当然,第一次做这种批量操作呢,我建议大家可以让他们先生成预览的清单, 不要马上重命名,你确认命名风格没有问题,再让他真正的去执行。那第二个案例,我们来讲一个更贴近内容创作者的能力,用插件和 skill 把口播稿变成视频, 我想把一段口播稿做成一个有节奏的视频片段,通常我会用到两个东西,第一个是插件, 比如 hyperframes 插件,你可以把它理解成给 codex 装了一个能力包装上。以后呢, codex 就 知道 hyperframes 是 用来做 html 视频片头,动画字幕视觉化和动态图纹的。那第二个 skill skill 其实更像是我们自己的工作方法说明书, 那比如说我这里有一个自己的 video skill, 它规定了做口播的节奏,然后再做 time map, 屏幕上呢,只能放关键词,动画呢要跟着旁白重点走,最后呢,还要检查文字有没有重叠,有没有太小,有没有画面太空。那所以这个案例完整的跑起来,就是我给 codex 一 段口播稿,然后告诉他,请使用我的 video skill 的 方式,把这段口播做成一个视频片段。 然后呢,他会开始跑关键帧的预览,主要看三段的版式,有没有文字的溢出啊,层级是否清楚啊,然后再决定调整之后要不要渲染完整段视频。 ok, 这里他根据我们的需求,将文章分成了三段,然后做好了视频,并且渲染好了。这里我给大家看一下,如果之前看过我视频的,应该有看到过这些片段, 那这里呢,他会根据口播的速度,对画面的一些重点部分进行高亮,或者是增加一些动画的特效等等。 这个案例呢,其实想跟大家分享的是插件和 skill 的 使用,插件解决的是 codex 会不会用这个工具,以及是否具备这个能力。那 skill 呢,其实就是我们自己的工作流, 每当你完成一个任务,如果你觉得 codex 最终出来的结果是 ok 的, 那你就可以让 codex 把这个工作流总结成一个 skill, 下次遇到类似的问题,你就可以直接调用这个 skill 了。 前面给大家讲的都是比较基础的功能,接下来我们用一个案例讲一个稍微高级一点点的功能,命令行的使用,也就是 c l i, 那 c l i 的 意义就是让 codex 能够通过命令行直接操作其他的程序。这里呢,我们可以以非输的 c l i 为例, 你可以直接去复制提示词,然后在这里聊天框里面,你可以选择一个文件夹啊,就像我之前说的,我可能一般这种任务会把它放在这个文件夹, 那直接把我们刚刚复制到的 c l i 的 提示词发给 codex。 那 我们可以看到,在安装过程中其实会遇到各种各样的问题,但是 codex 一 般呢,都会自己解决,如果实在解决不了,需要权限的,他才会再来找你。 ok, 那 现在 c l i 就 已经配置好了, 装好之后呢,你就可以在 codex 里面让他去操作文件了。比如说你可以直接跟 codex 说,帮我整理一下这个文章,优化一下内容, 那它就会自己去操作啦。那这里我想说一下, c l i 呢,不只是给程序员用的那个黑框命令行,对 codex 来说, c l i 是 很多软件对外开放的一个操作按钮,当一个工具有了 c l i, codex 就 更容易替你去调用它。 c l i 也是 codex 从聊天变成执行的一个关键。 最后,如果你实在搞不懂这些名词,什么 c l i m c p 啊?因为我经常也搞不懂。那其实也有一个非常简单可行的方式,有什么问题直接问 codex。 这其实也是我经常用的方式, 就是哪里不会点哪里哪里不懂就直接问。在跟它的一轮轮的对话和操作过程中,可能你就已经搞定了这件事情了。

好的各位朋友,那今天主要是给大家介绍一下我使用 codex 首测这个项目,是一个智能选片工具的 demo, 它目前还没有部署上线,是在本地进行一个小测试,它面向的受众主要是一些摄影爱好者。 那我知道一些摄影爱好者在很长一段时间有这样的困惑,要不停的去拍了很多照片,光在选照片这个环节就耗费了很多时间,特别是还要手在键盘上敲一下去看,特别遇到有一些废片,中间可能会有一些照片出现过曝的状况,之间整个屏幕哇突然变得很白,对眼睛非常不好。 我相信有一些这样的摄影爱好者会有这样的困惑,那我这个还没有上线的智能选片工具,可能能够帮助你解决这样的问题。好,我们先来看一看他有什么样的功能。那首先他的名字就是在这里智能选片工具, 那他会有一个简单的介绍,这里有一个他的一个模式的按钮,你可以在这里选择白天黑夜的一个模式,如果你晚上就可以把它调成这个模式,我们点击选择照片,他就会弹出我们的文件文件夹,项目管理器 进行一个照片选择。如果说这是你本次拍的照片,一键全部导入, ctrl 加 a 全选导入进来,他就全部进来了,这里只有七十多张,如果你更多,他也是能够容他的下的。没关系,我们直接点击开始分析,这是第一轮的分析,我要讲一下这个逻辑。我在智能选片工具当中一共近 行了两轮的筛选,还有在第二轮之中签套了一个云端的智能选片,那如果说你懂得如何接入 api, 你 可以进行云端的智能化的进一步的选片,实际上它是有三轮的, 但是我在这里只展示两轮,因为我这个 demo 还没有完全搭建好。现在我们开始第一轮的筛选,首先导入进来之后,我们直接点这个开始分析,稍等他会全部加载完之后,我们点这个。好,他开始分析了,我们再往下滑,你就会看到他分析过后,经过第一轮筛选之后,是一个什么样的场景。 好,往下滑好,分析完了之后,我们大家可以看到他根据构图光线还有姿态、神态, 已经将这些照片进行了一个初步的一个评分,我们可以看到这个分数还有一个排名,他把七十多张照片只保留了二十四张,那么我们可以对二十四张照片进行再一轮的筛选。 好,那我们点这个,如果你后端进入 api, 它这里是直接可以 进行一段操作,进行再一轮的筛选的,那我们这里就不点了,直接往下我们进行第二轮的筛选。那第二轮的筛选跟第一轮的筛选实际上是有区别的,我们进行一个对比,在这当中我们这些照片当中会有一些构图相似的,他们进行两两的对照组进行平对,在左右两边继续 进来试一试,好点,开始对比。好,他会进行看相同构图的姿态,他会进行一个对比,让你去选择,我们这里选一个,留下左边,那你喜欢哪一个,你就可以留哪个。好, 这个可以留这样右边啊,你继续选这个,直接选过来就可以了。如果说你对两幅照片你都很满意,那你就点这里,两张都保存 这两个构图,或者说已经出现过的,你不想再选了,你就可以跳过这个。好,这样出闪下来,我们就进入最终筛选这个环节,点击选择文件夹,就会弹出我们的 管理器,我们是接新建文件夹,或者说选择你想要保存这些图片的文件夹,那我们可以看到从刚开始的七十多张,现在选下来只剩十七张,那你仍然可以从这里点击它去查看你不想要的。最后你再进行人工筛选,可能会有更精美的,更少的图片截下来。这就是我的智能选择工具 这个小 demo 这个项目的一个简单的功能。那如果说你对此感兴趣,或者说你是作为计算机专业的朋友,我希望你能在 评论区留言,我考虑如果说下一步有更好的意见,我会向他部署上线。如果可以被封装,它发布在我们的移动端的应用商城当中,那本期的内容就这些了,谢谢大家。