粉丝17获赞1439

哈喽啊翠友们,用 ai 做应用,现在一句话就能生成代码,但一旦项目变复杂,需求开始迭代,你或许会发现结果可能会偏离预期。不过,我这次用翠 solo 从零搭建了一个 ai prompt 管理平台,就没有遇到这样的问题。 因为我起用了 step 模式,它会在进入开发前,先建立清晰结构化的规范文档,然后让 ai 基于这些规范去生成代码。是的,目前翠中国版和国际版的 solo 模式下, solo code 都已经支持 step 了。 back 呢,是一种文档驱动的任务执行方式,你可以把它理解为 ai 的 项目说明书。在 tree solo 里 add solo coder, 输入斜杠,选择 back 后,就会自动生成需求大纲 spec 点 md, 任务列表 tasks 点 md, 验收清单 checklist 点 md。 ai 呢,会先理解项目,整理规划,整理确认后再开始实现。这里我知道你可能会问了, aspec 和 plan 有 什么区别呢?我们之前已经在 solo coder 里支持的 plan 呢,适用于中小型功能开发和模块结重构,就先生成一份计划文档,然后去执行。而 spec 呢,则是面向更复杂的系统级任务, 他会先生成三阶段文档组,每个阶段都支持用户确认。你看,比如这里,我们发送指令后,搜搜 code, 很 快就生成了这三阶段文档组,每个文档都需要确认后,你点击执行才能进入开发。 然后 ai 呢,会根据他拆分的任务按顺序执行,并且会实时标记已经完成了的子任务。在任务全部完成后,还会去一一 check 验收清单,让整个开发过程都更可见可控。所以,如果你的项目设计从零到一,搭建新系统、新模块, 大规模重构、多人协助开发,高质量、高稳定性要求以及需要长期维护的,你都可以试一试。 stack 模式,它会帮助你在动手之前把需求讲清楚,拆明白、备齐确认,把复杂任务的风险前置,提高一次性成功率。

属实没想到,新年第一天,中国大模型又出王炸产品,号称是另一个 deepseek 的 一款编程大模型 iquest coder 今天火爆外网, 而且出品方还是国内的基金公司,看来股票量化运算才是 ai 模型最好的训练场。这款模型的软件编程能力测试结果显示, 其 swaybench 准确率高达惊人的百分之八十一点四,超越了 cloudsonnet 四点五和 gpt 五点一。更令人惊叹的是,其模型参数仅有四十 b, 只有后两者的二十分之一,表现相当惊艳。而且它们的技术方案也是业界首创,采用了一种名为代码流训练的范式,能够从代码库的演化模式、用户的提交历史以及动态代码转换中进行强化学习,相当于它可以理解真实的软件开发流程, 而不是像其他模型一样仅仅学习了静态代码。目前该模型已经在 l m studio 可以 直接下载 q 四和 q 八的量化版本,模型体积分别为二十四 g b 和四十二 g b, 感兴趣的朋友可自行下载并进行测试。

今天要讲单词是 code c o d e code code 座名词是密码或编码的意思。 左动词是制成法典。那 code 的同根词要哪些呢?它做名词是 coding, 密码或者 coder。 编码器 code 的同类词是 password 或者 cryptograph, 都是密码的意思。 那 code 的相关短语有哪些呢?设计范围可以说 design code, 行为准则可以说 code of conduct。 举个例子, the sport has a street code of conduct。 体育运动有严格的行为准则。那么今天 code 这个单词你学会了吗? 词是 colder, colder, 它是一个名词,意思是编码器编码员。它的同根词有名词 code, 意思是代码,密码,还有名词 coding, 表示意码的意思,表示编码器编码员。我们除了用 coder, 也可以用 in colder。 那 colder 这个单词可以怎么使用呢?我们来看一个例句, your task as the colder is to ensure that nothing goes wrong, 意思是作为编码人员,你的任务就是确保不出差错。那今天的单词 colder 你学会了吗? 今天我们要讲的单词是 codex。 codex, 它是一个名词,意思是法典股抄本或者要点的意思。那它的同根词有哪些呢?比如说名词 cody fake, 意思是整理。还有动词 codify 是编钻的意思,那表示法典。我们除了用 codex, 也可以用 corpus juries 表示古钞本,也可以说 pharmacopedia, 食品法典委员会就可以用短语 codex elementarios commission for example a codex is an ancient type of book which was written by hand not printed。 意思是抄本,是一种手写而非印刷的古书。那 codex 这个单词你学会了吗? 今天我们要学习的单词是 codified。 codified 它是一个动词,意思是编转或者把什么编成法典。它是动词原形。 codified 它的过去式,还有过去分词形式,那表示边转。我们除了用 codified, 也可以用 compile 成文法就可以用短语 codified law。 那 codified 这个单词可以怎么使用呢?我们来看一个例句, he codified much on the law, 意思是她编转了大部分法律。那 codified 这个单词你学会了吗? 今天我们要学习的单词是 coating, 用作名词表示意马,而用作动词呢?是动词的 i n g 形式,表示把什么编码。它的同根词有 coacher, 编码器以及 coat。 编码是一个动词, 除了用 coding, 我们也可以用 decryption 来表示意码。编码系统可以用短语 coding system。 那我们在生活中会怎么 我遇到他呢?比如说这句话, based on the coding system, the device managing system is built。 以编码系统为基础,建立设备管理系统。那么今天这个单词 coding 你学会了吗?

啊,如果你还没有见过 web coding 是 怎么一回事的话啊,那么这个视频可能会让你感受到,为什么说 coder is dead creator instead 啊?我刚刚好遇到一个例子,我拍给大家看一下,这是一个我刚刚剪好的视频,然后我现在呢,是要给这个视频上字幕 啊,然后因为 final cut pro 是 不支持给中文视频啊,直接去生成字幕的啊,所以我就想到能不能用 web coding 直接做一个小工具来完成这个功能。 好,那我们就试一下。好,现在呢,我是已经让 cloud 帮我根据我的需求写了一个呃, prompt, 然后现在就让它开始来帮我做这个工具。好,这里它的思考时间是六分多钟,我就加速了一下。 好,他思考了这么久,终于开始写了,那他写的过程呢?一共是两分多钟。嗯,我还是加速了一下 好,他这样看起来就已经把它整个写出来了,然后最终我让他做成了一个工具,是一个 html 的 一个页面。好,这个工具就是,呃, cloud 帮我写的了,然后我把我的 音频文件上传上来试一下。好,它这边显示已经完成了,然后我们把它加载到我的视频里面,看一下在时间线里面能不能正确的加载出来,然后把它贴近我的时间线里边, 然后执行来看一下我刚开始的想法是表达及智能。什么意思呢?就是说如果一个人没有以任何的方式 来做自我表达的话,那么从外部视角来看,前面看起来是对的啊,那么这个情况在我身边的很多朋友,但是现在这种推荐机制可以让你连接到很啊我的这样的思考和感受, 我前后拉动了一下,它生成的这个字幕跟时间线完全是匹配的,所以我觉得它应该是一次就完成了我想要的这个效果。 对于这个 web coding 的 效果,我第一次见到的时候,说实话我还是有一点啊觉得惊艳的啊,因为我这个展示的场景呢,就正好就是很多 up 主他真实的在剪视频当中啊会遇到的情况。那么之前呢,非常多的 up 主啊, 他的做法是把这个音频导出来之后,用剪映去生成字幕,之后再把这个字幕转成 fanac pro, 支持再导回到 fanac pro。 而 ai 这个用 web coding 呢,它用了不到十分钟的时间,就直接给我做出来这么一个工具,而且是免费的。从上面这个非常小的小工具的例子,大家可以感受到,为什么说 coder is dead creator instead 吗? 啊,就是说如果你是把自己仅仅定位成是一个 code, 一个编码者的话啊,那么不好意思啊, ai 比你干的又好又快啊。但是如果你是一个满脑子都有各种想法,就只是缺人去帮你实现的话,那这简直是最好的时代 啊,因为 ai 相当于给每一个人都配了一个 p 七水平的程序员吧。好,今天的视频分享就到这里啊,我是巴太,这里是巴太的终身学习频道,我们未来的学习路上再见!


为什么这个在 python 里返回 false? 说些话,你本以为会是 true 吧,但 python 打印出的却是 false 等等, python 就是 连基础数学都算错了。其实并非如此, 这背后的原因很有意思,计算机存储数字的方式和人类不一样,人类用的是十进计,计算机用的是二进计。而问题的关键就在这里,有些十进计小数,比如零点一无法在二进计中被精确表示, 这就像一除以三的结果没法用实,竟计完美写出来一样。所以,当你在代码里输入零点一时,拍放实际存储的是一个近四值。 当你计算零点一加零点二时,得到的结果并不是精确的零点三,而是一个和零点三极其接近但并不相等的数。就是这微乎其微的差值,足以让这个比较硬算返回 false。 那 解决办法是什么呢?

我们尽量就不要给他更改,我们只提取这个核心的部分,最后把它封装成一个函数,封装在这里, 剩下的都是一样的, 可以看到这里都是一样。 接下来这个呢,是我觉得讲起来比较麻烦的,我们可以看到 我在引败的左边的是原始的,接下来这个我觉得是。 接下来这个我觉得是讲起来比较麻烦的,我们可以看到啊,这个 w generation, 还有这里的 w generation, 我这里参数是不一样, 我也是做了一些更改,但这里的更改呢?具体是业务上的一些更改,我基本是没动,比如这里输入参数小于四个, 我们才需要对他怎么怎么样,而我这些参数数量变了,所以这个我就删掉。 还有这里有个随机数的,其他的我都没动的,像这个对他调大小,所以这个我觉得没有必要给他删掉。 这个都是具体 you 上的,嗯,东西需要你具体懂代码,等到你遇到什么问题,具体对他怎么改就可以了,包括这个, 这个我也说一下这个 in it pa parameter, 我是对这个参数进行初始化,我为什么有这个呢?然后原始的没有,是因为 met lab 中 它比如有些漏的 lalad 加载,或者是 store 存储这些 myself coder 是无法直接对它转换 c 或者 c 加加代码的,所以我希望把它拆解出来, 但实际 上也是用到了这里。很多东西只是确实这个 low 的代码或者是 store 需要对它进行拆解。这个都是具体业务上,你遇到什么问题,你对它进行解决, 将代码修改完毕后,我们就可以对它进行转化了。我们点开 matlab code, 选择我们的核心代码,可以看到这里已经不提示说他是一个脚本,所以不能转换这个问题了, 点击下一步。这里呢,我们点击这个 w and bide, 我想跟大家说一个什么事情呢?就是,嗯, matlab 它这个函数,它不可能知道这个函数是不是对的,所以它需要我们对它输入一些数据, 然后他通过异形这些数据得出结果来判断这个函数是不是正确的。 同时它通过这个 w, eind, 我们这些参数也能得到它这些呃, 变量的类型,希望我说清楚了。 像这里我都是不检查,因为觉得没有问题,检查也可以是肯定是没错的,检查一下吧。 好,我们可以看到没有问题,我们点击 next 之后,我们就可以生成 c 或者 c 加加代码了,我们可以看到这里有 live dial ese。 哦,对了,嗯,这个 我们虽然是生成原代码 c 或者 c d i 代码,但实际上我们是脱离不了 mate lab, 比如生成这个代码 c a r 代码,它会有很多的 matlab 的例不酷文件。也就是说呢,如果你是受到某些限制,比如,比如某国不允许你使用 matlab, 比如你是个某些学校不允许你使用的话,那你也是使用不了。 然后这里我们可以看到运行在哪些平台上,包括这里工具链,我们觉得一般使用 seemic 或者是就 seemic 吧,呃,就是默认的吧。 然后呢,这个 x tract 提取水印实际是一样的,我们把这个 w x tract 里面的核心代码提取出来, 然后也是这么操作就可以了。现在我们等他成功, 好 build exercise 啊,那个说错了, build success 现在就是你怎么用 c 代码,那么你就怎么用它,是没有任何区别的。

一天一个 skills, 今天分享的是 systematic debugging。 随着 ai 能力不断强大,越来越多普通人成了 ai 编程者,通过口述要求让 ai 为自己 打造产品。不过 ai 也会犯错,有时候碰到复杂问题,他瞎猜后反复修改,非常低效,着实让人抓狂。别担心,这个 systematic debugging skill 帮你解决这个烦恼。它是专门用于解决遇到复杂故障时,通过系统化调试来解决代码问题的技能。它不是教你写代码, 而是教你如何通过逻辑围猎故障。它基于科学实验法,简单来说就是通过观察现状、提出假设、预测结果、 验证、修复这样一个闭环流程,不断缩小故障范围,直到定位并解决问题。没有它, ai 解决问题纯靠经验。 有了它, ai 能让你在有限的时间内通过排除法逼近真相,而不是碰运气。它依靠提出假设控制变量的核心逻辑,每次只改变其中一个因素,像解剖手术一样拆解系统。如果你想从试错型选手变成 ai 编程高手,让 ai 为自己打造工具,一定要去装上这个 skill 试试。

一提到 ai 写代码啊,大家脑子里可能马上就蹦出什么网站呐,手机 app 之类的。不过呢,今天咱们要聊的可有点不一样, 我们要看一个专门为我们这个物理世界设计技术的 ai, 你 没听错,它要构建的不是下一个 app, 而是下一个未来。到底怎么回事呢?咱们一起来看看。 好,咱们先来聊聊一个概念叫代码的工业前沿。首先啊,你得知道,代码这个东西可不是只是用来做网站和 app 的, 在那个世界之外,还有一个更广阔的天地, 在这个天地里,代码它可是在实打实的设计和构建我们身边的物理世界。 那这到底是什么样的代码呢?你看,这可不是你手机里那些普普通通的 app, 咱们说的是那种用来设计电脑芯片,创建复杂三维模型,还有控制精密工业机械的代码。 像图里展示的这样,这些工程任务的复杂程度说真的远远超过了我们平时接触的那些软件。 这就演出了一个特别有意思的问题了,对吧?要是我们把现在这些功能超长的通用 ai 拿来干这个活,呃,就是让他们来试试构建我们的物理世界,你才会发生什么呢?答案可能跟你想的不太一样, 事实证明,这些 ai 有 一个巨大的硬件盲点。嗯,这也就是问题的核心了,即使是现在最顶尖的通用 ai, 一 旦碰到工业代码这种特殊的需求,他们常常就视手无策了, 可以说他们对硬件是视而不见的。为了更好地理解这个盲点,咱们可以打个比方, 通用的 ai 就 好比是全科医生,他们很厉害,能解决百分之九十的常见病。但是如果要做一个特别复杂、风险又高的手术,比如脑部手术,你肯定不会找全科医生,对吧?你得找一个专科的外科医生, 咱们今天说的就是这个区别。这儿就有一个非常具体的例子,能把这个硬件盲点说的明明白白。 你看左边一个通用的 ai, 比如 cloud, 在 处理一个 gpu 任务的时候,因为它根本不理解硬件的物理限制,写的代码直接就让系统崩溃了,这是个致命的失误。再来看右边这个专门的模型就不一样了,因为它懂硬件的边界在哪, 所以它就能够成功地优化和执行任务,把性能发挥到极致,同时还不会出问题。 所以总结一下关键点其实很简单,这些通用的 ai 为什么会失败呢?就是因为他们不理解硬件的极限,搞不懂那些高度现代化的编程语言,也处理不了这个领域里常见的那种非常严格的资源限制。 那么为了解决这个硬件盲点的问题,一个专门的解决方案就因运而生了。没错,他就是我们今天的主角。来认识一下这位工业代码专家, encoder 三十二 b。 那 encoder 三十二 b 到底是个啥呢?简单来说啊,他是有史以来第一个专门为工业代码智能打造的大型语言模型。 它的特别之处就在于,它把好几个以前完全不搭界的领域,像是芯片设计、 gpu 优化,还有三 d 建模,全都给统一起来了。 这张图就特别直观地展示了 encoder 三十二 b 的 能力范围有多广?你看,从左边的通用软件开发,一直到右边这些高度智能化的工业编程任务,比如说芯片设计啊, gpu 核心优化呀,它全都能搞定。 好问题来了,这么一个数字专家到底是怎么炼成的呢?咱们现在就来深入了解一下他与众不同的训练方法,也就是他的独家秘方。 他的训练过程呢,分成了三个关键阶段。首先是预训练,就是用精挑细选的工业代码给模型打一个特别扎实的基础。然后是一个很独特的中训阶段,在这个阶段,他们用合成出来的数据来教模型怎么去思考, 还把它的记忆窗口,也就是上下文扩展到了惊人的一百二十八 k。 最后也是最关键的一步叫后训练,它们会让模型在磨砺环境里实际运行代码,然后根据运行是成功还是失败来对模型进行微调。 简单说就是让他从实践中学习。这张详细的流程图,就把我们刚才说的那三个阶段怎么衔接起来给展示清楚了。你看啊,从左边的预训练开始,到中间的中训和数据扩展, 再到右边基于模拟器反馈的后训练,整个流程形成了一个闭环,这就保证了模型不光是会写代码,更重要的是能写出能用好用的代码。 训练过程里还有一个特别有意思的地方,就是它是在非常逼真的数字模拟器里学习的, 就好比飞行员开飞机前要在模拟器里练习一样。比如它用 r、 t l 模拟器来验证芯片设计,你可以把这个想象成一个芯片设计的虚拟实验场, 它还会在真正的英伟达 a 一 百硬件上跑 gpu 代码,这感觉就好像让一个 ai 工程师在真实世界的工作环境里实习一样。 好了,我们已经了解它是怎么被训练出来的了,现在就到了见证真功夫的时候了,咱们来看看证据,它的实际表现到底怎么样。 这张图表的结果可以说是一目了然了,绿色的柱子代表的就是 encoder 三十二 b, 你看在像三 d 建模,也就是 cad code 这样的关键工业任务上,它的得分把其他我们熟悉的模型远远甩在了后面。 我们再来深入看看芯片设计这块的具体数据。这张表格啊,其实讲了一个挺有意思的故事, 你可能第一眼会看到,在 variescope 这个测试上, cloud 模型的分数好像更高一点,但是请注意,在更接近实际生产环境的 rio bench 测试里, encoder 三十二 b 是 以七十四点八的高分胜出的,这就恰恰证明了在解决实际的工业问题上,他才是真正的专家。 所以最后研究论文给出了一个非常非常有力的结论,我直接引用原文, encoder 三十二 b 在 所有评估的领域中都取得了最强的开源模型结果。 各位啊,在现在 ai 模型竞争这么激烈的环境下,这句话的分量有多重,相信不用我多说了吧? 好,咱们现在把视线拉远一点儿,从一个更大的角度来看看,像这样的技术突破,对于整个技术和工程领域的未来到底意味着什么呢? 你看这个可爱的机器人形象,我觉得它特别好的代表了这类新型的专业 a a, 它们正在走出纯粹的软件世界,开始真正地帮助我们去设计和构建我们身边的这个物理世界。 这就给我们留下了一个非常值得思考的问题,如果今天的人工智能已经可以设计计算机芯片了,那么明天它又将会为我们建造出什么样的新东西呢?

人工智能正在所见,一个新技能不是写软件,而是涉及硬件。咱们都知道,现在 ai 写软件已经非常厉害了, 但 ai 能涉及芯片吗?这可就是工业级的挑战了。在这,即使是最强的通用 ai 也开始碰壁了。你看,这两者完全是两码事,规则和限制都不同,工业代码呢,就得考虑芯片设计、硬件的物理限制这些了。 这一张图就很好地说明了问题,通用 ai, 它不懂硬件的物理极限。所以为了解决这个问题,一个全新的 ai 从零开始被打造了出来, 它就是 encoder, sorry to be。 它的成功关键在于全新的训练方法,它是第一个专门为了整合这些复杂工业领域而设计的模型。 那它到底是怎么训练的呢?这个流程就很有意思了,它不光是学代码,更重要的是学这些代码在模拟环境里怎么跑?对,关键就在这儿,代码对不对得在虚拟的工界环境里说了算。 结果呢,我们得到了一个不只懂代码,更懂硬件的模型。那咱们就来看看性能对比。在芯片设计这块, encoder 32b 立了一个新标杆, 这是他在 realbench 上的得分,一个生产级的行业基准,在各种工业基准测试里,他的表现都超过了其他主流模型。所以,这不只是代码写得更好那么简单,它意味着 ai 能设计我们的物理世界了, 我们离那种能设计和优化自己硬件的 ai 又近了一步。就连他的创造者都说,这是第一个专门为工业代码智能打造的模型。这就留下一个很有意思的问题, 当 ai 能同时设计软硬件,未来会是什么样呢?

如果你是一个独立开发者或者 vlog 者,现在正在考虑接下来做什么产品的话,我推荐你一定要去看一下 google lab。 google lab 现在已经推出了四十六个实验性工具了,并且我觉得他们每一个都有潜力干掉一大批市面上已有或者即将出现的产品了。 这些实验性工具覆盖的领域非常广,包括舞蹈、时尚、生产力设计、音乐、影视、教具、职业发展等等, 你能想到的它们都在做。那么看过这四十六个工具以后呢?我想跟大家分享四个我觉得还蛮有意思的产品,并且它们对标的是什么产品?第一个, disco, 它是一个可以帮你打造个性化 up 的 一个产品。 假如说你准备出去旅行了,现在你想做一个计划,那你可以跟 disco 说明你的需求。 disco 会通过你的需求来做一个小工具,来帮你安排整个旅程, 或者是你现在想买东西。假如说你要买一辆车,你想做各方面的对比或者是研究,那 disco 可以 帮你做一个软件,专门就帮你做不同车的对比,包括你最在乎的哪些方面,甚至它可以帮你自动地抓取一些 信息。其实现在大部分的大众 app, 它都是做一次给所有人用,但是每个用户的需求多多少少可能会有一点不一样,所以还是有很多用户需求是没有被满足的。但是 disco 这个应用可以把它做到每一个 app 都只为一个人打造,所以它完完整整贴合你的需求,所以我非常看好 disco 这个产品。 第二个, mixboard, 它有点类似于 figma, 用语言来形容你想要设计或者做什么东西,然后一个 prompt, 它就帮你生成一整 面墙的不同的画面。在这个基础上你可以去修改某一些图像,或者是你说你觉得这个风格很好,你帮我生成几个类似风格的图 像,它就可以在设计方面这样大大的提升效率。我觉得它对标的应该就是类似于 figma 这样的产品。那同时假如说 canvas 或者是 pinterest 这些大家去找灵感的地方,也可能被它代替。 那第三个 doppo, 它是一个网购试衣服的视觉产品,可以在网上帮你上身试任何造型和衣服。那其实平时我上网也会看到很多 vipod 在 做类似换衣服 或者试衣服这样的产品。我觉得 doppo 进入这个市场可能是会一个比较强的竞争对手,所以我个人可能会避免往这个市场发展。那第四个是 oppo, 它做的是一种 angelic workflow, 对 标的类似于 n 八 n 这样的产品, 但是它又有一个绝对优势,就是 gemini。 在 谷歌的环境中,又有 google speed, 又有其他的 gemini 产品可以一起用,可能会比 n 八 n 的 不同的 note 来的更自然更好一些。那同时被干掉呢?可能也是那些 robotic process automation 或者是 r p a 公司,因为我觉得谷歌它跟很多大企业已经有非常好的合 错了,那这种情况下,他如果想打入公司做企业级别的 egotistical, 肯定还是有绝对优势的。除此之外,还有三个领域是他们有好几个产品都在类似的市场中的,比如学习方面,有 learn your way, little language, lessons 和 learn about 这些学习类的产品也是超级个性化的,以你的学习方式为主,看你平常都喜欢如何吸收信息和理解内容,把学习这件事情变得更无痛和更有趣。 那特别是 little language, lesson 这个,我觉得它可能会对标 doolingo 这样的产品,还有音乐方面,有 music ai, sandbox, 还有 music effects, 我 觉得它们两个可能会对标类似于 suno, ai 这样的产品。最后呢,还有视频方向,有 google vids, video effects, sparkify and flow。 单独是视频生成方向,它就已经有四个产品了,可见谷歌对这个市场的重视性, 帮你做到从最小最简单的这种自媒体短视频,也可以做成电影级的那种非常高质量的画面。那么讲了这么多,其实我的感悟就是,谷歌在进军的这些行业和做的产品,对我们独立开发者或者是 solo rapper 来说,大部分情况下来应该是比较难跟它竞争的,所以我可能会主动地去避 避开这些赛道。当然,你觉得如果你在这个赛道中有一些自己独特的想法,或者是在产品上会有很强的特殊性,但你依然可以进军这个行业。最起码谷歌的加入已经帮你验证了这个市场应该是有价值的。不过 lg 有 些产品现在是可以用的,有些还在测试阶段中,之后还会有什么新产品来到市面上呢?我们一起拭目以待。