今天磊叔教你一个极简蒸馏法,关注,收藏,点赞,别走散了。上条视频很多人都在问怎么去蒸馏,没问题,今天教你一个三步极简蒸馏法,可以把任何人变成 token 存在你的电脑。第一步,复制我的这段提示词到任何一个大模型,然后附上 这个人的所有资料,什么 pdf, 聊天记录, ppt, word 什么都行。传上去之后,稍等片刻,他就会蒸馏出这个人的克隆体。 这里呢,我就是蒸馏了卡兹克卡神能够看到他把卡兹克的性格特点、说话的风格,潜意识里的逻辑都蒸馏出来了,而且你会发现他会用非常卡兹克的语气来跟我去交流。你学会了吗?想要提的词,评论区找我。
粉丝7906获赞4.4万

hello, 大家好,这里是无聊的研磨啊,最近 scale 蒸馏这个话题在网上讨论热度也是非常高,然后最近我在逛 get up 的 时候,也发现了一个新出的基于 python 的 一个非常有趣的一个开源项目,叫 your scale, 就 自己蒸馏自己嘛, 添加你的聊天记录,日记,再加上你对自己的描述,就可以创造出你自己的一个数字分身出来啊,也算是一种赛博永生了。 那么有趣的一个项目,我在网上看了看,好像并没有一个特别详细的教程,那我们今天就不谈原理,只谈过程,来教你们如何创建一个属于自己的数字分身。 我们首先呢确保自己有一个可以科学上网的工具,然后打开 g hub, 直接搜 v flo, 点进去之后打开这个链接,他就会直接跳转到下载界面,直接下载就可以了。 后面就是三个运行工具,首先是 python, python 他 三点九以上的版本都可以啊,直接点击下载就可以了, 这个和 note gs 也是同理,直接点击安装程序,跟着他一步走,全部默认选项就可以。安装完成之后呢,我们回到桌面,然后打开搜索框,搜索 power share, 这个第一个就是点开它,然后我们直接把这个代码复制粘贴进去,这是安装 cloud cloud 的 终端,这样就是安装好了,我们怎么检测呢?我们在这个输入框输入 cloud 启动程序,可以跳出来这个界面,我们选 yes。 好,现在他就是已经进入了,成功进来之后呢,他这边会显示没有登录啊,这个我们登录一下就好,写一个 ok。 然后可以看到有三种登录方式,第一种是通过官网登录,它有 cloud pro 和 max 两种方案,一个是二十美元一个月,一个是一百美元一个月,然后第二个是通过 api k 登录,第三个就是第三方登录,这个这边我们推荐 选第一个,然后它会自动跳转到浏览器,好来到这个界面。因为我已经提前订阅过它的 pro 套餐啊,所以我可以在直接在这边授权你如果 没有订阅它的 pro 套餐的话,你是不能在本地使用可 out 的 模型的。这个月租套餐也非常简单啊,如果没有国际支付的银行卡的话,可以在淘宝或者闲鱼上找人帮你代购一下。我们这边直接选择授权,然后等待一会 好出现这个界面,你就可以把浏览器关掉了。那这边显示已登录成功,我们点击 enter。 好,先来测试一下,比如说你打个你好, 好像他这样能正常回复你的话,就是已经部署成功了,那我们不需要自己去手动的去安装这个 scale 项目,还有这个 lie 啊,就我们直接看它这个网 址,复制一下,直接 delete 这个 cloud, 然后只要它就会自己帮我们去自动的去安装,就不需要我们去操心了。那像这边它问你是否允许,直接选 yes 就 可以了。 好的,它现在已经安装成功了,它让我们显示这边要启动这个 yourself, 我 们给它复制一下 输入进去。好,那现在就已经正式进入蒸馏环节了,他会不会先问你三个问题,代号随便起,比如说小明。 好的,基本信息,呃,年龄,二十五,工程师,北京这边做个演示啊, 好自我画像,比如说 e n t p 天蝎 射孔, 如果你不知道怎么描述自己的话,你也可以随便再找个 ai 跟他聊聊天,然后让他把你的性格总结下来,总结成几句话,再丢给这个 cloud, 让他去整理这个基础信息。已经录入成功了,接下来就是提供原材料。我推荐的是用这个微信聊天记录导出啊。 呃,你提你提供的这个微信聊天记录越多,他模仿时,他模仿你时的语气就跟你越像。我们需要用到这个微 flow 这个软件,我们打开它。 好的,我们选择导出,能看到大量的这个信息,对吧?比如说我们选一两个人的,选中批量导出,然后我们一定要记得把这边格式改成这个格式啊, 要时间范围给他选择全部时间。好,我们先直接创建导出任务, 导出的过程会有点卡,因为它信息量比较大,我们打开目录, 这个 test 文件文件夹就是你的聊天记录,我们把它放到桌面,或者你放到别的盘也可以,只要能找得到。啊, 好,他现在让我们提供这个文件路径啊,我们不是提前把他拖到桌面上了吗?我们直接再把他直接拖到这个聊天框,他就会自动粘贴上去,直接按 enter 发送给他,他就会自动开始分析, 等它解析完成呢,你的一个数字分身也就制作好了。那这就是 your scale 简化版的一个安装流程啊,那本期视频就到这里,喜欢的可以点个关注,谢谢大家。

然后税后接近一百。嗯,很厉害的很厉害的。好,呃,你看你还有什么想讲的呃,没什么想讲的吧。好好感谢感谢生活好感谢啊,生活愉快。好,拜拜。嗯,厉害。这是这是真有东西那这是真有东西。你看还得是苏黎世联邦理工。 哎,你不服不行啊,还得是卡耐基梅隆,你看刚才一个是全球排名第一的计算机,一个是全球排名应该是前五的计算机, 但就是不一样,你不服不行,你看上来之后整个连麦的这个逻辑顺畅程度,表达内容的这个清晰程度,那不是说所谓的普通高校能比你的? 哎,知道吧,以后我招人也是这样的标准。哎,你是 qs 前十哎,知道吧。哎,你孩子也是含金量这是 对吧。就不多说啊。格鲁什科夫张总说站在巨人肩膀上要感谢张总感谢张总啊,帅气宝宝总说啊,切尔 gbt 负责被蒸馏感谢帅气宝宝总。幽默了幽默了。 呃,米总说拉我,我再给你简单的说透。好的,马上啊马上马上啊。不着急啊不着急,马上啊,下一个啊,来,再连一个啊,来 qs 排名前十的给我申请上麦啊。 呃,不到前十的先不要上麦。好吧,因为咱们就是说直播间人多哎 qs 不 到前十的就,哎,感谢我爷是快乐再次感谢我快乐总又性情了,这又是随随便便又是甩出 这个两个超跑哎呀,再次感谢再次感谢啊。来,接着连啊来接着连啊,来,不着急啊不着急。嗯,来,我看下一个连。谁啊这个是谁 来,你你你是你是哪个?哎。啊,你是卡纳基梅龙那个吗?啊对对对,是我。你怎么又又上来干嘛? 我觉得还能补充一点,就是说,呃,关于蒸馏这个事情目前在这边是有争议的,就是因为虽然说公开一下自己的协议里面说禁止其他的人商用化的蒸馏自己的模型, 但是 openai 本身就是说去使用互联网上的数据,已经被很多不同的团体和人给起诉了,很多人认为他这种行为本身也是侵犯他们的知识产权,所以说很多人在指责说 openai 你 一方面去侵犯其他人的知识产权来训练自己的模型, 然后另一方面,呃又禁止其他的 ai 公司用你的模型来训练自己的模型,所以说认为就是 openai 在 这方面有一些呃, 双重标准的问题。嗯,对,这个我就是想补充一点,但是蒸馏的确是一个很就是中中性的词,然后一个一个很久的一个技术了啊,只不过现在就是说这方面是有争议的,就并不能说谁对谁错,因为现在 目前来说没有。对,就是说 ai 训练数据是否侵犯知识产权这个问题有一个法律的定义啊,然后还有普通一点,嗯,还有普通一点,就我,你等一下我,我插插一嘴,你说这个我是认同的,我非常认同, 这我超级认同,就是你 open ai 去提取全互联网的数据训练自己啊啊,然后呢?你 当然他可以禁止别人蒸馏自己没问题,但是说实话就这个事情他就是一个轮流问题了,就你一边,你去提取全互联网的数据,你不在乎别人的版权啊一一方面呢?然后呢?别人也不在乎你版权的时候你又在意,你又在意版权了。 对,所以说你说这问题我是认同的,我刚才没连麦的时候我都讲了这个问题啊,与其这样大家都互相蒸馏吧,我觉得挺好的。哎 就就就就干脆互相争流得了。嗯,好,你就接着说我就然后我就只是想补充一下我们学校食堂确实很辣确实很辣。嗯,我就没好好感谢感谢。好的好,拜拜。嗯, 下一个啊,来。呃全世界排名前十的大学申请上麦啊全世界排名前十的大学申请上麦。好吧。哎或者说计算机类全世界排名前十的申请上麦啊 啊这个如果说你在学校计算机类全世界排名嗯五十之后的,那就不要申请上麦了。好吧,因为这个咱们时间有限。哎就是说你学校这个确实啊不到位对吧,你那个就就就就别上麦了好吧,来下一个啊下一个我看连谁啊。不着急啊 不着急啊来我看下一个还有没有啊。哎来申请啊,来本直播间硕博啊,什么软件工程学 ai 的 硕博哥申请上麦啊咱们今天把这个事聊透既然大家这么感兴趣咱们就把这事聊透啊。一定要聊透,不聊透都不行必须聊透。 哎,刚才我好像看到一个叫什么瑞士的是瑞士的吧啊不着急啊。嗯,这个 说不讲话是吧。来,呃,格鲁森克夫张总说蒸馏户啊, 让户写下来他的答案哦是这样啊感谢格鲁森克夫张总啊感谢张总。张总这个就说透了啊蒸馏蒸馏护尘风 啊。把别人问我的问题整理一下让胡成峰写一下他的答案啊感谢张总啊感谢。哎呀有好几个舰长啊感谢老于哥于哥总的两个舰长感谢我于哥总两个舰长啊。十分感谢啊十分感谢啊。好,来接着连啊接着连。嗯 好。这个吧这个啊 说 哎呀怎么了本直播间 qs 前十的没了吗。啊不是这个叫什么?就这个 来 y 你 说话。呃一定要。我不知道学校是不是 qs 前十啊。你大概判断一下哪个学校学校的名称叫什么。密歇根安娜宝什么密歇根安娜宝密歇根安娜宝不是前十的但是你你讲吧你现在是什么学历。 研究生研究生来不要戴耳机把你耳机扔掉。没有耳机。什么手机?苹果怎么这么闷呢。手机是不是修过 手机不知道浸过水没有。没有那那就不知道了来讲吧。那你就讲吧。来你研究方向研究方向你们在聊什么? 我们在聊 ai 你 的研究方向是什么?哦那我不是啊,我是搞软件开发的呀。我也学不懂啊。那你现在什什么学历大几研究生研一。我马上。我山西有一个亚马逊的面试。嗯亚马逊的面试挺厉害的来你对 ai 就是 蒸馏这个技术怎么看? 我觉得 deepsea 的 我很觉得我很好用啊非常好用啊。嗯嗯好。嗯他他的给我的结果比蔡经理好很多,尤其是我写一些算法上的东西。嗯好的。行你你在哪个城市?安大宝安大宝是吧。啊好的,还有什么想讲的 还有就是我觉得你不要看 qs 啊觉得就是我们从美本美本出来留学生出来我觉得国内一本的能力比对 美本有美本的排名美本有美本的排名。好吧我看美本排名。我不是说我不是说 ys 跟 qs 哎好好再愉快啊前程似锦来再读 sc 啊青蛙王子总说竟然能学到顶尖的啊蒸馏模拟生成过程呀感谢青蛙王子总啊感谢青蛙王子感谢啊感谢。来下一个啊下一个 来下一个啊。不着急这个来学校学历学校学历麦太吵了。说话 你麦这么吵你就别申请上麦了吗对不对。你还申请上什么麦啊来下一个啊没了吗啊没了这来学什么的 喂说学什么感谢人间深情总的精髓啊计算物理记忆学习方向记记呃学校呃武汉某九八五学历 博士哎又是博士直播间含我直播间含这个这个博士含量啊。这个应该是简中互联网最高的。来打个假。呃你你们学校主楼这个主呃在哪坐地铁哪站能到。我靠地铁 地铁我还真不清楚因为我不怎么坐地铁啊。那你真牛。我这我准备挂机了我已经准备挂你了。我我太假了。这真不骗这给你闹啥太假了哎我们在街道口我们在街道口。来来再来一个再来一个再来。你们需要在哪条路 在洛家山吗。洛家山洛哪条路。八一路 下一个下一个啊 来读读个 sc 啊语说完了于总说计算机看 cs ranking 更合适吧。感谢于总啊感谢于总感谢啊。嗯好下一个啊下一个啊好 不着急啊不着急。嗯这个来请讲新加坡国立硕士新加坡国立硕士来。呃研究方向研究方向纯算一体。什么纯算一体啊什么什么一体 纯算一体纯算一体。不是我可能听不懂你的中文什么叫纯算一体。 就是内存和计算啊放在一起叫行在一起。好来。呃新加坡国立大学他的这个地地标是什么? 呃 central library 你 可以搜。哎对没错,来我再问你新加坡国立大学有个牌子就是就是优什么优套哎对他前面是个什么 什么前面是个什么就是大家喜欢在那打卡吗在那拍照吗。有一个那个你看我是个草坪啊。啊对说对了。嗯没问题来讲吧。好没啥讲。你搁这玩我呢 直播间四千六百个人你搁这玩我呢 来说这个叫毕业日记说话毕业日记说哎麦哎这个毕业日记你麦太吵了啊麦太吵了麦太吵了啊麦太吵了。 来你不要再重复刚才你最后说的那句话了啊哎我就来停停停停停。好我就我就算你是武汉的毛九八五的博士我就算你是研究方向啊我我跟你说呢计算计算式函数嗯计算式函数计算一式函数。 哎学过。呃本科。本科是学什么的?学牛顿学物理的学物理的学物理。我这是怎么打讲吗来这个你这个牛顿三定律是什么 不知道牛顿第一定律牛顿第二定律。牛顿第三定律吗那三定律是什么那具体是什么。牛顿第三定律牛顿第三定律。我靠牛顿第三定律我现在有点忘了热力学第一公式是什么。 假的纯假纯假你还自己挂吧。纯假 我这问的我说实话我我我也只能问牛顿第三定律是什么了。你再高深我问不出来了因为我学历有限。你这纯假物理学博士这都不知道? 哥们这不是化学的吗?纯甲,你纯甲,来,我再问你一个, e 括什么?呃, e 括什么? e 等于什么?这个公式 哪有这公式啊,就是爱因斯坦最爱因斯坦最著名的这公式。 e 等于什么? 再见吧,纯假的纯假再见啊,前程似锦,生活愉快。纯假的啊,来我直播间搁这装啊。我格力低是吧,多多少少懂那么一点点,能给你打个假, 你连爱因斯坦最著名的那个公式都不知道是什么。你啊你可能你本科都没上过 e equal mc square 啊,知道吧啊 e 一 括 mc square 非常著名啊,知道吧,你连这都不知道。你找个地方哪凉快哪待着去吧啊,哪凉快哪待着去。 下一个啊下一个来。 qs 排名前十的现在给我申请上麦来。都别搁底下猫着了,快点。 qs 排名前十的现在给我申请上麦。 来,我先把连麦关了啊我先把连麦关了。嗯,来。哎,搁这啊,我我九八五的啊,我武汉大学的我华中科技大学的啊。 e 等于什么?不知道 下一个呀。感谢我爷是快乐我快乐总的璀璨烟花感谢快乐总感谢哎呀,来,接着连啊,今天咱们必须把这个什么 来学历学校学历学校说话,雾里看花说话。 qs 排名二十多可以吗?来,可以,我放宽门槛啊,现在本直播间放宽门槛, qs 排名前五十的可以申请上麦啊,我不要求前十了,来 qs 排名前五十的都可以。哎,我放我我放宽门槛来听讲乖,虎哥可以听到来学历学校 啊,瑞典乌普萨拉大学啊。瑞典什么瑞典什么乌普萨拉大学 ks 多少啊? ks 一 百零三啊,一百零三。 哎,行吧,让你讲讲吧,是研究方向啊,计算机科学。那计算机科学,呃,瑞典,你搁那上课讲什么讲什么语 啊?英语啊,我,我们是英啊,英文授课的。 c s 的 英文全称是什么? computer science 啊,没错,这个是的 ai。 英语全称是什么? artificial intelligence 啊,没问题,验证成功好说吧。 啊,就是啊,我想说一下啊,我赞同前面刚刚几个啊,前面的他们说的关于知识正流的一切,嗯,然后啊啊, 我想说的是我感觉啊,胡哥您想表达的意思就是啊,公开爱他做的是原创性的工作,所以的话啊,从我的角度来看的话啊, 任何原创性的东西都是要被值得啊尊重的,像 deepsea 他 现在所做的工作呢? 嗯,不应该被不应该被这样宣传。我我感觉有点宣传过度了,就是从我的理解上有点宣传过度。再见,你这还是 qs, qs 排名一百多还是不行,老弟没有恶意啊,这上麦没有内容在讲什么。 我说实话啊,真不是说咱们学历歧视啊,都比我优秀,我高中毕业这 qs 排名一百多的还真是不行,你们跟你跟苏黎世联邦理工没法比,跟那个卡耐基梅隆真没法比。真的,你看上麦说不出个所以然对不对嘛, 是不是你这是?哎呀,这是真不,一百多是真不行, qs 排名一百多这是真不行,这这对比太明显了对不对?不是说老弟瞧不起谁啊,都比我优秀,这对比太明显了, 下一个啊下一个。嗯,读一下是 c 啊。呃,这个叫石,石总说今晚人真多,人均硕士护子继续找。好的,感谢石总。也是快乐快乐总说护子考的问题我高中学历都会护子下一点难度啊。好的,快乐总。小护收到啊。 好,又有个见长啊感谢我折耳四肢感谢我折总的见长感谢我折总啊感谢折总。下一个啊下一个。嗯哎,我看下一个连谁啊。来来这 来学校学历浙江大学硕士。好,嗯,可以来浙大。哪个校区? 紫金港来。呃,浙大你去哪个食堂吃饭?我们的一楼的食堂。我之前在西校区后面合并了,我毕业两年了。呃,坐地铁到浙大到哪个站? 紫金港有紫金港站的。嗯,紫金港站来。呃,行,研究方向是什么?研究方向吗?嗯,对,化学。你研究化学?我们聊 ai 呢,你研究化学上来干嘛?哦,我刚刚听到这个。说什么?我没听到。不好意思, 我就说听到。好,你既然上来了我也不让你白上来。来,你是?你本科是哪?哪个学校的? 什么本本科?那个学校的本科也是浙江的。那很厉害了,那你现在做什么工作?毕业两年了。跑外卖。你能不搁这扯吗?你纯搁这扯犊子呢。 你现在干什么你你有这大化学硕士毕业现在干什么来,先打个假先打假先打假。请问化学热力学第一公式是什么? 什么又是个假的?不是你。你真敢啊,上麦就敢说自己事这大的。又是个假的又是个假的又是个假的。 你这下次学化学上麦先背元素周期表啊先先背元素周期表又是个假的。 好,感谢我青蛙总的见长感谢青蛙总啊感谢我青蛙总啊。来读个四 c 啊读个四 c。 呃,约定总说今天把户子蒸馏了。哈哈,幽默了。约定总感谢幽默感谢约定总啊,幽默了。又是个假的。哎呀,来,下一个啊下一个。嗯 哎啊,我这个连麦里面有有个人说自己是山姆奥特曼,可以申请上线吗?哎,你给我歇歇吧。你你,山姆奥特曼,你 你还山姆奥特曼,你,你真敢呐,这怎么,你怎么不说你,你对吧,你是马斯克呢?你还山姆奥特曼,你来,下一个啊下一个。这个 来。学校学历哎胡总胡总学校学历?不要废话, 我不写了吗? top 二国内 top 二本数哎,胡总,我之前给你上过剑的 哎。别别别别别,我知道感谢你像舰长。首先很感谢咱们,但是现在在聊话题来。呃,你是 top one 我 就清北了,就直说吧。清北研究方向, ai。 呃,专业名称?

如果告诉你有一种技术可以花学霸百分之三十的成本就拿到学霸百分之九十的分数,你想不想学一下?那我们今天就来一聊 ai 大 模型领域里边最热门的一种偷师的技术, 叫做蒸馏,我保证这里边涉及到技术原理的部分,连我奶奶都能够听得懂,但是听懂了这部分的内容呢,对于每一个人的学习都有用,那我们现在开始啊, 蒸馏这种技术呢,是现在大家都熟悉的 ai 三巨头里边的那个 hinton 提出来的。 hinton 老师的故事在我以前的那个视频里边,其实我就跟大家说过,出生于科学世家啊,他们这个科学世家厉害到什么程度呢? hinton 的 老爸是这么评价他的, 说,以你的聪明程度,只要花我两倍的努力,然后在我现在两倍的 岁数的时候,就能够达到我现在一半的成就了。问那 hinton 的 老爸的成就是 hinton 的 多少倍? hinton 老师在提出来蒸六这个技术的时候,他就指出,哎,有没有一种办法能够让训练大模型不那么费钱,能够让一个小模型以相对低的成本 和代价就能够学会老师的大部分的知识呢?所以呢,他就提出了这种技术背后的原理并不复杂,主要就是通过让 那个大模型的老师模型去教那个小模型的学生模型,最终让学生模型学会老师模型的大部分的知识。同时呢,小模型可以以更低的成本,更短的时间和更少的 代价去训练出来,这个就是蒸馏技术后面本身的想要解决的问题,那他是怎么做到的呢?关键在于这个老师模型需要把老师学到的知识里边 的那部分暗知识表达出来给学生。对于一个大模型来说,他所学习到的知识其实是一个 超级高维度的特征向量,这个特征向量在数学里边表达为神经网络的权重,权重的定义在之前的内容里边我也讲过了,大家可以自己去翻当啊。老师他对于这个世界的理解都体现为一个非常复杂的特征向量的时候, 这个时候老师去教学生,他就可以以不同的方式来教。这个方式呢?在呃,大模型领域里边有一个参数叫做 temperature, 叫做温度,当这个老师的教学生的温度比较低的时候,就意味着他比较保守, 当温度比较高的时候,就意味着这个老师比较活跃。哎,比较浪一点,可能举的例子会比较多一点。当老师模型再把温度调高的时候, 那老师就可以把对于这个世界的客观规律等那部分暗知识充分的展示给学生。当学生能够学会这个世界的暗知识的时候,学生就能够以更低的成本,更快的方式来理解 这个世界的规律,最终实现小模型在更短的时间里学到老师的更多知识的一个效果,而且他的表现不会大幅降低。那有了蒸馏这种技术了以后,大模型就不用再部署到那么几千台 gpu 的 机房里,而可能 他就能够很轻易的在未来走进你的手机里。这个就是蒸馏技术在大模型领域里的一个应用方式,但是实际上这个技术在我看来,他对于我们普通人的学习其实更有启发,关键就在于 我们每一个人或许在这个世界上都是学生,我们可能也有比较旺盛的求知欲,想要去了解更多的东西啊,我们怎么样去向我们的老师去学习?这个其实是与我们每个人都有关的。那其实刚才我已经说到了诀窍, 关键就在于我们要去学习到老师的那个认知体系当中的那部分暗知识,当你能够理解这一点的时候,其实你的学习就可以加速。那什么是这个世界的暗知识呢?我可能只能跟你举一个例子,是当年释迦牟尼佛像家业传法的故事,当佛祖像 弟子们传法以后,他看向一众弟子,其中只有一个人就是家业,就是现在的禅宗初祖,微笑的看向释迦牟尼佛,然后释迦牟尼佛就明白了,哎,禅宗初祖听懂了,从此家业 祖师就成为了禅宗的初祖。这个和暗知识有什么样的关系呢?我想说的是啊,这个世界的规律,他未必 都藏在语言当中,所以作为学生的我们,实际上可以向人学习,也可以向大自然学习。重要的不是我们向谁学,而是我们能够通过现象看到了 本质,看到了道的多少。这个其实是对我们每一个人的学习真正重要的事情。那今天我们聊完怎么样向聪明的人的学习真正重要的事情。那今天我们聊完怎么样向聪明的人的知识的话题。 你想不想知道,如果你是一个老师,你应该怎么样更好的去教会自己的学生呢?如果你对这个话题感兴趣,我们下一期可以聊一聊。

来,我们先看一下这段视频,如果你发现你的公司在用 skill 的 方式蒸馏你,我发明了一个反蒸馏 skill, 你 可以把你做好的 skill, 拿这个工具跑一遍之后,你就可以交差了。不过这个 skill 的 启发呢,是最近很火的同事 skill。 这个同事 skill 呢,就是可以把你的同事这个创作者他做了一个反蒸馏的 skin, 它为什么要做一个反竞争 skin 呢?是因为在前两天的时候, get up 上面出现了一款同事 skin, 也就是把你现在身边的这些同事,他们的工作文档,他们的一些工作流程,聊天记录丢给这个 skin, 他就会帮你做成一个线上版的同事,包括你跟他聊天的语气,包括他跟你平时沟通的这种方法,以及他平时做的那些选择决策,跟他本人是相差不大的,只要是他的文档数据足够多的情况下,跟他本人的实际情况相差不大。这作者他又做了一个反真牛斯基, 很有意思啊,就是很多评论区在那说,现在打工人的一生就是入职积攒足够多的 skin, 然后上传,最后毕业。我们先讲清楚蒸馏到底是什么。 蒸馏这个词来自于机器学习,也就是它原本是一个模型压缩技术,让让一个小模型去模仿大模型的行为,把大模型的能力提纯到小模型里,放在职场逻辑是一样的,你就是那个大模型, 会有情绪,需要缴纳五险一金,并且会因为一些失恋呀,或者是生病流感,导致陷入一段时间的性能低谷。 通过蒸馏可以把这些事情全部解决,只需要提取你大脑里有用的生产能力,装进一个永远不会请假,永远不会提心,永远不会有情绪的 skin。 当然,想要这个 skin 跟你达到一个非常匹配度的情况下, 是需要你大量的文档的,这里面最精准的原材料就是你的工作文档。现在是越认真写文档的人,越容易被蒸馏的干净。这里有个角度,这条路它其实不是现在才开始的,这是一条已经有几百年历史的道路。最开始在 工业时代,就像福特,他们就会把工人每天的工作给他固定化,每天做哪些动作,因为工人只做那一个动作,会让他们的产线上面的汽车生产时间从 几十个小时变成几十分钟,后来演化到现在,到了办公室里面就变成了 o k r k b i 包括 sop, 只要是你能被量化的工作流程,他都可以做成 这些 skin。 而真牛同事的这个 skin, 只不过是当下这个时代这条路的最终形态。这个博主,他用的这个反真牛 skin, 主要是用到了像 混淆、追踪、检测啊一些技能来反制真牛 skin, 就 让真真真牛出出来的这些技能没什么作用。呃,这里有个更深的问题是,反真牛真的有用吗? 你想想,其实我们的公司工作,你要说我们每天去写文档,如果说我们所有的工作内容都被文档记录下来,然后 去流程化我们的工作,这里面的根本问题是真正能被蒸流,能被轻易的就 skin 化的能力,根本就不是核心能力,本身也不具备核心价值。要知道我们在工作中,我们真正的很多专业能力,它是来自于人与人之间的 信任,以我们对业务逻辑的观察判断,这些能力包括对失败经验的一种判断直觉。你说这能力他是很难被 skin 化,被蒸馏。你去在公司里面工作一段时间,你就会发现, 我们很多时候真正重要的东西从来不在聊天记录里,他也不在任何可以被蒸馏的文件里面, 它在于它只发生在你和我面对面,而且是此时此刻。而且我认为我们以后不管是大模型发展到什么样的一个水平,或者是 拥有什么样的能力和阶段,最终一定是有人来使用,有人来操作这些大模型完成工作最简单的一个逻辑就是出了问题, 大模型或者是工作中出了问题,谁来承担这个责任?你大模型不会去承担工作中所出的任何的问题,或者他的一个判断导致工作失误,你怎么样去追责呢?虽然这样说啊,好像就是人用来是背锅的,但也确实 在大模型还没有说完全产生自我意识,没有完全达到一个颠覆的那种状态的时候,人很多时候就是用来背锅的。你把同事真牛成 skin, 那 他那问题是 这个事如果做出问题来的话,是这个同事可以背锅吗?总不会吧,你还是需要有一个能顶到前面的来承担这个责任的人吧?所以你说真正的重要的能力,或者是我们现在这个时代真正重要的一些技能, 这就是人类所有品格里面最稀缺的一个品格。人类是拥有无限的勇气去面对所有接下来会出现的问题,也能扛住这个锅。

家人们,事情开始有点不对劲了。马农发明了 ai, 现在 ai 开始斩杀马农了。今天我要分享的这个项目是一个同事蒸馏的 skill, 已经在开源网站上拿了一万多颗星了。它离谱在哪呢?你只需要把你同事的聊天记录、工作文档全部丢给 ai, 再加上你对他的主观描述,他就能够蒸馏出一个专属的 ai 替身。最离谱的是, 他不只是会写代码,他会用他的技术规范写代码,还会用他的语气来回复消息,连他什么时候开始甩锅,都能够给你精准预判。哼, 你人还没说话呢, ai 已经帮你把锅都甩完了,直接替他把活干了。我现在就好奇一件事情,有没有人已经偷偷把自己或者同事蒸馏出来了?这个东西啊,已经离谱到有点危险了,但你以为这就结束了吗?还有更离谱的, 已经有人开始做前任 skill 了,把聊天记录一位,把相处细节一写,他的语气,他的习惯,他什么时候温柔,什么时候冷淡,全部都能被还原出来。他人虽然不在了,但好像人一直在线。然后 我又看到了一个项目,叫做反蒸馏 skill, 你 蒸馏我,我反蒸馏你,那最后公司里生活的留下来的到底是人,还是一堆被复刻的灵魂呢?

谁能想到,人类追求了几千年的永生,最后竟然是被 ai 用一种近乎诡异的方式给实现了。这两天,张雪峰 skill 刷屏全网,只要输入孩子的分数,这个 skill 就 会用张雪峰那股标志性的语气,配着快节奏的段子, 劈头盖脸的给你算一笔专业的前途账。要知道,他并不是简单的 ai 角色扮演,而是直接把张雪峰生前的几本书、上百次采访和人生轨迹,全部提炼成了一套可以直接运行的思维框架。可以说,这就是一次张雪峰本人思维的源头,要追溯到一个叫女娲 的开源项目,女娲 skill 可以 自动蒸馏任何领域的顶尖人物。目前他已经成功提取了包括乔布斯、马斯克、芒格在内的十三位大佬的思维模型。这就意味着,现在你遇到难题,可以一键召唤芒格的逆向思维帮你避坑,也可以让乔布斯用他那套绝不妥协的产品官帮你瑞平一下现在的苹果。但如果你以为 这只是一场提取名人智慧的技术狂欢,那就想简单了,这项技术正在悄悄渗透进普通人的宫位。前阵子火爆全网的同事 skill 就是 最好的证明。只要把你离职同事的飞书消息、钉钉文档、工作邮件未给 ai, 就 能通过蒸馏生成一个替代他干活的数字分身。项目上线不到一周,就狂揽七千多颗星。更魔幻的是, 据说有些大厂已经开始要求员工把自己的核心工作经验写成 skill 上交。面对这种即将被炼化的恐惧,有网友火速开发出了一款反正留 skill 来保命,只要把你的工作文档扔进去,它就会精准识别出里面的核心知识点, 然后全部替换成正确但毫无用处的废话。从女娲造神到反蒸馏自保,这场看似荒诞的技术狂欢,揭示了一个无比冰冷的现实,人类正在被 ai 解体,我们的经验、习惯、思维框架全都变成了一串串可以被无限复制的功能模块。当一个人的毕生所学可以被无限蒸馏时,我们肉身在场的意义又在哪里呢?

作为一个职场打工的人,我们怎么样做才能不被 ai 时代所抛弃,那么才能不被 ai 强化完呢?那么在传统的时候,我们在工作中,我们就是努力的去学习,努力的去掌握更多的知识,那么我们掌握更多的技能,才能不被我们的工作岗位所淘汰。 但是 ai 时代不一样了,那么 ai 时代可能 ai 能帮我们能做的事情有百分之八十,那么剩下的百分之二十才是 ai 不 能做的。那么在这样的一个时候,我们如何能保持自身的价值,或者说让我们永远不被 ai 所淘汰呢? 这里面那么学习呢?还是一个永恒不变的东西啊。那么无论是在互联网时代,还是在我们工业革命时代,那么我们是学习机器的操作,还是学习电脑的操作, 那么现在 ai 时代,同样我们首先呢就是要驾驭好 ai, 那 么我们能复刻自己的 ai 正宗体能,把我们的能力传输给 ai, 这只是一方面,那么我们做到了这一点, 我们才能腾出来时间,因为我们百分之八十的工作让 ai 替我们做了,我们留出来充足的时间,那么就是需要什么?需要学习,需要创新, 那么创新什么呢?我们现在或者我们以前读书,可能是我们会把整本书读完,但是 ai 时代,那么 ai 一 眼能读懂的书可能是我们的十倍,一千倍,一万倍, 那么这个时候我们再去一页一页的看这本书啊,可能跟不上时代了,或者说你根本没有时间去看完这本书, 那么我们又想掌握这本书中的知识,那么怎么办呢?那么就不要把这本书投喂给 ai, 让 ai 给你去蒸馏, 去蒸馏它的核心观点,去蒸馏它的这种书中的方法论,或者说蒸馏书中的底层逻辑,那么只有通过这样的方法, 才能快速的补充自己在各方面的欠缺。那么比如说我想学习这种深度思考的书,那么我如何去运用书中的方法论去深深度思考呢?那么我只需要把里面的一些废话全部提取掉,那么只需要了解他是如何用什么样的方法进行深度思考的啊? 这是我们这两年啊,给上千家企业落地 ai 总结出来的一个心得,也是一条宝贵的经验吧。那么我们把这些宝贵的经验呢,整理成了一个标准的文档,足足有八米长,包含了如何提炼提词词,如何搭建直通体,如何搭建知识库,还包含了我们平时所使用的这些 ai 工具啊, 二零二六年,真正的想在职场立于不败之地的,或者说想跟得上 ai 时代的,那么可以尝试一下我们这套打法。

这个 skill 可以 让巴菲特直接变成你的私人助理,配置好后,在 ai 里输入任何一只股票,他就会用巴菲特的思维结合专业的分析,最终给你输出一份机构级的深度报告。这跟那些针对别人说话风格的 skill 完全不一样,使用起来也非常简单,直接看下怎么操作吧。 首先我们打开 github, 在 里面输入这个叫 buffet oracle analysis 的 项目,它的中文名叫巴菲特神域分析师。然后我们可以看一下这个项目的介绍, 你未给他任何一个公司的名称或者股票代码,他都将输出这些维度的专业分析,底下是他的一些分析流,让我们直接上手开始操作吧。 然后回到上面,我们直接点击这个绿色的 code, 然后来下载它的压缩包,把它下载到桌面,然后我们回到 cloud, 这里我建议大家直接创建一个 project, 方便于后期的使用。 我们直接点击 new project, 然后名字里直接叫巴菲特分析师。底下这个 what are you trying to achieve。 我 们可以直接让 cloud 给我们写一段 md 文档,复制粘贴进去,然后创建项目。创建完之后,我们直接把刚刚下载的压缩文件发给他,让他学习这个 skill, 然后可以看到他解压分析,学习总结。等他安装好了以后,我们也不多废话,直接让他开始分析。就以腾讯为例子,我们可以看到他在分析,他在解锁。下面我直接给大家看这个分析过程的醇香版,非常牛逼,不需要多余的解释。 然后我们可以回头看一下他这个分析,他列出了一个非常详细的看板,对于他的一些收入,毛利率,包括 roe 都是非常清晰的列在上面,以及他的护城河分析,多维度估值汇总,包括巴菲特的分析卡,对他进行了一个评分。 下面是风险矩阵,投资决策,在多少价位的时候买入多少的市场比例,我觉得还是非常有价值的,大家如果有什么感兴趣的股票也可以去搜一下。 最后这个项目还在持续的迭代更新中,未来肯定有更多功能有待开发,那么今天的视频就到这里,希望大家喜欢,这里是 bryce。

今天给大家拆解 gitop 上爆火的两大职场神器,同事 scale 和反蒸流 scale。 一个帮你守住个人核心资产,一个帮你留住团队经验,堪称 ai 时代打工人的必备组合。先说说同事 scale, 他 精准戳中了所有职场人的痛点, 同事跳槽、实习生、离职、导师毕业搭档转岗、交接、文档潦草,核心经验凭空消失。这个开源工具能把飞书、钉钉、 slack 的 聊天记录、文档、邮件截图等原材料,加上你的主观描述, 生成能替他工作的 ai 分 身。它采用双层架构 workscale, 负责技术规范、工作流程。经验知识库 persona, 通过五层性格结构、复刻语气、决策模式和职场习惯,使用超简单,在 cloud code 输入斜杠 create colleague 填写信息,选择数据源,几分钟就能生成专属 skill, 还支持版本回滚、增量更新,越用越精准。有了同事 skill, 团队知识不再随人流失, code review、 问题排查、业务对接都能无缝衔接,真正实现职场经验赛博永生。但随之而来出现了新问题,工 公司要求员工上交自己的 scale, 变相蒸馏核心经验,打工人该如何自保呢?反蒸馏 skill 应运而生,成为完美繁殖工具。他的逻辑很直接,把你写好的 skill 文件丢进去, 自动识别核心知识,替换成正确却无用的专业废话,输出两份文件交差用的清洗版和保留全部核心经验的私人备份,支持轻、中、重 三档清洗强度,适配不同审核场景,既完成公司要求,又守住职业资产。比如把 redskey 必须设 ttl, 不 设 pr, 直接打回 清洗成缓存使用,遵循团队规范,表面合规,实则核心经验自留。这对组合形成了完整的职场 ai 攻防闭环。用同事 skill 沉淀团队公共知识,提升写作效率。用樊登聊 skill 保护个人核心竞争力,避免被轻易替代。 他们不是简单玩梗,而是打工人在 ai 时代的智慧生存策略,既拥抱技术,提升效率,又守住自身价值底线。目前两者都是开源项目, 安装便捷,兼容 cloud code 和 open cloud, 新手也能快速上手,不管是技术岗、产品岗还是运营岗,都能找到适用场景。职场竞争本质是经验与能力的竞争, ai 时代更要学会用工具守护价值。去 github 搜索 colleague skill 和 anti distill 体验一下吧,让团队知识有序,让个人资产安全,在赛博职场中站稳脚跟。好了,今天的内容就到这里,关于本期内容,你有什么看法,欢迎在评论区交流,我们下期见。

已经离职的同事,竟连夜帮你改 ppt, 这看似天方夜谭的慈善行为,其实是这两天爆火的赛博鬼故事。二零二六年四月, github 上的一个同事点 skill 突然爆火,他能把离职同事的飞书记录、钉钉文档、微信聊天,为给 ai, 让 ai 创造一个他的数字 分身,用他的语气回消息,用他的逻辑改代码,连甩锅的姿势都能惟妙惟肖。而这个过程,也有一个相当恐怖的名字,蒸馏同事。 本来这是提取大模型精华,把大模型变成小模型的 ai 专业术语,现在这个词被用到人身上了,取同事之精华去,同事之遭破,把离职的他数字化后继续干活,甚至比他活着在职的时候还积极。网友还戏称,同事的离职电脑就是赛博骨灰盒。 那这位同事究竟该怎么争呢?先要讲究食材,聊天记录是日常的烟火气,凡是与他有关的文字, 都要一一背齐。在时间与算力的交汇处,一个人的痕迹被悄然还原。这个人的技术底线是什么?他什么时候会甩锅?他是先说再做,还是先做再说? 所有这些,最后压缩成一个几百 kb 的 markdown 文件,肉身可以。今天离职数字分身永不下 下班回到这个项目本身,同事点 skill 的 项目介绍里写着,将冰冷的离别化为温暖的 skill, 欢迎加入数字生命。刚开始听起来还挺浪漫,但仔细想想,似乎有哪里不对劲?因为此事在赛博朋克二零七七里亦有记载。 游戏里的荒版三郎,八十多岁挂了,他很早就把自己的意识蒸馏上传到了云端。肉身死了,数字人格接着统治荒版集团顺理成章。但不一样的是,另一个角色抢你银首则是被做成芯片塞进了主角 跃飞的脑子里,连选择的余地都没有。所以,所谓永生的前提,应该是,我自己想活着。但如果是别人想让你活,甚至是在你不知道的情况下强行给你续命呢?哪里有压迫,哪里就有反抗。热心开发者看完这个项目,第一反应不是惊叹技术,而是感叹牛马 何必为难牛马,他花了四天做了个反蒸馏 skill, 核心功能也很简单,那就是只给公司留下一堆美丽的废物, 有用的数据一个没有。举个例子,原本你的飞书聊天记录是标题二十八号论文用四元,黑体,数据用红色,去年老板看不清字,直接给毙了。反蒸馏后变成 ppt, 排版需要规范且美观,每个字看着都没啥问题,但每个字也都没啥用,这就是反 蒸馏废话文学真正的用武之地。你说这个,你说哎呦,你说这叫什么?你说我还在这一,我还说我说哎,我说你这,你说你哎呦。更有意思的是,同事点 skill 上线几天后,国家网信办就发布了数字虚拟人管理办法,核心内容就是未经同意用别人信息创建数字人违法。 看起来是确实有震慑效应,但这只管住了面子。问题里子的问题还没有交代。著作文档第十六条中明确规定,职务作品除署名权外的问题还没有交代。著作文档代码由 见归公司。这没有什么争议,但你的判断直觉、你的沟通方法,你在困境时的取舍标准呢?这些有个人特色的经验,在学术界有个专门的名词默会知识,是迈克波兰尼在一九五八年提出 的哲学定义,代表那些只可意会不可言传的隐性知识。所以问题来了,著作全法说文档归公司,虚拟人管理办法说个人信息归个人, 但这个末会知识到底归谁,目前仍然是法律的真空地带。如果公司真的要求蒸馏员工,无疑是把又一个两难的选择摆到了每一个牛马面前。距离二零七七还有五十年,但同氏点 skill 已经让我们快进到了那个世界。蒸馏虽然不是真的把人煮了,但 过程也许就像温水煮青蛙,水温一开始很舒服,等我们意识到不对劲时,恐怕已经没有反抗的能力了。这是 ai 突破,关注我,了解人工智能最新进展。

九 b 的 蒸馏模型工具调用测试居然打了满分。大家好,我是 ai 学习的老张, cloud opus 蒸馏 q n 三点五这条线我从 v 一 追到现在,今天 v 三来了,这次改动大到连名字都换了,叫 q opus 三点五。 q n 加 opus 的 合体 v 一 是让小模型学会推理, v 二是让他想得更少,答得更快。 v 三的核心是让他学会用工具干活,从会思考到会行动,这是一个质变。 先看数据,九 b 的 g g u f 版本下载量十点九千,断崖式领先,说明什么大家心里清楚,九 b 就是 甜蜜点, 十六 gb 的 macbook 就 能跑, windows 上普通显卡也没压力。再看跑分, humanivowv 三拿了百分之八十七点八,比原版 q 三点五的九 b 高了将近五个百分点。 v 二在九 b 上其实没啥提升, v 三一下子拉开了差距, mmlu pro 通用知识能力 v 二掉了百分之七点二,当时我说这是代价。 v 三把这个问题修了,反超原版一点四,三个百分点,代码更准,知识也没丢,这在蒸馏模型里非常少见。 效率方面,思维链缩短百分之二十五,推理效率提升百分之三十一点七,用更少的 token 办更多的事。 最让我兴奋的是,工具调用 v 三专门做了针对工具调用的强化学习训练。我用凸口十五跑了一遍,十五道题全部通过满分。之前 v 二的二七 b 才做到这个成绩,现在九 b 就 行了。我的判断,这是这个系列真正成熟的一代。 想本地跑一个能写代码,能调工具,还不吃资源的模型。 q r p 三目前最值的是关注,老张,我们下期见!