粉丝769获赞7417

如果你还在苦恼 deepstack 的 改变,从现在开始用 api 吧啊,上期视频我虽然提到了,但是很多人说太复杂了,更多人说不知道怎么用,那这期视频我们就来一期手把手的教程啊,不会很复杂,而且相信我,这有可能是你实现 ai 认知跃级的一大步。 你现在用的 deepsafe, 不 管是网页版还是手机 app, 它的背后其实是一堆服务器在跑。给大家看一看我们的老师在服务器里最原始的样子,一个黑底的界面,先加载各种乱七八糟的东西,加载完之后就会出现一个箭头,你打字进去,他会一行一行的给你回应, 看起来就很原始哈,能用吗?是能,但是只有技术人员能用,这时候他就在想,我怎么能把这个服务器共享给别人呢?毕竟这设备钱跟电费都烧着,如果我能共享出去,还能够按量付费去收点钱回血,对吧?那么就会有第一个问题,怎么能让别人知道你这台服务器在哪呢? 答案也很简单,给大家一个统一的调用网址,然后大喊所有人连接这里,保持 wifi 稳定。 第二个问题,我怎么知道谁来用了,用了多少呢?也很简单,给大家一堆密钥,按照密钥来统计个数就行,其实这块就挺像账号密码的,它就是两行参数。然后会有第三个问题,因为 deepsea 它也不止一个模型,那你到底要调用哪一个?需要你指定它的模型名称, 只要你手上具备了这三个东西,你就可以在任何地方去调用。迪老师, 比如你来到了一个酒馆,跟 d 老师扮演的几位男士女士非人类聊聊天。又比如你打开了一本全是日语的材料,辛勤的 d 老师一句一句的把它们翻译成了中文,然后你脑子突然冒出了一个想法,想搞一个创业的网页 代码,当然都是由 d 老师亲自来写,当然你也可以什么都不想,就在一个简单的聊天框里面,跟老 d 老师好好的聊聊天, 你之前应该也遇到过的老师说到一半,然后紧急撤回,又或者是服务器繁忙,请稍后再试,那在这里就都不复存在了,而且尺度无限大啊。如果你听兴奋了,那我们就快速去过一遍,流程就很很简单, 然后我再去跟大家分享一些更多我对于 ai 的 一些想法操作,一共就两步,那我们先来解决后端,也就是拿到我们开头讲的那三个东西, 用电脑或者手机都行。打开 deepsea 的 官网,左边这个网页版就是我们熟悉的老路,我们这次走右边 注册一个账号,然后就开始充值,最低一元起充,具体充多少呢?我就给大家一个参考。我上个月总共花了两块三,最多的一天花了四毛,而这一天我大概跟 ai 聊了十二万字,说白了, d 老师真的很便宜,就是充十块钱,应该能够聊到你历劫了。 充完值,找到左边的 api case 点创建这个名字,你随便起,这串密钥要保存好,因为它只会出现这一次,相当于我们也拿到了我们的一个身份码。所以后台呢,其实就是充值跟创建密钥这两步。我们再去看一眼它写的接口文档, 对老师的请求地址就是这个 api 点 deepsafe 点 com api k 就是 你刚刚创建的那个。然后模型名称你有两个选择,分别对应着 v 三点二版本的非思考模式和思考模式。如果你好奇的话,可以看一眼左边的价格标准,输入两块,输出三块,每一百万, 这个比起国外的大模型真的是白菜价了。好了,至此,我们后端的这三个东西就齐了,接下来呢,我们来选前端。前端的软件是非常多的 啊,我现在给大家报个菜名,网页版有 open web ui, next, chat labor, chat, 桌面端有 chat studio, deepchat, chatwise, 手机端有 chatbox, replay, hub, cleveland 多的是。但是你要记住,就这些软件,它们所有的软件除了功能上有些细致的差别以外,其实都一致,它们就是一个壳,来为你提供一个对话的聊天界面。我们这一次呢,以 chatbox 为例啊,因为它的 ios 跟安卓都是免费的, 虽然界面会有点简陋,但其实还挺好用的,当你第一次打开它的时候,里面是空的,但如果你配置好了,它是可以什么模型都有的。 首先我们一进来全部插掉,在这个菜单里面找到设置模型,选择提供方,找到 deepsea 这里,因为 deepsea 实在太有名了,所以大家都用那个地址还有模型的名称,所以它呢,简化了,都给你填好了, 这里你就只需要填入你的密钥就可以用了,填完呢也可以检查一下,一般是没有什么问题。现在呢,再一路返回,你就可以在下面选择 d 老师了。前后段的教程就到这里结束啊,应该讲的还挺细的,如果你还有什么疑问,都可以发在评论区,我是会看的。 这里你细想一下,其实 deepsafe 的 官方 app, 它不也是这么一个壳吗?只不过官方帮你把这些地址、密钥、模型全都接好了,再给你免除了 api 的 费用,大家就这么习以为常着用着了,对吧? 到这你可能会想啊,就为它这个模型升级,然后我为了找回老模型,就费了这么大劲,值吗?说实话,如果你只是把这个 api 接入到一个聊天软件里,那体验上确实跟之前聊天没什么区别,而且你现在还开始花钱了。 但是呢, api 这个东西,一旦你学会了领悟了它的用法,那它打开的就绝不是一个聊天窗口这么简单了。 其实我看到了一个比较主流的 ai 的 理论,它会把使用 ai 的 人分为了四层,第一层跟 ai 聊天,用网页端或者手机版的 app 去帮你查查资料,写个周报,你个新年贺词,或者帮你处理一些感情问题啊,也不是说有错,只是说这样其实没有发挥到 ai 所有的能力。 第二层,其实就是我们这次讲的用 api 的 方式把 ai 拉出来,放到各种不同的软件里面,那区别在哪呢?比如说,我这里有五个需要翻译的文件,用网页的方式一次复制不完,我就得把它们分段去粘贴, 不仅麻烦,而且这个流程是很不规范的。但凡 ai 出现一次幻觉,那字幕的格式就会错,非常容易出现各种各样的问题。 但有了 a p i 之后,我们就可以利用现成的翻译工具,只让我们的老师去做这个翻译的部分,而且整个过程都是批量的,处理完之后自动合并成一整个文件,准确而且优雅。如果你用好了 a p i, 其实你工作的效率会有很大的提升。 第三层其实就是现在爆火的 ai 编程,刚才我们翻译是有现成的工具的,但有些小众需求,比如说我想要自动抓取一些 ai 热点,然后主动推送给我, 市面上没有这样的程序,那就自己造。有一种很特别的程序,专门为 ai 编程而优化,同样它需要 api 的 方式接进去,然后你跟它自然语言描述你想要的东西,它就能帮你一点点做出来,而在这一层,无论你的需求有多小众,它都可以解决。 最近呢,我是用 ai 来搭建了整个写作的工作流,虽然文章还是我自己写,但是有一些选题的想法,或者是发布之后的数据总结,我就都交给 ai 去做了。昨天晚上我去跟 ai 复盘总结,也说了很多的想法,然后我觉得有点累了,就跟他说,不然今天就到这里, 然后他就说好了,今天就先到这大概讲了什么东西?合上电脑,我突然有点恍惚,就过去的一个小时,我是完全没有看手机,没有呃,刷短视频,完全就是种心灵模式,而这个心灵模式竟然是我在跟一个 机器在协同工作,这种感觉真的还挺奇妙的。至于第四层,其实很多人都还在观望,应该也是一个今年的趋势啊。一个 ai 是 已经可以帮你很好的完成任务了,但是更加复杂的,更大的任务可能他还是做不了的。那么一群 ai 如何去协同合作? 这个事情还是比较难的,就目前还是一片混乱。就是你让一个总领导的一个人去安排几个不同的小 ai 去做事情, 他就会着急的说那 ai 还没做完呢,他就自己上手去做了。总之现在的视觉效果是远大于实际的效果的啊,还不是很好用,跟大家发散的会演多了,只是想让大家去了解一下现在的 ai 进行到什么程度了。 呃,这一次的小事故,如果能够让你有机会去接触到 api 的 用法,我觉得是一个非常好的机会。好了,这期视频呢,我们就讲到这里啊,应该都听懂了吧,如果,嗯,哎,反正后续我也会做各种各样的,一步一步的,这种 ai 的 内容也可以先关注一下我。 嗯,就讲到这吧,然后我是大黑,以纯人工的方式去帮你去去分享智能。好,我们就下次再见。拜拜。

熬了三个通宵,我的 ai 员工终于上线了,你看,我可以直接用飞书发消息,让他干活,帮我把桌面整理一下。 哇塞,瞬间收纳好了,但这对他来说只是小菜一碟啊,他还能帮你处理邮件、浏览网页、帮你查资料。重点是,他所有的技能和记忆都存在你这台电脑上,不用签保密协议了呀。接下来教你们怎么装点赞收藏慢慢看。 首先,你得搞一台可以上网的苹果电脑,接着去注册申请个大模型的 apikey, 我 用的是 kimi code, 你 也可以去尝试其他的。然后就按 command 加空格输入车密码,按回车输入这些命令行。然后呢,跟着指引在上面贴上你刚申请到的 apikey, 完成之后就可以直接在这里跟 ai 对 话了。但想要接飞书的话,还得多做一步,就是在飞书开放平台上创建一个机器人应用,然后将这个机器人的 id 密钥告诉他, 这就大功告成了。你可以给他取个名字,告诉他你是他的老板,就把他当做一个员工来看,他也会告诉你他能帮你做什么。总之呢,非常有意思。我把我的实际操作步骤整理成了一份文档,有兴趣的举个手直接发你。

网页给手机刷 root 教程,它来了,很多小伙伴说用网页给手机刷 root 刷分区,怎么可能,甚至还有的小伙伴狂言说信的人这辈子有了那么好,三丰今天就带你开开眼界。在此之前,我们依旧是需要准备数据线,可以是 type c 对 type c, 也可以是 o t 区转接头。其次我们需要准备 e d g e 浏览器,这个是 a p i 支持的原因路径在张三丰资源网页刷 root 分 区等。那么现在我们开始教程。首先我们需要把手机进 入到这一个 fastboot 模式,我这里的话为了方便就直接用面具进入了。 ok, 成功进入 fastboot 模式,我们先进浏览器访问到对应的网址,我们会看到这样的页面,此时我们就可以连接数据线来怼进去。好,下面我们点击连接 fastboot 设备,点击我们会发现上面会提示希望连接什么,我们希望连接 android, 你 要点击连接允许 edg 访问 android 吗?确定这样就连接成功了?下面我们就可以进行分区 镜像的刷写,选择刷写镜像,我们选择文件,我这里选择 d t b o 分 区,我就随便刷一个 d t b o。 大家你们可以刷 boot, 如果是刷 boot 就 输入 boot 分 区, in boot 就 输入 in boot 分 区。好,这里很显然我刷的是 d t b o。 好, d t b o 输入 d t b o, 我 们点击刷写分区,此时它就会 进行刷写,如果这一个文件消失不见了,就是刷写分区,此时它就会进行刷写,如果这一个文件输入这一个 v boot, 重启 i e b o t 执行命令执行好,此时手机就进行重启了,看到没有,这个是有效果的是吧?如果没有效果它是不可能重启的,说明它是可以给它进行刷写的,也是可以正确执行 fastboot 命令。再给大家提一 嘴,这一个 fastboot 命令前面不需要添加 fastboot, 比如说你想执行一个刷写命令,但是在这里的话,我们可以省略掉这个 fastboot, 只保留 facebook 后面的命令,这个是刷写工具的使用方法。所以这一次是不是让你大开眼界了,并且是真实可用的,所以那些说信的人,这辈子有的你们可以这样出来说话了。那么好了,本期视频就给大家分享到这里,关注我,了解更多玩机资讯,我们下期再见!

兄弟们,今天做一期关于这个鸿蒙六开发者 beta 版本的这个视频,但是涉及到保密部分的我们就不聊,也不方便展示,只是说一下一些公开的能够说的东西。首先第一个这个版本怎么去报名?在应用商店里面搜索这个开发者联盟, 然后在这里面完成认证以后,首页点进去就可以报名了。如果答题答了几次的不行的,你就换个手机号再注册就可以了。 这个题其实都很简单,有一些可能你答不了,你如果身边有其他的设备,是可以去提供一些帮助的。然后说这个需不需要刷全量包,因为它 ota 更新其实是整包更新的, 所以刷不刷全量包这个对于整体影响不是特别大,只是个人习惯,所以这个不影响。在刷之前需不需要备份数据, 这个官方肯定是建议备份的,这个整体还是比较稳定的,但是建议还是把数据备份好,重要的比如说你的微信啊,相册这些备份好,以防刷机过程中,比如说出现一些死机情况很低,但是还是做好自己的数据保护是最好的。然后还有 兄弟在问,就是说刷了这个内测版以后还能不能收到,比如说像幺三零或者幺三二幺三五的正式版的更新,肯定是你收不到了,因为内测版的版本号是高于正式版的,所以只有等内测版后面切换到公测以后是可以切换过去的,后面只要不点尝鲜就没有问题。 整体这个版本还是比较建议升级的,升级的兄弟们也自己享受就行了,不要去公开的去泄露怎么样?尤其是功能界面,毕竟还是内测,好吧?

tiktok 官方开始鼓励通过 api 发布短视频了,所有做 tk 电商的注意了,特别是美区玩家要注意,就在现在, tk 官方鼓励各个商家把自然流挂车的短视频通过官方的 api 接口进行发布,率先从美区开始。 什么是官方的 api? 从官方 api 发布短视频到底有哪些好处呢?以及怎么从官方 api 发布短视频呢?一分钟给你讲明白。一、什么是官方 api? 就是 tk 官方为了完善生态,希望有技术实力的伙伴一起玩,研发符合官方生态发展的产品, 一边既能满足官方的商业上的增长需求,另外一边又有利于提高用户的粘性和活跃度,给到的各种接口和能力。 简单来讲啊,就是官方不做,将又需要的产品交给生态伙伴来做,那就需要给这些伙伴柴米油盐呀。那么第二,从官方 a p i 发布挂车短视频有哪些好处呢?好处有三个,一是安全,无论你在哪,你的账号发布的挂车视频都是通过官方分配的 ip 去发布出去的,不限流也不封号。 二是预审额度的提升,从之前每个账号每天预审两条提升到十条,这意味着什么不用我多说了吧。三是更容易得到官方的流量直接扶持,牛逼不牛逼?那么怎么从官方 a p i 发布视频呢?这就跟我前面说的什么是 a p i 有 关系, 要想通过官方的 api 发布挂车视频,是要找有这样的能力的,并且经过官方承认的第三方应用一定不是那些群控云控啊,这些作弊器官方想清掉还来不及,永远不可能会放给他们 api 的, 别被蒙了啊。究竟哪个工具能既安全合规又能自然流挂车?通过 api 发布作品?评论区打 api 三个字母。

嘿,各位搞逆向工程的朋友们,有没有遇到过这么个怪事,就是程序明明调用了一个函数,可你翻遍了它的导入表,就是找不着。 今天啊,咱们就来当一回侦探,把这个案子给破了。没错,就是这么个情况,你想想啊,你信心满满的打开一个程序,想把它看个底朝天,查查它都调用了哪些 api, 结果呢?一上调试器, 嘿,它居然调用了一些压根就没在列表里的函数,这到底是怎么回事啊?难道说这个导入表它还会骗人不?重 行,咱们这就来看看这个案发场,你看这个对比就很能说明问题了。左边静态分析的时候,你翻遍了 pe 文件的导入表,就是找不到某个 api 的 影子,对吧?它根本就不存在。 但是,一旦你把程序跑起来,切到右边的动态视角,用调试器一看,哇,这个 api 调用不仅成功执行了,而且程序还跑得好好的,这感觉就好像这个函数是变魔术一样,凭空冒出来的。 当然了,这背后可不是什么魔法。其实呢,这是一个 windows 系统里头非常聪明,非常巧妙的一个机制,它的名字就叫 d l l 延迟加载。来咱们这就把它扒开,看看它到底是怎么玩的。 那到底什么是 d l l 延迟加载呢?说白了,它就是一种懒汉式的加载方法,或者叫拖延症加载法。哈哈,你看啊,一般的程序启动会一下子把所有需要用到的工具,也就是 d l l 和函数全都搬进内存, 但延迟加载不怎么干,他特别懒,他会说,哎,先别急,等会再说。只有等到某个函数,你第一次真正要用它的时候,它才慢悠悠的去把对应的 d l l 加载进来,再去找到这个函数的具体地址,是不是很形象? 那这么偷懒有什么好处呢?好处可太大了,最直接的一点就是能让你的程序嗖的一下就启动起来。咱们来看这个例子,特别好理解。 就拿一个功能超多的照片编辑器来说吧,它可能有好几十种滤镜,什么复古风、赛博、朋克风,每一种滤镜的功能代码都放在一个单独的 d l l 文件里。你想啊,要是你一打开这个软件,它就把这几十个 d l l 全都架在一边,那你估计得等上半天。 但用了联时加载就不一样了,只有当你真正去点那个复古风滤镜的时候,程序再会说,哦,该干活了,然后才去加载那个特定的 d l l, 这样一来,启动速度不就快多了吗? 好,我们现在知道了,为什么要这么干。那接下来最关键的问题来了,它是怎么做到的呢? 这个看起来像变魔术一样的小把戏,他背后的流程其实是相当精密的,咱们一起来看看他的内部构造。 要演好这出戏啊,得有三个关键角色登场。首先是延迟导入表,你可以把它想象成一个代办事情清单,上面清清楚楚的写着,喂,这些 d r r 和函数,先别急着加载啊,等通知。 然后呢,是编一起纯汁儿,这玩意儿就像个接线员儿,或者说是个哨兵,他守在那儿,专门拦截对这些懒加载函数的第一次呼叫。最后就是我们的主角儿,叫 delay load、 helper two 函数儿,他才是那个真正干活儿的, 接到通知之后,就由他负责去把 d l l 找来,把函数地址问到。那么,当你的代码第一次调用那个懒加载函数的时候,到底发生了什么呢?咱们一步一步来看。 第一步,你的调用请求,他并不会直接找到真正的函数,而是先撞到了那个变异器存根那个哨兵。第二步,这个存根哨兵自己不干活,他马上转身去呼叫那个爱孩子 delay load helper 二的助手函数说,哎,来活了,快来帮忙。 第三步,这个助手函数一登场就立马开始干活,他先是调用 load library, 把需要的那个 dlc 文件给加载到内存里。 第四步, d l l 加载进来了,他又马不停蹄地调用 get pro address, 从 d l l 里问出那个函数的真实地址。第五步,也是最关键的一步, 他会把这个刚到手的真实地址写回到一个叫导入地址表,也就是 i a t 的 地方。这一步特别重要,就好像是更新了通讯录,原来通讯录里记的是那个哨兵的地址,现在直接更新成了函数的直达专线,你看,这个信息就被修整了。 最后一步,万事俱备,程序就直接调转到那个真实的函数地址去执行代码了。你看,整个流程下来天衣无缝,而且因为 i a t 已经被更新了,所以下一次你再调用同一个函数,就直接走直达专线了,再也不用这么麻烦了。 ok, 原理咱们搞明白了,那现在轮到我们这些侦探出马了。面对这种藏起来的 api 调用,我们到底该用什么工具,从哪下手才能把它揪出来呢? 一般来说,咱们有两条路可以走,也就是两种主要的分析手段,静态分析和动态分析。 静态分析呢,就是不动手,不运行程序,咱们就对着文件本身进行分析,我们可以直接去 pe 文件里头找到那个我们之前提到的廉耻导入表,把它解析出来。 而动态分析呢,就更直接了,咱们把程序跑起来,用调湿器盯着它的一举一动,我们可以跟着代码一步一步走,或者更聪明一点儿,直接在那些关键的加载函数,比如 load library 和 get proc address 上面设个断点,等到它自投罗网。 这里要给大家一个特别好用的静态分析小技巧。你看,在代码里找东西,最怕的就是没线索, 但是对于延迟加载来说,有一个几乎可以说是铁证的线索,那就是如果你在返回编代码里看到了一个靠指令,它调用的正是我们前面说的那个主角, js underscore delay load helper two, 那 基本就可以百分之百确定了,这就是一个延迟加载的触发点,这个信号简直不要太明显。 但是啊,咱们得记住,任何技术它都是一把双刃剑,这个本来是为了提升程序性能的好东西,现在也成了恶意软件作者眼里的香饽饽, 他们会利用这个机制来跟我们玩捉迷藏,把它当成一种隐藏自己的障眼法。没错,你想想,恶意软件最怕什么?就是怕被发现,所以它们会想尽一切办法隐藏自己的行为, 比如他们要调用一些很敏感,一听就很可疑的 a p i。 那 怎么办呢?直接写在导入表里不就等于自报家门了吗?所以他们就很机智地用上了延迟加载 他们的如意算盘就是,哎,反中,很多自动化的安全工具,就只会傻傻地扫描那个标准的导入表,只要我把调用藏在延迟加载里,不就能躲过去了吗? 不过呢,正所谓谋高一尺道高一丈,只要咱们搞懂了它背后的原理,识破这种小技巧简直是小菜一碟。首先啊,现在很多专业的静态分析工具,比如大家都很熟悉的 ide pro, 它已经非常智能了,大部分情况下都能自动帮你识别出这些延时加载的函数。就算静态分析搞不定,咱们还有动态分析这个大杀器。就像我们前面说的,你只要在 load library 和 get proc address 这两个函数上设好断点,然后就泡杯茶等着。 一旦恶意软件想偷偷摸摸地去解析它藏起来的函数,啪的一下就会在你的调试器里停下来,被你抓个正着。 好了,那关于这个会说谎的导入表的案子,今天咱们就分析到这里。现在呢,我也特别想听听你的故事, 你在自己的逆向分析生涯里,有没有碰到过类似的情况,或者你有没有什么独门秘籍,可以更快的发现这些被藏起来的调用?都非常欢迎你在评论区里留言,分享你的经验和看法。好,我们下期再见!

每天淹没在海量信息里,其实真正值得读的内容,可能连百分之十都不到。 与其把时间浪费在手动筛选标题党和垃圾广告上,不如直接搭建一套自动化的情报系统。利用 n 八 n 这类工作流工具,我们可以把原本每天需要两个小时的信息获取过程,直接压缩到几十分钟,甚至完全不需要人工干预。 这不仅仅是省时间,而是把获取信息这件事,从低效的手动劳动,升级成了一条现代化的流水线。 这套自动化逻辑的核心,其实就是一条现代化的信息加工流水线。不管你是用什么工具、标准架构跑不出这四个环节,抓取、清洗、 ai 加工以及最后的微党推送。先把原材料从全网各个角落抓回来, 然后做清洗,把格式乱七八糟的数据统一标准化。接着进入核心环节,让 ai 大 脑进行翻译和提炼,最后把处理好的成品直接送到你手里。逻辑非常清晰, 我们一步步拆解来看。先说第一步,怎么把信息抓回来。这里主要靠两把刷子, rss 订阅和 api 调用。对于那些传统的博客、新闻网站, rss 绝对是效率之王。这机制就像以前订报纸一样, 你不需要每天跑去报摊看有没有新报纸,只要拿到对方的 rss 链接,不管是纽约时报这种大媒体,还是小众的个人播客,那边一更新内容就自动推到你脸上。 很多网站虽然没把 rss 图标挂在明面上,但你在网址后面试着加个 feed 或者 rss 的 后缀,或者去 feedspot 这类聚合平台搜一下,通常都能把它的源挖出来。 但问题来了,如果是推特、有馆这类封闭的社交媒体,光靠 rss 拿到的信息往往不够全,甚至根本拿不到。这时候就得用 api。 api 说白了就是平台官方开的一个后门。 他最猛的地方不仅是能抓到内容,还能顺手把点赞数、浏览量这些原数据也全部扒下来。这对于监控热点趋势简直太重要了。毕竟,只有拿到这些数据,你才能算出哪条内容正在疯传, 哪条是没人看的垃圾。只有 a p i 才能告诉你什么是真正的全网热点。抓回来的数据,通常都是没法直接用的,格式五花八门,就像刚从地里拔出来的萝卜,带着一堆泥巴和烂叶子。 如果你直接把这些原始数据扔给 ai, 不 仅处理效果差,还会白白浪费大量的 token 的 费用。所以,第二步必须做清洗。我们需要在 n 八 n 里用一个 set 节点,把格式强行统一起来。逻辑很简单,不管源头有多少个乱七八糟的字段, 我们只提取四个核心要素,标题、链接、正文字和发布时间,其他的广告代码、样式、标签统统扔掉,只保留最干的干活。 除了格式要干净,时间也得新鲜。我们做的是情报系统,不是历史博物馆。昨天的旧文对我来说可能就没价值了。 为了保证时效性,一定要加个过滤器,设定一个简单粗暴的规则,只放行最近二十四小时内产生的内容。凡是超过这个时间窗口的旧消息,不管标题多耸人听闻,直接拦截丢掉。 这样既能保证你看到的一定是热乎的,又能进一步帮 ai 节省处理资源,别让它在陈芝麻烂谷子上浪费算力。数据洗干净之后,就到了最有含金量的环节, ai 智能加工。如果只是把原文搬过来,那效率提升其实非常有限。 我们要做的第一件事是跨语言翻译。很多人不看外文资讯,不是因为内容不好,而是阅读压力太大。现在我们直接接入大模型,让 ai 充当你的同声传译。它不是死板的查单词,而是把全球范围内的资讯直接转成你的母语。 这一步的核心目的就是降噪,扫清一切阅读障碍,让你获取情报的速度跟看国内新闻一样快。翻译完之后, ai 还得帮你做第二件事,自动摘要。我们要的是认知压缩。 你想想,每天面对几十篇长文章,每一篇都通读,根本不现实。我们要让 ai 先读一遍,然后替他那个懂行的助理,直接把万字长文提炼成三句核心观点。 这几句话不仅能帮你省下大量的阅读时间,最重要的是它能帮你快速过滤看完摘要,有价值的再去读原文,没价值的直接划走。这一步能让你摄取信息的效率提升十倍不止。 第三步,也是最关键的一步,智能达标。这可不是简单的关键词搜索,而是让 ai 理解内容之后,按照你的标准去分类。 你可以在提示词里告诉 ai, 如果内容里有代码或者具体方法论,就打上硬核干货。如果是大厂动态,就叫行业新闻。如果是没营养的口水账,直接标上纯吐槽。 有了这些标签,你后续整理资料会极其方便。更牛的是,你可以设定机器人只给你推送硬核干货,那些垃圾信息连出现在你手机上的机会都没有。 情报加工得再好,如果只是在后台飘过去,那这套系统就白做了。我们需要一个落脚点,建议你直接把这些处理好的高质量信息存进回书、多维表格或者类似的数据库里。 这一步的本质是把信息流变成知识资产。有了这个库,你以后想查某个行业深度报告或者技术干货,不需要去翻聊天记录,直接按标签或者关键词搜索就行,这是你个人的私有,搜索引擎存的越多,他的威力就越大。 既然是自动化,你就别指望每天还去主动刷数据库。最爽的体验一定是喂到嘴边, 利用机器人接口,把每天整理好的情报按重要程度排好版,直接推送到你的手机上。想象一下,每天早上醒来,你不需要去翻那个乱七八糟的订阅列表, 机器人已经把全网你关心的最新动态全部翻译好,总结好发到了你的聊天软件里。 你只需要利用洗漱或者通勤的几分钟扫一眼,这一天最核心的情报你就全掌握了, 这才是真正的科技改变生活。最后说一下这套系统怎么跑,新手完全没必要一上来就买服务器,直接在自己电脑上装个 n 八 n, 或者用 npm, 跑起来免费又直观。先把流程跑通是关键, 但是本地部署有个硬伤,你关机睡觉或者断网了,它也就停工了。如果你想让这套系统真正变成你的全天候情报中心,二十四小时盯着全网动态,那把它部署到语音服务器上是必须的, 其实成本很低,租个最便宜的 vps, 几十块钱一个月把 dck 跑起来,这样即便你关机睡觉,你的数字情报员依然在后台默默运转,决不错过任何一个关键信号。

想拥有一个自己的大模型,但不知道怎么下手?别慌,这个视频教你从电脑开机开始,带你一行行手敲代码,全程实操微调出一个专属于你的大模型,新手小白也能轻松拿下。都二零二六年了,如果你的简历上还只写着会调用 api, 那 面试官可能看都不看就划过去了。 现在的企业真正缺的是什么?是能把开源大模型拿回来,在本地练成懂公司业务的自有专家的人。 为什么要学微调呢?试想一下,你把你公司十年的客服对话记录喂给模型,它就能从一个机械回复的机器人,变成一个懂退换货政策,甚至懂销售话术的金牌销冠。 或者把厚厚的法律条纹和医疗指南喂进去,他瞬间就能够变成垂直行业助手。最关键的是,这一切都在本地发生,数据不出门,隐私更安全。今天我就带你们用 deepseek r 一 一点五 b 这个性价比之王,零成本跑通这套价值百万的流程。 本期视频我们不整虚的,直接实战。第一部分,我会快速拆解微调的底层逻辑,搞懂 lora, 让你在面试的时候有资本和面试官谈笑风生。第二部分是环境准备。 我知道很多人入门 ai, 最大的门槛不是代码,而是配环境,报错报到怀疑人生。所以这次我直接帮大家选好了一个免费的云端环境,不用担心没有显卡,只要你能上网,哪怕是轻薄本也能跟着我一起跑。 第三部分,我会手把手一行一行代码,带着大家跑业务流程,亲手把模型给练出来。最后,我们来聊一聊目前 ai 行业里面微调这个技能的价值,以及未来我们还能用这套方法玩出什么花样, 毕竟工具是死的,思路是活的吗?我希望大家通过这个视频不仅学会操作,更能打开思路。我们马上开始第一部分,先来搞懂什么是微调,什么是 logo, 只有搞懂了这两个概念,你后面跑代码的时候才知道为什么我们要调整那些参数,遇到报错才知道怎么修。 首先,什么是微调发音? tony, 我 们可以把现在的 deepsea 二一想象成一个刚毕业的全能本科生,他读了很多书,历史、物理、编程什么都懂一点。但是如果他不经过培训就直接去你公司上班,不管是做医疗客服还是写法律文书,肯定是蒙的, 因为他不懂你们公司的具体业务,也不懂那个行业的黑化。那我们要做的事就是送他去读个在职研究生,我们把他关进小黑屋里面,给他塞一堆你们行业的专业教材,也就是你的数据集,让他从一个什么都懂一点的通才变成一个懂业务的专才, 这一点在现在的职场里面非常重要。现在外面面试 ai 岗位谁都会掉, api 那 个没有什么壁垒。但是如果你能说我能把通用的 r e 模型微调成一个懂我们公司十年累积下来的私有数据的专家模型,这在老板眼里的价值是完全不一样的。 但是如果要把这个本科生彻底的回炉重造,也就是全量微调,成本太高了,你得把他的参数全部都重新洗一遍,这在以前没几个几十万的显卡集群根本跑不动,这也是以前很多个人开发者被劝退的原因。 但是我们今天要用的是 lol 的 逻辑,特别鸡贼哦,是特别聪明,他不碰模型原来的大脑,也就是冻结原模型, 而是给模型贴上便利贴。这就好比教科书太厚了,我们印不起新了,那就在每页旁边贴一张便利贴,就是 adapter 设备记参数,把新的知识写在便利贴上。考试的时候呢,模型既看原来的书,也看一下旁边的便利贴,效果是不一样的。 我们为什么要讲这个呢?因为 lora, 这是我们今天能零成本做这件事的核心秘密。 lora 有 以下三大优势,一、存显存。因为只练便利贴,显存占用只有原来的三分之一,甚至更少。这就是为什么待会我们用免费的云端显卡也能够跑得起来。 要点是他速度快,别人练模型要一周,你可能呢?喝杯咖啡的功夫,几十分钟就练好了,而且他效果还好。二零二六年的今天, low 耳的效果已在很多的垂直领域,已经完全不输给全量微调了。 所以我们今天的方法论就是不动大手术,只做微整形,用最小的代价换来专属的效果。 好了,那么原理大家心里都有个底了。接下来我们要搞定零成本的环境,我们不花几千块去做服务器,也不用把你那个打游戏的笔记本风扇转得跟个直升机起飞一样。我们直接用 modscop 提供的免费云端算力。首先去 modscop 官网登录,找到我的 notebook, 这里我们要选择 gpu 环境,按这个配置,二十四 g 显存,这个配置呢,跑我们 deepseek 二一的 lower v 条完全是绰绰有余了。镜像这里我们就不用纠结,选官方默认的 petortech 镜像就可以了,它里面该有的驱动都给你装好了,主打一个开箱即用。 启动之后呢,我们先把它启动一下,好等待一下。 ok, 我 们的环境已启动好了,然后点击查看 notebook, 我们就进入了一个类似于网页代码编辑器的界面了,大家要注意啊,包括一小时没有操作,会自动关闭,所以大家跑训练的时候,偶尔要在网页上去点一点,或者是写一个自动刷新的脚本,千万不要什么你辛苦跑了一下午,回头一看,连接断了,模型权重全没了,那时候你真的会想,嗯,砸你的键盘的。 当然了,如果你是用的本地服务器,或者是你习惯用 club, alt dl 这样的其他的平台,不想用摩搭也没有关系。那下面这个依赖安装就是专门为你们准备的, 因为离开了这个摩搭的。嗯,官方镜像,你的环境大概率是少了一些东西的。想跑通整个代码呢,你必须把这几个核心库给安装好。 首先有 transmos, 这是大模型的基础设施,然后 pft 这是关,这是专门管 luo 适配器参数的库。最后一个是,嗯,能帮你做量化,帮你省显存。 大家在自己的机器上去安装这些依赖的时候,就用我给你的这一个命令,我特地还加了国内的气象员,三选一就可以了,因为你在本地环境安装这些大包,如果不换原的话,那个下载速度啊,能够让你怀疑人生, 加了这个呢,基本上就是秒下。好了,那到这里,我们的环境准备好了,接下来最硬核的一部分来了,开始我们的代码实战。不过呢,先别急着写代码,先养成一个好习惯,要整理一下我们的工作区, 在左边的文件浏览器右键新建一个文件夹,名字就叫 s f t zip。 二一, 待会我们训练出来的模型文件,还有日制数据集,我们都一股脑的往里面丢,如果不整理的话,那跑完这一堆文件是乱糟糟的,你想去复盘都找不到东西。 然后我们进入到这个文件夹里面,新建一个文件,这里你有两个选择,你可以写点 py 的 脚本文件,也可以用 jupiter notebook, 那 我们演示的话呢,就用嗯, jupiter, 因为点 py 文件一跑就是从头跑到尾,中间哪里出错了,你得全部重来。而 jupiter 可以 一块一块的运行 加载模型,这一块没有问题了,那我们就再跑下一块,重复率极高,非常适合我们边学边练。 为了不浪费大家时间,代码我都已经提前写好并且测试过了。接下来我会用我们程序员最喜欢的 cv 大 法,一段一段的考过来,但是每一段的关键代码我都会告诉大家他是干什么的,保证你能够听懂。 大家可以来跟着我的节奏,我们把这个像搭积木一样的训练流程给搭起来。对了,视频里面用到所有脚本代码,清洗好的数据集,还有刚才我提到的环境配置文件,为了防备大家手敲出错,我都已经给大家准备好了,打包好了, 大家可以直接打开就能够看到完整的工程文件,这样课后你在自己电脑上或者是在云端动手操作的时候,直接上传上去,就能够跑起来如打一个,省心啊,主要是希望能够帮助大家在学习大模型微调的路上少走一些弯路。 好了,那么资料在手心里,不慌了。接下来我们回到摩达社区,进入这个模型库,我们可以找到 deepsea 二一,你会看到很多个版本,但是为了演示流畅呢,我们就选择这个,嗯, deepsea 二一, distill 千万一点五 b, 这个模型虽然很小,但是麻雀虽小,五脏俱全, r e 该有的推理能力它都有。点进去之后呢,这里有一个下载模型,我们找到 s d k 下载,这里有一段 python 代码,我们把它给复制下来, 回到 notebook 直接粘贴一下,然后运行,因为我之前跑过系统有缓存,所以,嗯,它瞬间就加载好了,那如果你是第一次运行,进度条可能会走一会,需要耐心等待一下,那么现在我们一切准备就绪了,所以我们来到我们代码的第一步,加载模型并测试。 大家可以看这段代码,这里定义的 model name, 这个路径就是我们在摩达平台上 zip 二一存放的位置。那么这模型到底存在哪里了呢? 我们看一下这个文件夹里面没有,对吧?那怎么办呢?到底在哪里?好,这就涉及到 linux 系统的一个小知识了,我们可以打开一个终端来找一下,在根目录下直接输入 ls 是 看不到我们刚才下载的模型的,只有这两个文件夹,一个是我之前创建好的,一个是我刚刚跟大家一起创建好的。 因为摩达社区默认把模型存在缓存里面了,所以我们需要输入 ls 杠 a。 有 没有看到这个带点的 catch 文件夹 在 nex 里面,再点的都是隐藏目录,模型就藏在这个里面了。接下来我们就来玩一个剥洋葱的游戏,一层一层点进去,我们输入 cd, 点 catch, 就 进入到这个缓存了,然后我们再查看好进入 model scope, 继续 好再下一层 models 看到没有?有 deep seek ai, ok, 那 我们再进入这个文件夹,好看到这个 deep seek r e distale, 千问一点五了吗?这个文件夹就是我们刚才下载下来的,这时候我们只需要在这里输入一个 p w d 命令,把这一长串的绝对路径复制下来。 然后我们回到我们的 python 代码里面,把这个 model name 的 变量替换成我们复制的那一个路径就可以了,我把它给粘贴一下,大家注意看,这一行代码末尾有一个 qq 的, 这是什么意思呢?它的意思非常直白,就是把模型从内存搬运到显存里面去。 如果你是跟着我刚才的步骤,用的是摩搭的免费 gpu 环境,或者你自己有 n 卡,那这句话千万不要动,必须留着,因为只有进了 gpu, 我 们后面的微调才能够跑起来。但是如果你在本地用的是没有读写的轻薄本或者是 mac 电脑,你就把这个 toku 的 给删掉就行了,让它在你的 cpu 上慢慢跑。 不过呢,说实话啊,我们今天做的是微调训练,纯靠 cpu 跑的话,那个速度可能会非常慢,所以强烈建议大家还是要去蹭一下免费的云端的 gpu 啊。那我们就简单的来运行一下, ok, 模型加载成功, 接下来我们得给他准备教材,所以我们的第二步是制作数据集,我这里准备了五十条关于唱歌技巧的问答,数据其实都是大模型生成的,那可以看一下这个格式,一个问题 chrome, 一个回答 completion。 然后我们需要把这些原始数据转换成 json 的 格式,因为这是目前微调最通用的标准格式,也就是一行一个 json 对 象,干净利落。 我先把代码给复制过去,然后呢,把这个括号里面内容替换成我们的数据集就可以了,先把它给弄过来再说吧,因为这根代码很简单,我就不给大家解释了啊。 虽然在实际的大项目里面,我们通常会读取外部的文件,但是因为我们今天只有五十条演示,数据量非常少,所以呢,直接写在代码里面反而更直观。我们就不搞那些复杂的文件读取了, 你把它运行一下,很快就完成了。接下来我们第三步,我们需要拆分数据集, 要把它分成训练级和测试级。这就好比我们上学的时候,一般考试啊,老师会把百分之九十的题目拿来做平时的练习,也就是训练级,剩下百分之十呢,作为期末考试,老师要藏起来,这是测试级, 如果模型把考试题都背过了,那他就不是真懂,是死记硬背了。所以这一步虽然简单,但是必须要分,我们同样也把它跑一跑。 ok, 数据集总数量是五十条数据,然后呢,训练级是四十五条,测试级是五条,所以我们训练数据的准备工作是完成了, 数据分好了,但是模型他看不懂英文,看不懂中文,他只认识数字,所以我们需要一个翻译官,也就是 token。 这里呢,我们定义了个函数,主要是做两件事情,第一件是拼接,要把问题和答案拼成一句话好。第二件事是进行截断,也就是 tognine 的 性分词。 大家可以看到这个 max nurse 等于五百一十二,这就像是给数据定了一个统一的身高,太长的要切掉,太短的我们要把它给补齐。 padding, padding 就是 补齐嘛, 这样数据才能够整整齐齐的喂给 gpu 吃,同样的运行一下。好啦,看到分词完成,说明我们的训练级和验证级都已经经过透光粒子处理了。 接下来重点来了,为什么我们能够用免费的显卡跑动这个大模型呢?就全靠接下来这两步了。首先是量化,这一段代码就是直接把模型的体积压缩了一半以上,它采用了八倍的量化, 虽然精度会牺牲一点点,但是显存占用直接打骨折好了,量化也搞定了。接下来就是我们今天零成本实战的灵魂 logo 设置, 这一步呢,其实就是在定义我们刚才说的那个便利贴到底要多大,要贴在哪里,大家可以看这一段代码其实也比较简单,这里有几个关键的参数,我给大家讲一下。首先这个 r 等于八,这个 r 叫做质,简单来说,它决定了你的便利贴能写多少字, 数值越大,模型能学到的新东西就越复杂,但显存占用也就越高,数值越小呢,训练就越快。所以我们今天这种轻量级的微调设置为八或者是十六,性价比是最高的,完全够用了。 r laro 阿尔法,这是一个缩放因子啊,我们通常把它设置为 r 的 两倍,它就像是一个音量旋钮来控制微调,对圆模型的影响有多大?最后一个参数呢,就是告诉程序,我们是在训练一个语言,模型是用来做对话生成的,不是搞画图的。 热好了以后呢,我们来运行一下,大家可以看一下他输出的这一行字,这个百分比他只有百分之零点零六一三,对吧?也就是说,只有大约万分之六的参数被训练了,其他的其余的百分之九十九点九四的参数是冻结的。 这就是 law 的 魅力,我们不需要训练几十亿个参数,只需要训练这极小的一部分。这就好比你装修房子,不需要把整栋楼拆了重盖,只需要把壁纸换一下就行了。 好, laurel 的 参数设置完成了,我们最后一步,终于要开始训练了。这里我们定义了个 training arguments, 这是我们的训练控制台。参数虽然很多,但是只有几个是你必须要懂的,否则容易翻车。 首先是这个 output d, 我 们待会儿训练完的成果啊,会保存在这个文件夹里面,可以自定一下。 然后这个 import 等于十,这是训练轮次。因为我们数据少,只有五十条,所以我们要用模型多读几遍,读个十遍差不多了。如果是几万条数据呢?通常跑一到三轮就够了。 接下来这个参数 batch size 等于四,这个叫做显存杀手,意思是每次塞进四条数据给显卡,如果你待会运行的时候报错,提示显存一出了,就可以把这个数字设置为二或者是一, 然后这个,嗯,这个 f p 十六等于处,意思就是开启半精度训练,这开关一定要开哦,因为你开了之后显存占用直接砍半,训练速度翻倍,不影响效果。 好了,我们一切设置完毕,把它给粘贴过去,运行一下, ok, 开始训练了,这个不用管啊,这个不影响我们的训练,他进度条开始动起来了,我们会发现这个损失值确实降低了,他已经学会了我们给他那些唱歌技巧。 好了,那么训练显示训练完成了,那训练出来这些东西呢?来跟我看一下左边的文件区, 你记得我们刚才那个 output door 吗?就是输出的文件夹,找到这个叫做 fine turned models 这个文件夹,点进去,你会看到这个 checkpoint 文件夹,然后里面有几个关键文件。首先是 adapter model, 点 save tens, 这就是我们训练出来的便利贴。 然后这个 adapter config and json, 这是它的说明书。以后我们要使用微调后的这个模型的话,只需要把这两个小文件加载到原来的 deepseek r e 上,它就瞬间变成你的专属专家了。好,这就是我们今天的战利品,大家一定要确保能在这里面找到它。 所以恭喜大家,如果你跟着我一步一步跑到这里,那你现在手头上已经有了一个嗯,懂业务、懂私有知识的 deepseek r e 模型雏形了。 简单回顾一下刚才这二十分钟,其实我们就干了一件事情,就是白嫖。首先是环境白嫖,我们用的是摩达社区的免费算力。 接着是技术白嫖,我们用了 loo 技术,只训练了百分之零点零六几的参数,就撬动了整个大模型,然后结果也到手了。你现在已经跑通了从数据清洗到模型微调的全流程,这一套流程就是现在 ai 工程师的基本功。 最后呢,我想多啰嗦几句,今天我们演示的是教模型唱歌技巧,这只是一个小 demo, 这个技能真正的价值在于举一反三。你把数据换成你们公司的产品手册,那他就是金牌客服。你把数据换成法律条纹,那他就变成法律顾问。 然后你把数据换成 python 代码库,他就成了你的编程助手。在二零二六年,会掉 api 的 人会很多很多,但是能根据业务需求亲手把模型微调好的人,才是行业里真正稀缺的。我希望这期视频不仅是让你学会了几行代码,更是帮你打开了这扇门。

大家好,欢迎回到我的频道,今天咱们来聊一个你每天都在用,但可能完全没感觉到的技术,可以说是你手机里那些信息流能够无限往下刷的幕后大工程。 你刷手机的时候,那些社交媒体上的新内容是怎么做到源源不断那么顺滑的冒出来的?这背后可不是什么魔法,而是一种特别聪明的技术,咱们马上就来揭开它的神秘面纱。 一、什么是 api 分 页?好的谜底揭晓这个技术呢,有个听起来挺专业的,名叫 api 分 页 penguin nation, 说白了,他的想法特别简单,你想啊,服务器要是一口气把成千上万条帖子都扔给你,那你的手机还不卡死? 所以啊,他就很聪明地把这些数据切成一小块一小块的,比如一次给你十条或者一百条。这样一来,服务器压力小了,你的流量也省了,最关键的是, app 用起来那叫一个顺滑。 那么问题来了,工程师们到底是怎么把这个分页给做出来的呢?咱们先来看看一个最容易想到的办法。二、传统方案,基于偏移量的分页 offset based 这是一个虽然简单,但坑也挺多的方案。 这个方法呢,叫基于偏移量的分页,听名字有点绕,其实就是用两个参数 offset 就是 偏移量,意思是跳过多少条 limit, 就是 要获取多少条。他跟数据库沟通的方式就特别直接,就像你跟他说,哎,老兄,前面那五十条我不要了, 你跳过去,然后从第五十一条开始,给我来十条。你一听就明白,这法子最大的好处就是简单粗暴,逻辑特别清楚,写代码也快。 所以呀,好多程序员刚开始都爱用这个,但是凡事就怕这个。但是一旦你的数据量变得特别大,而且还变得特别快,你想想社交媒体上的帖子,那更新速度, 这个简单的方法就顶不住了。它有两个非常要命的缺点。第一个问题,性能 performance。 你想想,你要看第一百页的内容,就得跟数据库说,跳过前面九百九十条。可数据库 他不聪明啊,他得老老实实的从第一条开始数,一直数到第九百九十条,然后再给你后面的。这要是让你跳过一百万条呢?那数据库可就累趴了,你的 app 也就卡住了。第二个问题,更头疼, 数据不一致, data inconsistency。 在 你刷手机的这一秒钟,可能你朋友又发了好几条新动态,你刚看完第一页,准备到第二页,结果新的内容插进来了,整个队伍 都往后挪了。这么一来,你可能就会漏掉几条帖子,或者更烦的是刷到刚刚看过的内容重复数据,这就很影响体验了,对吧?三、进阶方案,基于油标的分页 cursor space 所以 啊,为了解决这些麻烦,工程师们就想出了一个更高级也更优雅的办法,咱们可以给它起个外号,叫它是书签法。 这个方法的学名呢,叫做基于邮标的分页 cursor based penation。 这里的邮标,你就可以把它想象成一个真正的书签。他不再跟数据库说你给我挑过多少条,而是直接告诉他, 你看,我上次读到这个书签这儿了,现在你从这个书签的下一页开始给我看就行, 这个书签是独一无二的,绝对不会搞错位置,整个过程就变得特别丝滑了。你的手机客户端每次跟服务器要新内容的时候,都会带上自己手里的那个书签。服务器一看到这个书签 哦,他就立马知道该从哪开始找了,完全不用从头数数。找到新内容之后呢,他会把这些内容连同一个新书签,也就是这一批内容里最后一个帖子的位置,一起发回给你, 你下次要内容的时候再用这个新的书签就行了。这么一来一回,数据就保证了不多也不少,非常准确。 那这个书签到底是个啥呢?其实很简单,它通常就是每条帖子的一个独一无二的编号,也就是 id, 或者呢,也可以是帖子的发布时间,也就是时间戳 times, 不 管用哪个目的都是一样的,确保这个书签是稳定而且唯一的,这样服务器才不会找错地方。四、巅峰对决,谁是王者? 好了,现在咱们两种方法都看过了,一个是简单粗暴的跳术法 cursor, 那 么是时候 让它俩正面 pk 一下了,看看谁才是真正的王者。这个结果可以说是毫无悬念了。性能上,书签法不管数据有多少,速度都嗖嗖的,一直很快。 而那个跳述法呢,数据一多,页数一深,就慢的像蜗牛。一致性上,书签法非常靠谱,保证你看到的数据不多也不少, 跳书法呢,就可能会丢三落四,或者给你看重复的。当然了,天底下没有完美的事,书签法写起来确实要比跳书法麻烦一点,但是为了我们能刷的爽,这点复杂性绝对是值得的 总结。所以咱们今天这个小课堂的核心结论是什么呢?一句话总结,只要你处理的是那种又大又变飞快的数据集, 比如社交媒体信息流,那就别犹豫,直接用书签法,也就是基于邮标的方法,它带来的那种稳定和快速的体验,绝对能让你忘了那一点点代码上的复杂。 其实啊,像 api、 分 页这样的技术,在咱们的数字生活里还有很多,他们就像是幕后的英雄,默默的工作,保证了我们每天的体验。那么你有没有想过,在你每次滑动屏幕点赞的时候, 背后还有哪些我们看不见但又特别巧妙的设计在起作用呢?这个问题我觉得特别值得我们保持好奇心去探索。 好了,今天就聊到这里,如果你觉得这个视频还有点意思,欢迎在评论区发表你的看法,如果你从这个视频学到了新东西,请点赞、关注、收藏并转发给需要的人,谢谢!

在网页上怎么来粘贴一张图片?我好像又长胖了,来吧,比方说截张图,哎,然后呢,粘贴你看就粘贴过来了,甚至呢,他是可以在操作系统级别上去复制一张图片,然后呢直接给他翻过来。要实现这样的效果的话,你需要用到一套 api 啊,叫做 cleveland api, 这套 api 呢,不仅能够实现这样的效果,像很多的常见效果呢都能实现。比方说像这个,呃,有些文字可以把它想象成一篇文章吧,然后呢,当你要去复制这篇文章的时候呢,你会发现一个神奇的现象,你复制出来了是这么一个玩意儿。 然后呢,比方另一个效果这里呢,有些文字,哎,我点击了复制过后呢,然后去粘贴,粘贴过来了,他后边加了一段文本,比如说同学们经常去复制一些代码,是吧?应该深有体会。他后边加上一些版权信息。 还有一种情况呢,就是你在进入某些页面的时候呢,他会直接把你目前复制的内容呢给你读取出来,哎,这种情况是什么情况呢?就比方说你在某音或者是某宝里边去分享一些东西,分享到某信过后呢,就变成一段文本了。然后当你去复制了这段文本过后,再一次进入某音或某宝的时候,他就能知道你复制的是啥, 然后进入到相应的商品页面。那这一块呢,就涉及到读取复制的内容,这些东西啊,全部都可以通过这套 a p i 来完成。而这套 a p i 呢,非常简单,它就提供了一个对象,两个事件,这个对象呢,它的位置在 navigator, 就 浏览器这个对象里边,它有个属性,叫做 clickboard 剪切版,它就是个对象。哎,这个剪切版啥意思呢? 剪切版啥意思呢?你可以把它看作是一个操作系统级别的内存空间。它是操作系统级别的啊,它是跨越所有应用的,任何应用或者是用户的操作,都有可能往这个剪切版里边写东西,写一个文件,写一段文本, 然后在某些时候呢,一些其他的应用或者是一些操作,可以把这个东西呢读出来,就那么简单。所以说这个 keyboard 的 对象啊,它提供了两个方法,一个呢,就是往这里边写,一个呢,就是往这里边读,对吧?它两个方法对应的东西呢,是 read 读或者是 read text, 读一个存文本, write 写或者是写一段存文本。因此呢,你看这个效果就非常简单了,对吧?这个效果在干嘛?无非就是读呗, 让你看一下它代码,非常简单,就是读一段文本。这个返回的是一个 promise 啊,因此呢,你要等它完成。为什么是返回 promise 呢?因为这个读啊,它是涉及到用户隐私的。你读的是用户的剪切版啊,你 鬼知道它里面保存了啥?它涉及到了用户隐私,因此呢,在用户第一次访问你的站点的时候呢,他会问你啊,是否允许这个站点读取你的剪切版?你看这里呢,我是已经允许过的,允许了之后呢,这个 promise 呢,才会完成。然后呢,你会拿到它剪切版里边的纯文本,拿到纯文本之后,你爱玩什么玩什么,你干什么都无所谓了。 我这里呢,只是做了一个简单的例子啊,把它显示到页面上,好,这是一个对象,除了对象之外啊,这个 api 呢,他还给我们提供了事件,一个事件呢是 copy, 一个事件呢是 pass。 copy, 顾名思义就是用户在进行复制的时候,他会触发这个事件。 pass 呢,是用户在进行粘贴的时候,他会触发这个事件。咱们来看一下其他的例子,比方第一个例子,当用户要复制这段文本的时候呢,他就会触发事件,你看我是怎么来处理的啊?非常简单,当他复制的时候呢,我不准他复制的默认行为,那么用户的复制操作失效,不管他是怎么复制的, 右键也好,还是 ctrl 加 c 也好,都失效了。然后呢,我手动的往剪切板里边写出一段文本,要写出这段文本,因此呢,看到的现象就是用户明明复制的是这些东西,一复制,但是粘贴出来呢,是另外的东西,因为他的复制呢,已经被阻止了。我往剪切板里边写出的是别的内容。然后再看第二个例子呢,第二个例子里边有一个按钮,你看 有个按钮,我这里复制过后,是不是加入了另外一段内容,是吧?也很简单,就是我去监听这个元素的,点击事件就复制按钮的。点击事件,点击过后呢?我做啥呢?我手动的往剪切版里边写入的是文本框的文本,然后呢,再加一段内容就完事了,这个 a p p 是 非常简单的啊。 然后呢,最后一个例子呢,就是粘贴图片了,其实也不复杂啊,咱们看一下代码。首先呢,页面上呢,要准备好一个附文本框,也就是一个普通的 d i v, 它的内容呢,是可编辑的,因为这一块呢,你要是准备的是 input 元素啊,或者是 textarea 啊,它里边也不能放置图片啊,你图片只能放到一个容器里边,所以说我准备的是一个附文本框啊, 然后呢,就监听这个文本框的粘贴时间,就是要往这个文本框里边粘东西的时候呢,它会触发这个时间,而我要处理的是普通的文本,我处理它干啥呀?不处理了,我只处理它粘贴文件的情况。 那我怎么样知道你是在粘贴文件呢?其实靠的是这个属性啊,事件参数一里边呢,有一个 clickboard data, 表示你的剪切版数据,这个数据里边一个属性叫 files, 表示你复制的文件,它是个数据库,因为你可以复制多个文件嘛,当这个数据库的长度大于零的时候,那么就表示说你复制的是包含文件的, 那么我就要进入进一步的处理。首先呢,我阻止了默认行为,就不允许你直接粘贴文件,而要干嘛呢?还要进行手动处理,你看怎么来手动处理的啊?把这个玩意打印一下,一点 color data files 打印看一下就知道了啊,保存现在呢,比方说我截个图,打开控制台啊,好,现在粘贴 得到的是一个尾数组是吧?他第一个呢,是一个否?我对象表示你粘贴的是一个文件啊,因为我这个图片本身是一个文件吧,对吧,不管是截图的还是在本地复制的图片,都是一个文件。那么这种情况下呢,我阻止你粘贴,那接下来怎么处理呢?接下来处理的方式太简单了,跟那个 clickboard 都无关了,就是一个纯粹的否我对象,你如何把它显示到页面上的问题了? 达到这个 friend 对 象后续的还用说吗?经常来听我短视频的同学,这个代码应该是都快看吐了。得到一个文件提取器,然后去读就完事了。读完了过后得到的是一个 data u i o。 然后呢,创建一个图片元素给它加到这个 diav 里边去就完事了。所以说最终的效果呈现出来呢,就可以粘贴图片了。好介绍一下这个颗粒 board api 啊。

有很多小伙伴获取了这个工具之后,不知道怎么使用啊,然后我现在做一个简短的小教程,就是你如果你第一次打开这个软件的话,点开右上角的设置,然后在设置这里面输入 api, 如果没有 api 的 话,点击这个获取 api, 然后具体的怎么获取,我会做一个图文的讲解,到时候发给大家。然后获取到 api 之后,你就把 api 粘贴到这个软件里面, 然后下面的话默认就选模型一不用管就可以。然后你再设置一个自动保存图片的一个路径,然后这个路径的话就是生成图片之后,然后会自动保存到这个文件夹,然后你都设置好了之后点保存, 然后这里有很多可以选的模块,就自由编辑啊,随机海报啊这些,包括产品海报,产品详情这些, 然后他们所有功能的逻辑都是一样的,然后我们就拿这个产品详情举例,然后产品图片这里你就至少要上传一张啊,然后设置的是最多三张,然后最少一张。 你上传图片之后,这里主标题一定要写的就是你这是一个什么东西,或者你是一个什么品牌,写在这里, 然后副标题的话可以写一些卖点啊,作用啊,产品的功能这些,然后你不写的话也可以生成, 然后产品名这些也是可选的,你可以写建议你写啊,就是你如果把这些都写了,写的越详细,他最后效果就越好,那我现在就写一个,他的效果可能就没那么好啊。 然后你都写了之后,就选一个图片的比例,然后就可以点击立即生成,然后他就会给你整套的详情页,包括这边有一个拼好的长图,然后你这边就是可以下载保存到你的本地电脑, 然后当然他你设置自动保存的话,他自动会保存到那个文件夹的。然后后面这个软件的正式版出了之后,我会出一个更正式版的教程,感兴趣的记得点一下关注哦。

最近,一个名为 outretrack 的项目就系统构建了一个超高质量的对话数据集。项目作者尝试用两个独立的 jpt turbo api 进行对话,从而生成多轮对话数据。具体而言,该项目只在构建一个开源、 大规模、多轮的、基于 turbo a p i s 的对话数据,方便研究者开发具有通用对话能力的强大语言模型。 此外,考虑到隐私保护等因素,该项目不会直接使用互联网上的数据作为提示。为了确保生成数据质量,研究者在生成过程中采用了两个独立的 gpt turbo api, 其中一个模型扮演用户角色来生成问题或指令另一个模型生成反馈。

今天给各位老板出一期在新版清检客服中, api 令牌如何绑定?先给大家解释一下什么是 api 令牌? api 与令牌要分开?介绍什么是 api, 不 同软件之间的翻译官。举个例子,你在美团点外卖时,美团 app 需要获取餐厅的菜单、库存、配送费等信息, 但美团和餐厅的系统是分开的,怎么让他们对话? api 就是 他们的翻译官。什么是 api 令牌?还是以餐厅为例子?令牌是使用 api 通道的身份凭证,就像餐厅只给美团、饿了么等合作平台发门禁卡,只有持令牌者才能通过 api 获取信息。 一句话总结, api 等于软件之间的对话通道,让功能互通。 api 令牌等于这个通道的钥匙,保证只有授权者能用。现在我们再来看看清检客服的 api 令牌该如何绑定。 我们来到首页,打开机器人管理界面,找到 ai 配置,就能看到 api 基础地址,下面是 api 令牌,点击获取令牌会跳转到算力符网页,点击左边栏的令牌,找到添加令牌, 设置好相关参数,一个专属你的 a p i 令牌就设置好了。回到 ai 配置页面,将令牌复制即可,点击测试,看是否连接成功。
