粉丝55.1万获赞128.2万


今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。

兄弟们,我直接白嫖到一年。 germany pro, germany 三,谷歌的大模型,目前是市面上最好的大模型之一, nasa 强大的升图功能, vol 三升视频的功能直接就可以用了。 废话不多说,我们直接上干货。第一步,我们准备好魔法和谷歌邮箱,我们先用谷浏览器进入到自己的谷歌邮箱,进入到谷歌邮箱之后,我们进行第二步验证这个资格,那如果出现这个页面呢?恭喜大家你有这个资格了,我们点击 这个验证资格条件。到这一步之后,我们打开一个新的网页,我们再回到刚才的网页,把这个链接复制一下,点击开始验证。 ok, 到这出现成功的 提示之后,我们返回到刚才的这个谷歌的页面,刷新一下,到这里恭喜大家已经这个成功的通过验证,我们来订阅这个 google ai pro, 再进行下一步,到这一步就是绑定自己的支付方式,这里面推荐第二种方式,添加自己的信用卡就可以支持这个 visa, master g c b 都可以。 ok, 添加完支付方式,就跳到了订阅的页面,显示是免费试用十二个月,从一六年十二月开始收费,我们订阅之后一定要记得取消,要不然在一年之后的这个时间点,它就会进行收费了,我们一定要取消订阅, 点击右上角的头像管理您的谷歌账号,我们找到付款和订阅,我们来管理订阅,我们点进去之后要点这个取消订阅。 ok, 到这我们就完成了。升级完 german pro 之后,我们来试一下它的这个升图功能和升视频的功能, 我们分别来测试一下,我们输一段提示词,来看一下他的生图速度怎么样,大概是十秒左右的时间,我们看这个图的分辨率是很高的。我们再来看一下他的生视频的功能是我们提前准备好的,让他生成一个比较有科技感的视频,我们来看一下效果, 嗯,非常不错,那分辩率应该是有一零八零 p 的。 视频中的文本网站资料大家关注后进粉丝群领取哦,群内也会解答大家各种问题,我们下期见。

真心建议现在我们有条件的同学啊,就往人工智能方向发展啊,其他行业真的就不需要考虑了。我从几个三个角度来给你分析一下,你听一下。第一个是从薪资的角度来去分析,那么我们到这个各种志愿招聘啊,或者说,呃,某种招聘网站去看一下现在给到人工智能的薪资是多少钱,对吧? 起薪是不是基本上都是在二三十万的?这样一个普通的开发高一点的,像那种研发这种的,四十万、六十万、一百万都是有的,没错吧?那就我们这边的同学来说的话,就是起薪的话基本都二三十万,这是非常非常正常的。那么高的就像最高的一个目前是多少钱呢?是六十一万,是直接到小棚里面去做 这个自动驾驶的,这个确实是高啊,这是第一个角度,第二个角度的话呢,就是从我们这个企业入职的企业的角度,企业的规模的角度,我们可以看得到 我们人工智能就两种真值,可以做的就两种岗位,一种呢就是研发,一种就算啊,一种就是那个开发,这两种岗位无论是什么岗位,他的企业就不会小了。那你只要是做这个工作,你入职企业就不会小了,除非 你做的就不是这两种岗位啊,你做的是一种垃圾的边缘岗位那种我们这边是没有啊,来这边培训的同学不会做这种垃圾岗位的啊,你到别的机构我不敢说,反正我们这没有。所以说这个从这个角度来说,我们既然要做这个工作,肯定要做一个体面的工作, 出入写字楼,金领、白领,未来,对吧?我们这样发展,这才是我们正儿八经的职业规划方向。第三个非常非常重要,他能火多少年啊?人工智能能火多少年?我不能说像以前那种什么土木啊,建筑啊,或者说一些之前曾经火过的 行业,现在不火了,对吧?或过个五年八年淘汰掉了人工智能,不可能。为什么?人工智能是不只是国家战略,是世界的战略 啊,未来十年、二十年、三十年都能够看得到的,他是会越来越火的。第一是国家的战略,就像十四五十五规划,还有发改委的这样一个文件,这是注定了我们这个方向肯定没有问题。第二个方向就是我们的,第二个就是判断标准就是我们的资本, 资本在里面,对吧?很多很多的热钱在里面,钱在哪里,前途就在哪里,很正常的,对不对?我们不往钱多的地方走,难道往钱少的地方走吗?这是我们普通人必须要做人工智能的啊, 几个理由我相信你也应该能够听得到,很多人就是知道了,之前是做测试啊,软件开发呀,做其他的设计啊等等的。就是听说了人工智能越来越火,之前前两年 觉得有一点苗头,还没有敢迈出这一步,现在就迈出这一步了,就到这里来学习了,而且就是三到六个的时间,基本上都能拿到一个嗯,高薪的 offer 吧,对吧?那么有的时间长一点的,时间短一点, 就是这样一个逻辑。所以说我就真心建议我们普通人能够什么条件啊?就是我说满足条件就是第一,本科及本科以上学历,这个没有办法,人工智能就是如此。第二点,如果说我们是 那个硕士或者说出国的硕士等等这种的话更合适啊。然后来了的话往这个人工智能方向去。呃,学习几个月我们就可以进入到这种高新的行业了啊。

杭州有没有能接 ai 项目的团队?我们最近客户咨询量有点多,团队业务有点接不过来了。如果你在杭州有以下这些能力,那我们可以深度合作一下。 第一,有工程师团队,能开发管理系统小程序、 app 的 能力。第二,有开发智能体的经验,包括但不限于提日词、工作流、 语音克隆,实时对话,还有知识库,知识库最少要做过百万级文字的,其他像 m, c, p, a, to a, react 框架这些都要用过,要时刻能保持最新的技术能力。第三,数字人的能力,能把数字人和知识库做一些结合,低时延回答一些常见的用户问题。如果以上要求你的团队都满足,欢迎来找我,我们约个时间好好聊一聊。

今天带大家白嫖一个小证书, ai 人工智能证书,这个有一定含金量,是人社部和工信部共同颁发的。它的证书语势,市场大量空缺,需求高,也是比较新颖的领域, 上手快,报考也不需要太多条件,考过领取两千多补贴,有兴趣的宝子关注或留下三百三十三。