粉丝65获赞2284

近日,豆包一点五 pro 超前体验豆包新一代音频视频创作模型,能够支持生成声音与画面相匹配的有声视频功能,音画同步,配音口型 音效可同时搞定。还会根据场景以及描述的提示词,自动调整视频的视角、运镜、景别等,能够使视频更加丝滑流畅,使画面更自然。还能精准音画同步与多语言方言支持,通过简单描述直接生成电影级运镜控制。接下来我将教大家如何使用豆包生成音画同步的视频。首先打开豆包, 点击开始创作,点击视频生成,点击参考图,先上传一张图片,使用豆包模型一点五 pro 输入简单的视频描述与台词,我输入的是拉布布,向镜头前招手,使用粤语说话,豆包就会所描述的内容。直接生成一个带有自动配音与自动生成背景音效的视频,一次就能搞定, 无需多抽卡。我还生成一个 b g d 娃娃的剪刀手的视频,背景音效都是自动生成。还有这个运动员的音效也是自动生成。 看看这个运动员的运镜,只是简单的描述,就能够直接生成丝滑流畅的运镜效果,滑雪动作自然流畅,双人对话的也能够精准的分清, 自动对应双人配音。我还在制作了一个直播带货的视频,口型表情很到位,精准抓住介绍产品的痛点,还可以用于短距离。像这种带有强烈情绪的微短剧剧本最考验 a a 的 逻辑,只是通过简单描述便可直接生成,达到想要的效果,这眼神里的空洞太真实了,非常的自然。 豆包这次升级直接一口气把精准音画同步、多语言方言支持和电影级运镜全部点满。最后我们一起来看看成品效果吧!你好,我叫莱布布 茄子, 中午你想吃什么?妹妹,我想吃麻辣烫,要特辣。 this is the new hand cream it has a really cooling feel when you apply it。 祝卿得偿所愿,来世定不再相遇,误了你我。

刚刚我发现了豆包手机有一个特别逆天的功能,到底有多恐怖?给大家看看啊!豆包豆包,打开向日葵,然后呢,再在图库上找到第一张图片,识别图片里面的验证码,输入进去,控制我的电脑,在电脑桌面上打开 i g 浏览器, 大家到底看看有多吓人啊?他先啊打开了向日葵,然后 查看了我的图库,找到了第一张图片,看它识别记录了这个验证码的信息啊,然后找到返回到向日葵,点击控制,看能不能控制, 看厉不厉害。用豆包控制电脑了,而且是用语音控制的,点击按键,你看它识别到了这个桌面的按键, 看能不能打开啊,等待按键打开,双击六不六,牛不牛?是不是很恐怖?

今天给大家分享一个豆包手机同款的开源项目,也就是最近特别火的智普,他们开源的 open oto g l m 是 专门用于控制这种托管手机的智能体。这个是一个框架,也是一个项目,但是这个总体来讲它的亮点大于实践, 主要有两个比较大的创新。第二个就是他们这个框架是可以进行这种手机的 连接,其实它跟按键精灵是差不多的,甚至它比按键精灵要小或者简单很多,实现了电脑和手机的远程操作,可以直接连 usb 或者直接在一个 wifi 里面就可以进行对接和联通。 我也详细梳理了一下这个项目,它开源的话其实并没有开源特别多的东西,像一些 memory 记忆体啊,这些记忆模块都没有开源,而且它只有一个智能体模块,它更像一个 simon, 而不是实际的一个项目。因为他在去年的时候其实是呃发了一个 app 的, 也是 otoglm, 但是在后面就没有特别多的推广了,而且效果也一般。 但是由于这一次豆包手机大火了之后,他借着这个风也做了开源,让大家也看到了这个项目。 我们详细来梳理一下这个项目。首先它的主要的架构就是你可以支持用它自己的本地模型,当然它都是使用的这种 best url 的 方式,你可以用本地的,也可以直接用现成的,但是那个模型必须要支持能元素定位, 现在币源的模型几乎都可以多模态的,最近的微软也开源了一个三 b 的 模型,应该性能也是蛮不错的,做元素定位,而且思考的模型 应该性能也是蛮不错的,但是他没有跟这个模型做一下对比,不知道他们九 b 的 这模型跟这个微软开源的三 b 的 模型比起来怎么样,应该大差不差,因为微软这个模型稍微小一点点,但是测试起来效果还是蛮不错的,而且小了之后才能在我们这种本地的这种显卡上面跑。九 b 还是挺大的,不算小了, 但是他有量化的,不过肯定是需要二十四 g 才能跑的,三 b 的 话做一些量化操作的话,也是可以让他实现在十二 g 内存上面跑的。 我重点比较疑惑的就是它到底有哪些工具和它这个智能体,它是什么样的一个智能体?它智能体只有一个智能体,然后我也没有 memory, 也没有记忆的规则,然后主要就是典型的 react 智能体, 整个流程就是典型的感知、思考、行动的这样的一个循环。然后每一次它做任务的时候或者下发任务的时候,它就会把整个 手机的系统去构建一个上下文,他的系统有什么应用这些,还有他的截图,就构建这样整体的一个上下文,加上你的一个任务规划, 然后他通过思考思考了之后去规划出来一个计划,然后去做执行,每一次执行了之后,他再进行一次思考,然后再进行执行,直到完成任务为止。当然他还有一些敏感操作,比如说验证码,比如说 要进行付款呀,这个是要人工介入的,它会主动的提示你们,我重点是想要知道它有哪些工具,或者可以执行哪些操作,是怎么样执行的?然后我就让它梳理了下,我是用的这个 deepweek 来做的,梳理它的工具也 跟按键精灵是差不多的,甚至比按键精灵要简单很多。首先就是启停指定的应用,然后手机上面关键的那几个按钮,还有就是滑动输入文本,返回上一页,还有点击,这些都都是可以的, 主要用的就是滑动文本和点击这几个,然后启启停应用,切换应用,这都是标准的按键精灵里面的东西。然后就是操作他的其实是一个相当于方寸扣领,点击某一个按钮去调用这某一个工具,然后有一些比较标准的规则, 应该执行前要检查应用,然后最多呢连续的等待三次,验证这个操作是否可以 进行操作。然后就是完成之后检查一下它的准确度,其实整体看起来它是一个 demo 的 形式,它并不是一个特别完整的项目,只是一个 非常简单的 demo, 稍微复杂一点的可能就是它搭起来了这样的一个框架,你自己可以去加一些 memory, 或者说加一些什么东西,然后我去可以放在你的手机里面,可以进行继续的二次开发。 总体来讲这个项目还是不能直接拿来做实际的运行的,可以做二开,这个是可以的。然后我都还专门让它梳理了一下它的记忆模块有没有,它是没有记忆模块的,它只有它模型上下文 token 的 这样一个上下文,然后这些提示词它都是用的中文呢?然后必须遵循的一些规则, 这些提示词其实还可以拿来做一些借鉴这些智能体的提示词借鉴还是蛮不错的。还有像这些执行动作某一个 app, 然后这就是它们方选透的一些东西了,当然做成 mcp 其实也是可以的。

豆包学习哥哥今天老师要给大家介绍一位超厉害的学习伙伴豆包,他就像一位无所不知的智慧导师, 能够在各方面为我们提供帮助。接下来老师就带大家创建一个专属的高值学习规划师。首先我们点击豆包工具栏中的我的智能体,然后选择创建 ai 智能体。 智能体创建好了,我们要给他为一些学习数据,这样他就能够更好的为我们服务了。先上传一份课程表,再输入已修课程成绩 看高池。学习规划师马上就根据这些信息生成了每周的学习计划,还针对薄落学科给出了详细的学习建议。准备机械设计竞赛的同学,他们通过在豆包上查找资料,在小组英语戏剧表演项目中,同学们借助豆包完善剧本。 这些案例都证明了只要我们善于利用豆包,它就能成为我们学习的强力助力。在不同的学习场景中,豆包都展现出了独特的优势,它就像是一个百宝箱,里面装满了各种学习资源和工具。


上一期视频我展示了使用 auto g l m 让 ai 去控制手机进行 ipad 购物笔架并且加购的动作。最近,我在它原本功能的基础上增加了更强大的 a 帧框架,使它可以进行更复杂的任务规划。今天我给他一个更有挑战性的复杂任务,这个任务是 他到底能不能驾驭的了呢?一起来看一下哦。可以看到,他现在在进行了一些基础的任务规划。他决定去打开点评 哦。他开始去搜索日料餐厅了, 他决定去搜索的关键词是京安四日料。 他决定去设置价格区间来调整这个进行筛选。我选中了一百到两百。我这里面其实已经有一个可以符合要求的 叫做鸟屋。他正在试图去提取地址 点击,他决定去点击了,嗯,但他选择的是一个阿武桌日本料理啊。并不,我们可以可以看到他并不符合我们的这个要求。可以看到餐厅的主要信息是评分四点八,人均消费一百八十四。他并没有,他并没有意识到自己选错了。 走开,走开走开。哎,可以看到他输入了徐家汇 好,并且他获取了这个拍摄获取的时间。 他竟然点击到了我的公众号里面去点错了。我这边退出来。他找到了妈妈的聊天记录,一个对话窗口,然后 好。最后他像一个真正的私人秘书一样,把收集到的所有碎片信息整理成一份完整的邀请发给妈妈,请他去吃午饭 哦。然后他的任务完成了,我们可以看到手机这边就不动了。他最后在这边给我打印出来了一条, 呃,一个完整的执行报告,包括使用了多少时间,以及他看了是什么东西,交通信息是什么,餐厅信息是什么,以及微信的信息是什么,最后给了一个完整的汇总 整个过程,整个过程呢耗时两百七十八秒,也就是四分半左右,这就是给模型增加了前额叶皮层,也就是任务规划器之后更加完整强大的手机 agent。

如何让 ai 来控制你的手机,帮你做事情?之前豆包手机这么做了,但是后来遭到了很多限制,于是给他哈普这么一个项目火了, oppo gm, 我 们直接来看一下效果,这里我让他打开抖音,给影视巨峰的随便一条视频点一个赞, 现在可以看到他是一边思考一边执行,经过一段时间的等待之后,可以看到他成功的给视频点了一个赞,这时候程序就可以宣告结束了, 那么我再试一下,打开微信,帮我给好友 lbi 发一条问候消息,但是我不说具体的消息内容是什么,让他自己生成,再次运行看一下效果,也是成功打开微信了。接下来他来到了搜索界面,输入好友的名字,查询到了好,点击在聊天框打字,最后点击发送。 好了,那么以上就是这个项目的体验,感兴趣的话大家可以自己去尝试一下,不知道你看完这个视频的感受是什么呢?

今天让我们一起探索一种超厉害的方法,借助指令,让 ai 全面接管手机,按照我们的指令自动打开微信,然后在视频号里给视频点赞。整个过程无需人工对手机进行任何干预,而且还能同时操控多台手机,高效又便捷。 如果传言不灵,和你说话,要你敬聆者。邪气愈重,请安在玄冥地府,二十七个步骤都有这样的,如果传言不灵,和你说话,要你敬聆者。

打开抖音搜索美女主播,给前三名点上关注, 如何安装,你也不需要去一步一步的操心怎么写指令,你直接把这个地址,直接把这个地址扔给啊切克 ppt, 或者扔给啊通讯签文,扔给豆包,他直接帮你生成一个安装的一个指令,但首先是安装那个对,安装 python 相关的一个环境, 那我们需要去安装一个 v o m 的 一个啊框架,然后再去下载一个模型,对,然后直接啊可以在本地啊启动服务,对,我们还要在手机中去安装一个 a d b 的 一个啊驱动,然后打开 usb 的 一个调试, 那就可以了。安装的过程中你直接的遇到任何的问题报错,然后直接丢给 a, 然后他会对直接帮你去啊找到一个相关的解决方案。

可能以后我们人与人之间比的不是谁,抖音有多少粉,比的不是视频号有多少粉,比的是一个新的东西。来给你们看一下现在 字节跳动公司,也就是抖音的公司,他已经做了一个豆包这个工具。豆包这个工具呢?你可以自己开发一个人,你自己开发一个人,你用这个人去帮你吸粉, 来给你们看一下,投一下屏,已经有人驯化了。潘金莲,来,我们找个男生来体验一下这个男生。你过来。金莲,你为什么害死武大郎? 我也是被那西门庆给迷惑了,他又有钱又会说情话,我一时糊涂就做了错事。那你杀死武大郎之后后悔吗?嗯,我后悔啊,后悔没早点跟大郎离婚,要是离了婚,我跟西门庆在一起也不会害死他。 那你现在有跟西门庆在一起吗?准备跟他在一起过多久呢?一辈子吗? 哼,我现在跟谁在一起也没用了,武松回来了,他知道了我害死大郎的事,他不会放过我的。 好了好了好了,咱们就先演示到这里了,所以各位你要搭建一个你的人工智能,你要搭建一个你的这样的账号,你就可以吸粉,这是下一个市场,现在已经有人在干了。 如果你是做自己独特行业的服装设计师,你是做自己独特行业的餐饮烹饪师、厨 师,你有一技之长,哪怕你没有一技之长,你可以创造一个虚拟人物,在全网找一些素材去喂养他。就哪怕现在他们已经在借古代的一些名人,然后去打造数字人了,打造这个人工智能的机器人了, 其实就已经在领先一步,在抢粉丝了,听懂了,渣渣挥手,这是一个新的商机,如果你还不抓住你就好比当年没抓住微商。微商简不简单? 天天往朋友圈发信息就可以了,拼命加人就可以了,拼命拉群就可以了,那现在的人工智能简不简单?太简单了,我今天教你们的做图片太简单了,小学生都会做,教你们的聊天太简单了,小学生都会做,但是需要你第一批参与进来,这里面才会有保障,被你挖住,对还是不对? 很多人说,老师,那现在人工智能趋势那么大,我能做吗?各位,全中国十六亿人使用微信的人有十二亿,请问现在真的有下载豆包,每天都有用豆包或者用任何一款人工智能软件的人,你们觉得全中国有多少人? 一亿都没有,甚至一百万都没有。兄弟姐妹们,大家是因为有这个福报, 是天选之子,所以能够链接到我们的周老师,而周老师有一颗大爱之心,所以在第一时间就给大家来普及,来宣导 ai 人工智能的时代已经来临, 如果你不关注新闻,你不知道任正非在宣传宣导,你不知道雷军在宣传宣导,而今天周老师离我们很近,所以我们才有这样的机缘和机会,成为全中国第一批使用和借用人工智能,抓住人工智能趋势,让自己生活和财富变得更好的人。是还是不是? 所以你会给别人带来价值,怎么办? 你就用人工智能代替你的人脑,为别人带来价值。赚钱的本质就是给别人提供价值,你没能力给别人提供价值, 你过去提升能力需要寒窗十年苦读,今天你有了人工智能,你会用人工智能可以写音乐,可以写歌词, 可以写演讲稿,可以做照片,所以你就成为了一个会借用人工智能给别人带来价值的人。钱是赚给你的,因为人工智能他也不会收钱。听明白的家人挥挥手, 所以大家一定要搞定流量好不好?所以这些 ai 的 工具我们一定要学会,好还是不好?