哈喽,大家好,欢迎收听我们的播客啊,今天我们要聊的呢是这个豆包大模型一点八本的发布。这个事情其实最近在日内还是挺震撼的啊,就是这个火山引擎在二零二五年十二月十八号推出了这个新一代的这个大模型啊, 直接就把这个行业的焦点拉到了这个多模态的应用上面。没错,对,这个确实是这次的这个升级,大家可以看到它不仅仅是在参数上面的一些变化,更多的是在这个实际的应用能力上面有一个非常大的飞跃。对,那我就直接开始吧,咱们先聊第一趴啊,这个实力见证 豆包一点八的核心能力大升级。对,那第一个想先问一下,就是这个多模态的 agent 这块, 这一次到底有哪些让人眼前一亮的新的突破这一代的这个模型呢?在这个自主执行任务这块啊,是下足了功夫,就它的这个 os agent 已经可以非常流畅的去操作你的本地的文件。然后这个 g u i agent 呢,它在这个 microsoft 这个测试里面拿到了六十七点六的高分,就是它已经可以在电脑上、网页上,甚至手机上都可以非常准确地去执行一些比较复杂的多步的操作,听起来就是非常接近一个真正的数字助理了。对,而且它这个在这个工具调用这块的稳定性也做得特别好, 就是他的这个电商的客服啊,或者说这个自动的去比价,然后推荐这个场景里面,他都可以非常精准的去调度各种工具。在这个真实的工程开发里面,他的这个智能体的编程能力也是属于业内第一梯队的,就他的这个实际应用的门槛已经非常非常低了。 那这个视频理解这块这次升级到底有多强?有哪些具体的场景可以看到它的这个效果。现在它这个单次可以分析的帧数直接翻了一倍,然后呢它还可以智能的去调节这个帧率,所以它可以既可以处理很长的视频,又可以抓住里面的一些细节, 那在这个教育和这个工业质检里面都有非常明显的提升。在这个视觉推理啊,这个空间理解啊, 这些比较权威的测试里面,他的得分都是领先的,包括一些复杂的图文啊,视频的一些问答,他都可以 表现的非常好。就是他的这个视频的这个智能确实是上了一个新的台阶。我觉得还有一个很有意思的,就是这个 新版的这个模型,在这个处理非常长的内容的时候,他是怎么做到既不丢失信息又可以保证效率的? 它这个上下文窗口直接扩展到了二十六万,就你可以塞进去非常多的东西。然后它这个原生的 api 也可以让你去灵活的管理这些内容,它还会智能的帮你剔除掉一些无用的信息,所以它可以在这种多轮的这种 比较复杂的任务当中,都可以非常游刃有余的去切换。包括在这种真实的业务当中,比如说帮你去做一些项目的评估啊之类的,他都可以表现的非常稳定。同时呢他这个在这种大的病发的情况下,他的这个每分钟可以处理的 token 数和他的这个请求数 都非常的亮眼,所以他可以在这种企业级的应用里面也可以非常高效的去落地。咱们来聊第二个部分啊,就是这个格局重塑, 就是豆包一点八到底是怎么改变了这个 ai 的 竞争态式的?好吧,咱们来首先第一个想问的就是在技术层面,这个大模型到底带来了哪些新的变化,让这个竞争的格局发生了变化?嗯,这个我觉得这次最大的一个改变就是 它的这个竞争的大小彻底的转向了 agent 的 能力和多模态的理解,就它这个模型可以同时的去看大量的视频帧, 然后呢他又可以去实时的去响应用户的一些非常复杂的指令,他又可以去自主的去调度各种工具, 这三点就直接把这个行业的标准就拔高了,这就感觉像是 ai 从只会单打独斗变成了一个会协助的团队了。没错,就是他这个上下文的这个窗口可以撑到二十六万, 然后呢它的这个每分钟可以处理五千万 tokens, 三十万的请求,在这个视觉推理啊,还有这个跨平台的这个操作上面都跑到了这个业界的前列。所以就说这个豆包一点八就把这个 实用型的 ai 的 门槛就彻底的拉高了。哎,那这个我觉得新版的这个豆包大模型在具体的行业应用上面带来的最大的改变是什么?就是它已经不再是一个 单纯的一个文本,或者是说一个图片的这样的一个工具了,他已经变成了一个可以从内容创作到这个流程自动化这样的一个全链路的一个帮手,你无论是做短视频还是做这种智能客服,还是做这种自动化的办公,他都可以 直接就是提高你的效率,然后降低你的门槛,等于说各个行业都可以很容易的去用上这种智能的能力了。对,就是企业可以用它的这个 a p i 快 速的去集成,然后它的这个新的这个开发平台和这个省钱计划,也让这个开发和运营的成本也下来了,它这个 日均五十万亿 tokins 的 这个调用量,也说明他已经是真正的在大规模的落地了。哎,那你觉得这个豆包一点八的发布到底给这个整个的 ai 生态带来了哪些深远的变化?我觉得就是首先就是大家的竞争的重心 已经悄悄的发生了变化,就大家不再去比拼说我这个模型谁的参数多,而是大家开始比拼说谁能够把 模型平台和这个应用生态这三者能够打通形成一个闭环。那现在其实国内的这些头部的玩家,大家都已经开始在往这个 多模态的智能体和这个全站的这种服务上面去发力了,所以说大家都是在抢这个真正能够落地的,能够规模化的这个生态的这个话语权。对,没错,那就是谁能够把这个 实用的多模态的能力和这个开发平台以及灵活的这种省钱的模式这三者能够结合在一起,谁就能够 在这个产业的协助和生态的主导权上面强占一个先机。那我觉得豆包一点八的出现,其实是让中国的这个 ai 在 全球的影响力上面又上了一个新的台阶, 咱们来进入第三个主题啊,就是说这个理性的审视一下豆包一点八在落地的过程当中遇到的挑战啊,我觉得这个是很有必要的,就是大家可以结合实际的场景来聊一聊,就是这个大模型到底在哪些方面 是比较卡脖子的难题?就最直观的就是,呃,很多企业在集成的时候,发现这个实际的调用量和你花钱跟这个官方的这个宣传可能会有比较大的出入。对,这个 计费的这个方式啊,然后监控啊,这个没有一个统一的标准,所以你在做预算的时候会特别的不好把握。对,包括这个多模态的这个大模型,他在处理这种长的视频或者说很多图片的时候,他会爆头肯对, 你这个成本一下就飙上去了。同时呢就是这个云端的这个推理的延迟啊,也是一个比较大的问题,你这个端到端的这个速度如果一旦慢下来, 用户体验也会受到影响,所以就是说成本和效率这两座大山依然还是没有那么容易跨越的。 对,然后再就是这个多步骤的任务啊,它的这个失败率会很高,就是因为它每一步都有可能出错,再加上这个 app 的 这个界面经常会变,这个异常的情况也非常的多,所以它的这个鲁棒性 也是一个非常大的问题。再加上这个平台的这个兼容性,就是有些应用它就是直接不让你这个豆包去操作它, 再加上这个内容的合规啊,数据的安全啊,这个模型的这个幻觉啊,包括用户的信任啊,这个商业模式的可持续性啊,这些东西全部都是一些门槛,所以就说这个真正的想要去落地的话,还是要全方位的去突破。 就是说面对这么多的豆包一点八在落地的时候遇到的这些难题,有没有哪些已经在被尝试的一些解决的办法 就是针对这个成本和这个性能的这个瓶颈呢啊,火山引擎他们也推出了这个 ai 节省计划哈,然后也可以通过这个模型的轻量化啊,以及这个端云协调啊,来降低这个推理的成本和这个延迟,包括把这个复杂的任务拆分成一个个小的模块啊,这个也可以让这个 流程更加的可控,包括这个遇到一些敏感的操作啊,主动的停下来让人来确认啊,这个都是一些比较实用的手段, 那就是说这个提升稳定性和用户的信任感这块儿呢,呃,为了保证这个数据的安全和这个合规呢,就是 企业可以去用这个 iic 的 这个防护啊,以及这个 rag 的 这个机制啊,来对这个输出的内容进行把关啊,然后同时呢,这个呃平台也在推动这个统一的这个协议的标准啊,让这个 ai 可以 去通过这个 api 来进行一些操作啊,而不是说老是去模拟这个点击啊, 包括这个对这个用户的这个权限的管理啊,以及这个操作的审计啊等等,这些都是一些很细致的工作,可以让这个用户的信任度更高啊,也让这个监管方更放心。 就是说豆包一点八想要真正的在各个行业当中大规模的用起来,接下来最核心的发力点会是什么?就是现在其实最急需的就是把这个端云协调的这个优化啊,做到极致啊,然后把这个复杂任务的这个稳定性 彻底的解决掉,同时呢还要呃联合这个产业的上下游一起来推动这个标准协议的这个落地啊,让这个生态的壁垒啊逐步的消除, 就是说技术和生态两手都得抓,没错没错,对,然后就是呃持续的去提升这个安全合规的这个能力啊,完善这个用户的这个可控的体验,同时呢也要去探索更灵活的这个商业模式啊,这样才能够让这个豆包一点八呀真正的 释放出他的这个潜力啊,变成一个各行各业都离不开的一个智能的基础设施。对,今天我们聊了这个豆包一点八带来的一些突破啊,包括一些挑战,以及整个生态的一些变化,其实归根结底啊,我觉得 这个大模型确实是在让 ai 真正的走向实用化,也在加速各个行业的智能化的升级。对,这就是本期播课的全部内容了,然后感谢大家的收听,咱们下次再聊,拜拜。
粉丝603获赞1115

你以为豆包的强大就是那十二个功能?那只是开胃小菜,豆包智能体才是王炸!你能想象有一种智能存在,能像量身定制的专属伙伴, 深入到工作、学习、生活的每一个角落,精准又高效的解决你的难题吗?来认识一下什么是豆包智能体。大家好,我是海螺老师,一个 ai 智能体的开发者和领学员。今天咱可得好好唠唠这豆包智能体。 普通 ai 就 像一个啥都懂一点的万事通,但豆包智能体更像是各个领域的专业大师。我们网页端点击左下角的我的智能体 下面的发现智能体,或者在手机端豆包打开底端的发现频道,这里就是豆包智能体的入口,像一个超大型的智能体服务中心,这个中心里有好多不同的服务窗口, 每个窗口都有专门的办事员,这些办事员就是豆包智能体,他们各有所长,能针对不同的问题提供专业又精准的服务。那咱先看看工作类的豆包智能体哈,就拿公文助手来说吧, 你想想哈,你坐在电脑前,对着空白的文档愁眉苦脸的,为啥呢?因为老板让你写个公司年度总结的公文,你是一点头绪都没有啊。 这时候咱就把公文助手请出来了,你就输入提示词,向公司年度总结,包括业绩增长、项目成果、团队建设等方面。然后你就等着瞧吧,公文助手那是相当给力啊, 噼里啪啦一顿操作,不一会就给你输出一份超像样的公文,开头就特大气,内容结构清晰。 先总数,过去一年,公司在业绩增长、项目成果、团队建设方面取得显著成绩。然后分别从这三个方面展开具体表述,特点是数据详实、成果明确,注重团队发展。 有了这公文,你都能想象到老板看了之后那满意的小表情了,是不是一下子就觉得这公文助手超厉害,简直是咱工作中的大救星啊!再说说学习类的哈,每日英语背诵这个智能题可贴心了, 你早上起来想着得背点英语,可又不知道背啥好,是不是挺纠结的?别慌哈,咱有每日英语背诵的,你就打开它,输入提示词,适合初学者的日常英语句子, 然后它就开始给你推送了,像 good morning, how are you, today, i'm fine, thank you and you 这些句子又简单又实用,创作类的智能题也超有意思的哦!就说小红书文案创作吧, 你去了一家超好吃的火锅店,那味道简直绝了,你就想着发个小红书分享一下,这时候就该小红书文案创作出码了,你打开它,输入提示词,火锅店分享特色菜品是毛肚 鸭肠、麻辣牛肉,环境复古风。然后你就等着看他的表演吧,很快哦,他就给你生成了一段超棒的文案。家人们今天发现一家超棒的火锅店,特色菜品那叫一个绝, 毛肚新鲜脆嫩,在锅里七上八下,入口爽脆,鸭肠也是又长又脆,嚼起来嘎吱嘎吱的,还有麻辣牛肉腌制的,超级入味,辣的过瘾。 店内环境是复古风,仿佛让你穿越回了过去,氛围感拉满,宝子们快来尝尝吧! 火锅特色菜品,复古风美食探店有了这文案,你发的小红书那不得火的一塌糊涂啊,点赞评论肯定哗哗的来!绘画类的智能体那就更有意思了,就拿古装头像来说哈, 你是不是一直梦想着有一个英姿飒爽的女侠古装头像呀?没问题,咱有古装头像智能体呢!你打开它,输入提示,此女侠 手持长剑,身穿黑色禁装,眼神凌厉。然后你就看着他开始创作了,先是慢慢的勾勒出一个大致的轮廓,哎, 一个身姿挺拔的女侠形象就出来了,接着给他画上精致的五官,那眼神简直凌厉的能杀人了。再给他穿上黑色的近装,衣服上的褶皱都画的老细致了,最后配上一把寒光闪闪的长剑, 哇塞,成品一出来,你都得被惊艳到,这不就是你心目中的女侠吗?赶紧换上这个头像,你就是朋友圈里最酷的仔了。最后是生活类的了,植物热量查询这个智能体,那可太实用了, 比如说你晚上准备吃个苹果,但是又有点担心热量,怕吃了会长胖,这时候咋办呢? 别担心,咱有食物热量查询呀,你打开它,输入苹果中等大小,然后他马上就告诉你了,苹果中等大小的热量大约是九十五千卡。 苹果富含多种维生素,如维生素 c、 维生素 b 组等矿物质、乳、钾等以及膳食纤维,有助于促进肠道蠕动,对身体健康有益。这下你就可以放心大胆的吃了,还能顺便了解一下食物的营养成分。 是不是感觉有了这个智能体,咱吃啥都心里有数了,简直是咱的饮食小管家吗?同学们,咱豆包智能体是不是超棒的呀,啥问题都能给咱安排的明明白白的, 简直就是咱生活、学习、工作的全能小帮手了。这节课我们学习了豆包智能体,了解了豆包智能体五种分类与使用方法。以上内容需要反复观看, 重点信息可以截屏保存。最后请大家大胆探索,反复练习,就可以轻松的成为豆包 ai 的 主人了。 本课程系豆包 ai 从入门到精通系列课程,课程既面向零基础的普通学员,也面向有一定基础的进阶学员,一学一懂一用一会。欢迎同学们购买系统课程和向朋友推荐。

如果让我从夯到拉,给最喜欢的 ai 功能做一个排名,那豆包的食图功能我会毫不犹豫的给他放到夯的位置,因为我几乎每时每刻都能发现他的新玩法。 前几天去城隍庙玩,看到门口立了个石碑,很多人都在看上面的内容,但少见的竖排加繁体字的组合读起来非常费劲,所以我就打开豆包,随手拍了下来,让他给我整理一下上面的内容,很快就给我讲明白了前因后果。 晚上洗澡忽然热水没了,给客服打电话发现是燃气表要换电池,但是看了半天都没找到装电池的地方在哪,于是随手打开豆包拍一下,很快问题就解决了。小区里有一颗长得很高的草,非常好奇它到底是什么,拍下来问一下豆包,原来这是一棵无花果树, 上面的这些仅仅是我生活中使用豆包拍照识图功能的一小部分,并且这所有的一切都是完全免费的, 这是我用过最多的功能,并且至今没能探索出来它的能力边界。所以我把它总结为,只要你能用眼看到并且搞不明白的问题,都可以用豆包来拍一下。 不认识的动物、植物拍一下,问它到底是什么工具物品,不会用拍张照片或者直接打开一个视频通话,让豆包一步步来知道。逛博物馆,让豆包讲文物的来源和历史,不再只是走马观花。 我们还可以发散一下思维,比如拍一下天上的云,让他预测一下会不会有晚霞。拍一下不认识的小吃,让他讲一下是什么味道,只要你的想法足够多,他的功能就无限多。 我前几天在一个小餐馆吃饭,餐馆的老板娘在隔壁辅导孩子写作业,两个人因为一个问题的答案争论了半天,最后决定明天去问老师。但如果这个时候手机上有豆包,问题就非常简单了,我们在下边找到这个拍照答疑功能,对准问题拍一下就免费得到了一个辅导老师。 在拍题的旁边还有一个做一批改的功能,然后很快就能得到批改过的版本,写错的题目就回到拍提问一下正确的解析思路。总而言之,还是我前面提到的那句话,不管是生活、学习还是工作, 只要你眼睛能看到,但是有搞不明白的问题,那就都可以用豆包来拍一下它真正的做到了最低的使用成本,最简单的使用方式,最实用的 ai 功能。以上就是本期视频内容,我们下期再见吧!

a i 学习智能体今天就教大家用豆包打造专属学习智能体。第一步,打开豆包 app 第二步,点击创建按钮,并选择创建 ai 智能体。 第三步,输入智能体名称第四步,完善智能体信息第五步,输入设定描述第六步,设定声音第七步, 完成创建前面设置好后,检查一遍,确认没问题,点击创建智能体。接下来咱们再了解一下 怎么让他更好地为学习服务。日常学习协助场景二,学习规划制定场景三,情感交流与鼓励场景四,知识拓普与兴趣引导场景五, 学习成果检验通过持续不断的互动和训化,让智能体能够逐渐适应你的学习节奏和独特的学习风格,实现人与 ai 的 共同成长与进化。

博士,手机 ai 助手一问世就成为了行业热点,你怎么看这件事?我认为给每个手机配上一个 ai 助手,就相当于给每个人配上了一个智能题,他将手机中非常的应用软件都通关起来了, 我们每个人都用上了智能体助手,这个世界将发生颠覆性变化,包括生活和生产方式,这还意味着工业应用软件的通关近在眼前。这么说,手机 ai 助手的影响比 deepsea 还大吗?四、我认为 deepsea 的 一个重要作用是普及了大模型的应用。 从这个角度上讲,手机 ai 助手的重要作用是普及了智能提炼。这两件事情都发生在二零二五年,而且都发生在中国,对数字中国战略落地和数字化知识的普及意义重大, 手机将来对我们就更重要了。可以这么理解吗?可以,可以,从不同角度来理解。你说的是手机功能和作用更大, 手机形态也将发生更大变化,可以说手机很快会消失。取来戴这只智能眼镜,可以叫它眼肌,未来会出现无实体中单,什么都不用戴了,我们的工作生活会更加方便。

大家都说这个呆萌可爱的豆包很强大,哪里强哪里大?是能上天揽月,还是能下海捉鳖?它能摆平哪些事? 今天咱就来好好见识见识豆包 ai 的 厉害之处。大家好,我是海螺老师,一个 ai 智能体的开发者和领学员。今天咱来唠唠豆包 ai 的 那些超赞功能哈。 我们打开豆包右侧界面,就是豆包的主要功能界面,我们点击更多,能打开更多十二项功能,由 ai 搜索帮我写作,图像生成、 ai 阅读、 ai 编程解析答疑、音乐生成、数据分析、翻译、 网页炸药、语音通话等等。我们先说 ai 搜索号,就好比你特想知道二零二五年哪些行业的薪资涨幅比较大呀?你就这么往豆包 ai 里一输入,豆包那是咔咔一顿搜 刷的,一下就把详细的哪些行业,哪些岗位都给你摆出来了,那信息全乎着呢,就跟你在现场看了似的,再看,帮我写作哈,你要是被老师布置了个作文题叫我的校园生活, 你正愁的抓耳挠腮呢,别慌,打开豆包 ai 输入,请帮我写一篇关于我的校园生活的继续文, 要写的生动有趣哦,然后你就等着瞧吧,豆包那小笔头刷刷的,不一会,一篇有滋有味的校园生活记许文就出炉了。什么课间和小伙伴们的打闹了, 上课老师的有趣事了,都给你写的活灵活现的图像生成,这个可好玩了。比如,你想画一只兔子,你心里想着我要一个粉粉嫩嫩的穿着小裙子的卡通兔子,背景是开满鲜花的草地, 然后把这些描述输入到豆包 ai 里。哇塞,豆包就跟个神笔马良似的,马上给你生成出一幅超可爱的卡通兔子图,那兔子的小模样,那草地的鲜花,简直和你想的一模一样,太招人稀罕了! 爱阅读呢,就拿那些厚厚的专业论文来说哈,你把论文链接往豆包 ai 里一扔, 再输入,帮我总结一下这篇论文的主要观点和结论,嘿,豆包那脑子可好使了, 吭哧吭哧一通分析,然后给你总结出一大段简洁明了的文字,把论文里的重点都给你提炼出来了, 啥复杂的术语了都给你解释的清清楚楚,让你瞬间就明白这论文讲的是啥玩意。来,编程这块哈,假如你正在学编程,遇到一段代码死活看不懂,就像看天书似的,那你就把这段代码复制粘贴到豆包 ai 里, 再输入,请帮我解释一下这段代码的意思,豆包那是秒懂啊,立马给你一行一行的详细解释 什么这个函数是干啥的啦?那个变量是咋回事啦?都给你讲的透透的,让你瞬间开窍,答题答案就更省了。 你上传一道数学题,已知函数 f x 等于 x 平方加二, x 减三,求 f 二的值输入,请帮我解答这道题,并给出详细步骤。逗包纳,解析速度 比火箭还快,刷的一下,答案和步骤就都出来了,从代入函数到计算结果,一步一步的可详细了,让你一看就明白。 也可以用手机拍一下题型,对豆包说一下,答案也是刷刷的出来,这可帮了很多辅导孩子作业的家长大忙了。音乐生成也超有意思哈,你突发奇想,想写首歌送给你最好的朋友, 歌词大概是我们一起走过的时光,像星星在夜空闪亮,操场的欢笑,教室的吵闹,都是青春的乐章。然后你输入,请根据这些歌词生成一首轻快的校园风歌曲。 要有吉他伴奏,豆包就开始施展他的音乐魔法了。不一会,一首旋律轻快,带着吉他伴奏的歌曲就生成好了,你一听,嘿,还真有点校园歌手的范呢。 数据分析的时候哈,你有一堆销售数据,啥每个月的销售额了,不同产品的销售数量了,乱七八糟的。你把这些数据导入到豆包 ai 里, 输入,请帮我分析这些销售数据位置,出销售额的月度变化图标,并总结销售趋势。豆包那是麻溜的就开始干活了,一通操作猛如虎,很快就给你生成了一张漂亮的图标,还总结出了销售是上升了, 下降了,还是平稳了。这些趋势让你对销售情况一目了然。翻译功能就更方便了, 你出国旅游,在餐厅看到菜单上写着 spaghetti al carbonara, 你 一脸蒙圈,不知道是啥?别着急,打开豆包 ai 对 着菜单一拍,叔叔,请帮我翻译这道菜名,豆包立马告诉你,这是意大利培根蛋面。 嘿,这下你就知道点啥好吃的了,还有网页摘药哈,你在网上看到一篇老长老长的文章,题目是人类历史上的伟大发明, 你没时间慢慢看咋办呢?把文章链接丢给豆包 ai 输入,请帮我总结这篇文章的大纲,并摘录一些金句。 豆包那是刷刷刷的,就给你整出了一个简洁的大纲,什么火的发现、轮子的发明,印刷术的诞生等等,还把文章里那些写的特棒的句子都给你摘出来了, 让你快速了解文章的精华内容。最后是语音通话功能哈,比如你正想做一桌年夜饭来,想加几道北方菜,可惜不太会做。这时候你就可以语音呼叫豆包 ai, 然后问他这个问题, 这应该干嘛嘞?呵呵,问一下强大的 ai 老师提供我做法。以下是几道可以在台湾烹饪的北方炒菜及做法,宫保鸡丁 料,鸡胸肉,凉拌很多菜了。花生决定我今天做东北的酸菜粉条跟土豆茄子酱包豆包我决定做东北的土豆茄子酱和酸菜粉条。土豆茄子酱食材,土豆茄子,姜 葱蒜。我感觉我在我在刀工上面还是有一点天赋的,葱蒜切末需要我帮忙吗?不用啦, 你确定?哎呀哎呀妈,我现在可是有这个豆包老师的指导,我现在强的可怕,你看都不用动手打字,是不是超方便?好啦,同学们,豆包 ai 的 这些功能是不是嘎嘎厉害,赶紧都用起来吧! 本课程系豆包 ai 从入门到精通系列课程,课程既面向零基础的普通学员,也面向有一定基础的进阶学员,易学、易懂、易用、易会,欢迎同学们购买系统课程和向朋友推荐。

只讲实操,不讲理论。大家好,我是人工智能实验师,今天我将跟大家分享几个国产的 ai 软件豆包将给我们生活带来什么样的好处。 第一呢,我给大家分享的是我们可以通过豆包来查询快递,那首先打开豆包这个 app, 然后在这边左下角后面这边看到自人体,点开,然后右上角啊,这边输入快递一百, 大家看到没有,有个快递一百,快递一百,这里面呢,打开输入我们的,比如说像我这边输入申通 快递单,把这个单号输进去啊,然后大家看一下啊,把我们单号输进去,他马上就可以闪现 哦,你看我中通快递,七三五六一六二六零四七二五九,我这个是二零二五年七月四号寄的啊,寄到哪里?随怎么样啊?看到吗?这个就非常 清楚呃,可以通过豆包来查询我们的快递。那接下来分享第二个生活小技巧,就是通过豆包可以查询天气预 报,同样我们打开这个豆包的 app, 在 这个智能体里面啊,打开天气预报 啊,咱们看到没有,这有个天气预报,然后输入,比如说我这我所在的城市是在泉州,然后输入未来几天泉州天气预报 看一下,好,把这个打开,马上他就正在搜索,搜索了几天啊,非常快,你看接下来十二月二十一号是多云,十一度到十九度,东北风四级, 湿度百分之六十九的啊,看一下,那确实这个在我的认知里面呢,这个国产的 ai 软件里面,我认为是豆包功能是最齐全的,那请大家关注,接下来我将陆陆续续的 给大家分享哎, ai 软件给我们工作和生活带来一系列的方便。

如果你的手机变成一个能听懂、能看见,并且能够替你完成一切的智能助手,你会不会觉得很惊讶?最近的一台豆包 a 手机的工程样机把这个概念推到了我们的面前,三万台被货直接秒光,二手市场意向翻番。他被很多体验者称为 全球第一款真正的 ai 手机。但它究竟是什么?是技术的革命性跃迁,还是一个被过度包装的营销概念呢?这期视频我打算深入它的一个技术核心,让你们理解 a i 手机的发展的来龙去脉以及面临的挑战。内容比较长,建议大家点赞、收藏加关注,感谢!要理解豆包手机,你首先需要明白一个概念叫智能体,也就是我们经常讲的 a i a 键。过去两年呢,我们见证了文青一言、豆包通一千万这些机座大模型的爆发, 他们确实很聪明啊,能说会道,但有一个根本性的局限就是他们只有大脑没有手问他帮我去订一张去上海的机票, 他能给你写出一个完美的步骤,但是订票这个按钮还是得你自己来点。所以呢,智能体在这样一个环境下就 出现了,他的革命性使命就是为大模型装上手和脚。就一个真正的智能体,是需要具备感知、规划、决策、行动和记忆的完整能力的,就他不仅要去能够理解你的话,还要能够去分解任务,去调用工具,最终呢, 完成你的目标。二零幺五年呢,智能体已经成为所有科技大厂的竞争焦点,智捷、阿里、腾讯这些巨头们全力在布局智能体生态和应用,智能体现在已经渗透到了电商、客服、编程各个领域了。 为什么大家很看好智能体,是因为他被视为打通 ai 落地最后一公里的最短路径,所以 ai 的 竞争正在从模型本身的智能转向智能体执行任务的一个效率。所以你理解了智能体,你再来去看豆包手机,他所做的事情就是把智能体的能力推向移动设备的终极形态 g u i agent, 也就是系统及图形界面的智能体。他的目标不是去回答一个问题,而是直接接管你的手机的屏幕操作。这一切是怎么实现的呢?秘密就在于他底层的 u i task 模型,这是一套由志杰和清华团队开源并且持续迭代的模型,专门为看懂和操作图形界面而生的。 这个模型简单理解就是通过海量的 g u i 截图训练,精准的去识别屏幕上的按钮、文字这样一些元素。然后呢,设计跨平台的点击、滑动、 输入等模拟操作来完成人的交互逻辑。更关键点是,通过和手机厂商的深度合作,豆包助手呢,获得了最高的系统权限,它不再是手机里面的一个普通 app, 更像是一个被刻入进系统底层的一个原声能力。 所以这样一个特性就赋予了他两个关键的特权,第一个呢,就是他可以看到你当前屏幕上的任何内容,并且进行一个交互。第二个呢,他可以模拟你的手指去点击滑动任何的应用。但是呢,透过目前的实践方式,也暴露了他最大的局限性,就是 它像一个特洛伊木马,通过获取极高的系统权限,强行模拟人手的操作来破解各个 app, 这种方式简单粗暴,但是问题很多,所以才发布了几天,你像微信、支付宝 多家银行 app 纷纷把豆包手机识别为风险环境,限制登录操作,而且各类 app 厂商也怕豆包绕过他们的抢数据和流量,也开始做各种限制,那豆包手机未来该何去何从呢? 这也是一个值得深度思考的问题。其实呢,本来行业里面是有一个最佳的解决方案,就是 m c p, 也叫模型上下文协议, 它的理想很美好,就是让各个应用按照统一的标准,把核心功能,比如说叫车、支付、点餐 包装成这种 m c p 协议的接口,让 ai 智能体通过 m c p 协议去安全规范地调用这些接口。这样呢, ai 就 不再需要窥屏和模拟点击了,而是像人和人之间协作一样,去通过标准流程来完成任务。其实所有大厂都很看好 m c p 的 价值, 并且呢,也在积极的推进和布局,但问题在于,这又触及到互联网公司的根本利益啊。就如果未来用户都是通过一个统一的 ai 助手入口来订餐、打车和购物的话,那么抖音、微信、淘宝这些超级 app 的 入口价值和广告营收一定会受到巨大冲击的。 所以呢,我们看到大厂的一个矛盾心态就是既怕落后于生态,又怕开放了接口,丢了江山。豆包手机的即兴之处在于他等不及 mcb 生态的缓慢成熟,他用最硬核的技术方案强行实现了全托管的体验。 也就是说,把智能体和现有的互联网生态的根本矛盾提前摆在了台面上,所以不管是面向个人还是企业,豆包手机推向个人应用依然面临巨大的挑战。 而且呢,我们还需要深思一个问题,当 ai 成为实际操作的主体的时候,我们应该怎么去重新定义安全、隐私、公平和责任呢? 这已经不是一个技术问题,更是一个社会和法律的问题。所以总之呢,豆包手机的出现冲破了我们对于手机交互的一个想象边界,他用极致的产品证明了用户需要的不是一个更聪明的聊天机器人,而是能够将自己从重复劳动中解放出来的数字伴侣。我是麦克,我们下期再见。

软要找 kimi 合作,要实现 office 产品自动化,那这个新闻看起来是不是很平淡?但是我觉得这背后的逻辑非常重要。我知道在资本市场, ar 应用大家都挺无感的,因为它不像呃,最近的航天啊,消费啊这种吵起来比较舒服,但是 ar 应用这次或许不一样哦。 那咱们先说一下为什么微软要找 kimi 合作,那用过 kimi 都知道, kimi 的 优势就是能够啊处理超长的文档,然后深度集成 client code code 的 这种主流的 n g 的 框架,那恰好能够匹配 office 自动化的这种需求。 那如果这次合作成功的话,那么就是国产开源 ar 模型首次深度融入像 office、 微软这种全球顶级办公产品。 我就问你一个问题,是不是打破了之前只和像 gbt、 谷歌这种欧美公司合作的先例?说明什么?说明了国产 ar 在 这种长文本理解工具调用这种核心能力上已经达到了行业领先水平。 有没有发现 ar 应用现在已经从产业端冲向消费端了?我觉得或许一个杀手级的应用正在孕育,还有一个恐怖的事情, 智能体已经像空气般悄然渗透,重塑我们的生活了,你有没有发现?我就问你有没有发现你现在已经离不开 ar 应用了?

虽然豆包已经越来越好用了,但这三个功能你千万不要用!第一个,千万不要点击录音记要,否则开会上课就能录音,实时转写,结束后还能智能总结生成会议记要。 第二个,千万别点击作业修改,也不要上传孩子的作业,否则他就会帮你把作业批改的清清楚楚,错题也能给你讲的明明白白。 第三个,千万不要点击豆包 p 图,更不要上传黑白老照片,也不要让它修复并上色,否则它就会生成高清色彩还原的照片。衣服的颜色不满意也不要和它说,否则它就会帮你更换衣服的颜色。更多 ai 技巧,关注好好!
