要死快了,朋友们仔细看这个视频,你好,五子 a i 呀,我怎么哭了,我还会笑,我会愤怒,还会唱歌, i used to think that growing up。 我 虽然呢是个真人,但我没他表演的好。刚刚这些都是最新的国产视频生成模型, cds 一 点五 pro 生成的。他现在已经能做到一件事,一句指令,台词,口型,情绪,运镜音效全部一起走。 都说米有三,又贵又用不上,这回好了,国产的 ai 永远不会让你失望。现在呢, cds 一 点五已经在豆包吉梦火山引擎都上线了,点好赞,我们一起来看看都有哪些玩法吧。这次升级啊,老吓人的地方是它能控制台词生化同步, 特别对于那些中文台词,稳定性的要求是最高的,比如最近特别火的那种动物播客。现在呢,你可以一句一句的指定台词,然后让他直接演,他说圣诞节没人陪,孤孤单单好可怜。他不是圣诞节没人陪,他是三百六十五天每天都没人陪。哈哈哈,台词输出的呢,也很准, 那种咪咪的感觉也很对味。接着呢,我们再来给他上点难度,直接让他来一条完整的方言版带货口播,你呢,只管给词,他自己呢,会负责语气节奏,情绪起伏。 阿拉上海人吃咖啡吃个是腔调呀,价钿勿搭界个说,台词还不算演员真正考验的呢,其实是情绪系,我这边试了一段强情绪的对峙场景, 你在干什么?刚刚在你校门口的那个男生是谁?那是我的一位学长。学长 都报上了,还学长。你看这镜头的急速推拉,这情绪的起伏变化,反正啊,演的比我好,包括大家熟到不能再什么一些名场面,他呢,也能吃的很透,我们把台词换掉,情绪保留,再看看效果, 家人们快砍一刀。而且他不只会说还能唱, 包括我们的本土特色。唱戏 唱的时候呢,口型、节奏、运镜是锁在一起的。 当然,如果你强行指定一些复杂的歌词,跑调的概率还是会高一点。这个呢,要注意,我还测试了多人对话的场景, 食人族抓到了一个打工族,然后就把他放了,你知道为啥吗?为啥为啥?他说打工人太苦了?哈哈哈哈,好消息是,他已经基本不会出现一起动嘴的老毛病了。 逻辑是通的,节奏也是对的,但是视线的准确度呢?还差一些,视频从来不是画面而已,他是画面加声音加情绪加节奏。 这一次呢,国产 ai 视频终于把这块拼图给补齐了。以后 ai 再做视频,不再只是玩具,而是真正能进内容生产线的工具。刚才用到的流程提示词和工具,我已经全部整理成了一份文档。 如果你对这些玩法感兴趣,后面呢,我会继续拆更多真实可用的案例。关注我,带你用 ai 早点下班!
粉丝1460获赞7769

你还不知道豆包语音合成二点零吗?他不只是读文字工具,更是懂情绪!能复刻音色的超级语音助手,仅需五秒,音频就能一比一还原目标声音。电影角色的喜怒哀乐都能精准演绎 什么是好的语音模型。无需标注情绪标签,它能自动读懂文本背后的迟疑、委屈等情绪,比真人更懂表达复杂公式符号朗读准确率高达百分之九十, 覆盖数理化等多学科,适配学生党和老师需求,情感陪伴、客服配音、教育辅助等场景都能轻松 hold 住。从工具升级为深度参与生活、工作、学习的超级助理。赶紧体验开启智能语音新体验!关注我,一起玩转 ai, 记得点赞关注哦!

好,今天跟大家来介绍一下我这个短视频合成工作流,我觉得非常的厉害,生产效率拉满,一看到从上到下呢,我开了几个窗口,整体给大家介绍一下这个思路。我们现在有很多的短剧的剧本,那这些剧本要快速的生成几十集的短视频,每集一分钟, 那如果有了剧本之后,我们该怎么去做?那我现在分四个工作流来实现这么一个整体的一个效率的产出。那第一个工作流呢?在顶部这块看了,还读这个剧本, 我们读了这个剧本之后,这个剧本前期要有一个预处理,用这个豆包把这个完整的剧本给到豆包之后,根据提示词让它生成结构化的这种数据。就 jason 格式的结构化数据比把它把这个剧本拆分成 四十级也好,五十级也好,它都是这种数组,五十个数组或者四十个数组,每个数组里面包含这一集里面的剧情,包括剧情,包括角色,包括一些这必要的信息,让它生成了这么一个 j 四文件。有了这个 j 四文件之后,我们就用第一个工作流来读这个 j 四文件 读读起这个 j 四文件之后,用这个扣的节点把这个 j 四文件进行一个拆解,因为它输出的是一个大的数组, 那通过扣扣的这个节点可以输出成簇多个数字,之后就可以用这种循环的模式,循环的这个节点。 look 节点,把每一个数组里面内容逐条的写入到非出多余表格里面, 在这个左侧就是我存放剧本的非出多余表格。大家可以看到我已经跑完了一部剧,是八十集,那每集是一行,通过第一个工作流,把每一集的剧本内容、角色这些信息逐行的写到这个表格里, 写完这个表格完了之后就是纹身十二宫格,这个提示词是空的,因为我要利用另外一个工作流,把纹身图的提示词,包括生视频的提示词,还有参考图的链接都写入到不同的表格里面,以备后面的工作流来使用。那第一个工作流讲完了,就是第二个工作流,第二个工作流可以看到啊,读取某一集剧本的 工作流,那有了这个剧本,因为在第一个表格里面,我们看到已经有剧本内容了,那每行的这个单元格里面的第一集的剧本内容,他要在第二个工作流里面被读取,或者说一次性读取。因为这块我做了一个,也又做了一个循环。 如果我们这部剧有八十集,那他要循环八十次,每次这个调用这个子工作流,就下面这个第三条工作流来完成一系列的提示词的生成。那就说他读取了一个第一集的剧本内容之后,他要通过这个第三条工作流来生成这个叫什么十二宫格 这个图题十二宫格文生图提示词,同时还要生成这十二宫格里面每一格的这个图片变成视频的图生视频提示词以及这张图最终要上传到服务器上,共生成视频的时候,作为一个参考图的一个链接,因为我用的是豆包的大模型,它支持链接提供参考图,包括 这部剧产生的这一集里面要产生的台词,这些信息都要通过这第三个工作流来完成之后填写到这两个不同的表里面。因为第一个表是每一集的 内容,那一共八十集,那他最多就八十行。第二张表是每一集有十二个分镜头,那八十集就是九百六十个分镜头,这个保存在这个表里面,那这样这个把这些基础数据用工作流来完成之后,最后 就是这第四条工作流,那第四条工作流就来生成视频了,他要读取右侧这张表里面的图升视频的提示词,包括这张图的链接,因为有了这个链接之后,他让他生成的视频的内容是 更标准的。生成这个视频之后,保存到本地就变成了一个五秒钟的一个素材,那一集是十二个分镜头,那那十二乘五就六十秒,那他就是一分钟一集这样的视频素材。左右下角这边大家也看到,我已经提前都生成好了,这些视频 都已经跑过一轮了,就这一集跑下来,十二个分镜头的这个视频都出来了,这也是左侧的这个是某一集的十二宫格, 有了这十二宫格之后,要我通过一个本地开发的一个工具,让他来把这十二宫格切成十二张图,那每张图对应的就是一个参考的 link, 他 切完图之后会自动上传到 服务器,生成这么一个 link, 这个 link 就是 在图声视频的时候作为参考图,给到大模型,整个的流程就这么简单。我觉得这个工作流核心的价值是在于节省了很多重复性的工作, 生产效率也极高。那这里面核心要就不断优化跟迭代的,就下一步要不断迭代的环节是什么?这个十二宫格的这个提示词很重要, 它可以控制这十二张图的图里面的内容跟剧情的匹配度,包括这种镜头镜头语言的控制,每呃每一张图的核心的表现力。 另外一个提示词就是基于这张图去生成这个分镜头五秒钟分镜头的图声视频的提示词。那现在这块这个提示词的内容我觉得是最有待提升的,因为你看这个关于图声视频的提示词的信息量就这点,那肯定是远远不够的。 但这块的题词怎么去打造,我觉得是有一定难度的,需要不断的去磨合整体的思路。就这样可以看看啊,可以看看这个视频 其中的一个五秒钟的视频,你看现在这个题词里面,我用的就是它的生成的内容,还都是英文的对白。那其实可以看到右侧的这个表格里面,我已经改了题词了,但是这个视频是昨昨天晚上生成的, 还都是用的英文的提示词。这块会发到发现一个幻觉,这个静态图的时候,那个男主角是正确的,但是女女主角的这个影像并没有在那张图里面出现。 那,那当他生成视频的时候,那这块女主角变成一个老外,那这就是如果说从严格意义上来讲,那这个五秒钟的素材没法用,就得需要重新的去生成。

在成都有这么一家软件公司,他们与火山引擎合作,用 ai 改写电商企业客服及企业塑造经营中书的未来,他们是一家用 ai 应用改变企业服务的创新公司,这就是福克 ai, 在这里思维创新和自我迭代根植于他们的代码,豆包大模型也正在这里落地生根。走,我们去跟福克艾的创始人 perry 聊聊去。 嗨, perry, 你 认为未来 ai 在 企业落地的关键能力是什么?我觉得在真正的我们现在国内的大部分的企业没有把 ai 真的 融入到工作流程,融入到场景,融入到业务流程里面去。 那现在大家处于我有空的时候,我用一下给我提供一些建议,有这样的一个状态,那么所以说从这个时间的维度上来说呢,我觉得第一步是你要先找到场景。我们第一个场景是我们认为最好落地的其实是一家客服,因为相对来说他的 roi 比较好量化,我一旦投入这个软件,马上就能看到 的人员成本的节约,看到转化率的上升,看到客户满意度的提高,那这个是 roi 可量化。就是说为什么客服我们选定了第一个场景, 但是长期来看,一定是在企业的每一个工作流程中,业务流程中其实都需要 ai 落地。那其实现在 ai 最缺乏的是什么呢?是缺乏对于语境的理,对于 context 的 理解,他需要理解业务的 这个状态,他需要理解,他需要把过往,比如说沉淀在这个核心的员工、核心管理层脑子里面的经验成为这个语料, 能能够在这个 context layer 就是 在企业这个上下语境里面沉淀下来,然后再把 ai 嵌入到对应的流程。比如说我们应该让用 ai 更多的参与企业的决策,例如备货,把库存管理,再到投放管理,再到我们的内部的这个企业的运营。 那其实每一个板块其实只要给 ai 足够好的语境,其实我们作为运营公司其实更多的是一步一步去构建语境。客服这个场景的语境其实最好构建的是吧?我需要有商品的知识,我需要有订单状态、客户的状态等等, 那么我就能够构建好客服这个语境,让 ai 能够去像人工客服一样去回复客户。但是客服这个场景有一点好,就是当我处理不了的时候,我马上可以转接给人工客服, 这个决策成本很低,而且落地的效果非常好。那么一步一步下来,我们应该是说能够去沉淀企业更多的数据, 不管是行业 logo 的 数据,就是比如说我们这个企业内部的经验的数据,还是业务的数据,能够实时的更新到这个企业的一个数字孪生的系统上面,让 ai 强大的大模型有 playground 去做决策。逐步看来企业要找到场景,要让 ai 嵌入流程, 让 ai 进入工作流程中,要沉淀足够多的数据,那么这个时候,嗯,慢慢的企业就从一个以人驱动的公司逐步的转向一个以 ai 驱动的公司。那这个其实是我认为下一步 我们其实是想在这个场景用更多的探索,其实福克艾的愿景是什么?在电商这个领域里面,其实我们还是专注一点,就是在电商这个领域里面,我们希望从电商企业,中国的电商企业能够从流程驱动与人驱动逐步转向 ai 驱动,但这是一条很长的路,客服是我们找到的第一个落脚点 啊,这个愿你真的太棒了,那要实现它的话,其实你们还需要一个非常强大的 ai 大 脑,那最初火山引擎的豆包大模型又是如何入了你们的法眼呢?火山引擎我觉得还是有几个点比较打动,第一点是说它整个普绘化的思维,因为 我还是回到之前我讲了企业要看到明显的 r i, 嗯,明显的 r i。 对 于我们这样的应用公司来说,我们最大的成本其实就是算力产,那么我们的算力成本就决定我们产品能够以什么样的价格提供给用户,那其实算力成本本然决定我们的毛利率,决定我们的一切。我们是一个 ai native 的 产品, 那这情况下,如果我们有一个性能足够好,但是又足够便宜的大冒险,我们就能够以一个比较有竞争力的产品提供客户,客户就马上能够算出这个产品。我的音符图我买了之后马上带来显著的 roi, 那 这样的 roi 其实在去年,其实我还是认为 去年的算力价格应该是现在的好几倍。今年的豆包的大模型是从能力到价格是我觉得 roi 比较清晰,那么这是第一点。 第二点是说我们需要模型的迭代速度足够快,因为现在其实我们一步一步的发现你越落得越深,你需要越强的。我比较欣赏的应用是 一直在快速迭代,我们看到了更多的场景,下面有更多的应用空间,包括其实我们也很关注这个,其实从这个普通的我们现在的应用是只是在回复消息,再到下一个层面应该是 agentos, 对 吧?就是大模型具备了 对系统、对操作的理解能力,它能够像人一样就是从智能体升级到数字,员工其实缺的是操作这一步就 agent 的 action 这一步,其实我们逐步能看到那个火山,其实在往这一方面逐步的走,我们也希望能够把这一方面的 agentos, 对 系统的操作能力,对系统的执行能力能用到我们的产品里来, 从回复更多的到 action, 能够直接执行操作,能够直接像人一样去跨系统的去操作,那这个其实我们也是看到火山其实在这方面能力的提升很快,我们很满意的一点是模型一直在快速的迭代,那我们每次有新的需求的时候,就有新的模型出来满足我们的需求,所以这个对我来说是比较惊喜的一个事情。 大家好,欢迎来到超级拍档向山行,我是主持人徐曼。时隔半年后呢, 我们再次来到了成都,这次呢我们发现了一片新大陆,其实对于做过电商行业的诸多商家来讲啊,客服是必不可少的一环, 那当客服遇到了 ai, 还能触碰出哪些火花呢?今天呢,我们就非常荣幸的请到了四位破局者,他们将从技术、产品、生态以及落地实践的角度为我们描绘出 ai 客服的新生态,他们是 成都福克人工智能科技有限公司 ceo 彭卓然、佩瑞。大家好,先翻译,厦门科技有限公司副总经理林文整,大家好, amd 公司大中华区商务特展经理孙培进, 大家好,以及我的搭档,来自火山引擎的豆包大模型产品解决方案总监赖韵杰。哈喽,大家好,欢迎各位。那咱们今天来的都是内行人,相信大家也都接触过不同行业的客服,然后大家其实也都肯定有过网购的经历, 那各位是否都曾遇到过哪些客服的问题呢?大家来吐吐槽呗,要不女生应该买东西最多。韵姐先来谢谢许文,这个问题,我觉得作为一个经常常年在网上购物的人,这个我真的特别有感触, 就尤其是比如说像在买东西的时候,其实他展现的信息可能不是我特别想了解的,或者我再想问问我的尺寸啊,我就会一定会问客服,但这个时候,比如说尺寸不对时候想退货, 可能每一家的商家的这个尺寸都需要再进行的询问,那那个时候客服又找不见人了,其实这个时候真的是非常破坏购物的心情,这点我真的是深有体会, 确实影响挺大的。那培训老稳整,你们有没有遇到过类似的这种客服沟通方面的一些问题?其实有,因为我最近的话其实有在这个其他平台上面进行一个购物, 然后呢主要遇到一些问题,就是比如你要买一件衣服的时候,我想问一下这个衣服的一个材质以及它的一个质感是怎么样的,然后每次我给他发的时候,他要等半天还是没回复,然后我有时候去买其他东西的时候就特别急,有时候临时就要用了, 那你临时要用的东西,你等他回复的时候,其实时间已经来不及了,所以呢,我就会再找其他家,那这家的话我就不会去考虑他了。所以有时候去买这些东西我也是特别头疼,因为现在的话很多时候没有专业的一个知识,我是不清楚这些东西的。对, 嗯,买东西这个情况就是因为我本身性格就很急,所以买东西我希望能快速响应,就是什么时候会让我下定决心买。 是基本上三句话说完,然后得到我想要的答复,然后我就会下单。但如果我要碰到一些店家回复比较缓慢,或者是回复的内容不是我想要的内容,我可能会马上切换到下一家。 嗯,以上都是来自我们 consumer 的 跟客服打交道时的一些真实的反馈。那 perry 啊,你对电商行业的传统客服的这些问题有非常深刻的理解,其实这也是很多企业乃至整个电商行业智能化转型的痛点。那福克 ai 诞生的初心又是什么呢?其实我们福克 ai 一 开始其实定位的就是说想在电商这个行业做点什么,因为我自己之前的经历是, 我从大学创业的时候就在做电商,我做跨境电商,也做国内电商,我在国内做了一个电商品牌,然后一边在大学的时候又做了独立站,然后又在海外去销售。所以作为商家的时候,我发现自己的很多时间是 花费在了回复客户的消息,回复客户的邮件或者回复平台的这个客户的消息上面,那么同时呢,我自己创业之后呢? 呃,我自己又会去跟很多商家聊,对吧?现在你们到底有哪个痛点是最痛的?就有一些商家会说,啊,我有图片的痛点啊啊,有一些商家会说我有投放的痛点,但是我发现就是找到一个共同点,就是几乎每一个电商的商家,嗯,他都会说啊,我现在有一个五十个人的客服团队, 我现在有一个一百个人的客服团队,然后我每年要在这个团队上面花了很多钱,但是实际上很多数据, 或者说我现在有的这个客服团队其实并没有达到我想要的这个状态,如果 ai 的 介入能够在这个场景里面做点什么,我愿意付最多的钱在这个场景上,那么我聊了十个 身边做电商做的非常成功的老板,我发现基本上每一个人都给我提到了最痛的痛点,是客服的痛点,那么我觉得这个就是那个场景。所以说 在在进入到这个场景之后,其实比如说他们有都在用传统机器人,但传统机器人对客户的这个流失非常高,像你们去购物,对方是机器人在回复我马上就走,你说我去问一个问题,实际上他回了一大堆,但并并没有针对我的问题去做这个专业的解答, 那么特别是在多轮对话的时候,你根本就没有感觉到他理解你的意思。那么人工端口,比如说其实培靖刚刚讲到了说我需要快速的知道这个产品清晰的这个卖点痛点, 这个时候人工客服的是我一个店铺有五百个产品,不同的产品他的卖点这些都是不一样的。呃,你需要我及时的去给你这个产品的清晰的你想要的信息的时候, 那其实人工客服要先去找这个产品的这个资料啊,什么再给你,这个,第一时间很长。第二大部分人工客服其实做不到这个点,当他有同时有三十个咨询进线的时候,他其实能回你是非常低质量回。 那么所以说这个时候 ai 的 介入就让这一切有了非常大的这个提升的空间,他能够快速的去阅读每一个产品的信息,然后给你最专业金牌销售级别的回答,同时他又不让你感觉机械,他是真的理解你的意思在做回复。所以我们真的是发现了 ai 在 克服这个场景大模型的介入, 能够在这个场景带来效率和消费者体验的提升,所以最后我们选择了这个赛道。嗯, 我也大概对咱们公司做过一些背景的一些学习哈。嗯,那其实相对于传统的客服机器人,我有看到咱们福克 ai 是 有这种多智能体协调算法的,那这种的话是如何让咱们的这个电商客服实现 与人的这种更自然的对话呢?在我们的这个呃算法工程上,我们其实有几个方向啊?首先算法的工程我们其实用的,嗯,是 context engineering 的 一个框架,呃,翻译过来其实叫上下文工程, 就是我们要提供一个足够丰富的语境给到 ai, 让 ai 能提供这个好的回复。那什么叫一个丰富的语境呢?就是 偶像传统的就是 reg, reg 就是 说我能够去解锁文本,解锁到文本之后我基于这个文本去做回复,比如说我做一个企业内部的这个问答的这个机器人啊,那其实我就用 reg 就 够了,对吧?它其实就是解锁到对应的文本,去给我对应的回复。 在电商这个非常复杂的场景,有售前、有售中、有售后,有不同的政策,有不同的这个场景,对吧?你需要考虑几个事情,第一个事情是说如何让模型真正的理解到底应该以什么去回复这个问题。比如说我们需要给到模型,不仅仅是说一个知识点, 要让他知道充分的在各个角度真的去理解我要怎么去做回复,我要知道这个客户的画像,我要知道这个订单的状态,他在售前,他是想买还没买,对吧?还是在售中啊?可能我我想询问一下我的这个产品制作,比如说有定做,我定做的情况怎么样了? 然后再到我的这个包裹什么时候发货,再到售后我不知道这个产品怎么使用,还是我对产品不满意,我要退货,或者我要申请一些补偿? 那在不同的场景下面模型应该理解啊,那我应该在这个场景下面注意什么?我的注意事项是不一样的,我的关注的维度是不一样的,售前我应该注重销售,售中我应该注重就是安抚客户的情绪,然后同时给客户清晰的解释。售后 那我要给客户信心,要挽留客户,尽量不要退款,然后再跟客户去友好的去协商,在可控的范围内,对吧?应该给补偿的时候给一定的补偿。 那么在这种场景下面,模型需要理解这个客户的状态,这个客户的情绪,我应该调用哪些知识库?是商品知识库还是政策的知识库? 我现在应该注意什么事项?比如说在售前我可能要注意一些关键词是不能讲的,可能我应该怎么去用词?因为这个非常重要。所以说在整个维度下面,我们需要提供给模型一个完整的语境,在模型真的懂业务、懂场景的情况下,多人对话的时候就是能够持续的、稳定的去回答,那这个是在语境工程这个层面,那么 呃,再讲到其实下一个层面就是多智能体协同,其实多智能体协同核心还是说他是要把整个链条打闭环,就是我不仅是一个回复的机器人,回复是智能体,幻觉控制,有有智能体,在回复完了之后,我应该有智能体去 review 这个绘画,人工客服介入之后,我应该去学习这个人工客服的这个回复,把人工客服的回复再提炼到我的知识库去来,这需要智能体。 那么再之后是我需要去帮助商家去做 voc, 那 这也需要智能题, voc 是 什么?就是我需要把它整个的所有的绘画进行 review, 再帮它提炼出来。在这个一线的这个绘画里面有哪些信息不同,哪些产品客户 需求很高,哪一些功能客户是有需求的?或者说哪一个产品经常有客户反馈拉链有问题啊?或者是什么什么有问题,我应该反馈给工厂,或者说我的某一个产品,它的发货就是特别慢,我应该反馈给仓库,对吧?那这个 voc 也是个智能贴,所以我要在客服这个场景去提供体验上的闭环。 在商家层面的话,我不只是一个回复的机器人,而是我应该提供一个全流程的机器人,让它用的好,而且是可持续进化,可持续迭代,能够真正在业务上能够持续深入它的业务,这个也很重要。 哎,差不多是这样。对,你刚刚也提到了很多啊,包括像说模型层的一些刚性的需求。对,然后包括像针对语境理解 context 这块的一些 算法工程的能力,包括像刚又有提到的这些针对多智能体协调的这块的一些硬性的需求。那火山引擎在这些层面是否真的都能够帮到你呢?嗯, 我是觉得火山已经是给了很大的帮助。一个是模型城,就是我们用了非常多的模型,国外的模型,国内的模型。其实为什么最后,呃,我们跟火山,火山是我们最重要的一个合作伙伴之一,那其实核心就是说,呃,火山是真的性价比非常高,不管是调用速度还是调用的价格的是性价比最高的。 那么第二是说,呃,我们发现,特别是比如说包括一些数据处理,包括我们现在在用火山最新的这个一点八,我举个例子啊,在尺码推荐这个场景就火山,因为大模型其实在数学计算这个是不不是特别擅长? 那当我们去导一个尺码表给大模型之后,其实我们用了市面上四到五款大模型,客户去报了身高体重之后,让大模型根据这个尺码表去推荐尺码的时候啊,大模型的出错的概率非常高,那么火山几乎可能只有百分之零点五的出错的概率, 就是他非常稳定的可以根据客户不同的身材,这是客户的身材,他没办法在这个尺码表里面符合之后,火山能告诉客户,这款衣服你没有适合你的尺码, 别的大模型可能会迎合,会乱推,所以其实火山这个换句控制器做的还比较好,那么就是在这个场景下面,我们就发现这数学能力啊,各方面能力,那其实火山是非常好的契合了电商这个需求。 第二就是说火山的这个响应速度很快,我们有些时候,对吧?有些绘画可能火山十秒以内就能回给客户,而且非常高质量的回答,那这个时候就你们就解决了你们这个等待这个痛点。那么还有高并发症,双十一的时候其实并发症非常高, 一个延迟都没有,所以这个也是我们觉得用火山还是比较放心的。嗯,跟他韵杰佩瑞有提到咱们,尤其是像上了豆包一点八之后。 然后呢,咱们动画大模型的能力是如何去匹配福克 ai 这块的一些需求的呢?你能跟我们具体讲讲吗?我觉得 perry 刚刚讲到了一个就是我觉得让我们就非常触动的一点,因为其实我们去做无论是模型还是推理,就是为了像福克 ai 这样的 ai native 的 公司,能够在新的 ai 时代能够迸发出更多的 商机,更多的生命力。其实刚刚 perry 提到了几点我觉得都很重要,一个是普惠,一个是呃多选择,一个是稳定,还有一个就是持续的迭代,就模型能力的提升,我觉得这块其实都是火山本身自己在模型层面在做的非常重要的事情。 包括刚刚提到我们其实有不同尺寸的模型,比如说从一点六开始,我们就有 flash、 有 light, 然后还有我们的旗舰模型,然后同时在我们的比如说像图片识别, 因为在电商其实有很多图片识别的场景,我们其实有这个一点六和一点八的综合模型,同时还有像一点六 vision 这样专门针对图片识别 v o m 场景的模型,这块都是都能够给到呃客户非常多的选择,而且不同的价格对应不同的区间。然后同时还有一个就是刚刚提到的这个呃可选择度很高, 比如说我们在不同的这个输入输出的长度上,其实我们也会给到客户能选择,因为刚刚像提到比如客服就是一个可能短输入、短输出,但是可能在一些比如说退货的场景,可能就是长输入短输出,那这个情况我们会让企业有自己去选择,能够让他们去根据呃情况进行呃设计。 对。然后还有一个就是稳定,因为就刚刚提到,比如说食盐,比如说我们有非常高的容纳的 tpm 和 rpm, 这个其实在客服场景是非常 就是重要和致命的。就是一旦是说,比如说双十一,双十二的节庆的时候出现了这种高病发,一旦崩溃之后,可能对于一个企业的名誉度和这个受信度都会非常影响,但我们其实能够支持和容纳非常高的 t p a, 这个也是火山一直在去做的推理,然后我觉得还有一点就非常非常重要,就是生态, 对,就是我们一直希望说大模型今天是一个时代的东西,那么一定是一群人走得更远。所以其实在我们的,比如说推理和高频发背后,其实像 md 这样的合作伙伴能够给我们去 支持。然后同时我觉得像我们的合作伙伴,比如说像千帆易,包括像文枕他们的公司,帮我们去识别到更多像福克 ai 这么有潜力的 ai native 的 公司,这个其实能够 让我们更多地反馈到我们需要怎么样把模型,怎么样把推理做得更好,来符合真正的商业化需求。我们做的每一个功能的迭代都是能够去符合企业需求的。比如说刚刚提到的我们在做更多的,比如说 response api, 就是 像刚刚 perry 提到的如何去调用工具 啊,如何去调用这个不同的这个呃 contacts, 然后帮他们节省成本,那这些都是我们的生态合作伙伴给到我们的反馈,形成了一套商业化的闭环,这个也是火山我觉得一直在坚持的事情。嗯,是提到了生态合作 这整个的体系。那我又想问问培进啦,那其实福克 ai 无论是从对这个基础层的这种推理能力啊、推理速度啊,包括这些高并发症的这些, 呃,并发量控制、稳定性这些,其实对于底层算力的要求都是非常高的。那从 amd 的 视角来看,支持像福克 ai 这类的客户的话呢?咱们针对硬件提出了哪些特殊的要求?然后 amd 与火山引擎的合作又如何能满足客户这些需求呢? 首先 amd 是 一家半导体公司,然后它是从 cpu 到 gpu 到网络实际上是一体的这样的一个半导体公司。呃,对于福克这样的一个应用场景来看,其实客户选择福克无非就是两个原因,第一是好用, 第二竞争力强,那竞争力强就是就是可能呃产品稳定实惠,然后给给客户真的是在应用场景上带来了一些收益。当然对于我们而言就是可能从复刻的维度来看,和林总的这个这个情况来看,是 md, 实际上是是没有体现在任何应用层面上。 比如说从 agent 的 这个这个维度来看, agent 只是一个应用,你们是真正享受到的 agent 带来的收益,但是我们是要保障,相当于 agent 的 底层是不出问题的。 现在火山比如说对外售卖的一些云十个亿,像 g 三 a 和 g 四 a 就是 我们的锦欧版和图灵的这代产品,实际上是做的十个亿, 它在保证我们的一些 agent 可以 稳定的运行。然后那另外我们在明年也会推出呃我们的一些威尼斯的对应的一些产品来丰富实力的这样的一个内容,便于我们的用户来进行选择,我们也会用更好的产品去服务 agent 更加稳定,更加实惠,来保证像福克这样的一些用户,可以让他们的这种客户呃,通过高质量的这样的一些应用场景来保证我们的业务的一些有序发展。 嗯,那我们继续围绕生态合作这个话题来说,文整,作为深入一线的这个服务商,你当时是怎么接触到福克 ai 的? 而且当时你了解到福克 ai 的 时候,你认为他的哪些特质让你第一感觉就觉着这就是我们的客户,并决定把火山引擎的技术介绍给他们的。 我们长期深耕一线,帮客户降本增效。我们非常清楚,企业在使用 ai 普遍面临三大痛点,技术复杂、落地成本高、摸型效果不稳定。正是在这样的背景下,当我接触到福克 ai 时,它所展现的几个特质让我立刻认定就是它了。 福克 ai 将复杂的 ai 能力封装成简单易用的工具,让企业能够快速上手,低成本的落地,这正是我们一线最需要的产品形态。最后也是最重要的一点,我看到了福克 ai 这个团队 对产品的热情和投入,技术再好,也需要优秀的团队去推动落地,而福克 ai 正是这样的伙伴。 正是这些因素让我确定引入火山引擎技术给到福克 ai 团队,是解决客户的痛点, 提升了服务能力的最佳选择。那 parent 从你的角度吧,与火山引擎通过像文整这样的服务商进行合作,那这种技术平台加上服务商,再加上这种解决方案商这种 组合的方式,这种模式相比你们直接去对接云服务,能带来哪些不一样的价值?首先,服务商他会给你很多新的信息, 有时候可能我们一直忙工作,我们不知道,可能就是更有销售性质,他会告诉你,可能我有新的模型,新的模型的价格怎么样,我能给你争取到什么样的政策?然后,呃,新的模,我给你拉技术团队来给你对接,给你服务, 我们原来可能对接这个,直接对接大明星厂商,我们是需要这样的服务的。比如说我刚开始用的时候,我就会说啊,我的病发不够,我就找他,我说你马上把这个病发给我提上去, 然后他又去走申请,对吧?我马上给你申请这个提病发,我马上给你申请这申请,那这个时候我们是需要这个及时的响应的这个服务的。像我们原来跟其他直接跟云合作的话,可能没有办法快速响应,然后快速去给你做这个,但我们是需要快速响应的。 那么第二个是说啊,服务商能够全流程的,比如说他会主动来找你,是吧?你的需求是什么?就我们有一个提需求的渠道 啊,把我们对模型的需求,我们的模型需求提上去,就由他再去做反馈,其实这个对我们还是比较重要的。我也想补充一下,就是因为我觉得今天大模型的创新,其实我们我们承载的其实大模型商业化的一个出口嘛,所以的从实验室到市场的这一步。 但是其实今天就刚刚,包括我就像文诊如何找到 perry 的, 非常的典型,就是说创新发生在非常一线,发生在千家万户这个里边,所以其实我们技术和商业的需求双向奔赴, 所以我们也非常非常需要像千翻叶和文诊这样的同学,或者说这样的服务商来去帮我们找到它们。并且确实就是大家诟病的一个点,就是说大模型的 sku 实在是太多了,并且大家能够看到每一年的大模型迭代都非常快, 每一代模型其实都有它优化的一些长处,其实像比如说服务商就会或者伙伴会帮我们把这些翻译成客户理解的 场景,需要的行业有认知的语言告诉我们最终的客户,这样能够快速的能够形成大模型的商业化,同时形成一个闭环,所以真的非常非常重要。是那其实服务商作为火山引擎与最终客户的一个 中间那个桥梁,非常好的连接了彼此的这个需求。那咱们火山引擎在构建大模型生态的时候啊,云姐你是如何看待包括像千翻译我们的这个合作伙伴, 包括像福克 ai 这样的?其实面对最终客户,包括一些弊端,商家的一些解决方案上他们不同的价值的?然后咱们的生态策略又是怎么样? 嗯,对,就刚刚其实有提到,其实大模型今天从技术再到商业化,其实还是有挺多步再去走的,我觉得一定是一个生态化的打法。 就包括比如说像我们其实我们承接的两块非常重要的能力,一个肯定是模型的能力,我们要保证它足够稳定,对吧?有这个合作伙伴的这个支持下,能够稳定的输出承载高并发,然后模型持续的迭代,不断的给到这个客户最新的模型能力,这是第一点。然后另外点其实是工具。 就刚刚提到,其实在模型迭代的过程当中,一定有一些东西是基作模型无法去满足的。所以其实我们也有,比如说像这 viking db 的 知识库,包括 a 阵那些形态,我们都把大家的这个就是武器库啊,做得足够的充分,但这些武器库充分的同时就一定会有一些信息差, 比如说如何迭代的,然后如何能够适配到不同行业,那这个时候其实就需要深谈伙伴,然后我们的渠道伙伴来去基于客户的需求来去反馈。而且我觉得对于像渠道伙伴,其实他们往往集中在一个行业或中间某一个区域,他会有一些行业的属性和区域特性,这些东西能够集成或者抽象成为一种就是 块状的需求,能够再反馈回来,那我们的迭代就会更有方向,而不是说一个一个客户的单独这个反馈。而且我们也建立一些,比如 case 的 反馈池,能够快速的响应到每一个毛细血管的需求。 然后同时我觉得特别重要的就是在每一部分模型迭代之后,其实我们的渠道伙伴会帮助我们去转换成行业语言,然后给到客户, 因为他们一定是最了解客户的那群人。那这样的合作伙伴其实火山已经有非常非常多了,然后也希望发展更多的合作伙伴,然后来去构建这样的生态。这样的话其实大模型今天所有的迭代,它才会有商业价值的意义。 嗯,说到不同行业最终客户的这些实际的一线的需求,那 perry 能不能跟我们分享一个呃,让你印象最深刻的案例?比如说,呃,在六幺八呀,双十一这种高峰时段,咱们的 ai 客服具体是如何扛住这大波流量红风的? 像现在双十一啊,什么,其实他已经不算是真正的红蜂了,六幺八双十一其实只是说量会比原来大一些,那真正的红蜂会发现在什么时候呢?就是有大量的电商商家,其实他的整个产品的销售是具备这种非常强的季节性或者阶段性的, 然后在那一个阶段他的需求是原来的十倍、二十倍,甚至一百倍,那这个时候他可能原来六个客服,就在那一个月他需要六十个客服,这个时候你临时去招人,临时来培训是完全没办法,就是非常痛苦。 就是我先讲一下图书类的这个这个商家啊,就是这个是我们发现的,就是图书类的商家,我们是儿童读物或者是学生读物,那在这个时候呢?其实,呃谈暑假的时候会迎来这个疯狂的这个增长,就是咨询量会涨到原来的十倍、二十倍,这样的 家长会询问我的孩子适合读什么书啊?我的孩子大概是什么年龄段啊?那我们要去推荐他适合他读的书籍,或者说我们要去根据这个孩子的这个基础,对吧?你孩子应该读什么样的书?是读基础的书还是读进阶的书,还是读这个培优的书,对吧?那这是这个书籍的选择上是不一样的。 那么这个时候 ai 不 仅是要扛住流量红风,而且 ai 是 要做非常高质量的回答,家长需要知道,想知道这个图书的内容,对吧?就是 ai 本身豆包他,他的这个预训练的这个语料非常足,他就能够去回复不同的书的讲的是什么内容,来判断是不是适合他的孩子。那你人工客服是完全不可能记住这这 六百本书,八百本书讲的分别是什么内容,适合什么样的人读,对吧?那么第二是说家长会说我,我的孩子基础怎么样?那其实豆包本身他强大这个这个能力,他就会说啊,那你的小孩这种书是适合初中的孩子读,但那个书可能对初中的孩子可能不好读懂, 那其实本身依靠豆包的能力就能做非常专业的回复,结合大模型的回复是超过人类十倍的,同时的话呢,因为它非常精准的转化率,还有就是降低了这个退后率,就家长 他推荐的每一本书,家长会发现孩子真的爱读,有的还班级还是说我读懂,可能原来是家长不会买,买回去退了。但现在确实就他,他能够说推的每一本书,他不仅转化高,而且推回去之后真的发现这本书适合我的孩子来读的,这个时候,哎, 不仅是转化,而且是低退货。现在马上寒假又要来了,所以说我们现在积累了大量图书,商家是满意度非常非常的高。那,那咱们还能举一些其他行业的案例呢, 那么我再举一个案例啊,他的流量红风是一百倍的这种增长,月饼,月饼好像在平时是完全没有咨询,平时可能这个商家他只需要三五个客服,但是到了月饼季,我需要 三百个客服他才能承接。在这个时候你临时去找客服,然后月饼也有很多,比如说口味的问题啊,售后的问题啊, 在这个时候你临时的客服很难去承接,而且临时去找的之后,下个月我不需要这些客服了,那我这个临时用功,这个其实是非常大的问题,那么这个时候我们在这个月饼季其实就帮助很多月饼的商家去扛,这个月饼季它是突然一百倍的增长的。红红, 我们呢非常好的回,然后在售后的场景,我们的引导客户去给我们提供图片,或者说对吧?我们现在利用这个豆包多模态识别能力,我们去给我们提供图片,或者说对吧?我们现在利用这个豆包的包裹有破损,那豆包能够精准的判断, 比如说在包裹破损的程度,是轻微破损还是中度破损还是严重破损,我们应该给不同的赔付方案,比如说轻微破损我是补偿,中度破损我是换货,严重破损我是退款,对吧?那在这种 这种不从方案上,我需要借助精准的图片识别的能力,那这个时候我们在售后的场景月饼大量的售后,我们利用豆包去做非常好的解决。这月饼也是一个非常非常典型的,它是百倍增长的这种流量,那下个月又马上又降下去粽子,对吧?就是说在这种场景下的食品,季节类的食品,它是百倍的流量。红红, 这个时候我们帮这大量的这样的商家去解决这个问题,他们就再也不需要临时招人,临时培训,然后又在这个时候客户非常重要 啊,非常痛苦。就在原来对于月饼的商家来说,他卖的好的时候,最大的痛苦就是客服跟不上,但我们现在用 ai 就 完美的解决了, 所以这两个案例我觉得比较典型吧。嗯,是,那听 perry 讲完哈,其实 ai 客服对于传统客服环节带来的这些转变还真的是挺大的。那呃,文长从服务商的角度来看的话呢?咱们是如何实际协助复刻 ai 这样的客户来完成这些转变的? 其实我有很多朋友他其实也是做这种传统电商的,那传统电商其实有面临两个问题,一个问题的话就是人员培养的一个问题。其实人员培养的话成本是非常高的,而且一个人 正常要管理这个店铺的话,可能八到十家,最主要的话就是他去培养这个人工成本差不多要四周的时间去培养一个人,这属于第一个点。那第二个点的话就是客服在回应 客户咨询的一个信息的时候,其实会出现一些问题,有很多客户都是重复咨询的,这效率其实都是非常慢的,因为他要一个一对一的进行一个服务。那传统 ai 的 话,还有一个点就是客服这个板块, 我们现在如果是用通过传统的方式去进行个回答,其实时间成本就也是大大去浪费了,而且也 没办法很好解决客户的一些问题。那现在的话有大模型了,他可以很好解决。就比如有一个客户咨询一个订单过来了,他客户咨询是什么产品,他可以很好去进行一个回答。其次的话,比如客户已经下订单了,他会问,哎,什么时间去进行一个发货啊?发货时间是什么样的?他需要一个过程。 最后的话就是有一些客户可能收到这个包裹有一些问题的时候,就刚才彭总有提到了,哎,比如他这个包裹是什么一个情况?比如是破损了还是严重破损了?他有各种各样的一个解决方案来协助彭总更好去把这些问题进行一个解决掉。这个是我们利用大模型 ai 可以 做到一些效果。 对,这个是传统 ai 跟大模型这一块的一个区别,那用到大模型之后,咱们能够帮助客户大概成本能降多少呢?呃,有关成本这一块的话,我们可以帮他降低百分之八十一个成本,那我们现在用大模型就可以把这个问题很好解决掉, 真的是那百分之八十的这个降本就听起来真的是非常诱人的一个数字。哈,那嗯,我想问问运杰,包括裴进,那其实在百分之八十这个背后的话呢?其实是一个算力成本取代了人力成本的这么一个新的模型。那从火山引擎和 amd 的 这个生态合作的角度来看, 咱们是如何通过技术和商业的创新,共同帮助像福克 ai 这样的企业去把大模型的应用成本控制在客户或者说商家可接受的这个范围内的? 咱们分别来聊聊。对,我觉得就是因为我们其实是前后厂的逻辑,然后其实我们是一个承接嘛,就承接所有的需求。那其实这块我们也在商业模式上和产品设计上其实有非常多的思考,就是去面对一个是对于稳定性 普惠和一个这个价格的一个这个需求。所以其实第一能看到说我们有非常多的这个输入输出的呃区间,比如说像零到三十二 k 的 这个一个输入输出区间,我们可能就是一个特惠区间,其实很多大量的比如说电商的需求都是这样短的一些需求,那其实我们希望把这个的成本能够降到最低, 让大家在百分之九十的情况下都是一个相对普惠的一个状态。然后同时我们还会有一些,比如说像那个节省计划,然后包括像这个 t p n 保障包,保障包就是专门就是针对于像, 比如说双十一、双十二,包括像刚刚说的图书行业或者月饼行业,端午的这种,就是送礼季的这个心态突然增加,那么希望能够保障所有的商家有一个保底,有一个保障。然后同时我们还会设计,比如说像离线跑批, 对吧?比如说像刚刚呃, perry 提到有一些强化学习的需求,或者有一些数据的分析,比如说 voc, 那 它可能不需要用到实时的算力去直接回复,那它可以通过,比如说闲时算力,它可以通过数据跑批的方式能够进行数据分析,那这块其实直接是百分之五十的成本的降低, 给到大家不同的这种工具方案,然后让大家来去节省。那这个当中肯定也会需要 amd 在 背后给我们提供非常强有力的算力和实力的这个支持,能够让我们以把这个成本能够降到更低,同时谱回到每一个企业。 嗯,从我这个维度来看,其实现在基本上就是市面上的模型真的是百花齐放,各种各样,对,然后每天实际上都有模型的迭代这样的一个更新。 然后呃,从我看到的市场的情况,原来可能我拿着折扣可能去找客户同样的东西,我的价格比竞争对手便宜,你试试我这个。 但是现在基本上都是拿着应用场景去找匹配的客户去在我这个场景下获取了收益之后,才会有下一步的这种合作。 然后对于我们而言,跟火山的合作也非常非常的长,也非常紧密,像火山推出的 esi 的 这种潮汐式的这种实力,也是基于呃我们的量变带来的这种成本上的变化, 从而达到了刚才说的百分之八十的前端看到百分之八十降本的这样的一个情况,这个不单单是 cpu 的 便宜,或者是我的研发人员的投入变少,然后我的硬成本投入的降低到 看到的这种成本的便宜,而是真正的应用场景上,我们帮客户解决了实际上的问题,让他少在这个场景上减少了他的投入,那么来优化了他的运营的成本,从而达到了他的收益最大的这样的一个成本合算是这样的一个场景, 所以,嗯,我们在未来也会好好的服务自洁和尊客户,通过我们更优质的这种技术啊,调优的这种方式来保障每一个客户的使用的这种满意度。谢谢裴静啊,那其实也非常感谢各位的分享,那其实除了客服,除了 ai 客服之外呢? 未来还有哪些我们想象不到的创新可能呢?好,我先来吧。就是我觉得我从我们公司的愿景上来说,我们是希望能够 用 ai, 用大模型帮助电商的企业更好的去做整个经营到整个经营的决策,从单点的应用,我们希望在跨度到 全生态的应用,就是在整个电商的任何一个模块,其实都应该用大模型去帮助他们去更好的运营。企业从一个传统的企业转换成一个以 ai 数字化的一个企业,那么客服应该是第一步,是最好实现的一步,所以我们第一个产品是客服。 但是 long term 来看,其实客服的 concept context layer 是 第一步,它整个电商的业务应该形成一个更丰富的 context layer, 它有客服的数据,对吧?应该有投放的数 据,要有我的这个,呃,前前端展现的数据,再到我内部的这个业务的逻辑,再到我的这个库存的数据和仓储的数据,那么 ai 的 赋能从客服再到我的备货,再到我的经营决策, 我是不是应该补货?那么从现在我只是回复消息,到最后我能够逐步的给出决策上的建议,再到可能在在最后,我认为两年之后、三年之后, ai 甚至会变成一个决策系统, 它帮助企业去直接决策。比如说原来我可能需要审批去补货,那现在 ai 发现我的各个环节有缺货,能直接补货,和 ai 现在能够直接帮我建一个新的投放计划, 那么这个是一步一步,随着这个企业它的数据越来越积累的越来越多, context 积累越来越多,业务逻辑积累的越来越多, ai 会逐步地从单点的这个应用到整个经营层面的这个决策的应用, 全流程都可以用到大模型去赋能。当然这个需要各方面的更成熟,数据的积累更成熟,大模型的能力更成熟,比如说豆包,对吧?他需要更快的在迭代的二点零,甚至甚至之后,那我们也是非常期待二点零之后我们能够在整个应用层去做更多的这个探索。那文章呢? 未来我希望就是 ai 这个大模型过程中,我们去服务像彭总这样的一个客户,过程中我们有累积一些经验啊。然后呢做成可复制的,可以快速让企业可以用到这个大模型,可以得心应酬。其次的话就是 客户在用这个大模型过程中其实会有遇到一些问题,我们可以很好解决掉,比如一些高并发症啊,高并发症这种场景,这是第一点。第二点的话就是 我们可以很好帮客户进行快速降本增效,帮助各个企业可以更好的去应用这个 ai 大 模型。我觉得从火山的角度来说,我觉得非常 欣慰的,其实能看到有越来越多的创新发生在,就不仅仅是客服啊,就还有非常多的企业上的场景。我觉得对于我们来说就是大家在一线越做越广的同时,我们能做到 模型的能力越做越深,他们都需要一个强大的、稳定的以及能够综合且普惠的这样的一个平台。那我觉得火山是非常希望能够做这样的一个大家可选择、可放心、安全可靠的一个平台,这是我们的使命,所以我们也会持续在这个方面越做越深,给到他们更深度的 结合着他们业务场景的一些服务能力。嗯,从我们的这个 a、 m、 d 的 这个这个角度来看,未来一定是 ai 的 市场,我们会有更多的精力是把我们一些比如说模型调优的一些专家,我们可能原来只是在基于我们的一些生态场景下的一些调优的一些方案, 呃,可能有一些好的度假事件,但是我们也会拿出我们的比较好的一些内容,然后来服务火山,然后帮助他们在一些模型优化或算子优化里面,我们能不能做好的一些内容和东西,跟火山一起尽快的把二点零、二点五、三点零做出来,然后服务于更多的这种客户? 非常感谢四位嘉宾的精彩分享啊。那其实从啊,从都江堰的道法自然的这个千年智慧,再到今天 ai 客服人机协同的这个科技之巧, 那其实成都始终在用创新追求更加极致的效率与体验,那我们相信未来的客服呢,它也不再是成本的中心,而是价值的引擎, 期待火山引擎有福克 ai、 amd 包括千翻译等众多伙伴的这个共同的努力之下呢, ai 能在成都乃至在全国的电商领域催生出更多更灿烂的创新火花。 本次圆桌对谈呢,也到此结束了,感谢大家的收看,我们下期再见!再见!再见!

朋友们一起来看这个人,虽然我是个 ai, 但是我很自豪, 因为我精通各地方言,哪怕是黑哥们的语言也能通了。黑哥们的语言通不通我不知道,但当我看到这个视频的时候,我真的是谢楠的老公张大了嘴,惊呆了。因为刚才这段非常有质感的短片,从生成到输出只用了四十秒。 演员、导演、摄像、配音、后期所有的这些岗位,现在只需要一个工具。最新升级的豆包 cds, 一 点五 pro, 它还支持同步生成音画,自带运镜能力, 还支持各地方言。这次 cds 升级以后,真的可以说是精准 get 你 的指令,运镜和表演细节也提升太多, 画面的质感直接拉满,这下能玩的花样可就太丰富了。之前总吐槽 vivo 三太贵不舍得用的朋友,国产 ai 平替他来了,现在用几分钟时间,我们一起见证 ai 视频创作如何迎来真正的革命。 可以说,这次 cds 的 升级,我们每一个普通人都可以在生活中用得上。这玩意最牛的地方就是它生成视频和声音是一锅端出来的。以前的 ai 生成视频的时候,先给你整段哑剧,再往上硬配音, 非常像现在的假唱,或者说说双簧。那现在呢?它是边生成画面边配音,所以说口型、动作和声音严丝合缝,彻底告别了以前对口型的那种尴尬。 姐妹们,这个面霜喷雾真是懒人救星,洗完脸直接喷水乳面霜一步搞定。注意看,即使是这种飞快的语速,他的口型,特别是一步搞定这种重音都完美匹配。最关键的是,他那种带货主播特有的节奏感, 不再是僵硬的念稿,而是带有微表情的表演。这意味着 ai 开始理解人类的情绪,而不仅仅局限于文字了。 光能说话还不够,还得会演 cds 一 点五 pro。 第二个突破就是他真正能理解表演的节奏,以及拥有了电影级的运镜 方案。数据错成这样,你今天就别想准时下班,我马上改,我马上改,记住,要绩效还是要全组加班。 看这里,镜头从两人坚定的中近景跟着情绪递进,持续向人脸缓慢拉近,这是 ai 自动控住的节奏运镜,你听组长的声音,从急促怒吃到慢下来的压迫威胁,情绪张力是跟着镜头推进一点点顶上来的。 再看实习生的脸,从紧抿的嘴角到眼尾发颤的特写表情细节,全是跟着镜头的坡度被放大。这已经不再是简单的生成视频,而是内置了一个 ai 导演,连镜头和情绪的咬合度都给你卡的死死的。 而且除了说人话呢,人家还能组乐队唱歌,我们看一下舞台的现场。 不过说实话,这个唱歌的效果嘛,各位自己评价单个演员的演技风神,那多人对话呢?会不会又变成了群口鬼畜?我也试了一试,感觉效果还可以。每次见你,你都穿同一件衣服,怕你是没钱买新的吧。 行了,说明我很专一,看到了吗?没有叠话,没有一起动嘴,逻辑还算通顺。每个人物说话时,其他人会有倾听的一些微动作,这背后是模型对谁在说话的精准识别。 这些高质量的环境音和音效,以前需要专门的后期制作,现在一次性全部打包生成,这意味着 ai 生成的内容真的具备了完整的试听语言的沉浸感。 所以大家发现没有,他最大的一个突破就是自己能思考镜头该怎么切,声音该怎么配。这意味着你只需要一个想法,回一张图片,他就能帮你自动完成剪辑和包装,直接打包生成一个既有画面又有声音和节奏的完整视频, 这简直就是为短视频时代的商业广告量身定做的。比如,我们来简单上传一张猕猴桃的产品图,看看他能生成什么样的成品, 鲜果现榨一口清甜,所以你会发现,豆包 cds 一 点五 pro 已经不再是一个玩具,它是一个真正的生产的工具。无论是个人博客想要提高日更效率,还是中小企业想降低拍摄成本, 它都能直接切入工作流,将创意实现的时间从天缩短到分钟。不会用没关系,我给你一个万能的提示词公式, 记住这个结构,你的生成效果会稳定很多。比如你想生成一个猫,微博客就可以套用一只橘猫,在书房里对着麦克风用东北话说段子, 镜头缓慢环绕,配上轻松愉快的 bgm, 当然,它还在不断进化。毫无疑问,豆包 cden 四一点五 pro 已经清晰地跨过了一条线,从会动会说走到了知道谁在什么时候该做什么, 把最难的表演和导演环节变成了每个人都可以调用的资源。现在你就可以在豆包 app、 吉梦 ai 或者火山引擎上免费体验到它。 欢迎在评论区分享你用这个 ai 导演系统拍出的第一个作品,未来每个人都是自己故事的导演,而现在导演请就位。

豆包大模型一点八发布,更像人的 ai 助手能看视频、会操作电脑,擅长处理复杂任务 今天,火山引擎正式推出了其豆包大模型的全新升级版豆包大模型一点八这次升级的核心是让 ai 变得更像一个能独立办事的智能助手,并在看懂图像和视频方面取得了重大突破。 一、新一代 ai 助手从回答到办事,以前的 ai 大 多是被动回答问题,而豆包一八则强化了智能助手的能力,只在主动帮人完成任务。这具体体现在三个方面,一、会使用工具, 他能像人一样操作各种软件工具,比如自动打开浏览器、搜索操作表格等。二、能执行复杂指令,即使你给出一长串多步骤的复杂要求,他也能准确理解并一步步去完成。 三、管理超长任务面对需要长时间多轮交互才能完成的工作,豆包一点八具备智能的上下文管理功能,它可以自动判断哪些历史信息需要记住,哪些可以暂时清理,确保任务不会中途跑偏或遗忘关键信息,稳定的执行到底。 二、眼睛更锐利从看懂图片到理解超长视频,除了更会办事,豆包一点八的视觉理解能力也大幅增强,变得更会看。他能以较低的频率快速浏览超长的监控视频,锁定关键片段,再仔细分析,从而高效的找到所需信息。 他在理解物体运动、复杂空间关系,以及从图片或 pdf 文档中提取结构化信息等方面能力都有显著提升。三、能力有多强?实测案例告诉你文章通过几个生动的例子展示了豆包一点八如何解决实际问题。一、全网比价助手 当你想要买一款耳机,只需提出需求,它就能自动规划流程,在多个电商平台搜索比价,最终找出最符合你要求且价格最优的选项。二、智能保安车辆被刮蹭后, 你可以将一段长时间的监控视频交给他,他能快速浏览、定位到事故发生的精确时间点和高清画面,找出肇事车辆。 三、企业高级秘书面对需要从海量邮件和文档中筛选、分析、评估并最终形成可量化报告的复杂任务,豆包一点八能调用各种办公软件,有条不稳的完成数十个步骤,输出最优的项目评估方案。 四、领先的技术水平根据官方信息,豆包大模型一点八在多项国际评测中表现优异, 在衡量智能助手能力的权威评测中取得了全球领先的成绩。在多项多模态理解的测试中,其能力也已超越了一些国际顶尖模型,处于全球第一梯队。 总结来说,豆包大模型一点八的推出,标志着 ai 正从一个对话者向一个真正的执行者迈进,他不仅智商更高、眼力更好,更重要的是具备了独立处理复杂现实任务的能力。 这项技术进步将能更深入地应用到电商、生活服务、企业自动化办公等众多场景,不忘大幅提升个人效率与企业运营水平。

什么?火山隐形?就在中午,二月十三号,关于 cd dream 的五点零的版本即将上线,未来所有的图片海报的各种设计会让你的图片进行联想,上网,最终做出更满意的样子, 也意味着以后的设计师可能要慢慢的失业,可能会诞生一个新的职业叫做想法师。关注紫薇,有消息马上报啊!

你想过什么是理想的旅行体验吗?你是不是也有这样的烦恼?查攻略要刷遍十几个平台, 航班取消了,打客服电话老打不通,机场太复杂而时常迷路。二零二五年中国航旅市场旅客体验仍面临全链路挑战。 有数据显示,旅客在出行前花在攻略比价预定的时间长达二十八天之久,期间却访问一百二十一次旅游 app。 旅行中,旅客年均拥堵时间多达八十五小时,遇到航班延误取消,百分之七十八的旅客不知道如何处理而陷入困境。 这些航空出行里的小麻烦,正在被一场技术合作悄悄改变。南航每年要服务一点六五亿旅客,让出行更省心,是我们一直想解决的核心问题。这次我们打造智慧出行管家,就是要让旅客出行全流程更顺畅、更省心。 我们总觉得踏出门的那一刻才算开始旅游,其实从想法诞生的那一刻,旅行就开始了。 我在准备出行前最大的痛苦就是查攻略、刷好几个平台,对比几十条信息,最后花了三天时间整理的行程,还可能会漏掉很多关键的细节。但是现在使用了智慧出行管家,我只需要说清楚一些需求,帮我规划一下去北京的旅游方案,顺便帮我订票, 马上就能帮我定制出最便捷的出行方案,省了我很多的时间。 南航智慧出行管家通过火山引擎打通头条和抖音的旅行内容,将两千多万个景点资源、海量的本地化生活服务数据信息整合起来,快速为旅客提供合适的旅游方案。 同时接入豆包大模型,根据用户的语音或文字输入,即可秒级生成覆盖机票、酒店、景点的个性化出行方案,真正实现型前智能规划、型中一致化、服务、型后情感化分享的全流程智慧陪伴,显著提升了旅客决策效率与出行体验。 一段美好的旅行,从告别路上的纠结开始,轻声告诉出行助手,航班变更即可轻松处理心仪座位唾手可得,机场路径了然于心。 如今使用了室内导航之后,我就能最快速的找到最优的路线前往登机口,省下来的时间还能悠闲的逛一逛沿途的特色商店,甚至发现了一些之前从没有注意到的休息区和餐饮点,这也让我等待的时光变得更充实有趣了。 我们基于火山引擎豆包大模型的多模态理解能力,为旅客打造了智能变更服务,用户只需说,帮我改进到明天,系统即刻自动匹配机票,将复杂流程简化为一句话服务。 针对用户的选座难题,我们开发了一句话选座时机功能,它能理解靠窗、前排等需求,同时捷克 c 型与实时座位情况,在用户表达偏好的同时,完成选座与值机,实现一说即得的便捷体验。 我们通过室内导航系统为用户提供实时动态路径指引,该系统可精准定位用户位置,将其快速引导至登机口、贵宾厅等目的地,同时智能融入沿途相互信息与服务提示, 在平均节省百分之三十步行时间的基础上,帮助旅客高效通行,让每一段机场路程都省时且充满趣味。 旅程的精彩在归来后依然延续。将这些承载故事的票根整理为你的飞行足迹,只需清楚便能分享至社交平台。智慧出行管家也会伴随你的每一次飞行。 以前出差,我可能记不清哪些城市,去过了多少次,但现在,我不仅能在 app 上查看我的飞行足迹,还可以用智慧出行管家生成我的飞行趣闻,下次旅行规划也就有更好的目的地选择了。 对于旅客而言,每一段出行都有着特殊的含义。我们的管家能够帮助旅客把碎片化的票根飞行记录变成有温度的旅程总结, 用户可快速生成旅程回应,并记录下有趣的瞬间。分享至社交平台。旅客虽已落地,但属于智慧出行管家的陪伴还尚未结束。整个南航出行 app 的 七四个功能已全部集中于管家身上。 无论是发票办理仪式、行李找寻,还是下一次行程,我们的管家都已做好了为旅客服务的准备。 本次南航智慧出行管家的正式发布,南航与火山引擎合作,不仅是智能化模块的引入,更是将 ai 能力深度赋能于航旅服务的全面条。 火山引擎豆包大模型凭借多模态交互、实时数据整合能力,全面升级了南航智慧出行管家。 他以自然交互为乘客提供动态一站式服务,显著降低决策成本,提升旅行体验, 同时助力南航构建差异化功能,增强用户粘性。对航旅产业而言, ai 加出行正降低技术门槛,推动企业融入智能生态,加速行业从数字化工具向智能化服务的深度转型。 南航坚持创新与合作发展理念,以营销服务场景为核心,倾力打造行业领先的南航智慧出行管家。以一句话、智能感知与主动服务为鲜明特色, 将人工智能技术作为核心引擎,深度融入出行全链条,不仅精准响应了便捷出行、智能协调的智慧民航核心要求,更生动进行了为客户创造价值的南航经营实力, 将 ai 技术的精度转化为亲和精细的服务温度,让美好飞行触手可及。