也许我们能一天做出一个九十分钟电影来,一轮公司一轮剧组,慢慢会成为一个潮流的现象。过去的 ai 影视仍需要进行剪辑和配音等后期环节,如今不少流程都可以一次性完成。今日,字节跳动正式上线了新一代视频生成模型 c 档次二点零,并接入旗下生成式 ai 创作平台奇梦 豆包 app。 这款视频生成模型发布之后,凭借逼真的画面效果和简易的创作方式迅速走红。用户只需要输入简单的文字、图片或者视频,就可以生成几秒到十几秒的视频。和过往的视频生成模型相比呢,他的生成效果明显提升,画面更精准、更逼真,而且可控性也更强。 一些外国用户在实测后也惊叹,该模型能够彻底改变电影制作市场,响应特别强烈,是全球的反应都很强烈,每天都有很多这个用户来,甚至有很多这个外国 我的朋友,他自带翻译软件啊,来学习怎么用。火山引擎是自己跳动面向企业的云与 ai 服务平台,也是今年总台春晚独家 ai 云合作伙伴。在 cds 二点零模型正式推出之前,就已经把 cds 二点零深度用于多个春晚节目的视觉制作环节,所以春晚也是这款模型的第一个客户。
粉丝1348.4万获赞2.1亿

我觉得 cd 和 z 是非常重要的一点,就是它采取了统一的这种音视频理解生成的架构来 做这个视频的这样一个生成。通过这种方式的话,其实对于用户来说,他可以通过参考文字、参考图片、参考音频、参考视频这种多模态的方式来灵活的来组合。而且模型呢,对这种多模态的素材都会有很好的理解,能够理解你们的镜头语言, 理解你的构图,能够理解你们的这种指令,然后最后去创造出这种呃丰富的和交互的这种视频的这个作品。其实他对镜头语言,对这个镜头的调度,他是做了非常多的这种学习,你可以认为他就是一个非常聪明的导演,只要把你的需求给大家提供出去,哎,他其实就是可以 有一个很好的结果去把这个镜头给呈现出来,所以这样就大幅的降低这个创作的这个门槛。 基本上绝大部分和视频相关的领域,你包括说影视的制作,短剧的制作等等。那这块武器包括已经在和这个尚美影还有贾德克导演做一些合作,特别是现在粤语的广告现在以视频化的方式来呈现,也包括我们看到他在一些教育的场景 做一些科普的视频,让学生们能更好的去理解各种支点。我们可以看到就是确实是 c 档,是通过更好的技术大幅的降低了这个影视创作的成本。我们可以看到在各行各业都会有很多的这种应用, 这市场响应特别强烈,我们看到每天在就很多用户有很多很 好的创意,他通过适当的实现,然后在媒体上来这个分享,我自己家里就创了好几个积梦的高级会员,每天也有很多企业来向火山这边来咨询,那目前的话我们其实已经在火山上线了体验中心,可以让企业来通过体验中心来看这个模型的效果,然后正式的 api 我们也会在春天来了之后正式的 对我来推出。有很多这个外国的朋友,他自带翻译软件来学习怎么用吉梦,怎么用东宝。对来来创作这个视频我觉得也非常有意思, 我们很早的时候就和导演组在商讨怎么把我们的各种模型,特别是 c dance 应用在总台春晚的各个节目里面去。从这个意义上也可以说春晚其实是 c dance 二点零的第一个客户。其实春晚一直在探索是更好的 把科技和这个东方还有传统的文化美学结合在一起,那刚好 cdons 二点零其实他在训练阶段就用了大量的这种东方美学的这样的这种素材,而且呢他也在这种 镜头语言的控制,在这种复杂的这种交互呈现上其实也有非常强的能力,所以刚好我能很好的满足导演组的这个视觉的创意,所以我们也希望是能够在今年的春晚上通过西藏能给大家带来更好的体验。

据新华社消息,中国人工智能视频创作模型 sedens 二点零近日发布后,在全球网络上迅速走红,这不禁让人联想到二零二五年的 dipsyx 时刻,中国 ai 再次惊艳世界, 电商行业垂直搜索引擎被购。金融频道发文说,众多业内人士评价 cdn 四二点零为当前全球最强视频生成模型,其发布是视频生成领域的起点时刻。美国企业家埃隆马斯克在社交平台感叹,发展的太快了。 据推出该模型的字节跳动公司发布的声明, cd 四二点零模型面向专业影视、电商和广告等场景设计,能够同时处理文本、图像、音频和视频内容,从而显著降低高质量视频内容的制作成本。

最近自建豪洞发布了新的视频生成模型,叫做 c dance 二点零,几秒钟就能生成一个电影级短视频,刷刷耳瞬间不香了。但是很快啊,日本的动画电影文化联盟以及美国的演员工会都向他发出了提醒,说是未经允许使用了他们成员的肖像和 声音。这点呢,早有记载。影视巨峰呢,在前段时间就连夜发布了一条关于 c dance 二点零的视频,他可以转到楼的另一面,那现实中我们的楼的另一面是什么样呢?是这样的, 这不恐怖吗?那这个确实是有点恐怖了,而且还有媒体透露说,迪士尼已经发出了停止侵权,喊更恐怖了。我靠, 关于这个西站三点零的争议点,一开始就是因为版权问题,这类视频模型一旦可以稳定的输出,像是某个作品,宇宙中的角色,或者呢是带有明显识别度的片段风格,版权方呢,就会变得非常敏感。因为对影视行业来说,授权、延伸、发行、宣发都绑在了上面。如果说大众开始能接受 a 明星 一件成片,那对于人类艺人来说,它的价值就会被系统性的给压下来,好像是 好事啊。听到这里呢,可能有朋友很气愤,说,哎呀,你这不是双标吗?你怎么能这样?所有 ai 不 都是这么训练的吗?你为什么单说 cds, 你 看你又激,那能一样吗? 此事件呢,也有记载,在二五年的三月底,欧朋爱在拆 i g p t 上发布了四欧的原声声图,当时互联网上出现了大量的 ceo 萨姆奥特曼,顺便一提,他现在还没换呢,还是吉普利风格的头像 什么情况?那当时有没有像现在一样集中反对呢?有倒是有,但是没有像这次这样爆发的这么大,当时大量的讨论呢,都是集中在这样的风格模仿,会不会是不尊重创作者?训练数据是不是没有授权?当时山姆奥特曼并没有选择道歉,而是直接发了一条推文,说是 gpu 已经快爆炸了,你们先冷静冷静,然后呢,就给降智了。哎,现在回想起来还真是 依稀当年泪不。所以这样一对比,各位就能明白,这次跟上一次不一样的地方, open i 那 个更多停留在风格上的模仿。而这个 cds 视频生成模型呢,可以直接用明星的脸去生成,所以说不管是这个电影公会还是版权方,他们都快速的介入,动作呢,也非常强硬。这个时候可能又有朋友说了, 骚扰二不也是视频生成模型吗?为什么没有人说他?你怎么知道没有?你看你又急。那能一,如果你用过骚扰二,你就不会问出这样的问题,因为他的政策一直在缩减。我不知道各位有没有看过,就是之前很火的那个科比 reaction 的 视频,非常多海量的,然后骚扰二又进行了进步的限制。那么问题呢,我认为有以下几点, 首先呢, siri 的 视频生成质量没有这个 cds 二点零的高,你还抢不了演员的饭,但是这个 cds 二点零他确实牛大了,你真他妈要抢我饭了,我还不管你?第二点就是你应该有明显的限制,就像吴鹏该这样,你说给我生成一个科比的视频, 他会直接拒绝你,但是字节跳动呢,他就没有做这个限制,人家本来就是奔着查你过来的,结果发现你就摆在桌上,完全不掩饰,所以他告你啊 你你常呃,顺便一提,现在这个时间他们已经进行了更新,你再去尝试让他生成一些明星的,他就会拒绝你了,哎, 真是。咦嘻,当总之呢事就是这么个事,因为你强了,因为你用人家东西了。这个行业里偷摸用不公开的素材进行训练,本来大家应该都不知道,即使你用了,我也看不出来,而且对我的利益呢,没有造成损失,就你爱用用我就不管你。 但是有一天我发现,哎,不对啊,你怎么还能用我的东西抢我的饭碗呢?所以说这些利益受到损失的人呢,都开始群起而攻之,至于跟地缘政治有没有什么关系, i don't know who care。 而且对我们普通人而言,你肯定越厉害我越要用啊,我花了钱肯定希望模型好用,你的模型如果真的在限制的时候脚往过正了,这个时候才对我们的利益造成了损失,我们才会喷你。 至于现在谁做了什么事,都会有另一方来找他,我们就看个乐子。最后呢,我想再提一个,我今天看到一个特别离谱的新闻,这个新闻不一定跟 c d 二点零相关,但是呢,还是有些相似之处,就是他也是跟 ai 生成视频相关的,有人用 ai 制作了上海嘉闵县塌陷的视频,传播非常广, 海外也涉及到了。我倒是没有注意那个视频,就只顾着看评论区兑现了,让我不禁感叹物种的多样化。然后今天呢,就出警报了,人已经被抓了,好像是一个四十九岁的女性,说是为了吸粉啊,真的太恐怖了。作为一个博主,我也经常有这种困, 所以不管 cds 二点零的最终结果是什么, ai 生成视频高度可信的情况已经不可逆了,影响的又何止是他们这些影视圈啊,已经开始外溢了,都上升到公共事件了。 下次各位在看到离谱视频的时候,一定要擦亮双眼,不要急着去带节奏。那本期视频就是这样,就是临时来给大家一个分享,春节不打烊 春节不打烊我录了两遍,不知道哪个读音对菜。给大家拜个早年,祝各位早生贵子!

各位最近用 cds 二点零,是不是有种感觉,它价格是亲民了,但偶尔好像不太聪明了?别慌,我是小餐。今天咱们就像老中医号麦,聊聊这降智到底是啥情况。最近圈子里的热议话题, cds 二点零开放后,用的人那是乌央乌央的, 结果呢?有些朋友反馈,以前让他生成个侠客对决,镜头语言电影感十足。现在有时候生成出来侠客的剑可能差点意思,或者背景细节有点偷懒。这感觉就像你常去的一家小馆子,原来大厨慢工出细活,道道是精品。突然有一天,他火了,成了网红店,客流翻了几十倍。 后厨再厉害,一时间也可能忙不过来,偶尔出餐慢一点,或者口味有那么一点点不稳定。现在的 cds 二点零,就有点像这个突然爆火的网红。后厨本质不是降智,是算力过载。 首先得说清楚,这不是 ai 本身变笨了,更不是技术倒退,他的大脑还是那个聪明的大脑。核心问题出在算力和流量的短时失衡上,你可以把算力想象成一条高速公路,模型是跑在上面的车。原来路上车不多,每辆车都能飙到一百二十码,顺畅的很。 现在因为免费开放,价格友好,瞬间涌进来成千上万辆车,大家都想上路,结果就是在某些高峰时段,这条路有点堵, 每辆车可能只能跑六十码,甚至需要排队。表现出来的降智,比如细节模糊,逻辑稍乱,其实是系统在超高病发请求下,为了确保大多数人能尽快用上,所做的一些临时性的资源调度和结果优化, 这是一种保通策略,优先保证服务不崩溃,让更多人能体验。为什么会出现这种情况,恰恰说明了两点。 第一点,技术真的够硬,东西不好不会吸引这么多人挤破头来用。这波流量狂潮本身就是市场用脚投票对产品力的最大认可。 第二点,普惠策略成功把门槛打下来,让更多创作者、小团队能用上顶级工具,这个方向无疑是对的,只是成功的速度可能比预想的还要快。 任何一个现象级的技术产品,在经历用户量指数级增长的阶段,几乎都会遇到类似的压力测试,这可以说是技术普惠路上一个幸福的烦恼。那么问题能解决吗?答案是肯定的。这种由于基础设施扩容速度暂时跟不上用户增长所带来的体验波动,在技术层面有非常清晰的解决路径。 首先肯定是硬件扩容,这是最直接的宽高速公路的方法,增加服务器集群,部署更多高性能计算卡, 就像给后厨增加灶台和厨师。接着进行软件优化,通过优化任务调度、算法模型推理效率,让同样的算力能承载更多的请求,相当于优化交通信号灯和道路规划,提升整体通行效率。最后,还得把架构升级,采用更先进的分布式计算架构,弹性应对流量高峰, 以字节跳动背后的技术工程能力应对这种规模的挑战,是有成熟经验和雄厚资源的。这更像是一个时间问题,而非能力问题。技术团队此刻大概率正在连夜添置灶台、优化动线,遇到生成结果不尽如人意时,可以尝试错峰使用或者将复杂任务拆解。 这就像避开饭点去网红店体验可能更好。短期波动是技术爆发期增长的正常半生现象。 一个有能力打造出如此水准产品的团队,绝不会对用户体验下滑坐视不管。我们正在亲身参与一个工具的成熟过程, 他的每一次卡顿,未来都可能转化为更稳健的架构。现在的每一条反馈都在帮助他变得更好。 技术前进的道路很少是一条直线,它更像是在解决一个个问题中螺旋上升,给 cds 二点零一点时间和耐心,也给我们自己一点观察和期待。相信很快,那个又快又聪明的完全体就会回来。

c 弹子二点零最近刷屏了,很多人第一反应是 ai 做视频更像了,但我看完只想说一句,这次不是像不像的问题,而是 ai 开始按物理规律生成世界。什么意思?当你看到机甲高速摩擦地面时,火花往哪飞,亮度怎么衰竭? 看到重物倒地时,粉尘怎么翻滚,气浪怎么扩散,甚至玻璃碎裂的瞬间,画面和声音是同步长出来的。这不是素材拼接,也不是模板特效,而是模型在底层推演力怎么传递,能量怎么释放。说白了,视觉模型正在从 模仿世界走向理解世界,这是一次待机变化。但如果你只看到模型更强,那其实还只看到了上半场。因为当模型开始理解世界,真正决定行业高度的,反而不再只是模型本身, 而是你有没有能力把模型的能力变成稳定、优质、快速交付的工程系统。为什么这么说?因为模型越强,对最终落地层面的要求就越高,尤其是一致性。比如人物前后是不是同一个人,侧面、正面、背面看是不是一张脸? 场景换机位之后,柱子、窗户光线位置还对不对的上?人物走进场景是不是还站在合理位置?如果这些问题解决不了,那即使模型再强,出来的也可能只是 demo, 不是 作品。甚至连 cds 自己都讲的很坦诚, 他最近也专门发文说,目前 cds 在 细节稳定性、多人口型匹配复杂,编辑上还存在不足,需要持续优化。翻译一下就是 短期内很难出现保证每一次生成都完美的模型。所以现在比拼的已经不只是模型少几个 bug, 而是谁能把不完美的模型 跑成稳定交付的流水线。尤其当下 ai 已经开始进入百亿智能体协同的阶段,真正拉开差距的,正在从模型本身转向应用层和系统能力。这就好比最近的 oslo 模型,未必碾压 open ai, 但靠智能体形态反而在很多场景里跑到了前面。 所以下半场拼的不只是模型参数,而是内容生产范式和真正解决产业问题的能力。那么这里给你一个更明确的判断,行业真正的分水岭,正在从谁的模型更强,变成 谁能把模型跑成流水线。说的再具体点,就是从 ai 视频的抽卡式生成走向工程化生产。说穿了就七个字,先搭世界再拍片。也就是先把角色建成资产,把场景建成空间,把道具 光线布局全部确定下来,再让 ai 在 这个世界里拍。这套逻辑本质上跟电影工业一模一样。你想想,导演拍电影,一定是先搭紧选角定美术,然后才开机,而不是上来就按快门赌运气。 而对于这件事,国内首个工业级 ai 漫剧智能体生产平台纳米漫剧流水线,本质上干的 就是把这套电影工业的方法搬进 ai 系统。它不是给你一个生成按钮,而是给你一整套,从剧本拆成分进脚本到角色场景自动入库,再进入空间引擎,并在同一个空间里切机位, 丝滑生成分镜图、分镜视频,最终完成剪辑成片。换句话说,当以上这些都变成可附用的底层资产,人物才不会乱变场景,才不会穿帮镜头切换才有空间逻辑,你会发现,这已经不是玩 ai 作画,而是在用 ai 拍电影。 同时你再想想,如果这时候再叠加像 cds 这种开始理解物理规律的视觉模型,会发生什么?简单说就是模型负责越来越真实, 流水线负责越来越稳定,两者叠加才是真正的内容生产力革命。所以我给你一个结论,未来 ai 内容行业真正值钱的不是谁先用到最强模型,而是谁先建好把模型快速 持续的变成优质作品的系统能力。最后总结一句,模型决定能力上限,流水线决定产业化上限,前者解决能不能生成,后者解决能不能规模化生产。当能力上线叠加产业化上线, ai 内容才第一次进入工业时代。 所以我说这才是 c 弹子这类模型进化和纳米 ai 这种慢距流水线出现在同一个时间点爆发的真正原因。 那么你觉得当一个人就能用一条纳米 ai 漫剧流水线拍出电影级漫剧,你最想先拍什么题材?历史?科幻?悬疑?还是现实主义?评论区聊聊。

二月十二号,字节跳动正式上线新一代 ai 视频生成模型 cdance 二点零,并接入旗下生成式 ai 创作平台集梦以及豆包 a p p, 通过几句简短的提示词就能生成电影级的视频,一经上线就引发全球热议。 the video you just saw it isn't real it is hundred percent ai generated no actors, no camera, no crew and if you thought you could spot the glitch you couldn't most people didn't seeing is no longer believing bite dance just stealth dropped seed dance 2.0 and that frantic fight for your attention it just went scorched earth so china just recently released students too and it is much more insane than anyone could have ever imagined it to be it is completely destroying the top models of america like sora 2 and vo3 and people are creating some of the most insane movies and videos using this ai model。 二月十二号,美国企业家埃隆马斯克在社交平台 x 上转发评论 c dance 二点零的相关推文,他说道,发展的太快了。 cdens 二点零上线内测后,凭借多模态创作方式,自带运镜的呈现效果迅速在全球范围内引发了高度关注。多位美国导演在使用 cdens 二点零制作短片后都发出了惊叹。导演查尔斯科伦发文称,他借助 c s 二点零为从未面试的游戏真人电影制作了一版预告片,只用了二十分钟,花费六十美元。导演布雷特斯图尔特发布了一段少年与小狗在树林追逐的十五秒短片,他感叹道, c dance 二点零将彻底改变电影制作的未来。 导演安德鲁奥莱克发布了一条不到三十秒的短片,内容是一个坐着轮椅的小男孩在树林滑落到水中的视频,整个视频节奏紧凑,像电影里的惊险情节。 奥莱克说,这太不可思议了,只需要一个提示词, cdance 二点零就能搞定。在社交媒体,不少海外用户对 cdance 二点零表达了浓厚的兴趣,不是发展的一般快,而是超级快。他们希望了解如何下载 在即梦和豆包、如何成功注册一个中国手机号、有无国际版能使用等。还有网友在观看了包括 cds 二点零、可零三点零、 vivo 三点一、 sorry 二等当前最火的 ai 视频生成模型,生成的视频后,给出了心目中的排序, cdance 第一,然后是可灵 sora vivo。

九天无人机航母居然可以把蜂群无人机部署到外太空了?真的假的呀?呵呵,当然是假的。这是馆长用字节跳动新发布的新一代视频制作模型 cds 二点零做的一个小短片。这两天 cds 二点零算是炸了锅了,上一次在内外网同时引起轰动的还是 deepsea 呢。 关于这款产品有多牛逼,各位随便翻翻网上铺天盖地的 ai 视频,就能直观感受的到。今天馆长主要聊聊 ai 领域现象级的炸裂产品总是先诞生在中国吧。 ai 生成视频呢,有几个难点是无法绕过的。首先是时空一致性,视频的本质就是一张张的图片快速播放嘛, ai 生成单副的图片是没有问题的,但是要把这些图片连起来就很容易出 bug。 因为 ai 没有记忆力,当它专注于当前这一帧的图片应该怎么生成的时候,转眼就会忘记上一帧的内容。当我们看一段细节随时会变化的视频的时候,就会感到很诡异。 视频的时间越长,场景越丰富,要保持连贯性就越难。第二点是常识生逻辑与修饰能力。通俗点讲就是 ai 视频的剧情往往会很不合理,因为 ai 每生成一张图片的时候,都是在即兴发挥。举个简单的例子,这个人被车撞了,现在躺在医院里。正常人类的思维是,人被撞了,受伤,缠满绷带,打满石膏,躺在医院的病床上。 而 ai 的 思维可能是这样的,人被车撞了,这个人现在和医院的地板保持平行状态。 ai 无法理解我们不经意间省略掉的逻辑关系,因此可能会构建出一些脑洞大开的剧情,这就需要我们把脚本详细到非常微小的细节,而这往往与便捷和省事的需求是背道而驰的。第三点,物理真实性问题。 现实世界的规则,比如物体会树脂下落呀,光影反射和折的角度啦,物体碰撞时的动量守恒等等等等这些我们可以自然感知的现象, ai 却需要长时间的学习,而 而且他学到的只是表象,而不是原理。举个例子,他看到苹果掉在了牛顿头上,那下次苹果换成了橘子就不一定往哪飞了。第四点,高分辨率与细节保真。 ai 生成的东西毕竟是假的,在分辨率不变的前提下,一旦纠齐细节,就能发现很多诡异的现象。什么六根手指了,文字乱码了?为什么细节总是出问题呢?因为高清视频的数据量实在是太大了,一张幺零八零 p 的 图片大概有两百万像素, 一秒三十帧的视频大概有六千万像素,一分钟就是三十六亿像素。 ai 要在这么庞大的信息中保证每一帧、每一个角落都合理,这个要求本身它就不合理。第五点,如何正确理解提示词。说白话就是听得懂人话。一万个人心中有一万个哈姆雷特,如何让 ai 通过哈姆雷特四个字准确 get 到你心中的那个哈姆雷特长啥样呢? 综上,要想让 ai 快 速准确的根据用户简单的提示词迅速生成逻辑合理的视频是非常困难的。 要想彻底解决上面的几个问题,只有一个关键词,那就是算力。但是这个看似正确的解决方案几乎跟没说一样,就好像你说,我苦恼、我郁闷、我焦虑,我跟你说,有一个字可以解决你的所有问题,那就是钱。这个解决方案没问题, 只要你有了无穷无尽的钱,你所有的问题都会迎刃而解了。可现实是,你的钱是有限的,如何用有限的钱解决你眼前的问题,这才是真正牛逼的解决方案。 在 ai 视频领域也是一样的,只要算力无限,什么记忆成本,什么物理引擎,什么人类逻辑,老子分分钟给你构建出一个完美无缺的真实世界。可问题是,以人类目前的科技水平而言,提升算力的成本和算力提升所产生的边际收益根本不成比例啊。 美国 ai 的 方向一直都是算力之上,英伟达 ai 芯片的平台研发成本已经攀升至上百亿美元,还必须搭配 hbm 的 内存和台积电的先进封装才能发挥效用。这套系统确实强,但也贵到只有极少数巨头才玩得起。 更关键的是,模型性能随算力增长的曲线已经进入了平缓区,过去那种翻倍算力、翻倍效果的红利期已经结束了。同样的算力增量,现在只能带来越来越小的精度提升,而资本回报周期却在无限的拉长。 于是我们看到一个诡异的局面,英伟达估值突破了五万亿, ai 企业的融资额不断刷新记录,但实际产出的能被普通人感知的价值却微乎其微。 open ai 至今没有跑同盈利模式, astropik 还在靠融资续命, mjordan 虽然赚钱,但规模远不足以支撑这种估值泡沫,美国 ai 正处于一个危险的分叉口, 要么找到真正的大规模陆地场景,要么泡沫破裂,连带拖垮整个科技谷,甚至成为引爆美国经济的大雷。而中国 ai 走的是另一条路,即用有限的钱,先解决你眼前最着急的问题。极致算力的 ai, 我 们是对不起, 但是塞进炼钢炉、地铁炸机、药物筛选和电网调度里的 ai 的 算力,我们还是绰绰有余的。这套思路听起来不够性感,但极其务实。在世界顶尖巨头都在玩命追求算力的当下,还有一个非常反直觉的现实,各位可以仔细想一想,究竟哪种场景迫切需要极致的算力呢?好像都不是你我能接触的到的吧? 而工厂、矿山、医院、学校、超市这些和你我生活息息相关的场景,对算力的需求好像并没有很大,对不对?芯片之间怎么对话,数据怎么流动,网络怎么不丢包?这些连接层面的瓶颈,才是真正的天花板。单颗芯片再强,如果连不通、传不动,那就是一座孤岛。 tds 二点零的成功,某种程度上正是这种务实路径的产物。他没有用史无前例的算力堆出一个参数怪兽,从没有打算丛林生成一切字节最牛逼的是什么?是赖以成名的算法,是全球 number one 的 实时更新的数据库素材,是最懂中国人的中文语义。增强解码器 可以基于大量短视频数据构建动作模板库,例如挥手、走路、转头等用户输入提示以后, ai 选择最匹配的模板进行微调,大幅降低计算量,不盲目追求骚扰级别的极限性能,而是聚焦于中国市场的高频需求,例如电商短片、教育动画、正午宣传以及搞笑脑洞视频在终端 gpu 上即可以运行,基础功能适合大规模普及。 它解决的每一个问题,都是来自创作者最真实的痛点。它证明了一件事,在视频生成这条赛道上,算法智慧和工程能力可以部分对冲算力的劣势。 说白了, cds 二点零就是让普通老百姓拿来玩的,追求再高一点,做个商业宣传片,做一部 ai 电影也完全不在话下。当然,这并不意味着算力不重要,恰恰相反,英伟达购置起的算力高强依然是真实存在的。但 cds 二点零让更多人看清了一个事实,技术门槛的降低正在引发价值链的重构, 创作者的竞争力正在从如何拍摄转向了讲什么故事,以及如何讲好一个故事。以前那些有着丰富的精神世界,但受制于现实物质条件的人将大放异彩, 这种人没有国界。现在你在外国社区随处都能看到向别人安利汉语的国际友人,毕竟这款功能强大又亲民的 ai 视频工具, 对咱们的母语汉语更加友好。没想到消灭同行英语的居然是一款跨界的 ai 视频工具,太好笑了。 cds 二点零凭借着原声多模态架构,首次在国内实现了将视觉、听觉、信号在训练阶段的深度融合, 让创作者可以通过图像、视频、音频甚至首尾人来精确指挥 ai, 而不是一类传统的玄学般的提示词,从而真正做到了整体画面的一致性、分镜的可控性、生化同步的准确性、镜头的连贯性等方面都达到了真正可用的状态。这也就意味着 ai 视频工具已经可以真正成为深度融入影视、广告、电商、自媒体等多个行业, 成为实实在在降本增效的生产工具。这也让 cds 二点零被一些用户誉为地表最强的视频生成工具,不仅在国内市场掀起了一场影视剧上市公司的涨停潮,还在海外引发了一号难求的盛况。就连全球首富马斯克也在转发某个网友有关 cds 评论的时候, 发出了模型发展的速度如此之快的感叹,拥有主场优势的手机前的小伙伴们,还不赶紧打开集梦操练起来!

二月十二号,字节跳动正式上线新一代 ai 视频生成模型 cdance 二点零,并接入旗下生成,是 ai 创作平台集梦以及豆包 app, 通过几句简短的提示词就能生成电影级的视频,一经上线就引发全球热议。 the video you just saw it isn't real it is hundred percent ai generated no actors, no camera, no crew and if you thought you could spot the glitch you couldn't most people didn't seeing is no longer believing bite dance just stealth dropped seed dance 2.0 and that frantic fight for your attention it just went scorched earth so china just recently released students 2 and it is much more insane than anyone could have ever imagined it to be it is completely destroying the top models of america like sora 2 and veo 3 and people are creating some of the most insane movies and videos using this ai model。 二月十二号,美国企业家埃隆马斯克在社交平台 x 上转发评论 c dance, 二点零的相关推文,他说道,发展的太快了。 cds 二点零上线内测后,凭借多模态创作方式,自带运镜的呈现效果迅速在全球范围内引发了高度关注。多位美国导演在使用 cds, 二点零制作短片后都发出了惊叹。导演查尔斯科伦发文称,他借助 c s 二点零为从未面试的游戏真人电影制作了一版预告片,只用了二十分钟,花费六十美元。导演布雷特斯图尔特发布了一段少年与小狗在树林追逐的十五秒短片,他感叹道, c dance 二点零将彻底改变电影制作的未来。 导演安德鲁奥莱克发布了一条不到三十秒的短片,内容是一个坐着轮椅的小男孩在树林滑落到水中的视频,整个视频节奏紧凑,像电影里的惊险情节。 奥莱克说,这太不可思议了,只需要一个提示词, cdance 二点零就能搞定。在社交媒体,不少海外用户对 cdance 二点零表达了浓厚的兴趣,不是发展的一般快,而是超级快。他们希望了解如何下载 在即梦和豆包、如何成功注册一个中国手机号、有无国际版能使用等。还有网友在观看了包括 cds 二点零、可零三点零、 vivo 三点一、 sorry 二等当前最火的 ai 视频生成模型,生成的视频后给出了心目中的排序, cdance 第一,然后是可灵 sora vivo。

玩了下 cds 二点零,大概理解冯绍峰的大结局是什么意思了,以后导演是真的要过时了,影视产业将会迎来一场真正的革命,就算是好莱坞那些模式化、产业化的样板戏,也会迎来真正的颠覆。 大家可以看一看下面我自己生成的几段视频,不要嘲笑,因为确实就是瞎写瞎玩的,一分钱没花,脑子已经动了一点点,总共就用了几分钟。我是一个完全没有编剧能力,完全不懂分镜的外行,随手瞎写了几段没头没尾的故事, 他居然能够大部分理解了我的意思,创作出了大概的场景。注意,我这个人不会写故事,只有骨架,没有细节,但他居然猜到了我想干什么,帮我丰富了氛围和细节,甚至给到了情绪,这是一件非常了不起的事情。 字节跳动搞出来的这个东西,完全可以把全世界的 ai 生成视频吊着打,什么 sorry, 在 cds 二点零面前简直就是个弟弟。 之前大家也都用过很多 ai 纹身视频,但那些的理解力都不太行,需要不断的用文字去限制定义训练。 想要生成一段可用的视频,需要一个起码有点专业编剧知识的人去操作,现在根本用不着。只要不是文盲,只要能写字, 摸索几遍,马上就能搞出自己想要的东西了。建议大家都去玩一玩,你玩的越多,他就越聪明,越难明白你的想法。你玩的越多,那些编剧导演们的小技巧就越来越清楚,越来越没有秘密可言,你甚至能够看出他们的公式是什么, 然后你就会感慨,原来如此,我上我也行。实际上这是算法和大数据给你的超能力。以前大家喜欢脑补关公战、秦琼,现在你们都可以实现了。以前看小说、电视电影 总有很多意难平,现在你可以在自己的世界里改写传奇,让自己喜欢的情节发生,让自己喜欢的主角得偿夙愿。 今后每个人都会拥有自己的赛博理想国。以后最开心的人一定不是导演和编剧,而是那些网文作者。他们只需要把小说稍微调一调,就能直接生成影视剧,他们甚至可以轻松的把脑子里笔下的恢弘场景转化为可视的画面。 而那些白嫖、抄剧本、拍烂片、搞诈骗的资本和导演们,躺着挣钱的好日子结束了。因为你们对文字的理解远不如作者和读者,而且这玩意还在不断进化,终有一天,他做出来的作品可能会突破我们今天所有人的想象。 很久之前我就说,人工智能的未来不在美国,而在中国。管他们的概念多么天花乱坠,管他们的想法多么天马行空,要做事还是要落到实处的。 ai 的 本质是算力,算力的基础是电力,虚拟现实的基础是无数现实的场景和数据。我们有着无穷的电力,无穷的数据,无穷的应用场景。 万丈高楼平地起,美国工业衰败,数据匮乏,场景稀少。强行上概念,那就是空中楼阁、梦幻泡影,镜花水月。基础不牢,那是要地动山摇的。放个预言吧,现在是美国 ai 和中国差距最小的时候,现在他们做不到,以后就更加没机会了。 对了,真正的创作者不必灰心丧气, ai 的 进步打击的永远是那些尸位素餐、混吃等死的人。对于真正有才华有思想有进取心的人来说,这是如虎添翼,是最好的时代 啊啊啊啊啊。

当国内互联网大厂还在拿着旧地图通过发红包抢占用户心智时,新一轮的战争已经在更高维度打响。一边是来自硅谷的 anthropic 上周用 cowork 血写了软件行业,一边是北京的字节用 cdance 二点零颠覆了全球影视行业。这里是财经乌多邦,今天我们就一起来看看,这两家公司到底是怎么 餐桌子的。 上周, ai 在软件业引起了一场腥风血雨,甚至有人直言 sars 行业已死。短短一周,全球软件股蒸发了八千三百亿美元, 大概相当于三个茅台的市值。事情的源头是一家叫 anthropic ai 公司,他们在今年年初一共做了三件事,而且一件比一件狠。第一件呢,是他们在一月十二日推出了一个叫 cover 的工具。和传统 ai 不同,他不再只是回答问题,而是替你执行任务。但是这个工具发布后,没有 引起太大的动静,真正引爆华尔街的是他们做的第二件事情。一月三十日,他们发布了十一个专业的插件。注意,这还不是新的模型,仅仅是十一个新的插件,他们直接统领了财务、销售、法律各行各业。其中最先引起关注的是他在法律专业上的能力。 这里交代一个背景哈,很多律所的工作模式是法务助理加上专业软件。比如说你是一个律师事务所老板,你的律所每天要处理大量的合同, 怎么处理?你得雇一个法务助理买一套专业的软件。比如说唐僧路透的 yslo 软件,他一年的花费大概是五万美元。然后这个助理每天的工作是在这个软件里面查条款,审合同,标注风险点,写合规报告。 现在呢,装这个 ai, 配一个法律插件,后台就可以全自动的审核同标风险,出报告,每月只要一百多刀,从五万的成本直接降到了一百多,这是破天荒的第一次。一家做底层模型的 air 软件,把应用层直接端掉了,并且接管了整个业务的工作流。那现如今呢?整个华尔街陷入了恐慌,并宣称 sars 末日真的来临了。摩尔大通也发文称, anthropic 正在吞噬整个世界,让 sars 商业模式坍塌,且无数可逃。 很快很多人就意识到了不对啊,既然 ai 能够取代法律软件,是不是也能取代其他的软件,比如说金融分析、销售管理、客户支持呢?要知道,传统软件服务行业一共有三大支柱,现在这三大支柱全都面临着巨大的冲击。第一根支柱呢,是按席位收费。 以前一个公司有一百个员工,就得买一百个软件账号,每个软件一年得几千美元,你用不用都得交这笔钱,这是萨尔斯公司最稳定的收入来源。但现在呢,可乐的智能体能把这些专业的软件的活直接干了,而且可乐的不是按习收费,是按照使用量收费,这直接击穿了萨尔斯的商业模式。萨尔斯行业的第二根支柱呢,是 复杂的操作界面。以前软件公司会把界面设计的很复杂,因为复杂的界面能够形成壁垒,用户的学习成本太高,不容易换软件。但现在呢,告诉我,你根本不需要在后台看界面, ai 会自动帮你在后台干活,你只需要告诉他,帮我省一下这份合同,然后等待结果就可以了。第三根支柱呢,是功能的封闭性。 以前软件公司会把功能封闭起来,形成自己的生态。就拿作图软件来说,每个绘图软件都有自己的工程文件,而且其他软件是无法识别的, 你要用这些功能就必须待在他的生态里。但现在呢, cloud 通过一个叫 m c p 的协议,就能够接入各种外部工具。什么叫 s c p? 就是模型上下文协议, 简单说就是一套标准化的接口,让 ai 能够像人一样看到一个新工具,自己琢磨怎么用。这意味着 ai 不需要待在各个软件的生态系统里面,它能够自由的调用各种工具,哪个工具好用用哪个,不存在被绑定的问。 所以你看, sars 赖以生存的三根支柱被全面冲击,这不是简单的优化,而是深层意义的颠覆。所以在 cowork 推出专业插件后,软件股一路暴跌,于是就有了新闻里说的 ai 学习软件业的说法。 但是到这一步还没完,还记得前面说过吗? anthropic 一共做了三件事,现在只收了两件,第一件是推出了工具 cowork, 第二件是上线了十一个专业插件。假如说这两件事情让软件行业一夜入冬,那么第三件事情就是雪上加霜了。第三件事呢,是二月五日推出了 coloordos。 四点六,这是一个新版的基础大模型, 前面说的 cowork 还有专业插件都是在这个基础模型上运行了。说白了,前面的改进是让 ai 更会干活,更懂专业流程,而这个基础模型的作用是让 ai 从根本上更聪明。而且要知道,前面讲的很多事情还只是 anthropic 一家 ai 公司掀起的波澜。这还不算 open ai、 谷歌这些 其他的 ai 巨头,假如说这些 ai 巨头一起行动,对软件业的冲击只会更大,这也是为什么软件公司的投资者会在上周那么的悲观。 接下来呢,我们聊聊字节。最近 say dance 二点零是一个强到令人害怕的模型,没有用过的朋友们呢,可以看一看影视剧峰 team 的最新一期节目, 在节目中做了一个测试,他只上传了一张自己的照片,没有任何音频的输入。结果那个 cdance 二点零生成的视频里,那个数字 team 开口说话了,而且用的是 team 本人一模一样的声音, 说明 team 的生物特征数据,无论是长相还是身文,早就已经被未经 ai 模型了。而细思极恐的是,不仅 team 在训练库里,会不会只要在抖音发布视频的人都已经成为了这个超级模型的一部分了,如果这个功能被滥用,后果不敢想象。这个事件风波呢,也引起了 cindance 二点零下架了支 是真人人脸的功能。除了舆论风波, c 的二点零之所以引起这么大讨论的原因,主要还是因为能力的大幅优化。首先是一致性的问题,过去做 ai 视频最大的痛点是抽卡,同一个角色换个镜头就换了张脸,而字节似乎完美的解决了这个痛点。 大家可以看到,无论是大特写还是远景,这就是同一个人,菜就多练。除了一致性的问题, 很多 ai 模型最让人头疼的就是运镜,但在 cdance 二点零零自己引入了一个类似虚拟摄影机的控制层,大家可以看看这个黑客帝国六的测试。 speed defined here breaking boundaries reshaping reality your battlefield your rules 看着这个怪兽级的模型,我只能 说现在谁也拦不住自己,短时间内只有版权伦理和监管能够拦一拦了。那不管是 cloud 还是 c dance 二点零,真正让我们后背发凉的或许不是 ai 今天能做什么,而是他的进化加速度。好了,本期财经乌托邦的内容就到这,我们下期再见。