大家新年好,最近这个 cds 二点零非常火,效果也是非常好的,但是我感觉它最近好像降智了。 这是我之前生成的一条视频,你现在可以说我了,我说你怎么了?你了不起,你清高,你是打野最高的山,我呢,这么多年我就是一个下水道,下水道,下水道,我就是要一步一步一步地爬到最高,做王者,西谷最超标的野王,枪王之王,这个效果非常之炸裂, 没有抽卡,一次生成,而且这还是用的二点零 fast 那 个快速的版本, 但是我第二天去生成的时候,效果完全不一样了。金大人,金大人这里开头就没绷住,金大人有三只手,而且这个是原版生成的,不是 fast 版本生成的,我也超标了,这是最新的打友榜单, 少废话,开始吧。后面我还生成了一条视频,效果也是不太行,尤其是一些打斗和转身的动作,完全没处理好, 什么时候你能把野区刷干净再来找我吧。后面我心血来潮起了一卦,得了三火奔 自己的用是亘,它就是土,体呢,是离火, 它就属火,火生土,那么这个体是被耗泄的,所以说这个降至的事情肯定是板上钉钉的了。那么再来看变卦,这个训是木 啊,这个也是泥,他是火,木生火,所以他后面他的水平肯定会回升的。至于是什么时间训,我们一般是五代表数字五,泥卦代表 数字三,我们就断他个三月五号吧,正好三月五号是金,折到下一个月了。 当然以上的大家都看一个乐字就好了,这期视频就到这里吧。
粉丝31获赞2000

各位最近用 cds 二点零,是不是有种感觉,它价格是亲民了,但偶尔好像不太聪明了?别慌,我是小餐。今天咱们就像老中医号麦,聊聊这降智到底是啥情况。最近圈子里的热议话题, cds 二点零开放后,用的人那是乌央乌央的, 结果呢?有些朋友反馈,以前让他生成个侠客对决,镜头语言电影感十足。现在有时候生成出来侠客的剑可能差点意思,或者背景细节有点偷懒。这感觉就像你常去的一家小馆子,原来大厨慢工出细活,道道是精品。突然有一天,他火了,成了网红店,客流翻了几十倍。 后厨再厉害,一时间也可能忙不过来,偶尔出餐慢一点,或者口味有那么一点点不稳定。现在的 cds 二点零,就有点像这个突然爆火的网红。后厨本质不是降智,是算力过载。 首先得说清楚,这不是 ai 本身变笨了,更不是技术倒退,他的大脑还是那个聪明的大脑。核心问题出在算力和流量的短时失衡上,你可以把算力想象成一条高速公路,模型是跑在上面的车。原来路上车不多,每辆车都能飙到一百二十码,顺畅的很。 现在因为免费开放,价格友好,瞬间涌进来成千上万辆车,大家都想上路,结果就是在某些高峰时段,这条路有点堵, 每辆车可能只能跑六十码,甚至需要排队。表现出来的降智,比如细节模糊,逻辑稍乱,其实是系统在超高病发请求下,为了确保大多数人能尽快用上,所做的一些临时性的资源调度和结果优化, 这是一种保通策略,优先保证服务不崩溃,让更多人能体验。为什么会出现这种情况,恰恰说明了两点。 第一点,技术真的够硬,东西不好不会吸引这么多人挤破头来用。这波流量狂潮本身就是市场用脚投票对产品力的最大认可。 第二点,普惠策略成功把门槛打下来,让更多创作者、小团队能用上顶级工具,这个方向无疑是对的,只是成功的速度可能比预想的还要快。 任何一个现象级的技术产品,在经历用户量指数级增长的阶段,几乎都会遇到类似的压力测试,这可以说是技术普惠路上一个幸福的烦恼。那么问题能解决吗?答案是肯定的。这种由于基础设施扩容速度暂时跟不上用户增长所带来的体验波动,在技术层面有非常清晰的解决路径。 首先肯定是硬件扩容,这是最直接的宽高速公路的方法,增加服务器集群,部署更多高性能计算卡, 就像给后厨增加灶台和厨师。接着进行软件优化,通过优化任务调度、算法模型推理效率,让同样的算力能承载更多的请求,相当于优化交通信号灯和道路规划,提升整体通行效率。最后,还得把架构升级,采用更先进的分布式计算架构,弹性应对流量高峰, 以字节跳动背后的技术工程能力应对这种规模的挑战,是有成熟经验和雄厚资源的。这更像是一个时间问题,而非能力问题。技术团队此刻大概率正在连夜添置灶台、优化动线,遇到生成结果不尽如人意时,可以尝试错峰使用或者将复杂任务拆解。 这就像避开饭点去网红店体验可能更好。短期波动是技术爆发期增长的正常半生现象。 一个有能力打造出如此水准产品的团队,绝不会对用户体验下滑坐视不管。我们正在亲身参与一个工具的成熟过程, 他的每一次卡顿,未来都可能转化为更稳健的架构。现在的每一条反馈都在帮助他变得更好。 技术前进的道路很少是一条直线,它更像是在解决一个个问题中螺旋上升,给 cds 二点零一点时间和耐心,也给我们自己一点观察和期待。相信很快,那个又快又聪明的完全体就会回来。

这几天爆火的 cds 彻底把好莱坞给气炸了,演员工会的直接就发公告痛斥这是赤裸裸的侵权。那就连地表最强的法务部迪士尼也杀进了维权群了,直接甩出律师函给字节。 那为什么呢?因为字节跳动刚发布的这个 cds, 二点零效果实在是太吓人太炸裂了。你只要在输入框随便输入一句汤姆克罗斯和皮特在屋顶打架 那十五秒,电影级的视频就出来了,表情光影,动作,逼真到连亲妈都认不出这是假的。以前拍这种镜头啊,得烧几十万美金,或者你得要像 openai 那 样乖乖交十亿保护费。但现在呢, cds 等于是直接把桌子给掀了,全部免费。那这下可好了,有人拿他生成的钢铁侠打灭霸漫威,一毛版权费都收不到。他们是这样形容的,有人偷了你家钥匙,配了一把,住在你家的房子里面,睡你家的床,那你发现了,最后他还来一句,别生气啊,这就是借用一下。但面对这些控诉呢,自己到现在都没做任何回应。 可能有人还会问啊, open eye sorrow 以前不也是这么干吗?怎么好莱坞不告他呢?我前面也说了, open eye 其实早就把保护费交了,去年就乖乖给迪士尼塞了十亿美金,买了两百多个角色的授权。那如果你还想用漫威钢铁侠呢?行啊,钱给够就行。难怪此事的编剧看完后也绝望的在 x 上发文说, 啊,我们完了。所以这归根结底还是钱的问题,这件事后面肯定还有后续,估计官司也少不了。那你觉得这是好莱坞太霸道,阻碍技术进步呢?还是觉得 ai 这样随便用别人的脸来生成视频确实过分了。评论区说说你的看法。嗯, that's the good stuff and that's a wrap。

c dance 二点零让美国电影协会彻底急了,他们现在正搁外边警告字节跳动的 c dance 二点零大规模侵权,理由呢,是大量受版权保护的作品被未经授权使用, 因为用户只需要两行提示词就能生成阿汤哥大战皮特,指环王截肢同志。但我看这件事并非如此,美国电影协会现在不是怕侵权, 而是怕两行字就能拍电影。这一件事不是由美国人做成的。去年秋天, openai 发了 solo 二同样被骂,然后呢? openai 加了防护,迪士尼签了授权协议,两百个角色合法使用皆大欢喜。就是你发现没有,美国电影协会不是反对 ai 深层内容, 而是反对不受他们控制的 ai 深层内容。 openai 是 自己人,可以谈,可以合作,可以授权。字节跳动是外人必须停,必须封,必须谴责。 版权法对于无耻的美国人来说,就像是一根橡皮筋,需要的时候拉紧,不需要的时候就松一松。之前十四的编剧看了克鲁斯大战皮特,他绝望的说,一个人坐在电脑前就能做出和好莱坞分不清的电影。他说对了,但是他绝望的方向错了, 真正该绝望的不是好莱坞要完了,而是这么好的工具居然是中国人做的。如果这是美国公司的产品,此刻应该在谈新一轮融资,而不是被协会发警告函。爱尔兰导演罗宾逊只用了两行提示词就能生成那只疯传的视频。 而面对争议,他反问,我应该因为输入两行字按一个按钮就该失业了吗?当然不应该,但是美国电影协会的潜台词其实是,如果你用的是美国 ai, 两行提示词就是创意。如果你用的是中国 ai, 两行提示词就是侵权。 所以这件事根本就不是技术的问题,而是看谁掌握了技术,这才是问题。所以美国电影协会的声明表面上是维权,但本质上是官门, 门里是迪士尼和 openai 的 两百个角色授权合作,门外是字节跳动和所有想用两行字拍电影的普通人。他们不是不敢拥抱未来,他们是不敢拥抱一个不由他们定义未来的未来。

大家应该都发现 c 到四二点零不能上传真人图片了,很多人都很着急。其实这个问题非常简单,收藏好这条视频,仔细听好了,只需两步就能解决这个问题。第一步,换装,使用免费的积木换装,打开积木的身图,上传一张自己的照片,给他换个衣服, 挑选一张自己满意的图片,下载下来。第二步,用小云雀生成视频,上传刚才生成的换装图片,用小云雀生成视频就不会违规了。最后大家看一下效果。

全网最近爆火的 sanders 二点零真的是太恐怖了,就比如我想给我的桌上的财神玩偶做个大片,只需要给他拍张照片,然后打开小程序,点开相册,找到这张照片,然后上传上去, 再给他一段提示词,给这个财神玩偶做一个跳出来给大家送祝福的视频, 然后点完成,然后我们选择十五秒点立即生成就 ok 了。视频已经生成好了,让我们一起看一下。新 的一年财神到了,祝大家二零二六年财源滚滚,事事顺利,好运连连,愿你们笑口常开,现在的 ai 真的 进步太快了,就问大家,这样的视频你看到感觉炸不炸裂?

目前我们自己去生成大部分带人脸的照片,其实都是可以通过的,我们测试下来,除非说你用的是那种公众人物的人脸,或者说那种很近景特写的那种人脸,再或者就是说真实度很强的照片有可能被打回 其他的大部分情况,官方现在都是睁一只眼闭一只眼,就哪怕他完全禁止了一个带人脸的人物去生成视频,其实我们也可以去参考一下之前我们在 solo 二的一些做法,比如说你把一个你的真实的一个九宫格的一个分镜图, 然后把分镜图提交给他,然后在提示词里面再补上一些人物的面部的一个描述,这样子话生成出来的人物的视频跟你需要的一个人物基本上是百分之八十到百分之九十的相似度,其实还也还行的。 然后再就是第二个办法,就是把你的图片丢给豆包啊,或者说丢给啊现在 crem 五啊,然后让他去生成你的人物的一个 ai 图片,然后再把这个 ai 图片丢给 sims 二点零,让他去生成视频,这样子的话大概率也是能通过的。 其实就我自己的看法的话,我觉得 c 档四二点零应该是不太可能完全禁止你去上传带人脸的人物的,这样子的话对很多人来说就会变得非常鸡肋, 所以这件事情目前其实影响不大,大家不用担心。然后最近有朋友在问我,我们的工具什么时候能够接入到那个 c 档四二点零?其实不是不想接入,而是官方公告就是他的 c 档四二点零的 api 接口会在二十四号的那个下午六点钟才会去做一个开放,所以目前除了官方的一些渠道,是没有其他平台能够去使用那个 c 档四二点零的, 所以目前大部分号称接入了 cds 二的一个工具或者平台的话,呃,我觉得大家要谨慎一些,然后防止上当受骗。等官方的 a p i 开始开放的时候,我们也会尽快接入到我们的工具上。我是牧童,目前正专注于用 ai。 呃,为服装行业去提供一些解决方案。我们下期视频再见。

ai 圈又炸了,各大科技博主为他连夜制作出视频,他就是极梦 cds 二点零。这一版本的出现大幅降低创作门槛,这是我仅花一分钟做出来的视频, 根本不用去理解那些专业的提示词,你只要像日常聊天一样说出需求,他就能精准理解,并在此基础上优化。他是从未接触过 ai 的 小白,也能轻松上手制作 极梦 cds 二点零将会震惊整个 ai 行业, ai 漫剧等相关行业将迎来爆发期,加上各大平台对 ai 漫剧的扶持,这是普通人入局的最佳时刻。专属 ai 提示词、免费工具包和入门课程我已经全部整理完毕, 感兴趣的六六六,话不多说,咱们马上开始实操。大家好呀!相信今天不少小伙伴都在体验极梦二点零新推出的视频模型,它的实力大家有目共睹,上线后就成为了 ai 创作圈的焦点,不过还有些小伙伴没来得及去尝试,对它一无所知。 不用着急,这期视频我分三个模块,详细讲解它的用法、能力和福利,保证大家看完就能上手,轻松玩转这个强大的视频工具。 一个模块,实测模型能力。我会分享今天测试的各类案例,包括人物、场景等不同风格,说明每一个案例的提示词和生成思路, 让大家清楚的知道它优势的适用场景,避免浪费使用次数。第二个模块,教大家白嫖和低成本使用技巧,这是大家最关心的, 我会把所有使用方法分享给大家,让大家不用多花钱就能进行体验。第三个模块,免费分享视频生成模板、分析图、提示词和生成方案都有,大家直接套用, 零门槛就能出优质视频。最基础的玩法就是人物三式图搭配提示词生成视频能严格控制每个细节,开头的演示片段大家也看到了,画面清晰,动作流畅,还原度高,就是其他模型无法实现的。而且生成的速度快,几十秒就能出一个十五秒的视频。 我的提示词模板会免费分享,大家复制、粘贴、替换核心参数,就能快速生成自己想要的效果,不用费心研究提示词写法。 第二个趣味玩法,截图上传小说内容生成视频,不管是网络小说还是自己写的文字截图,上传到 cds 全能参考二点零,它就会自动解析文字,生成对应的视频片段,把文字格式化,特别有意思。这里提醒大家,小说的内容较长, 它会提炼核心部分生成十五秒的视频,重点是让大家看到它的多模态能力。内置智能体识别图片文字,这也是它强大的关键。和 nasa 一 样,先处理需求,再生成效果更精准。 第三个玩法,用分镜图生成视频,适合想创作完整视频的小伙伴。先用 nano banana 生成宫格人物分镜图,标注好动作和场景,上传后极梦二点零会完美还原分镜细节,搭配提日词,补充光影画面风格即可。提日词模组我会整理好免费提供, 新手也能轻松操作。关于使用方法和白嫖技巧,一定要登录极梦网页版,手机 app 暂时没有这个功能。 入后找到视频生成入口,就能进入二点零版本,首次注册付费的小伙伴有一元开通的福利,非常划算,一元能获得一千多积分,能生成十多次视频,足够新手练手尝试所有玩法。操作完成后,上传素材,输入提示词,就能快速生成视频。 最后, ai 视频教程 cds 二点零使用手册和所有模板,大家评论区或者私信就能领取。如果有任何的问题都可以留言,我会第一时间回复,别忘了关注我,后续分享更多玩法和技巧。这期视频就到这里,大家赶紧去上手体验吧!

这两天豆包上线了免费的 cds 二点零模型,但是跟季梦的 cds 二点零对比,感觉是两个东西啊。这个是季梦的,我生成了一个我的 ai 形象,然后跟季梦说帮我生成一个在夕阳西下玩滑板的视频,然后季梦给了我,这个 就挺真实的,如果没有 ai 提示,真的很难分辨真假。但我用同样的提示词跟 ai 形象给到豆包,他给了我,这个 只能说也挺好,就是这个人物跟我的 ai 形象已经没有任何关系了。所以如果你想正儿八经的搞点有价值的 ai 视频,还是老老实实付费吧。好,那针对极梦,我们再来看一下,如果给他特定场景、 特定声音、特定剧情,会怎样呢?来试一下。这是我写的小剧本,我将它分成了两段剧生成,然后这是我要求固定的场景、人物、道具以及我的声音,接下来看看生成的效果如何。 皇上,今年的高铁票奴才又没有抢到。哎呦,都说了以后叫大哥,清朝已经亡了,是皇大哥,高铁票抢不到,你就用黄包车拉我回去啊。 这。哎,累死老奴了,该死的高铁票为什么这么难抢?看完这个视频,其实还是有挺多瑕疵的,比如这里的这个场景,明显跟我提供的场景是对不上,但然后面我又调整了提示词, 深层了几遍,但每一次多多少少都会有一些些的瑕疵,不过总体来说还是很好的,起码他的分镜很专业,很连贯。好。最后来总结一下,就是,经过测试,肯定还是付费的 cds 二点零更具备可玩性,但是一旦给到他比较细致的要求,目前来说还是有缺陷的,不过如果你不那么抠细节的话, 那么普通人也能做出来很多看着很专业的小段子电影或者是动漫了,而且上手门槛真的很低,再加上如果你的脑洞够大的话,那这个就真的很适合你了。

吸电二点零,很多人都没办法上传这个真人的这种素材照片了,那么都会显示失败,那么我今天总结的有两种解决方案。先说第一种吧,你们可以看到我这里上传本人的照片都是失败的呀,然后呢?后面我为什么这里就成功了呢? 这里成功了是因为我做了一个三四图啊,这是我三四图啊,用这个纳洛本纳的把它合并成三四图,合并完之后呢?嗯,直接上传就可以了,他就识别你是 ai, ai 的 这种三四图就可以生成了。 对了,忘了说,你们这里最好这个分辨率选择这个四 k 啊。然后呢,这个提示词就这样子,很简单的把三张图片合拼为一个三四图,非常简单。 然后如果你们不会用工作流的话,你们也可以用别的这种 ai 的 模型去把它这个素材给转一下,变成 ai 的 素材,它就可以生成了。 然后剩下另外一种方法我就先不说,我也不知道说这种方法他会不会马上被下架,所以你们能用即用吧,好吧,等有需要我再更新第二种,好吧,哈哈哈哈。

这两天有个叫 cds 二点零的家伙迈着六亲不认的步伐走来了,所以他有那么强吗?把这个视频里的角色换成小猫和小狗。楼上三二二住的是马冬梅家吗?马什么马冬梅什么冬梅啊 马冬梅呀马什么梅呀!去掉视频里的人物,把这个视频的运镜应用到这个产品里,用嘴 p 视频的时代真的来了,那这期视频我将教会你 cds 二点零全部玩法。 在小梦梦里,选择视频生成模型,选择 cds 二点零,选择全能参考,再上传宠物玩手机的图片,输入这段提示词,告诉他在规定的时间内做出指定的动作。点击生成, 继续给他一张产品图,再输入这段提示,交代好在规定的时间内做出指定的内容,你就会得到这样的商业大片, 用色彩唤醒活力年轻色彩活力全开, bg 色彩年轻活力无限。先准备一段参考视频,再把要替换的角色和视频都上传进来,输入这段提示词,点击艾特,选择视频,告诉他把视频里的人换成图片里的人物,并模仿视频中的运镜和动作背景换成古代街头 怎么样? 同样给他一段参考视频和产品图,让他把这个产品参考这个视频的运镜,就能得到这样的视频效果。 像这样的广告大片现在也能轻松的复刻出来。 当然你还可以上传一段自己拍摄的视频,再输入这段提示词,你就可以得到。这样 给他两张角色图片和场景图片,再输入这段提示词,你就可以得到一段打斗的片段。 那这是我提前生成好的一组九宫格分镜图片,现在只需简单的描述,你看他竟然能自动切换镜头。总之以上玩法都可以结合使用。对面几个人 是表哥吗?呃呃呃,是表弟呀啊表哥。哈哈哈哈你不要过来呀。 ai 创作虽便捷合规,底线不能越文明玩 ai 创作更精彩,拒绝滥用肖像,尊重影视版权,魔改有风险,创作需谨慎。

二月十四号最新消息啊,字节跳动才发布了三天的 cds 二点零,好莱坞直接宣布联合抵制拥有地表最强版权法务的迪士尼,已经正式发函,指控模型未经许可使用迪士尼的作品,要求立刻停止侵权,不得再犯。 这个春节,注定会是 ai 和 ip 持久混战的开始。为什么叫混战呢?因为它不分法与不分阵营, 直又寡头的互殴。一边是手握 ip 的 内容巨头,另外一边呢,是掌握技术的 ai 大 模型公司。现在全球这个 ai 版权的案件就跟精神分裂一样。在美国啊,作家群体就联合起诉 anthropic and meta, 指控他们在未经授权的情况下,用了上百万本有版权保护的书籍来训练他们的 ai 模型。最后法院判 这个 ai 训练是合理的。在欧洲呢,德国音乐版权协会就起诉 openai, 木尼黑第一地区法院就直接驳回了 openai 的 所有抗辩都只是冰山一角啊。纽约时报也在告 openai 和微软。迪士尼环球影业在速 midori, 环球音乐在速 solno 国内也有啊,爱奇艺在速 mini max。 国内 ip 维权的还有斗罗大陆,斗破苍穹,米哈油的元神数都数不过来,完全没有你。我国的 ip 公司在告美国的 ai 公司, 同时呢,美国的 ip 公司也在告中国的 ai 公司,中国的 ip 公司也在告中国的 ai 公司。混战的根本原因就是因为 ai 发展太快了,强到可怕,已经到开始不讲武德的地步。 这个视频是二零二二年的二月份 midori 的 第一个版本,当时刚刚开始有文字声视频这个功能。威尔史密斯是这样子吃意面的,短短四年过去了,我们再看看今天二零二六年 字节跳动 cds 的 wear 史密斯吃意面,整个画面如此的丝滑呀,运镜一气呵成,人物比例很精准,服饰纹理、场景细节都很细腻逼真, 就说这个动作流畅度,剧情序势的连贯性,还说整体画面感,你别说好莱坞,整个影视行业这个春节都在瑟瑟发抖, 他们现在不站出来的话,很可能在不久的将来,他们就会出现在菜单上。虽然跟版权相关的铭文法国有非常多,但是在现在来说意义都不大,因为整个技术的发展实在是太超前了。整个未来的趋势,唯一可以确定是未来的钱只会流向两头,一头是代表文化资本的 ip, 另外一头是代表技术资本的 ai。 哇,头们打下来,他们自己的盘是能 hold 得住的。但最惨的是中间有一个极长的影视行业的产业链,我说的这一段产业链就包括了 设备租赁、道具美术、服装化妆、群演,还有后期宣发,甚至还有线下的各种司机、餐饮小工作室、小服务商。 眼看二零二六年,这一个产业必将迎来断崖式的缩短,而且很可能到二零二七年会干掉一大批人的饭碗。这个行业的困境就跟当年数码相机学习胶卷行业是一毛一样的。 趋势就是那么个趋势,历史的洪流谁也阻挡不了,本质上这个就是技术资本对文化资本的强势围脖以后在内容这个赛道里面,很可能只剩下两头,一边就是头部的 ip, 另外一边就是顶级的 ai 大 模型, 其实不仅仅是影视行业的中间的小商家小环节,在整个 ai 席卷我们生活这十年当中,有很多身处中间地带的参与者。我举个例子,就像普通的笔译口译工作者,小型的记账公司,普通的会计, 普通的影楼摄影师,后期的修图师,这些岗位很可能在这场巨大的产业改革当中,都会成为支撑头部玩家前行的耗材。

cds 二点零这个视频模型爆火,咱们来说说它背后的关键人物,就是吴永辉。这个吴永辉是 seed 的 研究负责人,他是二零零一年毕业于南京大学, 之后在 uc riverside 就是 加州大学和滨分校读了计算机的博士,是在二零零八年加入谷歌,一干就是十七年,他从软件工程师一路做到了 google fellow, 就是 谷歌的愿士。 这个谷歌愿士是个什么级别呢?他基本上就是最高的技术级别,在管理的基层上相当于是副总裁。这个谷歌愿士的头衔只授于极少数人,他需要你的技术贡献,不仅仅是塑造了谷歌这家公司,甚至往往还引领了整个计算机科学领域。 所以谷歌愿士就是 l 十这个级别,到现在应该也就几十个人,但是谷歌有超过十八万名员工,所以想要成为谷歌的愿士,就意味着你得处于公司那最顶尖的万分之一。那这个吴永辉,他他为什么能晋升成谷歌的愿士呢? 一个主要原因就是它作为 leader 彻底重构了谷歌翻译,就是 google translate。 在 二零一六年之前,谷歌翻译它是用的基于词组的统计机器翻译,这个翻译的效果就是很生硬,而且充满了语法的错误。 这个这个吴永辉,他作为第一作者发表了一篇具有里程碑意义的论文叫 google's neural machine translation system, 就是 用神经网络,用 ai 来做翻译,它们的这个系统把翻译的错误率降低了一大半。这个是机器翻译史上的一个重大飞跃, 他让机器翻译的效果开始接近并且超越人类。当然了,在谷歌光写优秀的论文是不够的,你得大规模的部署,要能做出一个支撑全球几十亿用户的系统, 你需要解决延迟的问题,当时的神经网络推理非常慢,所以这个吴永辉他们团队通过创新的工程手段,解决了这个模型他在训练和实时翻译的时候的这个延迟问题。 这样呢,就让全球的用户能够实时的很快的获得高质量的翻译结果。而且除了在翻译之外,他还在通用语音模型,还有 google 自己的大模型 gemlay, 以及从文本创建图像一些重要的项目中,可以说是履历战功吧。 而且呢,他非常高产,发表了很多论文,是过去十年 ai 领域引用率最高的作者之一。 所以这个吴永辉他不仅是 ai 的 科学家,也是系统架构师,这样的人才就很难得,就是既能做前沿的科学发现,也能把它转化成实用的产品。那吴永辉为什么离开了谷歌,加入字节呢? 这个根据媒体的报道,他是说他想做新的探索,新的工作,这个说法非常的官方啊。 我想字节给他的 offer, 这个钱的方面咱们不清楚,但是显然字节是能给他更多的资源,更高的职位,这样呢,让他有更多的自由度,并且能产生更大的影响力。因为你看一下谷歌,他们在搜索呀,在云呐,在 ai 方面已经占据主导地位了, 所以在谷歌的工作可能主要就是对现有的系统做一些渐进式的改进,但是如果加入字节,就可以从零开始建立世界级的 ai 模型, 所以吴永辉加入了字节以后,他们就做出了 sit down 二点零这个效果非常炸裂,可以生成电影级的视频,而且支持文本啊,图像啊,视频啊,音频啊多模态的输入,还能生成这种多镜头去式的效果,完全像真人在拍 这个 cds 就 一战成名,成了视频生成模型的顶流。当然了,这也是建立在字节的独特的优势之上的,他们的抖音啊, tiktok 啊,有海量的短视频,这就是世界上最好的短视频和音频的训练数据,没有其他的公司有这样的资源, 有这么好的训练数据,再加上经验丰富的领军人物,所以他们开发出领先的模型也是情理之中的。 咱们从吴永辉身上可以看到这种踏踏实实十七年专业能力的积累,从搜索到机器模型到翻译到语音到多模态到视频, 每一步都是在建立在前一步的基础上的啊,所以啊,不要为了一万美元的加薪每年去跳槽,而是去选一个领域去生根,建立自己这个专业知识和能力的壁垒,让你变得不可替代。那样的话呢,你不需要追着机会跑,机会自己就会跑来找你,你觉得呢?