近日,一位网友用 ai 换脸技术将自己变身为 k 炮歌手表演的短视频因效果逼真到以假乱真,几天内席卷国内外社交平台,引发全网讨论。该网友通过动态 ai 换脸技术,将自己的面部动作及声音替换为 blackpink、 tsa 等多名艺人形象。部分网友表示未经授权使用艺人肖像,可能设计肖像权及著作权问题,技术潜力无限,但需在发展中找到平衡点。
粉丝170.9万获赞8723.8万

这条视频花了我一百个小时,也是我从零接触 ai 的 第一条作品。在这一百个小时当中,我遇到了三个难题, 解决这几个问题之后呢,我就得到了它。如果你觉得这还不错,那等你听完我的实验报告,你一定也可以做出这种效果。对了,我把这一百个小时的经验都留存在文档中了,在评论区送给你。好了,博士让我们开始实验。 我是我遇到了第一个 bug, 同样的提示词,换个镜头就换了张脸, 我误了 ai 没有记忆,希望他听话,不能只靠抽卡,得靠电图。所以我们需要三式图,定妆照。首先通过调整这段提示词,为人物生成半身特写,进行面部的定妆。然后再用这张图片作为电图,加上这两段微调后的提示词,分别生成人物的全身主视图以及测试图。 在文档中,我给大家整理了一张表格,大家可以根据不同的分镜需求去决定到底要垫哪张图。 博士,第二个坑来了,为什么人物总是不看提示词在那乱动呀?我又悟了, a 的 本质是概率扩散, 在复杂任务中,你不能只给他指令,你要给他画跑道,所以我们需要培养真思维。在设计分镜的时候,我们可以给镜头的难度进行分级 固定,或是简单的推拉镜头,锁定手帧即可生成复杂的调度镜头,必须同时锁定首尾帧。同样,我也给大家准备了一张运镜难度的分级表,你可以根据镜头的难度去选择到底该锁哪一帧。 作品即将完成,但我遇到了最致命的问题,画面明明已经很连贯了,但为什么看起来还是有种失帧感? 我彻底悟了,视觉只能完成蓄势,而听觉才能缝合灵魂。 ai 生成的是视觉碎片, 他缺乏物理世界的撞击、摩擦和震动,所以我们要为视频做最后的物理声音补偿。在最后的剪辑中,我们需要用表格中的四个声音层级分别为视频做音效补偿,先根据画面匹配环境,再微调里音,最后出人声音乐。 我是 leo, 每一场以上实验都来源于我的真实创作,拒绝 ai 焦虑,陪你一起进化,我们下场实验见。



宝子们,这个一家三口合照的 ai 指令和教程给大家找来了,你先点击这个小箭头,接着触碰这个图标,然后打开豆包,点加号,依次上传照片,粘贴评论区复制的指令,看不到的截图提取一下发送,稍等一会就生成好了,快去试试吧!



妈,快给我转钱,我真的好爱你。这还差不多,八千够不够?妈,我最爱你了。一万五吧。这么多,幸好妈就生了你一个女儿。 妈,饭做好了吗?你不知道我今天回吗?这么吃惊啊,赶紧转钱呐。妈,我爱你。怎么是我的声音啊?妈,世界上最好的妈。