粉丝1135获赞13.2万

qq 这次我是真的有空陪你闹,因为这也是我为闺蜜们点播的个性装扮怎么会玩梗速度这么快,我刚玩上鸟都不鸟怎么就连气泡都有了?而且闺蜜我还给你找到了低成本 cos 教程,只要拿出头像框和气泡,想 cos 谁就 cos 谁,甚至是懒羊羊和阿米驴,而且能玩解手机文学,写一集吕布董卓苦命鸳鸯都行。 想随时随地当老农民的话我也略懂一些 npc, 闺蜜,如果这你都不满意,那我只能让你自己去找了。闺蜜,我们要一起用上抽象气泡好吗?好的。



你知道我们的很多产品都是超大规模并发的,如果要为 qq 个性装扮上线一个实时 ai 生成功能, 比如根据用户输入文字生成头像这个功能,那要是在保障体验流畅的前提下,你会如何设计技术方案来控制成本呢?好的面试官,如果是在 qq 个性装扮这种量级上做实时纹身头像的这个功能,那这个重点不应该在模型能不能跑上面。 模型是一定能跑的,但真正难的是怎么在超大病发下还能稳住用户体验和这个成本。所以我会先把目标想清楚,到时什么叫这个实时? 就是我觉得实时不是一次性生成到最好,而是让用户两秒内能看到一个方向。对的,预览先有反馈,高清的部分可以再稍微慢一点, 其实八到十几秒都是这个用户能接受的,这样系统层面才有操作空间。基于这个判断,我会把整个生成流程拆成两段。 第一段是极速预览,就是用这个成本很低的方式,先给用户一个大概效果,让他知道这个风格这个描述是不是自己想要的。很多用户看到预览不喜欢,直接就换词或者走人了, 这一步其实是在帮系统挡掉大量没必要继续烧 gpu 的 请求,只有当用户明确点了,确定生成高清,我才会让它进行这个第二段的这个精修流程,就是用更高质量的生成把细节补齐,这样子一刀下来, 真正高成本的请求其实只剩下一小部分。接着我会把 gpu 当成一种稀缺资源来运营,而不是算力无限用。比如在用户层面就直接分层,非会员或者新用户默认只有预览高清要排队或者限次 会员可以走优先队列,质量更高,这样体验是不需要牺牲,但成本是按价值付费的,在病发高的时候也不会强撑通过排队和异步化来削风。预览呢,就用这个,在线低延迟精修,全部走后台,任务 高峰期可以提高门槛,甚至只给预览,不开放高清,保证必须得系统不崩。 为了进一步压成本,我会尽量让 gpu 一 次多干点活,比如把短时间内的请求拼在一起跑, 常见的风格和参数尽量附用。用户反复点生成的时候,优先把历史结果或者相近结果拿出来给他看,减少重复计算。模型这块呢,也不要一味追求更大,而是用小模型做预览, 高清阶段再补质量,低分辨率先出图,再用超分去拉细节,整体算下来,比每次都完整跑一遍要便宜的多。前端体验上,我会特别注意给用户持续反馈, 比如明确告诉他现在是在理解文本生成草图,还是在做高清渲染,而不是一个转圈圈卡在那里, 真失败了也要有兜底。比如给模板头像或者提示稍后再试,把任务保住。最后还有一块其实也很关键,就是风控,像违规内容刷接口这种,一定要在前面就拦掉,不能让 gpu 去白跑这些请求。 这块儿既是安全问题,也是非常实在的成本问题。整体来说,我会把这个能力当成一套两段式生成,按人群给质量高峰自动降级的在线系统来设计,让用户先快一步看到结果, 真正烧钱的部分只留给高意愿用户,这样在 qq 这种体量下,体验和成本才能长期跑得住。