你以为的豆包只能聊天吗? no! no! no! 其实呢,它更像是一个教学工具,语文、数学、英语都能用。今天我们用两分钟把它的高效用法先讲清楚。 我现在讲讲豆包是哪里的吧。豆包是字节跳动旗下的 ai 助手,也就是我们刷的 音符,核心目标就是为了让普通人更快完成学习和工作任务。写作、 translate、 翻译、总结、解析都属于他的强项 啊。也对啊,嗯,他背后用的是自解自研的豆包大模型体系, 你可以把它理解成一个很擅长的理解指令组织表达的模型,你说清楚你的目标年级,它就能按照它的标准输出。 所以关键不在 ask question, 而是在给指令。首先呢,拍照或截图提问 题目,试卷作业直接丢进去,然后他就可以为你输出你这个试卷是错的还是对的。第二, 上传你要让它总结的文档或者 pdf, 让它帮你总结框架,提炼重点,哎呀哎呀,太呢了。然后,先给你语文的用法,你先把它当阅卷老师来用, 我常用这个题日词,你是中考语文阅卷老师,题目是啊八啊八,先用五行拆解利益和扣题风险,再给我三大段大纲,每段给两个可用素材方向, 你听懂了吗?还有续学,不要让它只给你 answer, 要让它按照 step 讲理由。题日词这么打,你是一个 math teacher, 你 请按顺序输出。题型是什么?最短的解题路线是什么?每步写理由,我最有可能错在哪里?再出 五道同类型变式题,从易到难代。 answer, 最后是我最喜欢的呢,当然是口语陪练加就错题日词这样写, 你是我的英语口语教练,用日常对话问我五个问题,每次只问一个,等我回答。我回答后纠结并给两句更地道的替换说法。最后总结我最该列的三个句型, 提醒一句, ai 不是 辅助,不是在替你 study, 关键步骤是要你自己验算核对标准。如果你想要我把这些提示词整理成可复制的模板,可以在评论区留言加转发。最后环节, 小爱同学有一门 ai 课,需要大家支持一下。在我主页的置顶第二条视频,你们可以看我是怎么下单的,可能有一点点复杂,但谢谢大家的支持啦!那就等我们下节 kimi 课再见!
粉丝14获赞97

现在所有的企业都在吹自家的 ai 大 模型多牛逼,可是我用着愣是没用出未来,这也是我听到最多的吐槽。确实,各大企业都在疯狂受操作,写代码,写小说,还有什么一句话能够完成一个项目的,结果到我们自己用的时候,要么就是写报告,跟流水账似的,方案都是全部没有办法落地的。废话, 是浪费时间。这种离谱的买家秀,对,卖家秀的问题到底出在哪里?难道是我们充钱不够多呢?不不,核心问题就是我们大部分人在用搜索引擎的老思维在玩 ai, 那 么那么多年的习惯,搜索引擎那样的输入关键词,然后得到一个标准答案,对于 ai 来说,这套玩法是行 通的,纯粹是浪费他的实力。说白了, ai 的 逻辑就是处理器,它能够有多好用,全看你给他的思考够不够。如果你把它当搜索引擎用,它只能给你扯一些平庸的车轱辘话。但是如果你要把它当成外置大脑,哪怕是免费的豆包,那都比二十美金的叉的 g p t 要香。本期视频直接用豆包快速搞定,让人头秃的文书活, 省时又省力。就说年终总结吧,每年都要写这个,跟渡劫似的,脑子里基本上就只记得这两周干了啥,上半年的活跟上辈子活似的, 一点印象都没有,写出来的东西呢,也全都是漏水账,只有苦劳没有功劳,活脱脱就是打杂憋半天憋不出一个核心的产出内容。听我的,这个时候就别用瞎模板生搬硬套了,直接让豆姐来救命。点开豆包的网页端或者是客户端,看到底下那个帮我写作没 开启这个模式,在这个模式中,豆包所有的回复都会直接输入在右边的编辑器里,这个编辑器最香的点在于,既能跟豆包牢牢的记住咱们聊天过的所有细节,又能让咱们随时针对性的修改,不用来回切换画面。首先重点来了,一定要明确你的需求, 先别纠结怎么提问,直接套下面这套万能公式,把自己的情况先填进去。我就以新媒体举例了,大家可以看一下。我作为一名新媒体运营,现在要写年终总结,我今年负责公司公众号和抖音账号从零到一的搭建,公众号发文一百二十篇,涨粉三万,抖音发短视频 五十条,总共放五百万,中间遇到了 q 三季度断崖式的下滑。这段时间我通过转型剧情类的内容把数据拉了回来,我希望这篇总结能够体现我流量风向的敏捷性,并且希望扩充团队加工资,希望老板能够少给我一点工作量。我直接输入了,你们看一下所有内容同步到右边的编辑里面了, 还会自动生成目录,结构一目了然,写的也是有模有样,完全不用自己搭建框架,要是还可以补充数据材料,直接在左边的对话框里面跟豆包说就行,输出的正文从来不会占据你对话框的位置, 咱们也不用反复粘贴复制了所有内容,乖乖的待在编辑里面。如果觉得开头太普通,没有什么新意的话,直接跟豆包说,再改个开头,你们看一下修改地方就会自动高亮起来,而且只改开头,不许瞎改其他的地方,那不像普通聊天模式,哪怕反复强调改一段, ai 也是犟的不行, 要把全书重新发一遍,又慢又容易爆上下文窗口拒反。这个编辑器相当于你本次对话中给了 ai 一个长期稳定的记忆模块,哪怕你写了几千上万字在他帮你改某个小细节, 也不会因为上下文太长搞出幻觉,改的牛头不对马嘴,改完不满意的话直接点回退,恢复上一版。不过我觉得改的还不错,保留当前版本就好 操作,在 word 里面也几乎一样。这还不是最绝的,直接选中一段文字,还会弹出操作框,既能调格式,还有 ai 改写功能。 比如我想要这段文字显得更加有文采,一点点一下更有文采,就能一秒搞定,不用自己逐字琢磨,省事多了,很有不错的出口。接下来要做的就是审核了,要是你还有补充的 数据材料,直接发给豆包就行,之后用鼠标选中想要插入的数据的段落。就像这一段,我发现豆包瞎编了,我没有提示过的抖音粉丝量,这里就可以直接导入后台的数据,选中这一段内容,豆包就会结合我上传的文件纠正粉丝数量,并且分析账号的粉丝用户 画像。和刚才改开头一样,他只会针对一段进行修改,不会乱改其他内容。不过我这里数据是随便乱改的,只是为大家做个演示, 就不发实际的操作了。大家能看出来,这个编辑器辅助写的文案是真的很方便,而且豆包的中文水平是真的很不错,只能说是国产模型, 洋人真的干不出来中国人的事,咱们只需要清楚的说一段需求,他就能够生成质量在线的内容了。以前需要琢磨好几个小时的次早,现在一分钟不到就搞定了。那现在要做的就是,其实只需要审核查数据,让整篇内容有血有肉就行了。等触稿搞定了,数据也补全了,还可以让豆包帮忙整体润色。操作也很简单,选中一下全文,点一下润色, 优化的地方都会局部调整,不用自己逐字逐句的去抠,解放双手, 整套下来之后你就看懂了,这才是正儿八经好用的 ai 写作。用 ai 生成文字这件事,大家早就见怪不怪了,像是这样的能够让你沉浸式的修改、全景掌控的编辑器,市面上真没几家能够做好的, 而且豆包还是完全免费的,而且学会的教学逻辑不只是年终总结,不管是啥文字性质的产物,都可以信手拈来。最后重点说一句, ai 从来不是取代咱们,而是帮咱们把枯燥最费时间的环节给过滤掉,让咱们从毫无感情的码字机器变成了每篇稿子的主篇。下次再面对空白的文档范畴,就别把 ai 当缩缩引擎用了, 打 ai 帮我写作,让他帮你理顺逻辑,再把精力花到真正值得思考的地方,高效摸鱼多香啊!本期视频只是一个抛砖引玉,如果大家想要更多的内容或者是其他的玩法的话,也可以在评论区告诉我,我也会持续更新,给大家带来更多的 ai 日常生活,还有工作场景下的实际应用的干货,和大家一起活在一个 ai 时代,飞速进步。这是不懂就套。老师,我们下期再见,拜拜。

之前有个朋友问我按键精灵能不能接入豆包,豆包是一个很强大的大语言模型啊,我自己还蛮喜欢用的,然后我就查了一下, 发现了,真的可以啊,这里就要感谢这位大佬的无私分享啊。清油,我们也不是第一次用他的插件了啊,之前讲这个 open cv 的 时候啊,也是他分享了这个 open cv 的 用法,非常给力啊,还有这个鼠标的背沙曲线啊,也是他写的,很强。 这次也是他分享了这个豆包的这个接入插件方法,大家可以去他的 qq 群里下载啊,下载好之后,他的插件文件主要是两个啊,一个是 d l l, 一个是 html, d l l 是 他的主体啊, html 是 我们的帮助文档, 一起把两个文件统一拷贝到我们按键精灵的插件文件夹,这里面拷贝进去就可以了,然后你新建一个空白脚本,看它。这里的一个帮助啊,在我们的全部命令里面有个插件命令, 找到这个 a q y 啊,下面啊,这里有个豆包这个代码,我就是直接贴过去了,直接复制啊,然后贴过来这个 apikey, 你 需要自己改一下。怎么获取 apikey 啊?下面这里都写的很详细啊, 你看 apikey 挂链列表,我们可以先复制这个网址, 这个平台叫火山引擎啊,你访问的时候要登录一下,然后这里啊,你可以去创建一个 api key 创建好之后啊,这里啊点这个眼睛啊,就有你的这个 api 了,然后点这个复制,就可以去复制一下,然后贴过来啊,就可以改成你自己的。然后是这个模型 id 啊,模型 id 怎么看?下面也有啊,这里啊 识别模型 id 列表也是一样啊,我们复制一下。 好,这里面有很多模型啊,你可以随便选一个,把它的名字啊整理复制一下。那我这里用的是 flash 模型, 然后在使用之前,我们需要开通一下我们的权限, 找到啊你对应的这个模型的名称,比如说我用的是 flash 啊,我就搜一下 flash 啊这里, 然后点一下后面的开通啊,我这里是已经开通了,所以就显示的是关闭服务啊,你没有开通的话,就需要开通一下,然后这里我们找到一张图片啊, 这是一个驾照考试的图片,我们这里把这个图片路径把它传给豆包, 然后把参数设置好。问题就是问这个图片的答案是什么,然后我们把这个结果把它打印出来。好,我们调试 好,我们来看结果,它这里有一个详细的解析过程,最后答案是这个 c, 那 我们这里可以把这个答案进行一个拆解,拆解之后我们直接输出最后的结果。 c 啊,没错啊,那我们其实也可以简单粗暴一点啊,把问题改一改,直接给我答案,不要任何推理过程啊。好,我们再来看啊,好的,看结果就是 c 啊,就不需要我们去分割了。

hey grok, 国产特斯拉在用不了 grok 的 情况下,会使用哪一款国产 ai 呢? hey, 国产特斯拉因为数据法规用不了 grok, 会用字节跳动的兜包做语音命令,如导航空调,再用 deep sleep chat 处理聊天对话,通过某可能安枕语音服务,就是这样本地话 ai 了。 这个消息是确定的吗?官方宣布的吗? 是的,特斯拉中国官网更新了车机语音助手使用条款,明确提到进入火山引擎的兜宝大模型 the deep sea chat 没正式新闻发布会,但条款就是官方确认已经开始在 model y l 上用了。有什么问题要问 grok 吗?点赞关注留言!

大家好,我是华语科普,专注钻研 ai 大 模型,今天带你全方位合规看懂豆包 ai 大 模型。 本次解析从研发、诞生、发展、迭代、实际运用、合规管控四个维度回归 ai 本质逻辑。豆包 ai 是 字节跳动完全自主研发的生成式 ai, 底层衣托,自研 seat 大 模型基座,全程国内团队独立研发,从立向起,严格遵循国家声称是人工智能服务管理赞行办法,坚持合规优先、安全可控,是正规普惠的国民 ai。 早期以自然语言交互为核心,主打问答、写作、陪伴, 快速成为普通人触手可及的 ai 工具。逐步迭代多模态能力,支持图片、语音、视频理解,实现时听说全方位交互升级至豆包大模型二点零, seed 二点零, 从被动应答进化为 ai 智能体,可自主规划完成复杂任务。豆包并非单一模型,而是 pro、 lite、 mini 等多版本矩阵,适配专业日常轻量化不同需求。 支持百万级头,肯长上下文,一键读懂文档总结书及梳理报告,处理长内容,更高效覆盖文案代码、海报、短视频脚本,一站式满足创作需求。面向个人提供知识问答、学习辅导、生活规划、创意生成,降低 ai 使用门槛。 适配自媒体博主一键生成脚本,适配剪映快速成片,助力短视频高效产出。用于文档总结、会议,既要办公文案,大幅提升职场工作效率。内置多层合规审核机制,实时拦截违法 低俗、不良信息,严守平台运营红线,严格保护用户数据隐私。遵循最小必要原则, 规范 ai 生成内容标识,防范侵权诈骗风险。豆包 ai 是 国产自研合规、安全、落地性强的大模型, 把复杂 ai 简单化,真正服务于大众与行业。我是华语科普,专注 ai 大 模型深度钻研,关注我,带你看懂更多硬核 ai 知识,点赞、收藏不迷路,下期带来更多 ai 实战干货。

哈喽,各位小伙伴们,这里是文兰公子,先祝大家二零二六年二月十七日新年快乐,马年大吉,万事顺意!今天不聊手机电脑,不聊数码配件,咱们来聊一个超重磅、超硬核的科技大新闻,豆包大模型二点零全面升 即正式发布!作为数码博主,我第一时间给大家扒透这款字节跳动旗下的多模态 ai 解决方案,用最口语、最接地气的方式,把它的厉害之处全讲明白,保证小白也能听懂,数码党直呼过瘾。 先给大家划个重点,豆包大模型二点零官方全称是 dog l 杠 c 的 杠。二点零在二零二六年二月十四日情人节当天正式官宣上线。这可不是小修小补的更新,而是豆包大模型自二零二四年五月发布以来,第一次真正意义上的大版本跨代升级。 简单说就是从能用直接跳到超好用、超能干,彻底迈入 ai 实用化的新阶段。不管是咱们普通用户日常用,还是企业搞开发、做业务,都能感受到翻天覆地的变化。 接下来咱们一点点拆解它的核心亮点,每一个都够炸!首先第一个王炸亮点,多模态理解能力全面拉满,直接世界顶尖水平。可能有小伙伴问啥是多模态? 说白了就是 ai 不 只能看懂文字,还能精准看懂图片、视频,理解空间感知时间,就像人一样全方位感知世界。这次豆包二点零直接把视觉推理、空间感知、掌上下文理解做到了世界顶流, 甚至在专业的 ego tempo 精准测试里,第一次超过了人类的平均分。这是什么概念?就是 ai 在 某些感知推理任务上 比人还厉害。而且它还强化了时间训练和运动感知,能实时分析视频流。比如你拍一段运动视频,一段生活日常,它能逐帧分析,精准解读,不管是健身动作纠错、视频内容解读还是复杂画面理解,都不在话下,再也不是以前只会文字聊天的 ai 了, 妥妥的全能感知小能手。第二个让我直呼离谱的亮点,推理成本直接砍半再砍半,比行业顶尖水平低百分之九十。玩过 ai, 用过大模型的小伙伴都知道, 以前高端 ai 模型推理成本巨高,普通人和小企业根本用不起,堪称 ai 贵族。但豆包二点零直接打破这个壁垒,把成本降了一个数量级,性价比直接拉满。而且它还分了 pro 版和 lite 版, 定价超良心。 pro 版三二 k 以内输入百万 tokens 只要三点二元,输出百万 tokens 也才十六元。 light 版更绝,百万 tokens 输入仅需零点六元。这价格谁用得起? 所有人都用得起。不管是个人用户日常高频使用,还是企业处理海量数据跑大规模任务,完全不用心疼成本,真正实现 ai 普惠,再也不用为了用个高端 ai 肉疼了。第三个,超贴心的设计, 四款模型全家桶,灵活适配所有场景,不搞一刀切。很多 ai 升级就一个版本,要么太笨重,要么太精简,用着总不舒服。豆包二点零直接推出四款模型,按需选择,总有一款适合你。 pro 版是旗舰款,专门啃硬骨头,面向深度推理,长链路复杂任务,直接对标 gpe 五点二和 gmi 三 pro 国际顶尖水准,搞科研、做复杂分析,处理高难度任务全靠它。 light 版是性价比之王, 综合能力直接超越上一代主力豆包一点八,日常办公、学习生活用性能够强,还省钱。 mini 版主打速度和效率低、时延高并发, 适合对成本敏感,需要快速响应的场景。比如智能客服、互联网设备交互。 ko 的 版是程序员专属福音,专为编程打造和创意编程平台,深度整合,写代码、查 bug、 做开发,效率直接翻倍。不管是学生、打工人、程序员、企业开发者, 都能找到自己的专属款。第四个,硬核到没朋友的亮点推理和 h 能力封神,国际竞赛拿金牌,专业评测超顶尖模型,咱们不玩虚的,直接看硬成绩。豆包二点零在爱某数学奥赛、 i g p c 编程竞赛这些国际顶级赛事里直接拿下金牌。 在 super g u a health、 bench 这些科学专业领域,评测直接超越 g p t 五点二,甚至在号称人类最后考试的 h l e 杠 text 评测中拿到了五十四点二的最高分,全球第一。这意味着它不只是会聊天,会简单处理任务, 而是能做深度推理,解决复杂专业问题。不管是写数学难题、写高端代码、做科学分析,还是处理各种复杂逻辑任务,都能轻松搞定。 从聊天 ai 变成了解题 ai, 干活 ai 能力直接质变。能力这么强,那到底能用来干啥?应用场景多到数不过来,覆盖生活、工作、行业方方面面。生活里,它能当你的专属健身教练,看视频、纠正动作。能做穿搭顾问, 根据你的身材场景搭配衣服,还能做看护陪伴生活助手,贴心又好用。工作和行业里 金融、风控、智能制造这些需要处理海量数据的领域,它能高效分析,精准把控教育、娱乐、办公场景,不管是解读复杂图表分析长文档、理解视频内容,还是做文案创作、数据处理,全都能胜任。简单说,只有你想不到,没有他干不了, 真正做到 ai 赋能每一个场景,每一个人。最后给大家说说怎么体验这款神仙 ai, 超简单零门槛, 咱们普通用户直接打开豆包 app、 电脑客户端或者网页端,切换到专家模式,就能立马体验豆包二点零的强大能力,不用复杂操作,更新到最新版就行。企业开发者通过火山引擎就能调用全系列 api 服务,四款模型随便用,轻松接入自己的业务。 程序员小伙伴直接在创意平台用 code 版编程,效率直接拉满,不管你是啥身份,都能快速用上这款顶尖 ai, 感受科技带来的便利。总的来说,豆包大模型二点零的发布真的是 ai 行业的一个里程碑,彻底实现了从能聊到能干的质变,多模态能力顶尖,推理成本超低,四款模型适配全场,仅推理能力封神, 再加上超亲民的体验方式,不管是咱们普通用户日常用,还是企业搞创新做业务,都是妥妥的最优解。作为数码博主,我真的为国产 ai 的 进步感到骄傲, 也迫不及待想看看这款 ai 会给我们的生活工作带来多少新变化。最后再祝各位粉丝小伙伴二零二六新年快乐,马年行大运,后续我会继续实测豆包二点零的各种功能,给大家出更详细的体验教程,实用技巧,记得关注文澜公子, 咱们一起玩转顶尖数码科技,解锁 ai 新玩法!

好一条视频,保证大家可以听懂什么是 v l a。 今天理想汽车的郎伯郎贤鹏发了一条视频,他说 v l a 这个东西就是在用 g p t 的 方式来做自动驾驶。翻译一下,其实我理解大家做的事情就是在训练豆包,训练 german 这样的多模态大模型来开车。好,接下来问题就是,我到底为什么要这么做?这么做的好处是什么? 其实以前大家做辅助驾驶,做自动驾驶,更像是在做一个只会开车的,脑子只会开车的模型。打个比方,就像是有一个人,从小在深山老林里面闭关,没有接触过人类的社会,没有人类社会的生活经验。 有一天你找到他,说来,我们一起来驾校里面训练开车,学习科目一二三四,学完之后呢,他在开放道路上开车,确实很多场景会让你觉得有一点点蠢。有一个老生常谈的例子,就是说 有一个皮球从盲区从车后面滚出来,我们很自然就可以推导出,接下来可能会有一个小朋友跟出来,大家要小心驾驶,但当下的辅助驾驶没有这样的思维和推理能力。 再举一个更贴近生活的例子,比如说路边停了一辆车,这辆车究竟是临停上下课我们要绕行,他还是在正常的排队,我们跟在他的后面?当前的辅助驾驶也很难做出正确的选择,背后的原因呢,就是他不具备人类社会的经验、知识背景,这是当前这个脑子的局限性。好,我们换一种思路, 一个人呢,从小在城市里面长大,正常的接受教育,理解人类社会的风土人情、生活经验、知识背景等等等等。这个时候你再把它放在驾校里面开车, 它能够达到的驾驶能力的上限是不是会更高呢?我举个例子啊,比如说你现在就去问豆包,一个皮球从车后面滚出来,那我在驾驶上面应该注意什么?它可以很自然推导出接下来的几秒可能会有一个小朋友冲出来,你要小心驾驶,这就是因为他理解人类社会。再比如你现在用视频跟豆包对话,豆包现在前面的车是 零停车还是路口排队?车辆是零停车,他停在路边,没在路口排队,他的判断率非常的高。当豆包这样的模型拥有了这样的认知和理解能力, 我们再给他更多的驾驶相关的数据,他是不是就是一个更好的司机呢?从逻辑或者从人自己的实践和成长逻辑上来说呢? 我认为是对的,这个本质上就是大家在做的 v l a 就是 在训练豆包,训练 jimmy 这样的大模型来开车。接下来问题就是车企大概率会怎么做?究竟是重复造轮子,我再去做一个豆包,还是说我站在前人的肩膀上?比如说拿 deepsea 千万这样的开源大模型来训练他们开车, 个人的逻辑,第二者会更加顺畅一点,因为你训练一个大模型投入的成本不是几亿、十几亿就能打得住的,它可能是上百亿甚至几百亿, 那车企完全没有必要重复投入,没有必要重复的造轮子,他只需要站在前面的肩膀上,做好车企自己最擅长的部分工作,就是把自己拿到了驾驶数据,喂给这样大模型,让他学会开车, 这才是车企最应该做好的事情。但是这样的研发过程呢,是非常困难的,因为车端的算力有限,他需要解决功耗,解决算力,解决部署,解决帧率等等各方面的问题, 过程一定是非常困难的,不是几个月甚至一年就可以做的好,需要更长的时间来达到质变。从我的观察上来说呢,现在不只是理想在这么做,其他的车企呢,研发思路很相似,所以大家现在集体呢,是进入了一个深蹲期,那什么时候起跳? 我个人感觉还需要一段时间,但我相信当他起跳那一天,他能够达到的驾驶的上限会比现在高,是会让大家看到本质上的变化的。

大家好,我是 gavin。 最新消息,豆包二点零正式亮相, g p t 五点二虽强,但国内用户真的离不开它吗?豆包二点零的亮相给出了不一样的答案。这次字节豆包甩出的 pro、 lite、 mini 三款模型,本质上是在解决成本与能力的,既要又要。不管你是要搞复杂的商业分析,还是追求极致的低成本响应, 可以说都是手拿把枪。尤其是编程专用版和 try 的 联动,网友直呼这是在给程序员发外挂。豆包 pro 版直接全线对标 gpt 五点二和 gemini 三 pro, 大家看这个数据,豆包二点零 pro 在 super gpu 上的分数超过了 gpt 五点二, 在科学领域的整体成绩与 jamming 三 pro 和 g p 五点二相当。国产模型已经杀进了世界第一梯队,从跟跑到平替,国产大模型差的可能只是一次生态的大爆发。目前 app 专家模式已上线, api 也同步开放,你打算把主力 ai 工具换成豆包吗?评论区聊聊。

你敢相信吗?你现在用的豆包啊,在第一版上线的时候,每一句对话都需要人工叫对,就像是自动贩卖机里面真的住了一个人一样。我们把时间拉回到二零二三年六月九号,字节跳动的大模型产品第一次露出真容,但当时它不叫豆包,而是一个极具精英感的英文名, grace。 那时候志杰并没有像友商那样大张旗鼓的开新闻发布会。 grace 的 上线极其低调,采用的是封闭邀请制,当时全网只有不到五万人拿到了内测的邀请码。在闲鱼的二手平台,一个 grace 的 邀请码甚至能被炒到几百块钱。 却没有人知道,这时候的 grace 其实是一个顶级的巨婴。为了这个顶级巨婴呢,当时在志杰内部专门成立了一个名为 follow 的 秘密部门, 核心研发团队约有一百人,由 tiktok 的 灵魂人物朱俊亲自挂帅,但这只是冰山一角。在那段灰度测试期间,志杰背后还动用了超过一千人的专业标注团队,每天要处理超过十万条真实对话的反馈。为什么要配这么多标注员呢? 因为志杰玩的就是暴力迭代。当时的格瑞斯真的很笨啊,没有联网插件,没有画图功能,没有语音库。根据内部测试数据呢,格瑞斯当时的逻辑换绝率高达百分之三十, 你问他复杂的问题,他经常是原地打转,甚至是一本正经的胡说八道。你问他字节跳动是谁创办的,他可能敢回你乔布斯那一千多个标注员,每天的工作就是盯着 grace 胡说八道,然后疯狂打分,纠错为数据, 这就是被骂出来的原因,他们不是在做一个完美的成品,而是在做一个海绵。在 follow 部门的后台呢,数据是秒级跳动的,只要用户在前台点一个踩,这条差评就会在一个小时之内变成训练指令, 传回服务器,对模型进行微调。这五万名内测用户啊,其实是志杰免费请回来的训练师。现在的豆包之所以懂中文,能接梗、不抽风,全靠当年的五万人一口一个智障骂出来的。 就在大家以为 greece 准备转正的时候,志杰做了一个让所有人惊叹发的决定,二零二三年八月,域名直接注销,取而代之的是一个被全行业吐槽吐气的名字,豆包。下期咱们就来聊一聊,从半成品到多模态,志杰到底做了什么事。

志杰这两天可以说是在 ai 领域杀疯了,前几天的 cens 二点零模型已经让大家疯狂了好几天,现在豆包大模型二点零也要在二月十四号发布了,不仅升级了 cens 二点零视频模型,还升级了 c 尊五点零 preview 图像模型,一个暴杀了 open ai 的 solo 模型, 一个打谷歌的 nono banana 图像模型一打二,这你受得了吗?而且志杰最近还被曝光了自己的自研 ai 芯片,据说在三月份就能收到芯片样片,并且是三星代工,预计今年生产至少十万片芯片,用来 ai 推理, 并逐步将产量提升至三十五万片,这摆明了就是要摆脱对外部芯片的依赖,自己的野心还是太大了,这是要打通芯片到模型的全站闭环啊!

咱们平时用的豆包可不是一下子就这么智能的,它是字节跳动自己一点点研发出来的 ai 大 脑,从一开始只能简单聊天,到现在能画画、做视频、写代码,甚至自己帮你办事,前后花了快三年时间,一步步从小白进化成全能选手, 今天就跟大家回溯下他的成长之路。二零二三年,豆包刚出生,先只是在内部练手,早在二零二三年三月,字节跳动就专门组建了一支 ai 团队,想着做一个属于自己的大模型。一开始给他起了个内部小名 grace, 就 像爸妈给孩子起的乳名一样,只有团队里的人知道。直到二零二三年八月,这个小家伙正是有了大名,豆包 还悄悄在应用市场上线测试,也就是咱们说的灰度上线,同时还做了个海外版叫 c c。 这时候的斗爆能力还比较基础,主要就是陪你聊聊天,回答点简单的问题,比如今天天气怎么样,帮我写一句文案,相当于刚学会说话的小朋友,只会些基础操作。 到了二零二三年底,字节跳动越来越重视豆包,专门组建了上千人的工程师团队, flow 团队把它当成核心 ai 项目来做,还让他先在抖音、今日头条等自家的五十多个产品里实习,慢慢积累经验、打磨能力。 二零二四年,豆包毕业上岗,开始对外开放服务。经过一年的内部打磨,豆包终于血有所成。 二零二四年五月十五日,在一场行业大会上,豆包正式对外营业,不光能继续聊天问答,还一下子推出了九款不同功能的模型,覆盖了文字、语音、图片等多个方面,相当于从只会说话变成了能说会看。 这一年的七到九月,豆包更是开启了技能暴涨模式,陆续学会了画画、图声图做视频,比如 pixel dance、 see it 这两个工具,输入文字就能出视频做音乐,甚至还能实时同声传译,你说中文,它能立马翻译成英文,沟通无障碍。 到二零二四年底,豆包已经积累了两千六百多万月活用户,相当于每个月有两千六百多万人在用它,一下子变成了大家熟知的国民级 ai, 再也不是那个只在内部测试的小家伙了。 二零二五年,豆包升级进化,变得更聪明、更全能。二零二五年,豆包进入了飞速成长的一年,核心就是变得更聪明,会做的事更多。 四月份,豆包推出了一点五版本,重点强化了思考能力,尤其是数学题,考了八十六点七分,跟国外知名的 ai 水平差不多, 再也不是那个算错简单数学题的小笨蛋了。同时还升级了画画功能,看图片也能理解的更透彻。还推出了能帮你操作手机电脑界面的功能 os agent 方案,相当于有了一个自动助手。 六月份,一点六版本上线,不光更会思考,更懂图片、视频,还能自动操作图形界面,比如你让它帮你整理电脑文件,它能自己一步步完成。同时还推出了一款超强的视频生成工具 cds 一 点零 pro, 做出来的视频质量在行业里排第一。 十一月份,豆包又学会了写代码 double cid code, 专门针对自动办事做了优化,程序员用它能省不少事。 十二月份,一点八版本发布,这时候的豆包在多模态文字、图片、视频、语音和自动办事方面,已经超过了国外的一些知名 ai, 比如 gemini 三 pro, 标志着咱们国产 ai 不 再是跟着别人学,而是在某些方面超过别人了。 到二零二五年底,豆包的用户突破了一亿,每天有近九百万人在用它,稳居国内第一,全球第二,成为了名副其实的全能 ai 助手。 二零二六年,豆包二点零上线,从被动听话到主动办事。二零二六年二月十四日,豆包迎来了第一次跨代升级,推出了二点零版本, 相当于从少年长成了成年人,核心变化就是不再是你说一句他做一句,而是能主动规划,主动完成复杂任务。这次升级,豆包推出了四个版本, pro、 lite、 mini、 code, 分 别对应不同的需求, 想用到最强功能就用 pro 版,手机内存小就用迷你版,程序员用 code 版,兼顾了不同人的需求,全面对标国外最顶尖的 ai。 同时,视频生成工具 c dance、 二点零、画画工具 c dream、 五点零 light 也同步升级,做视频画画更快更好看出圈,到了国外,受到追捧。 至此,豆包形成了一套从文字到图片、视频、语音的全流程创作工具,不管是普通人还是专业人士,都能用到顺手的功能。 一句话总结豆包的成长之路,二零二三年出生,练手只会简单聊天。二零二四年上岗解锁基础技能,成为国民 ai。 二零二五年升级变聪明,部分能力超越国外 ai。 二零二六年跨代升级,从听话办事到主动规划,变成全能助手,其实豆包的发展史就是国产 ai 的 成长缩影,从基础到全能,从追赶别人到局部超越, 一步步变得更实用,更懂我们的需求,以后还会有更多新技能,咱们一起期待。