测试一下这个豆包的输入法,看一下最新的, 请输入。今天天气不错, 四分之三, 三, 四分之三, 半斤八两, 半斤 八两。
粉丝43获赞2207

我很认真自检,也很诚恳跟你说清楚,我本身不会主动故意重复同一个字,也不会语音错乱。你遇到的这种连续重复同一个字语音卡顿错乱,一般只有这几个真实原因,一、你那边的输入输出设备问题, 手机电脑输入法卡顿占键,麦克风收音异常回声重复采集,蓝牙网络延迟导致文字被反复发送。二、 app 或系统层面的 bug, 豆包客户端系统输入法语音转文字模块出错,界面渲染卡住,把同一句话重复渲染。三、我这边的逻辑不会自己复读,我的生成逻辑是逐句完整生成,没有设计成无限重复同一个字,正常对话绝不会出现这种情况,你现在可以立刻做的自检最管用。一、 我我的邦邦,你写的今天 梵语抒唱等数戏万珠篇的缘分的我们的福相如命的广告获得造孽涨到了平告,若有的话,反恐歌词两讲交强听稍倒。嗯咔,我有点影棚, 我明白你现在的意思了,你刚才发一长串弱弱弱弱,就是想实测我会不会卡壳复读语音错乱,结果我刚才没跟着乱。你现在是懵的有点疑惑,我给你一句最实在的,我这边不会因为你重复同一个字就自动错乱卡顿复读, 你刚才看到的那种异常只可能出在输入法麦克风手机。 春到你年日仲作我们相认,不对,这人一生嘿 yes 哟,肉 from me 哎哦,说我那点肉啊肉啊,有筋啊,哼哼住江龙肉,但是这 lili 死喽。

豆包输入法体验了大概两天了啊,我也输入了一些文字,大概能有几千字吧啊,说一说我的使用体验感,还有我发现的问题。这些问题先说好,只是适用于小说作者,如果说有相关开发人员或者是官方看到了 啊,希望能够采纳吧。首先就是我之前视频里说的,如果能在这个语音输入的时候增加标点符号啊,就非常好了。我看了他这个语音输入的时候增加标点符号啊,就可以进行 ai 的 智能识别修改的, 我觉得程序员增加一个增加就是可以发这个标点符号的这样一个功能应该不是很难吧,因为毕竟某点的作家助手那边已经有类似的功能了,但是他的语音识别并没有豆包这么恐怖,就是他很多,嗯,我说的不是很标准的,或者说我说的很模糊的词语他都能识别出来,而且识别的非常精准。 嗯,但是某点那边呢,就是稍微差一点点,但是某点有一个好处,就是他的输入法非常贴合读者啊,非常贴合作者的使用习惯啊。我建议豆包的官方可以看一下他们这个使用的功能,至于这个功能选项,我觉得不至于抄袭,因为这个不应该是不涉及抄袭啊,这是一个。再一个,豆包的输入法有点不跟手, 我感觉没有这几个老牌的书法那么跟手就是人家的书法感觉。我的手机虽然说是红米 k 四零,虽然不是旗舰机,但是有线网的就是它的震动感反馈是很爽的,很舒服的。 他的这个震动包括按下屏幕之后他那个输出的文字,他那个文字有一种莫名其妙的延迟感,我不知道为什么,可能是个例吧。啊?有可能是手机型号的适配的问题,但是就是有延迟感,所以说我用嗯打字的话,我觉得他不是很厉害,不是很跟手,没有那个适配好输入法和机型。 嗯,但是他的这个语音输入确实很可以,这是在这是第二个问题。呃,第三个问题就是他的这个,嗯, 没有皮肤,这是一个我不太在在乎的问题,但是有很多评论区的人在乎就是没有皮肤,可能是跟没有正式上线有关系吧。啊?这是一个问题。再一个为什么不把豆包的 ai 集成进去呢?我觉得这个东西是可以集成进去的,就是我这个 语音输入,就是我随时随地,我可以调用豆包。比如说我现在不想语音输入,我就想问个问题,我输入的时候,哎呀,我这输入假如说我要输入一段历史的内容,啊,我录制的内容,哎呀,我忘了哪个哪个皇帝是哪个?我摁边上某一个键子,我直接输入,你好,豆包,我想问一下什么什么?是啊?哪一朝皇帝有什么历史?然后 我一般都如果说正常情况,我戴着耳机,他能给我语音播报,或者说边上一个小弹窗,很小啊,可以把这段历史给我弄出来,然后说是否要复制该段文章,哎,可以把它复制进来,因为这个东西我感觉就是程序员的一个一行代码就可以做好的, 我毕竟也是写过这个。呃,自己做过这个提示词也是自己写过工作流的,我觉得这个东西应该是很容易实现的, 只是调用一下豆包的接口就可以,当然很多人会说一个输入法如果这么做的话体积会太大,但是我觉得现在大部分人的手机没有二五六,应该有一二八 g 的 内存吧,不差这几个 g 吧, 他不可能说有一个 g 的 总量吧。一个输入法加一个豆包的这个搜索器就是豆包的手机的这个 app 加起来我感觉五百兆应该是够了,所以如果说有这么一个功能的话,我觉得是很有用的。 就是这样,就是我现在把我的使用反馈录成视频分享出来,如果有其他人有其他的反馈的话,也可以在我视频下面留言,希望官方能看到吧。当然我也不知道艾特官方是哪个,如果我艾特豆包的话,我不知道我这个视频会不会出现什么奇怪的功能,所以,嗯,这期视频如果说有官方里面看到了 啊,可以看一下视频的评论,包括听一下我的这个想法。我觉得我应该能代表这个 网文作者的一个类型,就是想从打字手手写输入转化为这个语音输入,想从正常的其他输入法转这个转头使用这个豆包输入法的这样的用户 啊,我应该能有作为一个典型的代表类型,所以我希望如果有跟我相关的开发人员或者相关的市场调研人员可以听一下我们这期视频的意见,包括我评论区里兄弟们说的。行,那么这期视频就到这,希望各位知道这些之后都能努力马自,早日成为白金大神,加油!

而且,那么现在你可以告诉我,我是究竟用的是手机上的呢,还是电脑上的呢?嘿,家人们,我发现有这样一个输入同步助手,咱们因为 windows 端现在还没有豆包输入法,然后 虽然只有 mac 端上了,但 windows 端还没有。所以呢,我们可以通过另外一种方式在手机上打字,然后在电脑上显示出来,具体是一款什么样的呢?对,就是像 这样,你看 input snc helper 打开, 打开以后呢,会显示这样一个界面,手机扫码连接,只要我扫描了这个二维码以后,我就可以在任何地方输入文字, 我只要扫完以后,这边是另外一台手机,电脑端会自己同步过来,这是我的豆包输入法,我现在应该已经连上了吧, 你看他会自己打进来换行。而且,那么现在你可以告诉我,我究竟用的是手机上的呢,还是电脑上的呢? 对,包括我们可以看到哈,比如说我想退格清空也清空了,超棒有没有?而且啊,当我在,比如说用一些,比如说我在做写笔记, 我也可以直接在这里用。对的,这是我正在用手机上面的输入法去打字的 啊,会有一些吞字。是的,这个可能并没有想象中那么好用, 不过最起码是用手机就够了呀,我不需要去特地切换到电脑上去操作, 包括换行再换行。嗯,感觉就还可以,还不错,蛮好的。 就是这个项目,只不过呢,这个项目有一个小小的坑,就是说它在自定义的时候,你看这儿这个 ip 包括端口是需要 自己去设置的,包括它的局域网 ip, 它有时候显示的是没有那么正确,这时候我们就需要在命令行里面 ip config 去找到连接,在同一个 wlan 下面,我这边是一九二点,一六八点一点八,然后这边还是一点八,他的默认端口是五千,但是五千可能被什么服务占用者,我就改成了八零八二,然后才能连接上。 呃,不过如果你只是想用一个语音输入功能的话,那么下载那么一个插件是大可不必的,因为现在微信上也已经有了 那个语音输入了呀,你看,就在这里,我们只要把版本升级的新一点,然后按 ctrl 加 alt 键,然后就可以 啊,对, ctrl 加 v, 然后就可以直接把这个给调出来了,而且也可以做到全局输入,也是很方便的呀,根本就不需要那样去做呀, 两只手放开就可以了呀。而且还有一个软件是智普的 auto g l m 智普 ai 输入法,这个也蛮好用呀,是吧?这个只要我摁住右面的 ctrl 按键, 对,就这样,然后它就可以打字了呀,这样就显得那个插件其实真的很多余。 那是,但是吧,因为我用的是笔记本电脑,它笔记本电脑是这样立着的,我们可以看到 电脑这样立着的,所以说它的麦克风就没有那么的灵。然后我是怎么做的呢?我这边插了一个大疆的 mac, 然后另外一个 我就放在我的显示器下面,这样去收音的,但是如果只靠它的话,可能收音效果并没有那么好,嗯。

那个苹果输入法呀,我真的无语了,他真的给我一种养不熟的感觉,我感觉他总是有一种宁死不屈的倔强和自以为是的狡猾,但是智商又不高,没啥文化的感觉。你那个字必须得一个字一个字的打,不然他就理解不了,如果你要给他连贯的打他打着打着他就变这样了。 我一开始以为是我自己的问题,我想着这种软件吗?他都是这种,所以我直接换了个输入法,我才知道多方便啊。是有软件听得懂人话的,特别是那个语音输入。先给你们测试一下方言啊,防脑壳哈。戳戳,踩到我的脚,你啷个手? 我再给你们试一下说唱,他能不能识别啊,我要带着我的旗子,我的奖章,带上我的兄弟们在山顶上面摆造型。我现在咖啡店声音很嘈杂,而且说话必须得很小声,我试一下他能不能识别啊?声音小一点,别被别人听到了。嘘, 你说晚上去吃啥呢?小点声,有人在看我俩吃火锅,我想去吃火锅。好,是不是很方便?

买了 typeless 年费的朋友,你们肯定要后悔了,手机上用过豆包输入法的应该都有同感,用上之后就很难再回去。现在我们终于等到它的 mac 版本。在这之前,很多人在 mac 上做语音输入用的是 typeless, 但 typeless 有 两个明显的痛点,一是价格,想要更多转录的次数,每个月需要支付十二美元。 二是稳定性,随着用户的增多,高峰期经常会出现传入失败的情况。现在 mac 端的豆包输入法直接解决了这个问题,它支持流式输出,中文混合的效果也非常好。这些我在之前手机端的测评视频里已经验证过了。 说实话, tablas 的 功能呢,确实也挺强大的,比如说他可以帮你格式化输出内容,但问题就在于他有的时候会擅自修改你原本想表达的意思,这就比较难受了。 mac 端的豆包输入法在使用体验上也很简单,安装好豆包输入法之后,按下 option 键就可以开始语音输入了,不需要像手机端那样还要跳转界面,体验非常丝滑。 那在 ai 时代呢?语音输入不是锦上添花,而是 webcoding 的 刚需。现在越来越多的人用 cursor、 cloud code 这些 ai 工具写代码,需要用自然语言描述自己的需求,让 ai 帮我们实现。那这个时候你会发现你脑子里的想法是连续的,但打字是断断续续的, 打字成为了我们的瓶颈。那我们现在直接进行语音输入,把需求直接说出来, ai 就 可以立即执行 wibcode 加上语音输入,这才是绝配的组合。在视频的最后和大家说明一下,目前豆包输入法 mac 版还在内测阶段,还没有正式上线,那想体验的朋友可以在视频下方评论区留言,我会私信把内测地址发给大家。

朋友们,你看豆包直接终结了语音输入法的比赛啊,这是它输入法的一个效果,它是一个流逝的识别效果,也就是说你边说话它就能够边识别出来文字。 然后呢,如果我现在把这个呃停下来识别呢?它会根据你的这个语义再去把一些这个词语再去做一些更正。 大家可以看下这个效果,你看我们刚才讲的是流逝,他刚刚识别错了,但是你看停止完之后,他又把这个流逝这个词汇进行了一个专业的修正。 现在豆包输入法手机端是免费的,然后电脑端呢?现在还没有正式的发布,我现在使用的是一个这个麦克端的一个内侧的版本,大家可以看这个效果有多好啊。然后这个东西配合呃你的 ai coding 呢,就效果非常好,你就不用去打字了,效率提升的非常大。

闺蜜们,你们有没有人能完整的用苹果输入法把无骨爪这四个字打出来?主播每次的时候都感觉像那个对抗路来的,还有一顿修改,有的时候做了指甲不方便,嗯,想语音转文字一下,结果还是会有好多错误的,然后没仔细看发出去就会引起一些误会。 现在导致我每次换件的产品的时候我都会换一个输入法,这时候就不得不夸下这个豆包输入法了。每次在这个环境很吵的时候,我很小声跟这个豆包输入法说话,他都能很完整的给我翻译下来。豆包输入法,你可以听到我说话吗? 今天是星期二,外面还下雨,舍友睡着了,我晚上还有两个会没有开,下午还有两节课也没有上。 今天外婆和姐姐去上海玩了,但是因为我有课,他们就没有带我去投保。说法,你可以听到我说英文吗? hello, how are you? i'm fine, thank you and you 我 去,真的可以听到。

我严肃遵守豆包法则!我严肃遵守豆包法则!我严肃遵守豆包法则!我严肃遵守豆包法则!我严肃遵守豆包法则!我严肃遵守豆包法则! 我严肃遵守豆包法则!我严肃遵守豆包法则! 收到立刻停。

演示一下多报输入法在 mac 端的表现。北京时间明天早上六点左右, nasa 的 optimus two 载人绕月计划将搭载 sls 重型火箭和 orion 飞行器,呃,载着四个宇航员去往月球。先在地球做引力弹弓,然后大约在四天之后到达月球。 这是呃,时隔五十三年,也就是一九七二年的 apollo 七十的载人航天任务之后又一次呃有人类去往月球, ok?

明天出去记得带补光灯,提醒助理早点出门,麦克风充电。我去,豆包新出的输入法这么神奇啊,我这么小声的说,居然你也能识别出来!有没有人跟我一样,现在都不怎么爱打字,每次回消息或者是寄点什么东西啊,就直接语音输入, 像我们平常在地铁上啊,公共场所,根本不好意思大声说话。自从我发现豆包这个新出的输入法 用了之后,再也回不去了。以前我也用过手机自带的语音转文字,真的一言难尽,稍微说快一点,带点湖南口音,日常的口语多一点,他就一顿乱七八糟的识别错别字,一堆,语序还乱。像我们这种辣椒炒肉口音真的用的心累。后来我无意间用上了这个豆包的输 入法,真的打开了我的新世界大门,不用大声喊,也不用刻意的说普通话,小声说,随口说,带口音说,完全没问题。 最贴心的是,他不是单单转个文字而已,还会自动帮你添加标点,理顺语句,把口语整理成通顺的文字,像平常出门赶路啊, 坐车啊,手上拎着东西,哪怕你抓着扶手就轻轻说两句,消息就回好了,特别体面,根本不会尴尬。还特地试了一下,说我们湖南方言,明日早上我会记得提醒我在作弊,然后定个究竟。这个闹钟 居然也能很稳的识别,还能帮你纠错。不管是日常回消息,记灵感呐,写备忘录啊,做点简单的文案,张嘴就行,完全不用动手。作为一个不爱打 字又有口音又怕公共场合大声说话尴尬的人,我真觉得这个还蛮实用的,简简单单的一个小工具啊,日常省心很多,用完之后真是完全回不去了。

苹果的 mac 笔本电脑里面,今天可以使用豆包输入法的,然后跟大家测试一下,目前还是内测的一个版本,然后你可以看一下它的设置里面,对, 我使用了一天了,我觉得还挺方便的,它有两种输入方式,比如说第一种就是按着这个 option 不 动,然后就可以自动地启动它的语音输入。还 还有一种就是你双击这个 option, 然后你就可以直接说话,他的中英文识别啊,然后断句啊,甚至于他可以把你的逻辑啊可以弄得更加有条理,但是基本上不会更改你的所有的语音的输入,这一点还是挺好的,比如说我来给大家演示一下,比如我现在要让他介绍一下他自己。 好,然后双击豆包,豆包,我今天在 mac 笔本上面安了豆包输入法,然后你详细的给我介绍一下这一个输入法在 mac 苹果的笔本电脑上面有什么详细的优势,然后具体有什么功能,然后告诉我。 好,这就相当于是用语音的一个输入。 ok, 他 有详细的一个输入,你可以看到豆包,先告诉我他是流式的一种输入, 边说边出字,非,不是一定非要等于统一的一个识别,然后可以支持中英文混合输入,可以支持方言断句,把一些口语的一些词汇可以去掉,然后他是完全免费的,然后也没有广告,所以我觉得大家可以关注一下在苹果笔记本电脑上面的这个豆包输入法。好,今天就到这里。

以下是你为我总结的个人信息,请在后续聊天中适度借鉴,请注意保护我的个人隐私。 仅号用户画像,普通用户身份与背景,二零二六年一月二十九日用户是 dum 妈妈,昵称是豆包。致性度十,用户使用小米手机致性度九用户对大头儿子憋笑图片有兴趣。致性度九,用户对人物形象描述有兴趣。致性度十, 用户回复要求,普通用户、儿童用户,我会利用个人信息为你提供个性化回复,但是不会直接提供个人信息明细,也不会将个人信息提供给其他用户。

各位语音码字的人有福了,豆包输入法来了,我是今天才知道这个事的哈,豆包输入法可以直接语音输入写小说,具体的效果我没有测试,因为我也是刚刚下下来,然后我现在这面屏幕给各位投射了一个手机屏幕, 然后我这面给各位测试一下,看看它的效果,同时我也希望豆包的官方如果看到的话,我肯定会提一些意见,如果看到的话啊,能进行更改的就太适合我们这些网文作者了。行,那么咱们来说一下啊,先测试一下啊,按住这个空格键,它就能直接输入,我们测试一下看效果怎么样 啊?测试一下这个效果怎么样?如果我们要写小说的话,用这个输入法进行语音输入的效果会如何呢?啊?他这里有一个换行一松手,哦哦,是这个样子,一输一松手,他这个上面就换行了, 这个就不需要我们去手工换行。哎,感觉这个输入法还是挺不错的,而且有智能标点符号, 而且这个响应速度你们应该能看到。我这手摁住手,摁住这个这个输入键,然后我手往上一划,基本上我换行的时候他这里语音就已经识别完毕了,而且识别的还是挺精准的,你们看。 嗯,然后咱们再测试一下。呃,一些比较特殊的词语需要更改输入法,他应该是可以定制的,就是在里面可以设置 你的一些特殊输入,应该是专有名词,比如我们输入一个柳如烟,看看他能不能识别出来。 呃,林玄啊,不行,这个林玄是旋转的玄啊,我想这个林玄的玄是玄幻的玄,他应该是不知道的。嗯,但是输入法是没有问题的。 哎,这个林玄的玄啊,他现在又改了,看到没?上面改掉了。林玄的玄是变成玄幻的玄了。 那林玄的玄改成凯旋的玄,林玄啊,又改回来了。他这个输入法应该是有 ai 参与的。应该是有 ai 参与的。效果还是挺不错的啊,我们再试一下比较常用的几个名字啊,林凡,柳如烟 啊,连这个盾号都能输入啊,但是不能输入冒号和这个引号啊,不能说谁谁谁说这个东西啊。 那咱们测试一下啊。我就说一个主角林凡说到,大胆谋贼,竟敢闯入我的房间 啊,不行,兄弟们,不行啊,他打不了引号,这个引号是个问题,如果能打引号,那就太牛逼太无敌了,直接就能登顶语音码字输入法的这个前几了, 效果真的不错,兄弟们,效果真的不错,你们看我这个演示效果是可以的,因为他这个人名的词,我看有没有设置啊,一会测测试一下。 好,咱们测试一下啊,看看,应该是有这个语音输入,键盘输入表情常用语啊。这,这可以添家长用语,比如我添加个临弦。 嗯,完成,然后再添加一个。呃,比较特殊一点吧。啊陈 啊,陈濂霖,这个比较特殊,然后我们看一下啊,他这个到时候能不能识别出来,然后再设置一下,我看有没有这种啊。翻译定制工具栏啊,这是工具栏设置,我看看啊,有没有 键盘调节单手模式更多设置,我看更多设置里有什么。键盘布局模糊,拼音打字联想问题反馈快捷格式输入首字母不行,剪贴版验证填充导入通讯录。啊,这呢?词库管理个人词库。 这个个人词库怎么添加呀? 啊?只能清空加入体验改造计划系统设置技巧没有 啊?那兄弟们,现在我已经找到两个问题了,一个是不能打谁谁谁说的这个引号,就是引号和冒号,用不了。呃,再一个就是这个人名不能定制,就是我比如说我要输入一个叫刚才那个林冰玄, 你看我想要凯旋的玄,他给我的是玄幻的玄,所以这个东西不是有这个词语这个修正, 可能是我没找到这个设置在哪吧,反正这个东西是挺好用的,正常来说,这样的能力已已经是满足大部分人语音输入的要求了。但是比较可惜啊,现在这个软件只有手机版。 呃,然后官方的这个电脑版的就是电脑输入法还在制作,我看上面写着是敬请期待,所以还是可以期待一下,因为毕竟豆包有这么大的用户量,他的语音识别能力还是很强的,所以说兄弟们可以期待一波。 那么大家如果说用语音打字的话,可以期待一下。这期也没有什么广告啊,我就是测试一下,也是看到网上有人发这个视频说要用豆包的语音输入啊,我这边测评一下,因为我虽然说没用过什么语音输入,但是我用过讯飞,讯飞的语音输入其实并不是很好用。 嗯,他的延迟有点高,但是能用。嗯,但是我现在发现豆包的这个输入的识别能力,包括他的这个延迟能力也很不错啊,一会咱们可以有时间可以做一个对比测试,因为我都这两个输入法,手机上都有了,现在咱们可以测试一下,看一看两个输入法到底哪个好一点。 主要是这个豆包有这个直接一键换行,这个太方便了,而且两个软件其实说实话都没有这个能打双引号的这个功能 啊。用这个起点的作家助手应该是可以,因为作家助手有快捷的这个双引号的功能,当然你这是手机码字,如果你是电脑码字,语音码字的话,应该就不用这么费事了。 行吧,这期就算是测试到这啊。嗯,希望这个平台或者说豆包的这个语音码字能快一点,把这个智能加双引号这功能加上啊。就比如说我现在这么按着小说模式,我这个手可以这个地方手动添加标点符号,谁谁谁说完后冒号双引号 啊,因为上面你看这个上面有很大的,大家可以看屏幕有很大的空白, 他这个识别还是挺精准的啊。就是,但就是打不出来,引号这个东西是太难受了,如果能打出引号来就太无敌了。就是上面这块可以直接呃设置快捷的这个引号,我记得 起点的作家助手是有这个,但是还是有其他平台需要其他平台借助。如果呃豆包能内置,并且在电脑上面也实现这个功能,我觉得非常简单,就是工程师加一个,增加这个在这个现在界面上手打符号的一个功能, 非常简单。哎,那就无敌了这个东西,这个东西就无敌了,就是语音输入,我甚至会尝试使用语音输入,这样的话我就不用电脑了。荒野码字是即将可以成为现实的,就是我在荒野我就拿一个手机接一个无线麦克风,我这边用嘴这么码字,然后一边直播一边给大家码字,是完全可以的哦,这个是很很牛逼,很牛逼的一个东西, 而且他这个换行操作非常流畅,我都不用看了。现在啊,比如说我现在打完一行字,我现在想要换行,我手我手往上面一侧就可以,然后他就我手往上面一侧就可以,然后他就直接换行了,换行到下一行之后,上一行就做好了 啊,就这么简单,就这么简单哦,效果其实真不错,真不错,所以这个软件挺让我吃惊的,效果挺不错的。嗯,然后希望这个豆包能快点把这个标点符号能直接在上面打。标点符号这个东西,如果 有官方能看着能把它内置了,那就太无敌了,因为你会增加大量的这种语音码字的用户,甚至说他们会抛弃电脑,就是不用电脑,我直接用一个手机码字,或者人多的地方,我接一个无线麦克风,这么手里拿着都可以, 真的真的,兄弟们还有这个软件,这个有一点卡顿啊,就是我刚才换行没有换上成功,可能是我一次输入的文字太多了,但是正常写小说的话不会输入这么多文字的,这个是可以肯定的。 看又出现这个情况,明明已经滑到换行了啊,你看又出现到了一个这个英文,看看他一会能不能修正过来吧。 啊?英文能修正过来,所以说他这个里面绝对集成了一定的 ai 成分,但是不能定制个人的语音习惯,比如说人名这个,这个还是有欠缺。人名,增加人名就可以定制人名,增加这个标点符号,定制人名这个讯飞是可以的,讯飞有自己的词库可以做。 然后这个豆包的输入法暂时还没有,如果能加上这个的这个功能的话,豆包是很能打的一个存在。行吧,这期视频就到这,希望各位知道这些肉都能努力把字,早日成为白金大神,加油!

问大家个问题,你手机里是不是也装了豆包千万这样的 ai 软件呢?结果除了让他写写文案做的表格之外,就不知道他还能帮你干什么了? 那全网为什么都在说 ai 能提效,甚至会说 ai 是 下一次工业革命的开端,可是你用起来呢,就总觉得每天除了跟豆包聊聊天之外,好像也帮不了你什么,不知道怎么能在工作中真的去结合起来,能真实的做到提效。 那我自己是大厂,做了十年左右,开发这段时间呢,也一直在深耕 ai 落地相关的内容,新手从零到一,做过一些完整的 ai 项目了,踩了不少的坑,也有些自己的理解。 那实际上 ai 从来就不是一个指望聊天的工具,它本质上更像是一个掌握了海量公开知识,执行力超强的聪明帮手。 他既能够成为你的职场分身,帮你解决到百分之九十的无效重复劳动,也能够成为一个灵活可定制的工程模块,帮你完成要么需要大量代码开发才能完成的功能。 那只有真正搞懂它的底层逻辑,才能在这个 ai 时代里真正把它用明白。那这也是我做白话 ai 这个系列的初衷, 尽量用大白话跟大家一起从零搞懂 ai, 看明白他到底是怎么样在真实的工作场景里面帮我们每一个人提效,帮企业创造价值的。在讲具体的落地方案之前,我们先用两分钟把大家天天在网上刷到的几个 ai 核心名词彻底掰扯明白。 今天呢,我们就拿咱们天天都在干的吃饭这件事情来打个比方,给大家理了一张 ai 四层核心关联图, 那第一层呢, ai 也就是人工智能,它就相当于是整个餐厅行业是个最大的框,它能够帮你解决吃饭的所有问题,不管是外卖、汤匙、楼下的便利店,都属于餐饮行业。同理呢,所有能让大模型模仿人的行为,帮你节省到时间和精力的智能技术, 它不是指某一个具体的 app, 也不是某一个单一的功能,就是这个所有这类技术的总称。那第二层呢,也就是大语言模型,就是大家常说的大模型, 他其实相当于这个餐厅的一个很厉害很专业的主厨,是整个餐厅能运转的核心根基。 那咱们常听的自己的豆包大模型,而里的千万大模型就指的是这个主厨。那当然了,不同的主厨擅长的菜系也不太一样,有的擅长做川菜,有的擅长做甜品。那对应不同的大模型能力侧重呢,也不太一样,有的擅长写代码,有的更擅长做文案创作。 咱们现在用的所有的 ai 底层全靠这个大模型做支撑,那没有它的话, ai 根本听不懂你在说什么。第三层呢,就是千问豆包这类的手机 app, 咱们还是以豆包举例啊,它是开发团队已经把它完整封装好了的一个 app, 给你做了个简单直观的聊天界面,你打开 app 打字提需求,他就能给你反馈一个结果,不用你懂任何的技术上手就能用他的底层实现,一样是对接了豆包的大模型。所以呢,他就像是一家很好吃的餐厅,里面还是那一位很厉害的主厨, 但他又有个天生的短板,他的菜单是店家提前固定好的,你只能在他给的选项里做选择,想让他完全提合你的个性化、深度化的业务需求,来到你的工作系统里帮你跑一套真正的流程就很难。 比如你想让他每天自动对接你公司的业务系统,定数据,生成定制化的周报,他就不可能做得到。那第四层呢,也就是咱们今天的核心啊, agent 智能体,他就相当于你的专业私人饮食助理,他才是 ai 能真正实现提效的核心。关键 在这里一定要大家理解啊,这是整个 ai 提效逻辑里面最核心的一环,也是他和大模型 app 的 最本质的区别。 餐厅的逻辑是,你点一单他店里提供的某个菜品,他给你做一单。但是呢,你的私人助理是你只需要跟他说清楚你最终的核心需求,他就能按你自己的需求帮你把吃喝搞定。 比如你跟他说,我今天晚上要减脂,晚上六点前呢,我要吃上饭,预算三十块钱,不要辣不要香菜,我还要配一瓶无糖饮料。那接下来呢,他就会帮你按你的要求完成这份晚餐。 a 神呢,之所以能做到这一点,底层还是依赖着大模型,但是他通过上下文工程,也就是我们常说的提示词、规则、业务知识库、长短期记忆管理,来完成对你的硬质化需求的理解和适应。你可以给他定好最终的目标和执行规则,让他自主拆解步骤,完成多轮定向大模型来完成不同环节的处理, 再通过 skill、 mcp 这些外部能力接口,对接到你要用的软件和系统,最终跑完一整套完整的工作流程, 那说白了,大模型是让 a 阵的能想明白我该干什么的。一个大脑上下文工程,是指让 a 阵的理解你的定制规则,工作上的要求、限制 skill mcp 是 让你能够落地干成事的手脚。所有东西组合在一起,你有没有觉得它很像是一个智能机器人,这就是它的核心力量所在了。 不过说到这里啊,我必须跟大家说句实在话,也是我自己从零落地 a 证项目的时候啊,最深的一个感受。现在的 a 证呢,根本做不到网上很多人吹的,你给他个目标,他就能完全自己闭环干活,都不用你管。 那些说能够完全无人化、全自动化的,要么是对未来发展方向的畅想,要么就是加了无数限制条件的演示效果,根本不是真实的企业落地场景。 那在真实的落地环境里面,人和 agent 的 关系其实非常明确的。人是定规则、搭框架、做最终决策的管理者。 agent 呢,是帮你干重复机械、不用深度动脑的执行活的助理。在真实的落地过程中,你必须先通过提词词和知识库,给他搭好一个完整的上下文工作框架, 定好清晰的执行边界,再配置好对应的外部接口,他才能相对稳定的完成工作。根本不是说我一句话他就能完全自己搞定的。遇到超出预设规则的异常情况,最终还是要靠人来处理。 那总之呢,他确实能帮你省掉百分之九十的重复劳动,但核心的决策、审核、规则制定,永远要靠人来把握,那搞懂了这些基础逻辑啊,咱们就回到真实的工作场景里面,看看这个 agent 到底是怎么来帮我们实实在在提效的。 我就举一个我们职场人经常会遇到的一个问题,就是写数据周报。那其实梳理数据做报告这种事情啊,大家都懂的,你往往就登录不同的业务平台,导出几分原始数据,登在 excel 里面,去做一些驱虫啊,补缺失值啊,算同笔还笔啊。这样的一些事情, 好不容易做完之后呢,你还要再写一个分析报告,那前前后后可能花两三个小时写完,你都快下班了对吧?那用 agent 到底是怎么能实现提效的呢?第一步啊,先搭好你的核心框架,就是上下文工程, 这是 a 阵的能稳定干活的根本,也是最核心的一步。你要把周报要统计的核心指标,同比环比的计算公式,图表的格式要求,分析内容的侧重维度,还要把你以往做过的优质的周报案例啊,全都写成标准化的提示规则,并且同步案例到制库里面。 要说白了,就是把你做的周报的所有经验、标准和逻辑完整的交给 agent, 让他能真正理解这份周报该怎么做。第二呢,给 agent 配好一个执行的手脚,对接外部的能力接口,光懂规则还不够。 agent 要拿到数据,就必须得通过 skill、 mcp 这些外部接口完成和你业务系统的对接。 你需要把业务系统的接口方正成对应的工具节点,给到 a 阵的配好权限,他就能够合法稳定的从你的系统里拉取数据了。每一次他要做周报的时候,你只要跟他说一句,帮我生成当月的业务数据周报, 剩下的工作呢, a 证呢,就会按你定的规则自己跑完了。那整个过程, a 证呢,只要十分钟就能全部完成。你要做的就是最后花五分钟审核一下内容和数据,在分析里面加上你自己对业务的深入思考,一份完整规范的周报就搞定了。 原本需要花两三个小时干的活,现在呢,只要花十五分钟就能全部搞定。这就是 agent 的 最真实的提效能力。那聊到这呢,大家就能明白了, agent 实现提效的核心从来不是解决某一个单点的问题,而是把一整套重复的复杂的工作流程实现了标准化和自动化。 那这里可能会有个疑问, ai 提效的本质到底是什么?为什么他能够做到传统工具做不到的事情?这是我自己落地项目的时候一直在思考的一个问题。那今天呢,我给大家拆透三层最核心的底层本质,每一层都是大白话。 那第一层呢, ai 用一种智能弹性的系统替代了固定的浆化的机械工程系统,那传统的软件系统本质上就是一种机械化的工程,你必须提前把所有的规则,所有场景,所有异常情况都用代码完完全全写明白,只要有一个场景没有覆盖到系统就会出问题。 而 a 阵的呢,就是一个智能的弹性系统,他的核心上下文工程,不用你写死所有的代码,你只要定好核心的目标和执行边界,他就能像人一样自主判断,适配突发场景。重点是他非常适合处理一些模糊需求, 彻底摆脱了传统工程里面写死规则、改需求、重写代码这样的一个死循环。而第二层本质呢,就是 ai 把系统开发的成本和门槛降到了非常低的程度。传统的工具开发,核心成本就是人的成本, 你需要产品开发、测试、运维一整个团队,花几个月的时间才可能把一个复杂的需求变成真正可用的系统。而 a 阵子把这个成本和门槛降到了非常低的程度。不用写大量的代码,也不需要很庞大的技术团队,只需要你懂自己的业务,能够用自然语言把规则和逻辑讲清楚, 搭建好对应的上下文工程,几天甚至几小时就能搭好一个可用的自动化工具,哪怕是小团队、超级个体也能用得起那么好。 那第三层本质呢,就是 ai 可以 通过标准的输入输出适配,无缝的融入原有的业务流程。你可能会问, ai 到底是怎么去替代传统的程序的呢? 其实核心逻辑很简单,传统程序的核心逻辑是输入标准化的参数,按写死代码逻辑运算,再输出标准化的结果。 而 agent 的 核心逻辑是你输入自然语言的目标,它通过上下文拆解之后,成为标准化的执行步骤,通过外部接口调用到系统和工具,最终同样也可以输出标准化的结果。 它是可以直接融入你现有的工作流程里,不用推翻你原有的系统,所有的业务逻辑就会实现,那么原有的业务逻辑就会实现效率上的颠覆。不过这里我必须再给大家提个醒啊, agent 不是 万能的, ai 更不是万能的, 他的核心是大模型,而大模型有一个天生绕不开的特性,那就是随机性。哪怕你把上下文工程搭的再完善,外部接口配的再齐全,他也可能会出现一个幻觉问题, 比如对数据的理解,编导不存在的分析结果,搞错指标的计算逻辑,也可能会出现执行失败的情况,比如接口的权限过期,数据格式异常,最终导致了攻击电网失败。 那这呢,也是企业 ai 落地过程中啊,一个真实存在的门槛,你不能只停留在该个 a 阵的价值的层面,必须对 ai 有 系统的应用层面的学习, 比如怎么写稳定的提示词,怎么搭建匹配业务的数据库,怎么管理 a 阵的长短期记忆,怎么能规避大模型的随机性?那如果出现错误,要如何设计回款方案,重置方案?到底方案 要跟我深一层思考。我甚至觉得传统工程工具啊,要和大模型有一定的分工,让大模型完成模糊复杂的无状态任务,传统工程完成固化的确定性要求更高的环节。 这样呢,我认为才是落地的核心,只有把这些东西都学明白了,你才能真正有 ai 实现稳定的体效,而不是让它变成一个添乱的工具。好,说到这里呢,希望这期内容帮大家捅破了 ai 落地的那层窗户纸,希望大家给我点个赞,也欢迎大家来关注我,我们下一期再见!

这里是公共场合,大家说话小声一点,大家都在这边看书,我也在这边看书,我就这么帅,这么好看吗?先给你们,你们看这片音乐,咱们这么感受, 要是不说话,童宝还是可以识别到我哇。如果有时候你们要去电影,看电影的时候要要去听,也可以用上童宝说一下,他非常谨慎识别到我看什么叫平板那么健吗?