粉丝52获赞2159




不敢相信国产 ai 工具长眼睛了?最近参加了火山引擎 fox 原动力大会啊!看到刚刚发布的豆包视觉理解模型,上能给编程代码纠错,下能根据看到的内容联想故事,豆包都能通过视觉感知结合思考,深入浅出的表述出来。目前豆包视觉理解模型已经接入了豆包 app。 我在大会现场豆包展台体验了一下,先尝试找了一道需要微积分运算的数学题,豆包在识别到题目后,很快就根据题目的要求给出了解题思路,又给了豆包两份英语作文啊,豆包不仅能很迅速的指出作文的写作格式,语法使用是否正确,文章整体是否连贯,还能精确的识别出单词拼写的错误,然后给出综合打分。 豆包的图片生成能力这次也变强了,像最近很火的 hellokitty 雪地写字照片,估计很多差友都不知道豆包也能直接生成。作为一个南方长大的孩子呢,我是真的很羡慕北方年年都能玩雪啊,之前看到很多南方网友花钱找人雪地带, 还有人被骗过。而在豆包的图片生成里呢,我输入摄影,写实风格温馨,画面逼真细节, hellokitty 在雪地上首写差评,九二五就能轻松生成一张属于我的雪地写字照片。 我只能说豆包的这个功能啊,大家再也不用花冤枉钱去买雪地代写的朋友圈图片了,图生图就更好玩了,给他一张宠物狗的照片,输入几个字,让小狗拿起报纸就能生成一张看报纸的小狗图片。你要说图生图有什么用呢啊?像平常拍好的照片,可以让豆包帮你更换穿搭, 调整衣服颜色啊,甚至还能改变发型。这些在其他 app 上都要收费的功能呢,豆包都能免费帮你实现,还省去了复杂的 ps 操作, 图片生成能力呢。这次展会上,豆包语音能力的表现也挺让我惊喜的。作为 ai 工具中最拟人的那个,豆包对声音的理解已经到了 next level 了。在语音识别上的豆包可以根据语境来分析你说的词语,像一些同音不同字的词都能准确 识别出来。就算是各种方言,豆包也有不错的识别率,像上海话、陕北方言、川语、方言、粤语等,都能准确的识别转化出文字。而在语音生成上呢,像大家短视频里常刷到的家人们,谁懂啊?还有猴哥的声音,都是通过豆包的语音模型生成的。这次呢,我们在现场还专门去听了豆包写的歌, 输入你想要的歌曲画面,再选择风格和音色,豆包就能很快给你写出对应的作品,大家可以一起听一下。 那我当时听完最大的感受就是啊,真的没什么 ai 味啊,你说这要是过年给爷爷奶奶现场作曲一首啊,估计能让他们开心很久吧。这两年国产 ai 工具发展速度飞快,各家的产品也都开始找到自己的舒适圈, 而豆包越来越像一位随时在线的伙伴,我觉得随时功能不断丰富,喜欢豆包的人应该会越来越多啊,毕竟谁能拒绝一个能给你写歌的 ai 伙伴呢?