粉丝13获赞151




最近要说最火的 ai 啊,应该是谷歌的卷米奶,那么今天我就教大家如何免费使用卷米奶,请注意是完全免费使用,视频很长,如果想学 ai 的一定要看完,干货都在后面。首先介绍一下谷歌的卷米奶啊,它是一个多模特的大模型, 多模态的意思就是他在训练的时候啊,就用文本代码、音频、图像、视频作为原数据训练出来的 ai 大模型。也就是说江平的一出来啊,他就除了拥有语言能力之外,还有听力和视觉的能力。 那么相比于其他大模型,比如说 opni 的 gbd 以及打底衫,他们就是两个单独训练出来的语言模型和图片模型,然后 opponi 把它们拼接在一起,形成一个近视多模态的 ai 模型。这种拼接方式的布置注册啊,就在于面对多模态空间的时候,比如说我们同时输入文字、图片和视频, 然后再让 ai 进行深层次逻辑的复杂推理,他就没有真正的这种多模态模型来的效果好。所以江门来在演示视频时候,你就惊讶的发现,他的能力几乎在某个领域都是最强的,因为江门来是骨骼几乎靠近了他们所有内部的计算资源,训练出来的 ai 大模型。 模型一推出来就只能成功不能失败。专门呢分为三个量级啊,能力最强的是凹叉,用于处理高复杂的任务。第二个就是可处理多任务的 pro, 以及适用于特定任务和端侧使用的 narrow, 比如说用在手机和 pad 上,就是 narrow 专门的,号称是史上最强的 ai 大模型,并且在各项评分中啊,超过了 gb 四位,当然现在有很多人质疑啊,谷歌的演示视频有造假的嫌疑,所以今天我们来教大家如何真正的使用,专门的看看他到底有多强。 第一种使用方法就是直接在 bug 中使用英文,默认就是 jamila pro 这个 ai 模型,这里我测试了一道方程组的题啊,结果是对的,要知道在很久之前啊,我也做过同样的测试, gpd 和联网的 newbing 都没有做对,这次 jamila 终于做对了, 但是这里一定要注意啊,如果你使用中文去询问这个 bug 的话,你会发现他还是 bug, 他并不是 jammin, 所以一定要用英文。那么我们要使用中文的 jam 来怎么办呢?下面我给大家介绍两种方法。 首先我们去到这个 jeremy 的官网,然后点击右下角的这个 beauty 为 jeremy, 然后点击这个链接啊,接下来我们就点击这个获得一个 a p i k, 把这三个相关协议点上勾,点击继续登录账号,在左上角就可以免费获得一个 a p i k。 下面也是直接在这个网页上使用 jerem 蓝,在右下角点击一个 新的 freeform prompt, 然后接下来我们就可以使用 gemini 了,点击这里就是我们这个 prompt 的 name, 比如说我们出一个 gemini 测试。好,接下来我们在这边我们就可以看到,我们可以选择这个模型,模型我们可以选择 gemini pro 以及 gemini provision, 危险的意思就是我们可以进行图片识别。我先给大家演示这个 jammer pro, jammer pro 问你个问题吧,比如说我们问小明长得最像谁,我们点击这个下面的这个 run 好,他就会说他自己回答的没有问题,是不是? 然后我们测试一下第二个问题,小明他爸爸有三个儿子,他的大儿子叫大毛,他的二儿子叫二毛,那么三儿子叫什么?哦,他告诉我们,他三儿子叫小明啊,回答是正确的啊,这个选中项就是提示回答的答案,他小明,我们接受。 好,接下来我们来测试一下第三个问题,这是一道科目四的题目啊,大家很容易做错,我就把它给这个卷米来测试一下。他问的是这个驾驶机动车从加速车道汇入,行车道有困难的时候可以停车让行,请问这个做法对吗?我们问一下他,他答,不对, 还是挺厉害的,真的还是挺厉害的。那我问他一下正确的做法是什么?我想正确的做法是什么? 我们再问他一下,好,他说,减速慢行,四季汇入。哇,他的答案非常正确啊,非常正确。 好,这就是整个的语言模块,就是用中文可以问的语言模块,接下来测试下。这下面我给大家测试一下这个 jamai vc pro, 我们点击这个 jamia vc pro, 接下来我们就可以看到这里有一个玉米卷就可以输, 注意秘诀。好,我已经上传一张图片,这张图片是一我随便写的英文呢,我看他能不能识别。我问他啊,你看他识别的非常成功,他说, google ai studio you very good。 经过测试发现啊,他不能识别中文的输入。 当然后面我还进行了其他的测试,比如说图片的人物识别,他能够识别出这张图的是巴菲特和芒格, 还进行测试了这个图像人数,以及以图像中让他区别男女等,测试效果都非常的好。这个讲道理,我也看不出来是男的还是女的,最重要的是我测试了这张图, 问这张图中有多少个三角形,娟妹俩的回答是二十四个。我们再对比一下 gbt 四的回答,你会发现 gbt 四的表现比较差,为什么呢?因为他竟然用拍 百选题计算这道题,结果可想而知,就是没有结果。虽然 jamila 也有翻车的时候啊,但是我已经很满意了。好,接下来讲第三种使用 jamila 的方法,就是在这里点击这个 build with vertex, 然后我们就会进入到这个 google crowd, 我们在这里就可以看到这个多模态模型,以及语言视觉和语音多模态模型这里我们直接可以看能输入什么,我们能够输入音乐句, png, gpg, 还能够输入 video, 包括 m k v m p 四这种。但是它有个最大的问题,就是只有实照最大,只能输入实照, 这是一个很大的问题。经过测试啊,就是效果和这个这个这个 google a s 六里面使用差不多。我重点给大家讲一下这个语音啊,这个语音就是他可以进行文字转语音以及语音转文字,文字转语音,他只能 进行三种语言,英语的男女以及西班牙语的男,因为他不能够转中文啊,所以我就不给大家演示了。接下来给大家演示这个语音转文字, 语音讲文字,我们这里同样是可以上传一个不超过十兆的音频文件,我给大家试一下。这两天我觉得我做了一件飞,这是我上一上一个视频啊,这里选择中文效果不是特别好,效果不是特别好,大家就少用吧,我相信他后面会进行优化的,我相信他后面会进行优化的。 好,这就是使用三种这个卷本来的方法,大家可以各自去尝试一下。最推荐大家在这个 google vs 溜子上面使用。我是班长,如果你喜欢我的视频,请关注我,谢谢!