Google下一代逆天AI-Gemini Google 发布最强大模型Gemini, 多领域超越GPT4。Gemini能够跨文本、图像、音频、视频和代码进行推理，具有十分惊人的应用场景：多模式对话，多语言能力，游戏创作，视觉谜题，建立联系，图像和文本生成，逻辑与空间推理，翻译视觉效果，文化理解等。 #ai #gemini #人工智能 #gpt4 #知识前沿派对

Gemini怎么生成图

29

8

10

6

举报

发布时间：2024-05-30 00:43

查看AI文稿

小M的游戏人生🎵

粉丝717获赞1584

相关视频

10:41
Gemini 1.5震撼来袭！图片、视频、音频全搞定，真的很能打！ #Gemini1.5更新 #创作者必备工具
查看AI文稿
AI文稿
四月九日，谷歌面向一百八十个国家和地区推出了公开预览版的谷歌精密了一点五的 pro，这次版本首是包含了首个原声音频的功能和新的一个 api，我们看一下这个，这个是谷歌精密的里面的新版本一点五包含的图片，然后视频、音频文件，还有普通的我们的那个对话，那他的处理能力有多强呢？一次性处理大量的信息，包含一个小时的视频，十一小的音频，超过三行的代码，七十万字的代码库，现在这个能力已经对外开放。今天给大家带来演示一下目前这个机面一点五到底有多能打项目演示，那我们首先用谷歌账号进入一个叫 sd 六的这个管理界面，那这管理界面这边我们看看到这里面有我们右边窗口，这边是有谷歌的一些模型，比如之前的机密了一点零让目前现在还有一点五，然后这一块的话是他的可以申请的 ipik，那这之前我我的账号已经胜过了这一步，给大家演示了，目前我们进入了这选中一点五，然后这个是我进来的一个聊天窗口，手来进来的时候我说你好，你是谁？他的速度非常快，他就五哥揭秘了，然后直接模型说出来。那接下来我们这一块是给大家测试的是一个 pdf 文件，这里面我们是选择怎么操作的话，我们是先点点这个文件，然后这有发 irlood，然后这里面选 plus 浏览 c，然后我们可以选择一个我我们上传的文件，那后面的话视频、图像、音频都借助于谷歌 w 的这个 file，这个是我包括谷歌的网盘都是可以上传的，这里面的操作就不给大家演示了。然后选中完成之后，这里面的话，他就会上传一个附件，然后右边的话我这边填写了相关的内容，比如请分析一下这个文件的内容，总结一下，那他大概花了不到十秒钟的时间就把我这张 pdf 文件呃生成出来了。那人形机器人的内容，然后简介，包括他的行业状况，然后行业的机遇啊，建议和意见，然后文件提示，然后市场总结。那这块功能跟我们之前的 cloud 三这块其实是差不多的，那也不能够体现他的比较强大的地方。那第二个我们这边的话就是给大家演示了一个视频，这个是 g b d 四的多模探，其实很多模型目前现在也具备这样的能力。那他比较强大的地方就是他现在我把文件、大文件，呃文件，然后视频还有音频这些功能都整合起来了。那我们看一下这张图片，同样的道理，测试的时候我们是也是通过这个 image，然后选择一个上传，那这里面的话是他已经我之前上传了两个图片，他其实这个网盘里面是可以保存的文件，点击上传之后同样进入这个页面，然后点 box 浏览器，然后直接上传。上传完成之后，我们就在这个上传这个附件旁边这个窗体里面我们可以输入相关的内容，比如说请分析一下这张照片的内容，他巴拉巴拉他就分析出来了，因为这张照片很简单，一个男的，一个女的吗？呃，龙黑的眉毛等等，然后女性，然后总体来讲还是比较准确的，那这个对于谷歌的精密呢？一点五相信应该没什么难度啊，他总结其实内容还是比较丰富的啊，不像有些 gbd，他只是呃简单的总结和多么带效果不是特别好。那接下来我们看了一下他的视频这块视频这块是我比较关心的，也是比较强大的地方，我这里面上传了一个短视频，由时间关系大概上传了一分零六秒钟，请分析下这个视频的内容，总结这个内容，然后这个视频里面其实它包含的内容是是比较接近的，而且这个音这个视频是一个老外讲的一个英文，他把它转换成中文了。这个视频内容我们看一下，第一块向 pdf 转换 tst 文档，用在线的 pdf 转换文档转换这个来。第二个用 g b t 的分割文件，就是这是一个博主的一个早期用 g b t 这个 pdf 的文件的一个教学视频，然后下面有视频的总结，然后视频的一个归纳的，我们给大家看一下视频的一个原始的一个效果。 in the next video bye hold long text into chad gpd so let's go in this example， we're gonna load the seventy three page booth into chad gpd so first we need to convert it into a txt file we can use an online tool called pdf txt converter download the txt file now let's use jet gpd splitter without tool， you can load your text。时间关系这个视频我就不给大家放了，那其实他刚才给大家介绍了，就是这张是英文的一个博主的一个视频，他其实很好的理解了这个音视频里面的内容，然后把它总结成中文给我显示，因为我输入的这个内容是中文的，所以他很好的展示，那这块是比较让我惊艳的的。那接下来我们看一下音频视频，那音频视频我测试下来的，其实上传效果其实跟之前一样的，也是 upload，然后这边上让他总结一下这个，那这个音频这边是可能让我比较失望的地方，就是他总结其实是错误的。上传的音频是汪陈蕊的春风玉度，给大家听一下。我们回到这个音乐总结这块，这首歌是周深的问花，发行于二零四月十二日，好像有点点问题这块，但是他其实像模像样的给大家讲出了他好像能够分析音频的这个词，然后总结了一个，也还看起来不错。那接下来我们给大家实际操作一下。那我这里面有一本少年歌行的完整版，大概是这是个 tst 的，大概是三兆左右，我们把这个上传一下，给大家总结一下。啊。呃，二点九兆的文件，然后这边他已经就上传了，我们稍等一下。好，上传完之后我们解析一下，让他总结一下。那我们把这个内容输进去，请总结一下这个小说里面的内容，然后提到的十大高手有哪些，请详细展开说明，我们看一下它的处理速度。哦，他这个已经总结出来了啊，我们看前面的这一段，我们让他全部生成完成吧。他大概花了八十多秒把内容总结了一下，然后下面的话内容是我让他把十大高手也总结出来，他现在也在一边写一边总结好了，大家看一下，目前他大概花了一百五十多秒，把我现在这本小说里面所有的内容都总结完了，我们看一下，拉到上面去。呃，少年歌星讲述了以萧瑟、刘皇子为代表的萧楚和雷、吴杰、汤莲为主角，少林传的江湖故事，围绕盛世之谜，牵手黄队争权，可是为了争取治好的隐脉，于回到了天启城，揭开真相，并帮助白王肖虫登上灯位。啊，这个总结其实还可以啊，因为他并不是帮助肖王，他是自己让位的，但是这个理解能力基本上把大概的故事讲了一遍。家有十大高手，然后这里面提到了冠绝榜，然后关节网二甲，呃，洛清扬，然后班以东军，唐连月，然后关节网，哎，这个其实很好，总体来讲，我觉得哎呦，不错哦。使用 gemini，那我们讲一下这个项目是如何使用的，那我们输入，首先我们输入这个 define 的谷歌的一个网址，然后进入谷歌的这个项目，然后接下来我们选择这个这个 technology，然后下面的话，然后进入狗哥精密的这个网站，这里面有一个一点五，我们选中它，然后这里面这 you are all set，那就进入这个界面了，那这时候我们会弹出一个叫谷歌的这个地区的一个选择，因为这个问题主要是因为你目前选择的这个地区。呃，比如我们在中国这边是不能够访问谷歌的，所以他会跳这个页面，是没办法去体验的。那接下来我们给大家讲一下那如何？呃，绕过这个问题，哇塞，行了，我们复制这个浏览器网址，输入到浏览器，进入到这个网站中，然后网站里面其实是他套了一个浏览器，这样的话我们就其实是绕过了那个，我们这里面可以输个 dpmi 的那个网址，我们把这个输进去，我们输入这个网址，然后进入这个搜索，然后我们搜索进入这个页面，同样跟刚才的操作一样，我们点开它，因为这里面是浏览器套浏览器，所以这里面的话这个访问地区是不受影响的。我们下鼠标往下滑，点开这个，然后进入这个谷歌的页面，我们同样的按刚才的这个操作，这个页面是稍微有一点点卡，选中他，然后进入这个谷歌登录页面，输入你自己的邮箱，点击下一步，然后输入你的密码，点击下一步。那这时候因为你的异地登录了，所以谷歌里面有个安全验证，他会验证，我这里呢是用幺六三邮箱来接收验证码，我们点一下通过幺六三邮箱见证，然后这里面我们刷新一下我的幺六三，好，收到谷歌验证码了，然后把这个验证码输进去七八八零五七，我们点击下一步，好，这个时候我们进入这个页面，然后我们点这个，这样的话就进入谷歌的这个页面了，也就刚才绕过了这个界面了，然后在这里面的话，我们看到这是我的账号，然后这是谷歌一点五，这是我们测试的这个界面，我们就可以问问题了，叔叔你好，你是谁？然后我们点一下这个，这时候我们就可以用了，那后面的音频，呃图片，呃视频、音频文件，这大家都可以来，可以正用来使用了， nice 啊。今天的分享就到这里全部结束了，感谢大家的观看，我们下期见。
14周辉
06:34
Google Gemini AI 3种免费使用方法！！ #Gemini #AI大模型 #科技改变生活
查看AI文稿
AI文稿
最近要说最火的 ai 啊，应该是谷歌的卷米奶，那么今天我就教大家如何免费使用卷米奶，请注意是完全免费使用，视频很长，如果想学 ai 的一定要看完，干货都在后面。首先介绍一下谷歌的卷米奶啊，它是一个多模特的大模型，多模态的意思就是他在训练的时候啊，就用文本代码、音频、图像、视频作为原数据训练出来的 ai 大模型。也就是说江平的一出来啊，他就除了拥有语言能力之外，还有听力和视觉的能力。那么相比于其他大模型，比如说 opni 的 gbd 以及打底衫，他们就是两个单独训练出来的语言模型和图片模型，然后 opponi 把它们拼接在一起，形成一个近视多模态的 ai 模型。这种拼接方式的布置注册啊，就在于面对多模态空间的时候，比如说我们同时输入文字、图片和视频，然后再让 ai 进行深层次逻辑的复杂推理，他就没有真正的这种多模态模型来的效果好。所以江门来在演示视频时候，你就惊讶的发现，他的能力几乎在某个领域都是最强的，因为江门来是骨骼几乎靠近了他们所有内部的计算资源，训练出来的 ai 大模型。模型一推出来就只能成功不能失败。专门呢分为三个量级啊，能力最强的是凹叉，用于处理高复杂的任务。第二个就是可处理多任务的 pro，以及适用于特定任务和端侧使用的 narrow，比如说用在手机和 pad 上，就是 narrow 专门的，号称是史上最强的 ai 大模型，并且在各项评分中啊，超过了 gb 四位，当然现在有很多人质疑啊，谷歌的演示视频有造假的嫌疑，所以今天我们来教大家如何真正的使用，专门的看看他到底有多强。第一种使用方法就是直接在 bug 中使用英文，默认就是 jamila pro 这个 ai 模型，这里我测试了一道方程组的题啊，结果是对的，要知道在很久之前啊，我也做过同样的测试， gpd 和联网的 newbing 都没有做对，这次 jamila 终于做对了，但是这里一定要注意啊，如果你使用中文去询问这个 bug 的话，你会发现他还是 bug，他并不是 jammin，所以一定要用英文。那么我们要使用中文的 jam 来怎么办呢？下面我给大家介绍两种方法。首先我们去到这个 jeremy 的官网，然后点击右下角的这个 beauty 为 jeremy，然后点击这个链接啊，接下来我们就点击这个获得一个 a p i k，把这三个相关协议点上勾，点击继续登录账号，在左上角就可以免费获得一个 a p i k。下面也是直接在这个网页上使用 jerem 蓝，在右下角点击一个新的 freeform prompt，然后接下来我们就可以使用 gemini 了，点击这里就是我们这个 prompt 的 name，比如说我们出一个 gemini 测试。好，接下来我们在这边我们就可以看到，我们可以选择这个模型，模型我们可以选择 gemini pro 以及 gemini provision，危险的意思就是我们可以进行图片识别。我先给大家演示这个 jammer pro， jammer pro 问你个问题吧，比如说我们问小明长得最像谁，我们点击这个下面的这个 run 好，他就会说他自己回答的没有问题，是不是？然后我们测试一下第二个问题，小明他爸爸有三个儿子，他的大儿子叫大毛，他的二儿子叫二毛，那么三儿子叫什么？哦，他告诉我们，他三儿子叫小明啊，回答是正确的啊，这个选中项就是提示回答的答案，他小明，我们接受。好，接下来我们来测试一下第三个问题，这是一道科目四的题目啊，大家很容易做错，我就把它给这个卷米来测试一下。他问的是这个驾驶机动车从加速车道汇入，行车道有困难的时候可以停车让行，请问这个做法对吗？我们问一下他，他答，不对，还是挺厉害的，真的还是挺厉害的。那我问他一下正确的做法是什么？我想正确的做法是什么？我们再问他一下，好，他说，减速慢行，四季汇入。哇，他的答案非常正确啊，非常正确。好，这就是整个的语言模块，就是用中文可以问的语言模块，接下来测试下。这下面我给大家测试一下这个 jamai vc pro，我们点击这个 jamia vc pro，接下来我们就可以看到这里有一个玉米卷就可以输，注意秘诀。好，我已经上传一张图片，这张图片是一我随便写的英文呢，我看他能不能识别。我问他啊，你看他识别的非常成功，他说， google ai studio you very good。经过测试发现啊，他不能识别中文的输入。当然后面我还进行了其他的测试，比如说图片的人物识别，他能够识别出这张图的是巴菲特和芒格，还进行测试了这个图像人数，以及以图像中让他区别男女等，测试效果都非常的好。这个讲道理，我也看不出来是男的还是女的，最重要的是我测试了这张图，问这张图中有多少个三角形，娟妹俩的回答是二十四个。我们再对比一下 gbt 四的回答，你会发现 gbt 四的表现比较差，为什么呢？因为他竟然用拍百选题计算这道题，结果可想而知，就是没有结果。虽然 jamila 也有翻车的时候啊，但是我已经很满意了。好，接下来讲第三种使用 jamila 的方法，就是在这里点击这个 build with vertex，然后我们就会进入到这个 google crowd，我们在这里就可以看到这个多模态模型，以及语言视觉和语音多模态模型这里我们直接可以看能输入什么，我们能够输入音乐句， png， gpg，还能够输入 video，包括 m k v m p 四这种。但是它有个最大的问题，就是只有实照最大，只能输入实照，这是一个很大的问题。经过测试啊，就是效果和这个这个这个 google a s 六里面使用差不多。我重点给大家讲一下这个语音啊，这个语音就是他可以进行文字转语音以及语音转文字，文字转语音，他只能进行三种语言，英语的男女以及西班牙语的男，因为他不能够转中文啊，所以我就不给大家演示了。接下来给大家演示这个语音转文字，语音讲文字，我们这里同样是可以上传一个不超过十兆的音频文件，我给大家试一下。这两天我觉得我做了一件飞，这是我上一上一个视频啊，这里选择中文效果不是特别好，效果不是特别好，大家就少用吧，我相信他后面会进行优化的，我相信他后面会进行优化的。好，这就是使用三种这个卷本来的方法，大家可以各自去尝试一下。最推荐大家在这个 google vs 溜子上面使用。我是班长，如果你喜欢我的视频，请关注我，谢谢！
4388散步的彭导
05:47
用Gemini分析图表和K线图
2千山-独立开发-出海
12:06
GEMINI 最强AI模型Gemini完全免费使用，比G-4还强？随意创建API key使用，文本图像任务轻松处理#干货分享 #人工智能 #教程
35一只AI猪
10:17
谷歌 Gemini Ultra 与 GPT-4 对决！谁更强？实测对比便知答案！
60零度解说
02:21
Gemini更新后实战体验：一键解析音频、视频和图片 #好工具一起分享探索全新升级的Gemini 1.5 Pro，这款AI工具不仅能处理文本、视频和音频数据，还能从中提取和综合信息。本文将带你实操体验Gemini 1.5 Pro的图像解析、视频解析、音频理解和文件解析功能。无需转换字幕文件，直接上传媒体文件即可快速获取关键信息。如果你是内容创作者或数据分析师，Gemini 1.5 Pro将大大提升你的工作效率。别再等了，快来体验这款强大的AI助手，让技术改变你的生活和工作方式！#AI创作 #谷歌gemini #艺术在抖音 #抖音宠粉红包
24AIGC 作业本
01:13
贾佳亚团队开源识图梗王，媲美GPT4+DALLE3 #贾佳亚 #思谋科技 #GPT4 #Dalle
87AI科技评论
04:18
谷歌Gemini API调用实现图片内容识别 AI大模型开发系列
8陆通
11:04
Gemini + LangChain API调用入门教程 #Gemini #人工智能 #ai #多模态
查看AI文稿
AI文稿
今天来聊一点关于写代码的如何通过蓝线架构来调用 google 新出的 jamile pro 的文字和图片的 api，用到的语言是拍摄。先给不知道什么是蓝倩的同学解释一下，为什么要用蓝倩。各种 ai 的模型每周都会出来新的，每一个新的模型都有一套自己的 api，那势必会对使用的人造成很多麻烦。切换新的模型就得重新写代码，重新开发。而蓝倩的出现就是为了解决这个问题，他提供了一个开源的框架，让应用开发者只要开发一次应用程序，就能对接多种大语言模型。你今天想用 check gbt，明天想用 gma，后天想用 misstral，没问题，不用改代码，只需要改改配置就可以无缝的切换。它的功能不仅极限于 ai 模型上，更是实现了超多工序的集成，比如说搜索引、个人知识库，关系型和非关系型的数据库，网页数据爬取， pdf 文件的读写，多套说都说不完。这也就是开源的好处，就如他的名字所表示的， lam 表示语言， chin 代表链条。他把大语言模型列入了科技领域的方方面面。好了，介绍完毕，进入正题。首先你得有一个 gcp 账号，并且进入这个网址， ctrl 点 google dot com。如果你是第一次进入，会让你同意一些条款，并且输入付款信息。不过不用担心，使用 japan 是免费的，并且新用户会有三百刀，你也可以使用 google 的其他产品。进入 google cloud 以后，如果你没有创建 project，它这里会提示你创建一个 project。创建好 project 之后，它这里会有显示你的 project 名字，代表你就可以进行工作了，然后你会得到到一个欢迎界面。首先我们看一下网页版是如何使用的，在搜索栏里边搜索 vertics ai，然后进入 vertics ai 界面，打开左边的快捷栏，可以看见它，这里出现一个 multi model，在这里 multi model 里边我们可以看见他，这里有很多例子，比如说根据这张图片写一个故事，我们可以点击 open，这里是 gemni 的版本，是 pro vision。然后左边是一张图片，提示词是 write a creative story inspired by this image。也就是说他需要根据这张图片来写一个故事，点击 submit 就可以用。如果你是第一次使用呢，他会要求你开一些 api，这个我会待会详细的给你介绍。 ok，这里是可以用的。那怎么开 api 呢？我们首先进入这个色区，然后打开 api，在这里会显示 enabled api and service，点击这个 enabled api and service 点 continue。我这里一共开启了三个 api，一个是 vertics ai api，一个是 generatic language api，另外一个是 notebook api。做我今天这个视频呢，其实只要开这一个就够了，不过我建议你们把 vertics ai 和 genres language 都开开来，如果你是想要玩 ai 的话，基本上这两个都是要开的。具体怎么开呢？我们点击这里 enable api and service，点击，在这里输入 generative language api，然后点击这里，这个时候它就会显示 genetic language api，在这里点击。如果你没有开的话，它这里会显示一个 in able disable 的 button，我这里是已经开了，所以它显示 api in able。你把这里点击一下，它就会进行一个打开的操作。回去之后呢，我们再换一个 vertex ai，同样点开这里，然后点击 manage 或者点击 unable，就可以把 api 给打开。打开大概需要五分钟左右的时间，所以我们先做一下，待会再去携带嘛。把这里关闭，回到 googlecolo 的主页面。我们接下去呢，需要创建一个 google cloud 的 api key，这个也是很容易的。在这里刚刚我们输入了 api，我们在这里输入 api key，然后在这里选择 credentials。看这里我已经有了其他的 key，这个不用管，我们需要创建一个新的 key，点击这里 create credentials，然后选择 apm key，这个时候他就非常快了，帮你生成了一个 a p i k，非常容易。有了 a p i k 之后，我们把这个字符串给复制下来，待会我们会用。到现在为止，我们勾勾这边的操作已经全部完成了，接下去我们开始正式进入代码环节，左边打开我们的命令号。 windows 和麦克都是一样的，因为我们是写代码，没有任何区别。我这里就用麦克演示了，因为我麦克的电脑性能稍微好一点。首先我们创建一个目录， m k d i r m k d i r mk gemini 创建好以后 cd 进入这个目录。进入好之后， python 创建一个虚拟环境， python 三杠， m v and v v and v 创建好之后，激活 sauce v and v being activate 好，激活完成。能写代码的小朋友对这些已经是非常熟悉了，我也不多解释了。拍摄的版本是三点十一点六，第一点高一点，没什么关系，因为我们是调用 api，而不是做本地的训练。接下去我们需要安装一个依赖包，这个依赖包大概只出来了十八个小时，非常新的。这个一百包的名领是 pip install lanchen google g a i pillow，是关于一个图像处理的一个包，把这个给安装进去，安装不会很慢，安装成功，然后清掉命令行。接下去我们会用到 v s s，也就是我们的代码编辑器，打开 v s s，然后选择 open，选择刚刚我们创建的目录 lanchen jimini，点击 open，这个时候可以看见出现了一个空的项目，点击这个小按钮，我们新建一个文件，比如说叫 m e 点 p y，这是一个 python 的文件，我们把这段代码给复制进来，我待会解释一下这辆代码是干嘛的。先来演示一下他，这里会有第三行出现一个 google a p i k，在这里是 t b a。我们回到我们刚刚的 google 的界面，把这个 a p i k 给复制一下，粘贴到这里，这样我们第一个代码就完成了。然后我们切回 time 拍摄 m，一点 p y 进行运行，就可以看见他进行实时的调用了。这次我给的提示词呢是写一段关于蓝倩的介绍，于是他就开始写了，所以他的输出是正确的。如果我们试一下把 apik 给弄错，然后再次运行这个 python m 一，就会出现一些错误，如果你也出现一些错误的话，第一个检查你的 api k 是不是对，另外检查你在 google cloud 里边那几个 api 有没有赢 a 某，一般来说错误就是这两个能够正常运行了。之后我来解释一下这个代码，这一行就是我们的 a p i k，我不用多说，接下去这个就是他一个蓝天的安装包，直接可以下载，不用下载整个蓝天。而这一他就是创建一个 l l m 的 object，这个 l l m 是可以和其他蓝嵌的各种模块进行整合的，而当这个 l l m object 生成好以后，他可以定义你的模型，这里用的 james pro。接下去我们会实现一下图片的模型，然后通过 l l m in look 一个提示词，直接就可以生成一个结果，把这段结果打印出来，这是我们能看见屏幕上显示的一大串英文，好，没问题。做完这个东西之后呢，我们来试一下蓝线里面它自带的另外两个功能，一个是 streaming，一个是 batch。什么是 streaming 呢？演示一下你就知道。我们把这一行 print 改成 stream，然后把这个 result 给注视掉，这样的话它 l l m 直接调用一个 stream 函数，然后再进行同样的提示词，并且要求一千个切到命令行清掉，然后再进行 ism m 一点 p y 进行运行，这个时候你就看见它的结果不是一下出来的，而是一段一段一小段出来的。为什么呢？它就是一个 streaming 的一个过程，就像加起 gpt 一样，它的字是一个一个蹦出来的，如果他生成的非常慢，这个 stream 会给用户提供一个非常好的体验。然后是这个 batch，如果你有多个提示词，多个结果想一口气一下去生成，那你就可以用到这个 batch 的功能，我们可以通过这一段代码进行标志的操作，他一一次提了两个问题，二加二，三加五，然后最后把所有的 content 全部都打出来，我们来跑一下 pasen demo，这个时候我们就看见他出来是一行四，一行八，尤其是你需要处理大量的文档，大量的问题，这个会是非常有用的。好，讲完了这些，我们来讲一下如何进行图片的多模态的演示。我们在这里创建一个新的文件，叫 demo 二点 py，把这里给关掉，把这些代码给复制进来。同样我们需要 a p i k。我们从刚才的 m 一把这个 a p i k 给复制进来，然后粘贴到这里。第一个我要演示呢，是一个远程的图片，他这个图片是在网上的，他可以支持网上的图片输入。我把这个图片打开，他这里好像是一个雪山的图片啊。这个网上的图片可以通过一个 image url 的形式直接输入到 message 里边，然后把这个 message 打包给 l l n 这大语音模型，然后它就可以直接 invoke，然后输出人造来。我们来看一下结果，这个是 m 二这条批网。在等结果的时候，我们可以看一下这个 model 是 germany provision 的模斗，和刚刚的模型是不一样的，刚刚的模型是 jamina pro。我每次创建 l l m 模型的时候，得定义他具体是一个哪个模型，当然介于蓝倩的优势。如果你想用拆 gpt 的话，你直接可以生称成一个 l l m 等于 opple ai 的一个模型，然后 model 等于 gpt for，我们就可以实施无缝的切换，把它切成 google 的，或者切成 obani 的，或者切成其他的。好，我们这里的结果已经出来了，它的结果是 the image contains a snow capped mountain pick a sunset。这个是对的啊，因为他那个他的图片就是一个雪山，覆盖了山顶，并且有一个日落的效果。如果你想调用一张本地的图片呢？那也很简单，我们把这个英美局幺二二给换一换。这张架构图呢，是说 gpt 四是一个八个专家级模型组成的，而不是由单一个模型组成的，并且详细解释了如何通过一个绕挺的机制把用户的请求输送给不同的专家及用户，并且进行多核的处理。看一下姑姑是怎么解释的。姑姑说， the images shows how the palm two works it's a language model that to use generate text。他完全避开了 g p t 四这么大一个字，也非常有意思，因为 punt 他其实也是姑姑他自己的一个模型，而不是 obani 的一个模型。那么他的 g p t 四他看不见吗？还是他故意的？那这我也不知道了。好了，这就是我今天要演示的东西，一个是文字处理，一个是图片的处理，多模态的，你通过蓝圈可以把你把它整合在一起，你可以把这张图片导入到你的 c 和数据库，可以上传到你的云端，或者连接各种各样的云，亚马逊云，谷歌云，阿里云，什么云都可以，而且还可以开发你自己的自动应搭机器人等各种各样有意思的应用。这个只是一个抛砖引玉吧。谢谢你的观看，我们下期再见。
28無再少
00:30
Gemini vs 抖音让Gemini生成几幅以假乱真的图片来挑战抖音ai识别#gemini #ai绘画 #ai #ai绘画生成 #ai作画
5科技分享教程
01:48
国内如何使用Gemini，只需两步即可快速体验Gemini 通过两步简单的配置即可快速使用Gemini pro vision的图片识别能力#gemini模型 #大语言模型 #chatgpt #geminipro #语聚AI
47集简云
01:10
谷歌Gemini pro免费开放！接入bard，支持全球语种谷歌Gemini Pro免费全量开放！已接入bard #谷歌 #Gemini #chatgpt #bard
1196水山Ai漫谈
01:00
用Gemini画打篮球的动物#ai绘画 #ai #Gemini #ai绘画 #ai绘画生成
16科技分享教程
01:44
4月13日 google gemini 1.5pro
1静漠
01:13
2步教你使用Gemini！谷歌Gemini与GPT4.0，你更看好谁呢？ #人人都是ai艺术家 #Gemini #gpt4 #知识前沿派对 #知识领航者
801GetAI·解锁AI新技能

热门推荐

热门分类