粉丝70获赞414


敬各位卖家最近已经被 gemini 三 pro 包括 nano banana pro 生存模型刷屏,这被广泛认为是一次重大的技术飞跃,尤其在推理能力、多模态理解和编程方面树立了新的标杆。 在十二月一日, deepseek 也发布了最新的顶级开源模型 deepseek v 三点二,在诸多评测中战胜了 openai 最新的 gpt 五系列,甚至有些项目接近了 gmi 三 pro 的 水平,在效率、代码能力和中文理解方面表现突出。那么在亚马逊卖家使用场景下, gmi 三 pro 和 deepseek v 三点二会是什么效果和差异呢? 我们今天就为大家进行一次详细的实测。以下是实测环境和配置。 harry studio 是 一款业界公认的开源免费 ai 客户端,可以集成和调用全球各种主流的大模型。如果有卖家不熟悉相关使用和配置技巧,可以看我们公众号发布的攻略指南。 很多卖家使用 ai 做选品或调研时,都会遇到一种尴尬的情况,就是模型本身的预训练知识库可能已经是半年或者一年前的,那么你问他最新的亚马逊情况,他要么只能去网上搜索,要么可能就就产生幻觉给你编造一些虚假的数据 给他链接,也会遇上反爬或者信息抓不全的情况。为了解决这些痛点,我们这次为两大模型配备上了 softie mcp, 可以 实时调取最新、最全、最智能的一手亚马逊数据和方法论,让大模型发挥真正的实力。 腾讯 mcp 在 cherry studio 里面配置好后会显示已有工具,当前已有二十个,我们也会持续地增加更多有用的工具。 在开始对话前,还有一个进阶技巧,就是在模型配置里面为模型添加系统提示词。系统提示词的作用就是让大模型更聚焦用户的场景、习惯、技巧、禁忌、更智能、更听指挥。就像拉力比赛中 的副驾驶领航员,为驾驶员 ai 提供精准导航指引。我们已经为卖家准备了一套建议的基础系统提示词,方便卖家快速上手。当然,这个系统提示词不是一成不变,不同卖家都可以根据自身的情况和需求对系统提示词进行修改优化。 在无系统提示词的情况下, deepsea v 三点二和 gmi 三 pro 表现是这样的。 我们再来看看配置。系统提示词以后, deepseek v 三点二配置了系统提示词的回答,主动介绍,并且调用了 subprime m c p 时间工具,获取了准确时间 模型,一次性分步骤完成了调研,并给出了初步分析和建议。 gimini 三 pro 配置系统提示词后的回答比较简洁,没有急于一次性给出答案,而是跟用户进一步确认需求。所以我回复美国站没有明确的大类,你来推荐 gimmel 三 pro, 这样的回答你是否满意?相信不同卖家会有不同的想法,这种情况以后就可以靠系统提示词来调整约束。确认继续后, gimmel 三 pro 就 开始调用工具开始查询和分析。这里中间还有一个插曲,由于它一开始设置的筛选条件比较多,所以第一次调用还报错了, 但是它立即自动调整了查询条件,就获得了有效的数据,并进行了初步分析。经过以上测试,我们开始第二轮工具的使用。在关键词分析测试中,我们就选择两个模型都提及的关键词来提问。广告投入也是亚马逊运营的最大变数和风险之一。看看两个模型接下来的表现。 ipc v 三点二这次虽然输出了结果,但是我发现他并没有真正使用 m c p 获得数据,这些数据可能是上一轮获取的数据结合他的预训练知识库得来的,这里的确要扣分了。经过提醒后, ipc v 三点二进行了工具调用,所以大家在使用的时候一定要看到工具调用成功的记录才行。 第二轮模型建议对比中,工具分别给到的建议是这样的。然后在第三轮 ai 趋势应用测试中,我们提了一些高难度问题,这里两个模型的回答质量就拉开了差距,当然主要原因还是模型的与训练知识库的新旧差异。 deepsea v 三点二并不知道亚马逊 cosmo 是 什么,瞎编了内容, geminis 三 pro 给出了比较准确且全面的回答和建议。这是因为 geminis 三 pro 预训练知识库为二零二五年一月,也就是说这之前的知识他都学习了。 deepsea v 三点二预训练知识库虽然官方没有公布,但业界估计跟 v 三同源,也就说二零二四年年中左右。 所以关于亚马逊 ai 的 相关话题, gmail 三 pro 显然比 deepsea v 三点二知道得多。所以当我们需要让模型回答时效性强的最新话题时,加上可靠的联网工具肯定是必要的,我们后续会专门开一期内容讲其他工具,如搜索的调用技巧, 两个顶级大模型表现如何,基于客观公平角度,最终让第三方同样也是全球顶级大模型,也是亚马逊投资了的,出自 ansoreopt 旗下最新模型 cloudsonnet 四点五来评价两个模型的表现。 将两个模型的对话导出给了 cloudsonnet 四点五。对于数据分析工具,数据真实性应该优先于用户体验,错误的数据可能导致错误的商业决策,造成的损失远大于对话中断带来的不便。这是 cloudsonnet 四点五对这次评价的一个总结。 如果不加上成本差距的话, gemini 三 pro 的 确是专业卖家的更好选择。但 deepsea v 三点二的使用成本只有 gemini 三 pro 的 二十或三十分之一。在一些轻量级场景,结合提示词引导 deepsea v 三点二可能对于新手卖家来说会更加友好。 大家还想看亚马逊投资的 sonic 四点五使用 mcp 以及进阶的 cloud code 的 自动化吗?评论区打想看,我们立即安排并分享给大家。

