哈喽,大家好,我是满志,今天我们来分享一个经过 啊进一步改造的百度文星的这个生图,我将那个百度的文星这个跟我们照相这枚西托博进行一个结合出来的效果啊,相信大家在那个视频的开头演示都看到了啊,各有特色, 整个工作流我也给他做了一些修改啊,就增加了我们的这媒体 top 的 那个模型加载, 然后因为我们百度的话,它的一个颜色饱和度会相对比较高,所以我给他减少了一个颜色的饱和度,让他看起来会啊,颜色不会过一个艳丽,大家可以根据自己的抽卡情况 去调整,可以调整它的饱和度,对比度跟它的亮度,可以在这边进行一个修改。然后我在整个工作当中又增加了一个去 ai 的 一个情况,因为我们再加了那个 这媒体的那个模型之后,我们整体的皮肤变得比较光滑,不像我们像那个纯粹的百度这样子,它的肌肤纹理会比较好。我加了一个之前就是我们这媒体经常用的 这个去 ai 位的高清放大啊,保持人物的一个真实性,效果增强的一个 节点,然后给大家加上去,然后出来的话效果会更好啊。其他还是老样子,就是设置一下啊,输入我们的提示词, 然后设置一下分辨率,然后调整一下我们的模型,其他就跟我们之前是一样的。那如果你想 图像高清放大,那你就把这打开,打开之后图像就会进行一轮的高清放大,然后出来的图片默认就是四 k 的 啊,图像反推一个,旁边还是保留着不变啊,这个看自己需求去做切换就可以了。 然后我们这边还加了那个 j m g 的 一个光线,然后我这边也给大家加了一个 m j 的 一个 lala 的 一个风格 切换,这个的话是自己的一个美感需求去提交啊,我建议人像的话就关掉,如果你是生成一种那些场景的话,你可以把这个 logo 给打开,或者说在人像的过程中调低他的一些权重,这样出来的一个人像效果会比较好。 那我们一起来看一下有加这媒体的那个工作流跟没加的一个对比啊,我们百度的话,他的一个模型还是啊对于文字方面确实是 比较不错的,像你做这种海报类型的话,他会完胜于加了我们这媒体模型的。如果你想只是做海报的话,那你就直接只用我们这个百度的这个工作流就可以了,不要加我们的这媒体 top 的 这个啊。 那人像方面的话,你看我这边是同样的一个工作的节点,也同样的一个去饱和啊,右边加了之后,人物肖像的话,更符合我们的一个审美,那这边的话就 过于一个真实吧,因为也去了啊,去掉了一定的饱和度,所以看看起来会变得偏向于冷色调 这样子。然后这个是一个风景的啊,加了我们这些美女,他的一些细节各方面也增加了很多啊,都是同一组提示出的效果 啊,包括他整体的啊,图像都会比较明亮啊,色彩都会比较啊,比较符合我们的一个审美的情况吧 啊,加了之后,我觉得比不加的话,图像那些细节效果各方面会更好。我们这个高大,你看整体的一个审美啊,亮点啊,都不错啊。 至于这个海报方面的,还是要单独的,不要加我们的这个 jimmy 这个模型进去,你就单独用百度文心的这个去做就可以了啊。人像也是这样子,看到没有? 这种就相当于就是我们拍照,然后经过一个美颜,然后整体的效果会相对比较自然点。呃,我这些图片都是没有经过那个高清放大的,还可以再过一遍高清放大效果会更好啊。 我是觉得这样就整体的那些细节啊,各方面都比较不错啊,单纯用百度啊,他有时候还会出现这种反常规的这种图像,但是啊,加了之后不会,这是没加的啊, 还是一样的一个对比啊,二次元的话这个就平平秋色了,这个看自己的喜好,看自己更喜欢哪一种风格的啊?人像还是我们这媒体是一个优势 啊,如果你单纯真的能下的话,你就直接用这枚举的去做,这个效果会更好,比较倾向用这样的工作流逝还是一些涉及到场景内的要求,很多细节上的一些显示各方面的啊,看到没有? 这样子,包括这些,你看里面的一些小字,展现的一些美学啊啊,特效啊,各方面都会比单独百度文心的这个好, 那他整体的亮度、美学、观感都有了很大的一个提升啊。哥,我们这期视频大概就是这样,其他的话就跟之前介绍的 一样,如果大家觉得我这期视频对大家有帮助的话啊,请多多支持我,给我一键三连关注一下, 然后那个工作流,包括我们的对应的模型我都会上传到我们的王牌上,有需要的自取,需要进入我们学习圈的社群的关注并私聊我,然后获取我们加入的一个渠道。那我们这期视频就先这样,嗯,下期见。
粉丝998获赞268

怎么用通用 ai 工具做出真正高效的智慧作业?第一步,用 ai 自动生成作业, 打开 check gpt, 文心一言豆包,输入学科年级知识点, ai 立刻给你出练习题、分层作业、拓展题,难易度随便调,不用再到处找题。第二步, ai 智能批改作业, 客观题秒判对错,省时省力,主观题 ai 还能打分,写评语指出错在哪,该怎么改。 第三步, ai 做学情分析,作业一交, ai 直接统计预测点,薄弱环节谁没掌握,哪里要补,一目了然。 第四步, ai 个性化辅导,根据错题, ai 自动推送同类题目,做到错什么练什么,因材施教,真正实现智慧作业精准教学。 简单说就是 ai 出题, ai 批改、 ai 分 析、 ai 辅导老师减负学生、高校,这就是未来的智慧作业!

一分钟掌握今日全球 ai 圈大事!一、干货分享! open ai 上周发布 gpt, 五点五后放出一份官方提示词指南,核心信息只有一个,别再写长提示词了。 open ai 推荐的提示词模板最终浓缩成六个模块,角色、性格、目标、成功。标准、限制条件、停止规则。 每个模块都强调尽量剪短,只在需要改变模型行为的地方加细节。二、百度在大模型赛道上小步快跑。文心一言五点一预览版上线,国际大模型盲测平台 lmsyschatraderina 竞技场,目前位列全球第十三位。 three deep sea v 四多模态来了! deepsea 在 发布 v 四后,迅速开启多模态识图功能的灰度测试,标其多模态能力进入实质性阶段。四、阿里正式发布数字员工 coderwave 和 coder 移动端两款 a 阵产品,全面覆盖企业和个人场景的需求。 five chrome 正式发布 prompt api 浏览器,原生 ai 时代来临,网页直接调用 gemini nano 本地模型。

如果 ai 不 说人话怎么办?基于你刚才的倾诉,我总结了你今天想哭的三个核心动点和四个底层逻辑。需要我将你的痛苦转化为一份 excel 表格吗?我会在这里稳稳地接住你。 把 ai 当树洞倾诉时,你明明在宣泄情绪,他却在做逻辑拆解。我们经常被这种伟人发言搞得不知所措,让他帮我们做总结,写周报时也动不动就首先其次。总之,赋能新篇章还得带上一大堆已默契,发出去一眼就能看出是机器代谢。 其实有办法跟 ai 对 齐颗粒度,让他们不再当赛博菩萨,比如没事就接住你的 g p t 啊。我们可以去个性化设置中找到这行个性化指令,把这串提示词啊输进去,让它别升华,也别安抚。不要总是一句话概括 ai 位啊,就能 减弱不少。那对于没有个性化设置的 ai 助手呢?也可以把这串提示词啊主动发给他,有一样的效果。我是金猪,关注金猪 ai, 带你轻松玩转 ai!

给大家展示一下我们公司最新的研究成果啊,这是一个只要你会打字,你就能当程序员的 app, 有 多简单呢?比方说我现在让他给我做一个小游戏吧,我们就从一个简单的小游戏来验证一下它的完整功能,就告诉他做一个开心消消乐。好八个大字啊,打给他,然后他就开始自己的在这做了, 可以看到我们现在时间大概是六点三十六分,嗯,那看他能不能在六点三十六分之内把这个做完了。好,他已经做完了,那我们就直接打开。 好,他已经给了我一个啊,给了我一个。这个开心消消乐非常的迅速啊,我们这就可以开始玩了,你看功能的话也是比较完善的, 他们这笑来笑去,笑来笑去,嗯,还是蛮好玩的啊,我还可以重新开始,这是我们什么都没有给他的情况下,他呢独立的帮我们完成了这么一个开心消消乐。 但是我们发现了一个问题,比方说我再重新开始的时候啊,它有这个,呃,三个在一起的,但是它呢没有自动的完成这个消除,就是在这个开始界面,那我们让它给我们优化一下, 呃,优化一下开局, 呃自动消除功能,那这就是我所理解的我要一个什么样的功能, 它不像是,呃我们常用的那些 ai 软件,像 deepsafe 啊,豆包啊,其实你如果要一个非常精确的这个东西的话,你要呃大段的这个 呃叙述去给他,我们的这个呢?他不一样,他就是会捕捉到,就是最主流的这种需求。嗯,再来试一下, 你看我们现在的话就没有,那我们再重新开始再看一下,哎,他就不会生成像我们刚刚遇见的那种情况,对吧?然后我们玩起来呢,也是变得越来越流畅了, 我们再来重新试一下还会不会有这种三个在一起的情况呢?那就不会了,这样才是我们认呃,认知当中的那种开心消消乐嘛,对吧?

今日 ai 新闻一、朋友们, deepsea 在 推出 v 四之后,动作真的很快,现在已经开始恢复测试它的多模态识图功能了,这意味着什么呢? 就是说以后用 deepsea 不 仅能聊天,还能让他看图片了。现在在手机端和网页版上已经能看到一个新的识图模式入口,根据测试,它在理解图片基本内容、描述画面,甚至做一些简单的逻辑推理上都做得挺不错。 当然,开发团队自己也说了,遇到一些特别复杂或者刁钻的图片时,识别起来可能还有点吃力,这肯定是要继续优化的,但这第一步总算是迈出去了。 二、百度的文新预言最近有个新动静,它的五点一预览版悄悄登上了国际上有名的那个大模型盲测平台 armsvs 竞技场。 这个平台挺有意思,大家匿名评测,用户直接投票。目前文新预言五点一在这个总榜上排在第十三类, 这可不是小事,这意味着百度把自己的核心模型放到了全球用户的眼皮子底下,让大家直接去比较、去检验,这既是一种自信,也是一种快速迭代,跟上全球步伐的方式。 三、小书最近在组织架构上做了个大调整,专门成立了一个一级部门,名字叫到此,就是专门搞人工智能的。 这个部门可不简单,从 ai 模型的研发、底层的技术设施,到怎么把技术落地做成产品,全链条都包了。 同时,他们还把原来的企业效率部和数据科学部整合了一下,成立了企业智能部,为 ai 时代储备人才和架构。更值得关注的是,他们还设立了海外部 rednote 和一个叫 led 幺三二七的团队,这明显是在为国际化业务和孵化新产品做准备。 看来小红书在 ai 上的投入是动真格的。四、谷歌的 chrome 浏览器最近搞了大新闻,推出了一个叫 prompt api 的 功能, 这个功能让网页开发者可以直接用 java script 调用浏览器内置的 java nano 模型。这是什么概念呢?就是说以后一些简单的 ai 功能,比如翻译、总结文本,可以直接在你的浏览器里本地运行,数据不用上传到云端,隐私保护更好, 对开发者来说也省事了,不用再费劲去接外部 api, 开发门槛和成本都降下来了,这可以说是把 ai 能力真正放进了浏览器里。 五、阿里巴巴最近发布了一个叫 coderweek 的 产品,你可以把它理解成程序员的数字分身。这个 ai 智能体可厉害了,它能自己整理代码变更的简报,诊断错误,还能生成修复代码,实现从发现问题到修复的全程无人止手。另外,阿里还同步推出了 coder 的 移动端, 用手机就能远程操控桌面端的这个智能体去处理复杂任务。阿里这一步棋是想让 ai 从过去悄悄编鼓的辅助工具,变成能独立处理任务的生产要素,推动整个研发运维向自动化更深一步。六、蚂蚁集团把他们研发的外亿参数大模型令二点六一 t 正式开源了。 这个模型采用了一种创新的混合架构,主要优化了执行指令、适配各种工具以及处理超长文本的能力,简单说就是更聪明高效了,他特别擅长应对那些需要多个工具配合、约束条件复杂的业务场景,多步骤的任务执行能力很强。在 代码生成、修复缺陷,还有在槽达信息环境中进行精准推理这些方面,他的表现已经达到了开源领域的顶尖水平, 这对于整个开源社区和 ai 开发者来说是个重磅礼物。其 ai 制作短剧要变天了。一家叫聚日路的杭州公司和火山引擎深度合作,接入了后者的豆包视频生成模型。 这一合作直接让 ai 剧的制作进入了工业化时代。效果有多明显呢?制作效率提升了将近十倍。以前做一个剧可能要半个月到一个月,现在最快一两天就能搞定。更关键的是画面质量,以前 ai 生成的画面可能只有百分之三十能直接用,现在合格率飙升到了百分之九十以上。 他们构建了一套全站式的技术架构,从前期创意到最终成片,大大降低了 ai 剧的生产门槛,国内 ai 影视产业看来要迈上一个新台阶了。 八、谷歌的 gemini 最近迎来了一次堪称史诗级的更新,这次更新最核心的功能就是它能直接生成并导出多种格式的文件了。 你想写一份报告,整理一个表格,告诉我 gemini 你 的要求,它就能直接给你生成 google docs、 word 或者 excel 格式的文档,你再也不用自己复制、粘贴、调整格式了。更贴心的是,它还加入了图像识别功能, 你随手写的笔记拍了照,他就能给你转换成排版整齐的 pdf 文件。这对于每天需要处理大量文档的办公族来说,简直是效率神器。

市场上这么多模型,我到底该用哪一个?别急,今天我们不谈枯燥的参数,我为你准备了一张清晰的 ai 全球战略地图,我们先看全貌,再找坐标。 第一部分,大局俯瞰三大阵营顶足而立放眼二零二六年的 ai 世界,所有模型其实都可以归入这三个核心的阵营,记住它们,你就掌握了选择的主动权。阵营一,全球闭源巨头像 openai、 osropik、 google, 这是 ai 界的豪华舰队,它们的技术顶尖,生态成熟,但通常需要付费,而且对国内用户 存在访问和数据合规的门槛。阵营二,中国主力军团, dixie、 豆包、文心妍、通义、 kimi 等。这是我们的主场主力, 他们对中文理解更深,数据不出镜,性价比极高,甚至是免费的,是绝大多数国内的企业和个人的首选。阵营三,开源模型, luma、 queen、 g l m 等。 这是自主可控的基石,你可以免费下载,部署在自己的服务器上,数据绝对私有,但需要强大的技术团队来运维。第二部分,实战选型,什么场景用什么刀。现在我们把这三大阵营对应到你每天的具体工作。 如果我们在日常办公、写作提效的场景,我们主要的任务是写邮件、写周报、做 ppt 大 纲翻译、简单的数学分析。那么推荐大家用国产的大模型,像 deepsea、 豆包等, 它们就像你的瑞士军刀,免费打开网页就能用最懂中文语境。在合规性上,数据不出境,让你用着最踏实。对于绝大多数的非技术岗位,这里就是你 ai 之旅的起点。像复杂推理、代码开发、 前沿研究等场景,主要任务是编辑复杂的代码,进行数学证明、逻辑深度推理,研究全球最新技术。推荐用 open ai 或者是 deepsea, 理由是 open ai 其实是在复杂逻辑和代码能力上依然还是全球的标杆,适合追求极致型且能解决访问问题的团队。而 deepsea 呢,在数学和代码领域表现出色, 拥有极致的性价比,是开发者和科研人员的强力备选。像长文档处理、知识库问答这样的场景,主要任务就是阅读几百页的财报、法律合同,或者是构建企业的知识库。这个时候,我们推荐用 kimi cloud 或者是智普的 g l m。 这些模型在 长上下文窗口上具有优势,能一口气吃下整本书或者是超长文档,并准确回答细节问题,是律师、分析师和风控人员的利器。像绝对安全、私有化部署的企业级需求的场景,主要任务像处理金融数据、医疗记录、 政府涉密文件,或者需要定制专属的 ai 大 脑。这个时候呢,我们推荐用开源模型拉姆奎斯有化部署,这是安全级别的终极答案。 模型跑在你自己的服务器上,数据完全不出门,虽然需要技术团队搭建,但对于有严格合规要求的大公司,这是必由之路。第三部分,给你极简行动指南。面对这张地图,你可能还是会问,我还是不知道从哪里开始? 我的建议非常直接,别纠结,现在,立刻马上打开 deepsea 或者是豆包的网页版,从你手头的一个具体任务开始。为什么?一,零试做成本,他们免费, 这是你建立 ai 提干风险最低的方式。二、解决真问题。你工作中百分之八十的写作、总结、分析,它们都能完美胜任。三、建立基准。只有当你真正用起来,你才会知道它哪里不够用。 那时你自然就知道是该尝试更强大的 open ai, 还是该谋划自己的私有化部署了。记住,在这个时代,最大的风险不是选错了工具,而是因为害怕选错而迟迟没有开始。现在,就从一个问题开始,去问你的 ai 吧。

第二课,市面上这些 ai 工具都是啥?你知道中国有多少款 ai 工具吗?二十款,五十款,答案是光 一张表帮你全部搞清楚。你是不是这样,看到豆包下载了,看到同一千万,又下载了,看到 dvd 的, 卧槽,这个好像很厉害,又下载了,结果打开每一个都不知道干嘛用,最后全删了,你真的 不是,今天我给你画这张地图,我把中国主流 ai 工具分成四类。第一类,一类说第一类,废话, ai 就是 ai 陪你聊天,豆包不接受送出的完全免费,界面跟微信一样简单。同一千万,阿里巴巴出道,功能更强大,适合职场人处理复杂任务, 文凭一言,百度书的中文写作特别强。记住一句话,穷人用豆腐,厂人用工具写在马桶 d c。 第二类,影响 ai, ai 帮你办公提问 ai 对 办公, ai, ai 帮你打工, 深沉不一定要团队办公,特别牢固。第四类, 但是装好的东西知道怎么用它才是关键。下一节我告诉你热爱这一切的东西,什么是提示词,怎么跟 ai 说话,它才能给你真正想要 的老兵,之后你就能真正用 ai 干活了,工具不是硬。

国内大模型在天猛降,百度今日正式发布文新一言四点零,全面升级多模态理解超长上下文与智能体自主规划。新版本支持两百万字超长上下文,能一次性处理整本书及全年经营数据,给出精准 决策。多模态能力大幅增强,可深度理解图文、音视频内容,生成高质量文案、海报、短视频。 智能体,具备自主思考、工具调用、任务拆解能力,能独立完成选填 v 四零优化、广告投放、客户跟进等跨境全面路应用。 实测数据显示,文新一年四点零在中文理解、逻辑推理、多模态升腾等核心指标上已达国际顶尖水平。百度表示,将向跨境卖家开放专属 ai 全面路解决方案。