00:00 / 03:26
连播
清屏
智能
倍速
点赞71
FLUX.1使用教程:AI生图界“新王”,凭什么震惊世界? 【FLUX模型使用指南:从下载、安装到应用、工作流,一个视频,帮你一网打尽!】 可能是目前最强大的开源AI图像生成模型:生成质量堪比MidJourney,却免费向所有人开放? 上线不到一个月时间,包括LoRA、ControlNet、IP-Adapter等在内的各项配套设施迅速落地,堪称前所未有。 这期视频,我们来一起走近,这个神奇的新模型——FLUX.1! 本期视频内容提要: ① FLUX是什么?相较于过去的模型,它有哪些独特的优势? ② FLUX有哪几个不同版本?Pro、Dev、Schnell有哪些不同之处?有什么配置要求? ③ 如何体验FLUX?详细解析在线接口 / 本地运行 / 云服务器三种使用方法! ④ 如何通过ComfyUI / ForgeUI在本地体验FLUX模型?如何搭建工作流? ⑤ 显存不够?使用fp8量化模型,让你的FLUX跑起来更加轻松! ⑥ 进阶运用拓展:搭配LoRA、ControlNet、IP-Adapter,让你的FLUX更加强大! 【网盘分流】 视频里提及到的各项FLUX模型及整合包下载地址: gf66fxi6ji.feishu.cn/wiki/STPSwBjEUiELzjkGxYvcj4kAnxh(请完整复制到电脑浏览器打开) 注: ① FLUX模型见:【2.模型】-【FLUX.1 相关模型资源】 (请按照视频里说明的配置要求选择自己能运行的版本下载,不要一下子全下完) ② ComfyUI整合包见:【1.软件安装包】-【2.ComfyUI安装包】-【新前端版本】 ③ Forge整合包见:【1.软件安装包】-【3.ForgeUI安装包】-【最新版】 ④ 工作流见:【3. 工作流】-【支线任务】-【FLUX.1教程】 (整合包不含FLUX模型,请分别按需下载) #ai #AI绘画 #AIGC #stablediffusion #comfyui
00:00 / 20:44
连播
清屏
智能
倍速
点赞8348
🚀本地部署最强开源OCR大模型OCRFlux-3B!效果惊 🚀本地部署最强开源OCR大模型OCRFlux-3B!3090显卡即可运行!3B小参数模型企业级OCR准确率惊人超越olmOCR!3分钟部署OCRFlux,一条命令将PDF转Markdown,准确率惊人 🚀🚀🚀视频简介: ✅必看教程!3B参数OCRFlux碾压7B模型!企业级OCR识别准确率竟然超过99%,本地部署成本降低70%!手写体、扫描件、古籍全能识别,比olmOCR还强悍! 🔥 本期视频详细演示了最新发布的OCRFlux 3B参数OCR识别模型的强大能力! 📊 核心亮点: 仅3B参数却超越7B模型olmOCR的识别精度 GTX 3090显卡即可流畅运行,硬件门槛大幅降低 支持手写体、扫描件、繁体字、竖排古籍等多场景识别 完美保持原文档格式,支持PDF批量转Markdown 🎯 视频内容包括: ✅ 多种复杂场景的OCR识别效果测试 ✅ Windows/macOS/Ubuntu多平台部署方案 ✅ 完整的本地环境搭建教程 ✅ PDF文档批量转换实战演示 💡 对于需要本地部署OCR服务的企业和个人开发者来说,OCRFlux是降本增效的最佳选择!识别准确率惊人,部署简单快捷。 🔥🔥🔥时间戳: 00:00 开场介绍 - OCRFlux模型背景与企业OCR需求分析 00:24 模型对比 - 3B参数OCRFlux vs 7B参数olmOCR性能对比 01:11 手写体测试 - 潦草字迹打油诗识别演示 01:55 扫描件测试 - 模糊扫描文档OCR识别效果展示 02:32 繁体字测试 - 模糊繁体字扫描件识别挑战 03:05 极限测试 - 扭曲模糊文字内容识别演示 03:38 复杂文档测试 - 学术论文扫描件OCR识别 04:20 古书竖排测试 - 繁体竖排古籍内容识别 04:50 小票识别测试 - 重叠文字内容识别挑战 05:35 本地部署准备 - Windows/macOS用户LM Studio部署方案 06:10 Ubuntu部署实战 - 完整环境搭建与模型下载过程 07:21 PDF转换演示 - 扫描版PDF转Markdown格式完整流程 08:42 效果展示 - 转换结果查看与识别精度验证 #ocr #OCRFlux #olmOCR #ai #大模型
00:00 / 09:34
连播
清屏
智能
倍速
点赞248
开源图片大模型,改变AI应用范式! 
家人们出大事了!媲美GpT 4o图像生成能力的超强模型,FLUX.1 Kontext [dev] 模型现在开源了!当然这个是他的开发者版本,但是图片生成效果已经很强了! 拥有 12B参数,具备 接近专有工具的图像编辑能力,关键是,他可以在消费级硬件上运行。
一个可在本地运行,无需联网,媲美GPT4o可生成和编辑图像。你敢想象吗? 
这个版本最大的特点,就是解决了角色一致性的问题,要知道,AI生成图片,一直以来的问题,就是生成的角色与真实的人差距太大。 
而现在一个能解决角色一致性问题的开源图片模型,可以让我们在真实的人、物的基础上,进行任意的编辑。 比如说,我们看几个很实际的应用方案。我们随便拍一张T恤的图片,可以把他变成商拍级的水平;我们找一个普通人模特,可以给她增加品牌新品很自然的植入。 
我们可以说,在电商领域,这个开源模型,已经拥有了可交付结果的能力。 
这让我想起了Linux基金会创始人说的那句话:AI基础模型注定全面开源,战场只在应用端。 
所以说我们看为什么OpenAI创始人奥特曼,最近的采访中,已经在说OpenAI目前的重点可能不是追求AGI 了,而是更快地让目前的用户再翻一倍,达到10亿的月活用户。 
所以可以回想一下我昨天的视频,为什么open AI要进入金主微软更擅长的AI办公领域? 第一,更普世的办公软件可以让OpenAI更早达到10亿用户; 第二,OpenAI大模型在多个层面被google的Gemini2.5超越,某种程度上,基础大模型已经不再是壁垒。 
AI应用的范式完全变了,用AI的方式重做所有传统软件的时代到来了。 
用AI逻辑抢夺更多基础软件的地位,拿到用户更多的行为数据,10亿的月活,几亿用户的日活,完全能媲美现在互联网巨头的地位了。 
不过我想,接下来这种路径已经不再只适合OpenAI,而是适合所有做AI应用的创业者了。一个更有利于agent创业者的时代到来了! #人工智能 #Agent #OpenAI #AI #flux
00:00 / 02:34
连播
清屏
智能
倍速
点赞19